数据分析网

8.5、SPSS Cox回归模型—零基础入门教程

微信扫码观看完整版SPSS视频课程、分析师在线答疑解惑哦~

SPSS教程 (1).png

【课程摘要】

SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,其中Cox回归模型(Cox Regression Model)是其重要的功能之一。Cox回归模型是一种用于分析生存数据的统计模型,常用于生物医学和流行病学研究中。通过SPSS的Cox回归模型功能,可以评估多个预测因素对生存时间的影响,并计算出相应的风险比(Hazard Ratio)。Cox回归模型可以考虑到多个协变量的影响,同时还可以处理右侧截尾(right-censored)的生存数据。通过SPSS的Cox回归模型功能,研究人员可以得到关于预测因素对生存时间的影响程度和方向的统计结果,从而更好地理解和解释生存数据。
【详细教程】

SPSSCox回归模型



一、参数设置


(1)打开数据文件,选择“分析” →“生存函数” →“Cox回归” ,弹出“Cox回归”对话框,如下图所示,设置分析变量和其取值规则,各项含义如下。


1.png


●    时间:用于从左侧的变量列表中选入生存时间变量,应是数值型变量。


●    状态:用于从左侧的变量列表中选入生存状态变量,可以是分类型或连续型变量。单击定义事件日。按钮,弹出“Cox回归:为状态变量定义事件”对话框,如下图所示。


2.png


●    协变量:用于从左侧的变量列表中选入一个或多个协变量,可以是分类型或连续型变量。当有多组协变量时,可单击上一页必按钮和下一页。心按钮切换不同组的协变量。若考虑协变量间的交互作用,在可先在左侧的变量列表中选中有交互作用的变量,单击按钮,形成交互作用项进入协变量框中。当需要为协变量设置进入回归模型的方时,可选中该协变量,然 后在下方的下拉列表中选择需要的方法。这7个进入回归模型的方法的含义如下。


➢   输入:即强行进入法,同一组中的协变量,一次性地全部进入回归方程。


➢   向前-有条件的:指通过条件似然检验确定协变量是否能进入回归方程的向前选择法。


➢   向前-LR:指通过似然率检验确定协变量是否能进入回归方程的向前选择法。


➢   向前-Wald:指通过Wald检验确定协变量是否能进入回 归方程的向前选择法。


➢   向后-有条件的:指通过条件似然检验确定协变量能否从方程中消去的向后消去法。


➢   向后-LR:指通过条件似然率检验确定协变量能否从方程中消去的向后消去法。


➢   向后-Wald:指通过Wald检验确定协变量能否从方程中 消去的向后消去法。


一般情况下,使用向后消去法能减少漏掉前者的有价值的预测因子。但若要求至少有一个协变量进入模型,则可以使用向前选择法。


●    层:用于选入分层变量,应是分类型变量。分层变量可以看作是研究者欲加以控制的混杂因素,SPSS可以根据分层变量将数据分组,然后对每个组生成单独的风险函数,以便于研究者分析数据。


(2)单击按钮,弹出“Cox回归:定义分类协变量”对话框,如下图所示,各项含义如下。


3.png


●    协变量:该列表框显示主对话框中选定的所有协变量。


●    分类协变量:该列表框用于从左侧的协变量列表选入指定为分类变量的协变量,变量名后的括号显示当前变量正在使用的对照方法。


●    更改对比:该栏用于设置对指定协变量的对照方式,修改后需单击按钮确认,对比下拉列表给出如下7个对照方式。


➢   指示灯:指明各类代表信息的有或无,需指定参考类别,参考类别在对比矩阵中取值均为0。


➢   简单:预测变量的每个类别(除参考类别)都与参考类别进行比较。


➢   差值:除第一类外,预测变量的每个类别都与其前面所有类别的平均效应进行比较,也叫逆Helmert对比。


➢   Helmert:除最后一类外,预测变量的每个类别都与后面所有类别的平均效应进行比较。


➢   重复:除第一类外,预测变量的每个类别都与其前的所有类别进行比较。


➢   多项式:此方法假设各类别的间距相等,仅适用于数值型分类变量。


➢   偏差:预测变量的每个类别(除参考类别)与总体效应进行比较。


●    参考类别:用于指定参考类别。如果在上方选择了指示灯、简单或偏差方法,就需要指定一个参考类别,可选项有最后一个和第一个;默认的都是最后一个,若进行了修改,则需要单击按钮确认。若选择了第一个作为参考类别的变量,其在协变量列表框的名称后面会显示“第一”字样,如X(指示灯(第一));若选择最后一个作为参考类别的变量时不作提示。


(3)单击按钮,弹出“Cox回归:图”对话框,如下图所示,各项含义如下。


4.png


●    图类型:此栏用于选择输出哪些类型的图形,有如下4个可选项。


➢   生存函数:在线性刻度上显示累积生存函数。


➢   风险函数:在线性刻度上显示累积风险函数。


➢   负对数累计生存函数的对数:向估计应用了ln(-ln )转换之后的累积生存估计。


➢   1减去生存函数:以线性刻度绘制1减生存函数。


●    协变量值的位置:要作出生存函数或风险函数关于时间的图形,需要指定协变量的值。默认状态下,是以模型中对比变量和协变量的均值绘制函数图形。若用户要根据需求自己设定

值,则先在该列表框中选中某个变量,然后在更改值栏中单击值选项,并在后面的输入框指定需要的固定值,单击按钮确认即可。


●    单线:用于选入一个分类协变量,作图时将它作为分线变量作图,即按变量取值将数据分成几组,对各组分别作一条曲线。


(4)单击 按钮,弹出“Cox回归:保存新变量”对话框,如下图所示,各项含义如下。


5.png


●    生存函数:用于指定生成的生存变量,此栏给出如下7项可选的保存内容。


➢   函数:即生存函数估计值,自动生成变量名前缀为“sur”。


➢   标准误差:即生存函数估计值的标准误差,自动生成变量名前缀为“se”。


➢   负对数累计生存函数的对数:即对数转换后的累计生存函数,自动生成变量名前缀为“lml”。


➢   风险函数:即累计危险函数估计值,自动生成变量名前缀为“haz”。


➢   偏残差:用它对生存时间作图可以检查关于风险函数的比例假设,自动生成变量名前缀为“pr”。


➢   DfBeta:剔除某个观测后引起的参数估计值的变化,对最终模型的每个协变量都生成一个新变量用于保存,自动生成变量名前缀为“dfb”。


➢   X*Beta:保存线性预测的得分,由中心化协变量与估计参数相乘后再求和所得,自动生成变量名前缀 为“xbe”。


(5)单击按钮,弹出“Cox回归:选项”对话框,如下图所示,各项含义如下。


6.png


●    模型统计:此栏用于设置模型统计量。


➢   CI用于exp:表示exp的置信区间,默认为95% ,用户可根据需要更改为90% 、99%等。


➢   估计值的相关性:表示系数估计值的相关矩阵。


➢   显示模型信息:指对当前模型显示对数似然统计量、似然比统计量和总体卡方值。对模型中的变量,显示参数估计值及其标准误,Wald统计量。此处给出两种输出方式,分别为在每个步骤中和在最后一个步骤中。


✧   在每个步骤中:指逐步回归的每一步都输出相关的统计量。


✧   在最后一个步骤中:指只在逐步回归的最后一步输出相关的统计信息。


●    步进概率:此栏用于指定协变量进入或剔除模型的临界概率, 如果选择了逐步回归法,则需要对此栏进行设置。在进入输入框指定变量进入模型的临界值,默认为0.05;在删除输入框指定变量移出模型的临界值,默认为0.10。


●    最大迭代次数:为模型指定最大迭代次数。在后面的输入框指定最大的迭代次数,默认为20。


●    显示基线函数:生成基准危险函数、协变量均值生存函数和危险函数表。若指定了时间相依协变量,不能激活该项。


二、Cox回归模型的SPSS实现


实例三:“data15-03.sav”数据文件为63例病人的生存时间、结局及影响因素的数据,如下图所示。现要求利用Cox回归模型进行预后分析(数据来源于《医学统计》,孙振球主编,人民卫生出版社,北京:2002年第1版)。


数据文件:数据文件\Chapter15\data15-03.sav

视频文件:视频文件\Chapter15\Cox回归模型.avi


(1)打开“data15-03.sav”数据文件,选择“分析” →“生存函数” →“Cox回归” ,弹出“Cox回归”对话框。


(2)选中“生存时间”变量,单击按钮,将其作为时间变量选入“ 时间”选框中。


(3)选中“病人结局”变量,单击按钮,将其作为状态变量选入“状态”选框中。


(4)单击定义事件日。   按钮,弹出“为状态变量定义事件”对话框,在单值后面的输入框中输入0 。单击按钮返回主对话框。


(5)选中“年龄” 、“性别” 、“组织学类型” 、“ 治疗方法” 、“淋巴结是否转移” 、“肿瘤的浸润程度”变量,单击按钮,将其作为协变量选入“协变量”选框中,并在方法下拉列表中选择“ 向后:Wald项”。


(6)单击按钮,弹出“分类”对话框。选择“组织学类型” 、“淋巴结是否转移” 、“ 治疗方法” 、“肿瘤的浸润程度”变量进入分类协变量框中。选中这三个变量,将对比方式均设为“指示灯” ,其中“组织学类型”变量的参考类别为“第一个” ,其他两个分类协变量的参考类别均为“最后一个” 。单击按钮返回主对话框。


(7)单击按钮,弹出“ 图”对话框,勾选“生存函数” 、“风险函数” 复选框;并选中协变量列表中的“ 治疗方法”变量,单击按钮,将其选入“单线”选框。单击按钮返回主对话框。


(8)单击按钮,弹出“选项”对话框。勾选“CI用于exp”和“估计值的相关性” 复选框;单击选中“在每个步骤中” 。 单击按钮返回主对话框。


(9)完成所有设置,单击按钮执行命令。


三、Cox回归模型的结果分析


下表是对数据处理的说明。从表中可以看出,个案总数为63 ,用于分析的个案数为26 ,被检剔的个案数为37 ,带有缺失值和负时间的个案数为0 ,在层中发生最早事件前检剔的个案数为0 。删除记录不会用于计算回归系数,但要用于计算基准危险率。


7.png


下表给出了对分类变量自动编码的结果,它有助于解释分类协变量的回归系数。由(1)列可以看出,取值为0的表示参考类别。默认情况下,参考类别为分类变量取值的最后一个类别。但本例中在参数设置时,将组织学类型的参考类别选为第一个,所以,该变量的第一分类是参考类别,即在原始数据中的取值为0的低分化这一类。


8.png


下表是向后-Wald法的系数检验结果,包括每一步对系数检验的对数似然比值、总体分数的发卡检验、从前一步到本步变化量的卡方检验。如果删除一个变量后的卡方更改量的显著性大于0.05 ,则去除此变量是合理的,例如本例中“更改自上一步”列中第2 、3 、4 、5步的显著性 均大于0.05 ,由此可知在第2 、3 、4 、5步分别剔除组织性类型、年龄、 性别、肿瘤的浸润程度都是合理的;反之,如果加入一个变量后卡方更改量的显著性小于0.05 ,则加入此变量是合理的。


9.png


下表是向后逐步回归法(向后:Wald)的系数检验结果,即使用每一步向后剔除拟合的统计量和Wald检验。由表可知,步骤1是全部指定的协变量进入模型,但Wald检验说明在这一步骤中几乎没有变量对模型贡献显著;步骤5是经过一步步剔除对模型没有统计意义的协变

量,最后剩下治疗方法、淋巴结是否转移,从Wald检验说明这两个变量对模型贡献显著。


10.png


Exp(B)列表示变量相对于参考类别的危险率。在步骤5中,治疗方法变量的相对危险率为0.172 ,由此可知治疗方法变量相对于参考类别(值标签取值为1 ,即传统方法)来说,危险率仅为参照变量的0.172 倍;同理,淋巴结是否转移变量的相对危险率为0.394 ,表明其仅为参   考类别(值标签取值为1 ,即淋巴结转移)的0.394倍。所以,可得出结论:新治疗方法和淋巴结未转移能延长病人的生存时间。



下表为拟合结束时,未进入模型的变量统计量。统计结果Sig都大于0.05 ,表明对模型无统计意义的变量都没有进入模型。


11.png

12.png


下表中可以看出,两个变量之间的相关系数均不大,说明进入模型的变量之间基本相互独立,共线性问题不明显。


13.png


下表给出了每个预测变量的均值,以及在设置中所指定的作图协变量的各个模式。本例采用的是治疗方法变量作为作图协变量,其他变量的描述均统一显示为同行的均值。


14.png


下图是“协变量平均值处的生存函数” ,其是各协变量取均值时的累计生存函数图,即“协变量平均值和模式值” 。


15.png


下图是“模式1-2的生存函数” ,其是按治疗方法分组后的累计生存函数图,由图可知,新方法的生存函数曲线较高,而传统方法的生存函数曲线偏低。


16.png


下图是各协变量取均值时的累计危险函数图,即“协变量平均值和模式值” 。


17.png


下图是按治疗方法分组后的累计危险函数图。


18.png



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757