数据分析网

6.2、SPSS多元Logistic回归—零基础入门教程

微信扫码观看完整版SPSS视频课程、分析师在线答疑解惑哦~

SPSS教程 (1).png

【课程摘要】

SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,其中多元Logistic回归是其重要的功能之一。多元Logistic回归是一种用于建立和分析多分类变量之间关系的统计方法。SPSS提供了简单易用的界面和工具,使得多元Logistic回归的计算和解释更加方便和高效。通过SPSS的多元Logistic回归功能,我们可以建立一个或多个自变量与一个多分类因变量之间的关系模型,并进行参数估计和显著性检验。多元Logistic回归可以帮助我们预测多分类因变量的概率,并了解自变量对因变量的影响程度和方向。通过SPSS的多元Logistic回归功能,我们可以进行准确的统计推断,为科学研究和决策提供可靠的依据。
【详细教程】

SPSS多元Logistic回归


一、多元Logistic回归原理


在现实生活中,因变量除了前面介绍的二元变量,还有很多的多元变量,比如多种类型的商品,厂家为了提高商品的销售量,就希望预测 顾客们喜欢何种类型的商品,可以通过年龄、性别、薪水以及社会活动 等通过多元Logistic回归分析来确定对选择不同的商品类型的影响程度,从而有侧重点地多提供一些类型的商品。多元Logistic回归分析其实就是用多个二元Logistic 回归分析模型来描述各个类别与参考类别相 比较时的作用大小。


设因变量有k个水平,可以对其中的k-1个水平各做一个回归方程,每个水平的因变量的概率值取值范围为0~1 。当自变量是连续变量或计数变量,就可以用Logistic回归方法对因变量的概率值建立回归方程。


1 .Logistic 回归模型


1.png


对于因变量共有k个水平,则在第j个水平的Logistic回归模型为


2.png


这样对于每一个建立的Logistic 回归模型都有一组参数,如因变量具有3个水平,则会获得2组非零参数。


2 .模型检验


(1)拟合检验,Pearson卡方统计量是用于检验多维表中观测频数与预测频数之间的差异。定义为 , Pearson卡方统计量值越大,说明拟合效果越不好。其次,卡方偏差也可以用来检测模型拟合度,如果模型拟合优度好,则对数似然比的差值就小,显著性水平值越大,在大样本的情况下卡方偏差与Pearson卡方统计量值很接近。


(2)伪R2统计量,其中包括Cox&Snell 、Nagelkerke   R2和McFadden   R2统计量,McFadden   R2统计量,定义为



3.png


式中l(0)是仅包含截距模型的对数似然比的核,l(B)是模型中对数似然比的核。


二、参数设置


(1)打开数据文件,选择“分析” →“ 回归” →“ 多项Logistic” ,弹出“ 多项Logistic回归”对话框,如下图所示,各项含义如下。


4.png


●    因变量列表:将左侧的变量列表中的一个分类变量选入其中。


●    因子列表:将左侧的变量列表中的一个或多个分组变量选入其 中。


●    协变量列表:将左侧的变量列表中的一个或多个连续变量选入 其中。


(2)单击按钮,弹出“ 多项Logistic 回归:参考类别”对话框,如下图所示,各项含义如下。


5.png


●    参考类别。


➢   第一类别:将第一类作为参考类。


➢   最后类别:将最后一类作为参考类。


➢   定制:由用户设置除第一和最后类别的其他参考类。


●    类别顺序。


➢   升序:将分类变量中值最小的类设置为第一类,值最大的设置为最后一类。


➢   降序:将分类变量中值最大的类设置为第一类,值最小的设置为最后一类。


(3)单击按钮,弹出“ 多项Logistic回归:模型”对话框,如下图所示,各项含义如下。


6.png


●    个案处理摘要:输出分类变量综合信息。


●    模型


➢   伪R方:输出Cox&Snell 、Nagelkerke   R2和McFadden R2统计量。


➢   步骤摘要:如果模型选择了逐步方法,则输出每一步变量进入或剔除出模型时的效应表。


➢   模型拟合度信息:输出模型拟合度信息和只包含截距项的模型信息。


➢   信息标准:逐步回归的判别准则。


➢   单元格可能性:输出观测频数和期望频数表、协变量比率和响应分类。


➢   分类表:输出观察响应和预测响应的表。


➢   拟合度:输出Pearson卡方和似然比卡方统计量。


➢   单调性测量:输出和谐对数、不和谐对数和结点数,Somers'D 、Goodman&Kruskal's   Gamma 、Kendall's   tau-a 和Concordance Index C等统计量。


●    参数


➢   估计:输出模型参数的估计值,包括估计值的置信区间。


➢   似然比检验:输出模型偏效应的似然比检验统计量。


➢   渐进相关:输出参数估计值的相关系数矩阵。


➢   渐进协方差:输出参数估计的协方差矩阵。


●    定义子群体


➢   由因子和协变量定义的协变量模式:对所有的因子和协变量进行拟合优度检验,系统默认。


➢   由下面的变量列表定义的协变量模式:在左侧的列表框中将需要进行拟合优度检验的变量选入右下角的子群体框中。


(5)单击按钮,弹出“ 多项Logostic回归:收敛性准则”对话框,如下图所示,各项含义如下。


7.png


●    迭代


➢   最大迭代:指定最大迭代数,必须是小于等于100的整数。


➢   最大步骤对分:指定最大等分值。


➢   对数似然性收敛性:在下拉列表中指定对数似然比的收敛值,回归过程中对数似然比函数的变化值大于这个值时,迭代终止,系统默认为0。


➢   参数收敛:在下拉列表中指定参数的收敛值,回归过程 中参数估计的变化值大于等于这个值时,迭代终止,系统默认为0.000001。


➢   为每一项打印迭代历史记录:设置输出迭代过程的步距,系统默认为1。


➢   从迭代中检查数据点的分离情况:设置检查迭代过程的起始值。


●    Delta:输入小于1的正数,将被添加到交叉表的单元格中,有助于稳定算法、阻止估计偏差。


●    奇异性容差:在下拉列表中指定检验奇异性的容许值,系统默认为0.00000001。


(6)单击按钮,弹出“ 多项Logostic 回归:选项”对话框, 如下图所示,各项含义如下。


8.png


●    离散度量:指定离散度量,在刻度下拉列表中有:无,不指定;用户定义,用户指定,在值后的输入框中输入数值;Pearson ,卡方统计量;偏差,最大似然比卡方统计量。


●    步进选项:设置把变量引入或剔除模型的准则。


➢   输入可能性:指定变量引入模型的检验统计量的概率临界值,值越大,越容易将变量引入模型,系统默认为0.5。


➢   输入测试:指定在逐步法中引入变量的检验方法,选项有似然比和得分。


➢   删除可能性:指定变量剔除出模型的检验统计量的概率临界值,值越小,越容易将变量剔除出模型,系统默认为0.1。


➢   删除测试:定在逐步法中剔除变量的检验方法,选项有 似然比和Wald。


➢   模型中的最小分布效果(对于后退方法):当使用向后逐步法和向后消去法时指定模型所要包含的最小项目数。


➢   模型中的最大分布效果(对于前进方法):当使用向前逐步法和向前选择法时指定模型所要包含的最大项目数。


●    分级强制条目和移除项目:选择此项,设置模型对效应项的限 制条件,有以下3个选项。


➢   为了确定等级将协变量当作因子处理:适用于协变量和因素变量。


➢   为决定分级只考虑阶乘项目;任何拥有协变量的项目可以随时输入:只对因素变量加以限制。


➢   在协变量效应内,为决定分级只考虑阶乘项目:加入协变量的高阶效应时,要求因素变量效应必须先存在模型中。


(7)单击保存心。   按钮,弹出“ 多项Logostic 回归:保存”对话框, 如下图所示,各项含义如下。


9.png


●    指定模型。


➢   主效应:模型中只包括协变量和因素变量的主效应,不包括交互效应。


➢   全因子:模型中包括所有的主效应以及它们之间可能的交互效应。


➢   定制步进式:由用户指定使用哪些主效应和交互效应选择此项,激活下面的选项。


●    因子与协变量列表:列出协变量和因素变量。


●    建立项:用来指定效应的种类,包括主效应、交互效应、所有 二阶、所有三阶、所有四阶和所有五阶。


●    强制进入项:选择强制出现在方程中的效应项进入此框。


●    步进项:选择逐步进入或剔除出模型的效应项进入此框。


●    步进法:用于设置步进项列表中的变量逐步进入模型的方法, 有向前进入、向后去除、向前步进、向后步进4种方法。


●    在模型中包含截距:要求在模型中包含截距。


(4)单击 按钮,弹出“ 多项Logistic回归:统计”对话框, 如下图所示,各项含义如下。


10.png


●    保存变量:设置要保存在数据窗口的变量。


➢   估计响应概率:估计观测量进入因变量各组的响应概率值。


➢   预测类别:保存模型预测的观测量分类。


➢   预测类别概率:预测观测量分类结果的概率


➢   实际类别概率:预测正确时的估计响应概率。


●    将模型信息输出到XML文件:单击按钮,确定保存位置和文件名。选择“包含协方差矩阵” ,表示保存协方差矩阵在上述的 XML文件中。


三、多元Logistic 回归的SPSS实现


实例五:“data09-05.sav”数据文件是一些人的关于早餐如何选择的 资料,如下图所示。现要求利用通过年龄、性别、婚姻状态、生活方 式来对首选的早餐进行多元Logistic 回归分析。


11.png


数据文件:数据文件\Chapter09\data09-05.sav

视频文件:视频文件\Chapter09\多元Logistic 回归.avi


(1)打开“data09-05.sav”数据文件,选择“分析” →“ 回归” →“ 多元 Logistic” ,弹出“ 多项Logistic 回归”对话框。


(2)在左侧的变量列表中选中“首选的早餐”变量,单击按钮, 将其选入“ 因变量列表” ,将“年龄分段” 、“性别” 、“婚姻状态” 、“生活方式”变量选入右边的因子列表。


(3)单击   按钮,弹出“ 多项Logistic回归:参考类别”对话框。


(4)在“参考类别”栏勾选“最后类别”选项,在“类别顺序”栏勾选“升序” 。单击按钮返回主对话框。


(5)单击 按钮,弹出的“ 多项Logistic回归: 统计”对话框。


(6)勾选“个案处理摘要” 复选框,在“模型”栏勾选“伪R方” 、“步骤摘要” 、“模型拟合度信息” 、“单元格可能性” 、“分类表”和“拟合度” 复选框,在“参数”栏勾选“估计”和“似然比检验” 复选框,在“ 定义子群体”栏勾选“ 由因子和协变量定义的协变量模式”选项。单击按钮返

回主对话框。


(7)单击按钮,弹出“ 多项Logostic回归: 保存”对话框。


(8)在“保存变量”栏中勾选“估计响应概率” 、“预测类别” 、“预测类别概率”和“ 实际类别概率” 复选框,并勾选“包含协方差矩阵” 复选框。单击按钮返回主对话框。


(9)按钮和按钮中设置均为SPSS的默认选项。


(10)完成所有设置后,单击腿口按钮执行命令。


四、多元Logistic回归的结果分析


从下表可以看出分类变量下各水平下的案例数和边缘百分比,以及有效个案和缺失个案的统计量。本例共有880个个案,无缺失值。


12.png


从下表可以看出最终模型和模型中仅有截距项时的似然比检验结果,可以看到显著性小于0.01 ,说明最终模型要优于仅有截距的模型,说明最终模型成立。


13.png


从下表可以看到Pearson统计量和偏差统计量,从显著性都大于0.05 ,说明不能拒绝零假设,零假设为模型能很好的拟合数据。


14.png

15.png


从下表可以看出年龄分段、婚姻状态和生活方式在最终模型中的似然比卡方检验结果。零假设是某因素变量从模型中剔除后系数没有变化。因为显著性都小于0.05 ,所以拒绝零假设,认为年龄分段、婚姻状态和生活方式对系数的影响都是显著的。


16.png


从下表可以看出各参数及其检验结果,参考类的早餐为谷类。


17.png


表中第2列(B)为系数估计,如果系数估计显著为正,说明在其他因素不变的情况下,取此因素水平的观测者,属于当前类别的概率要比属于参考类别的概率要大,如吃早餐吧这类中,年龄分段=2 ,系数估计值为1.309 ,说明年龄分段=2的人选择早餐吧要比年龄分段=4的人选择早餐吧的概率大。


表中第6列是Wald检验的显著性水平,若值小于0.05 ,即对应因素 的系数估计显著地不为0 ,即对模型的贡献具有显著意义。如早餐吧栏 中年龄分段=3的wald检验的显著性水平都大于0.05 ,说明这个因素对模型的贡献无显著意义。


表中倒数第3列Exp(B),例如早餐吧的这一栏,年龄分段=1的Exp(B)为2.675 ,说明相对于年龄分段=4而言,年龄分段=1的人选择 早餐吧的概率是年龄分段=4选择早餐吧的概率的2.675倍。


18.png19.png


从下表是根据观测值和预测值得到的,例如早餐吧的这一行,初始观测有231人选择早餐吧,经过预测有116人被分为早餐吧,正确百分比 为50.2% ,其他行同理。模型总体正确百分比为57.4% ,可见模型的正确 率还需提高。


20.png


从下表可以看出观察值和预测值的频率和百分比,以生活方式不 积极的未婚的小于31岁这一行为例,表示实际观测值为14人,预测到的 观测为14.618人,观测值和预测值的百分比分别为42.4%和44.3%。


21.png

22.png



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757