数据分析网

7.6、SPSS多元对应分析—零基础入门教程

微信扫码观看完整版SPSS视频课程、分析师在线答疑解惑哦~

SPSS教程 (1).png

【课程摘要】

SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,其中多元对应分析(Multiple Correspondence Analysis,简称MCA)是其重要的功能之一。多元对应分析是对应分析的扩展,适用于多个分类变量之间的关系分析。其基本原理是将多个分类变量映射到低维空间中,以便更好地理解和解释数据之间的关系。SPSS的多元对应分析功能可以帮助研究人员在多个分类变量之间发现相关性和关联性,并将其可视化为二维或三维图形。通过多元对应分析,我们可以发现多个分类变量之间的关联性、群组之间的差异以及变量之间的相似性。通过SPSS的多元对应分析功能,我们可以进行多元对应分析的计算、图形展示和结果解释,以便更好地理解和应用多元对应分析的结果。
【详细教程】

SPSS多元对应分析


一、多元对应分析的基本概念和特点


对多个定性变量的研究,其计算方法和计算结果与两个变量时的情况具有一定的相似性。但多元对应分析比简单对应分析要更进一步,主要表现在:可以同时分析多个分类变量之间的关系,并同样用图形方式表示出来;能够处理的变量种类更加丰富,例如可以对无序多分类变量、有序多分类变量和连续型变量同时进行分析;最优尺度分析还对多选题的分析提供了支持。


但是,SPSS的最优尺度分析过程不像多元回归过程一样能够自动筛选变量,因此变量较多时容易使图形显得混乱,可能会掩盖掉真实的 变量联系。此时,需要用户根据经验和分析结果进行耐心的筛选,以得到最优结果,这对用户的分析水平是一个严峻的考验。


需要注意:多元对应分析过程要求把字符串变量按照字母顺序转换为正整数;用户和系统定义的缺失值,以及小于1的取值都会被当作缺失值对待;数据集必须含有至少3个观测;所有分析变量都需为多分类的名义变量。


二、参数设置


(1)打开数据文件,单击“分析” →“ 降维” →“最优刻度” ,弹出“最佳刻度”对话框,如下图所示。


1.png


●    最佳度量水平:该栏用于设置变量的度量类型。


➢   所有变量均为多重标称:当所有变量均为无序多分类(名义变量)时,选择该项。


➢   某些变量并非多重标称:当有的变量是单分类的名义变量、有序分类变量或者离散的数值型变量,选择该项。


●    变量集的数目:该栏用于设置变量集的个数。


➢   一个集合:表示只分析一组变量间的关系。


➢   多个集合:表示分析数据集中存在多选题变量集,即分析有多个变量是同一道多选题的不同答案。


●    选定分析:该栏是不可编辑的,是用于显示当前选项所使用的分析方法。


➢   多重对应分析:当选择“所有变量均为多重标称”和“一个集合” 时,多元对应分析使用该方法。其用于分析多个无序分类变量间的关系,并使用散点图表示出来,分析过程与简单对应分析非常相似,但分析的变量可以为多个。


➢   分类主要成分:当选择“某些变量并非多重标称”和“一 个集合” 时,多元对应分析使用该方法。其使用尽量少的主成分来解释尽可能多的原始信息。它就是市场研究中非常重要的多维偏好分析。


➢   非线性典型相关性:当选择“ 多个集合” 时,多元对应分析使用该方法。其用于分析两个或多个变量集之间的关系,允许变量为任何类型:无序分类、有序分类或连续变量。


(2)单击按钮,弹出“ 多重对应分析”对话框,如下图所示,各项含义如下。


2.png


●    分析变量:用于选择待分析的变量。变量名的显示格式为“name(n )ℽ , 其中name为变量名,n为其当前权重;权重的确定方法:选中“分析变量”栏中的变量,单击定义变量权重也)。 按钮,弹出“MCA:定义变量权重”对话框,如下图所示,在变量权重后面的输入框输入权重值即可,默认值为1。


3.png


●    补充变量:其不用于分析,只用于结果对比和描述。


●    标记变量:用于在结果里标识各个记录。


●    解的维数:用于描述分析结果的低维空间维数,默认值为2。


(3)单击按钮,弹出“MCA:分箱化”对话框,如下图所示,各项含义如下。


4.png


●    变量:该列表显示变量的格式为“name(f)ℽ , 其中name为变量名,f为其当前的离散化方法。


●    方法:其后面的下拉菜单中有如下4个选项。


➢   未指定:指不进行离散化操作。


➢   分组:将取值重新编码为固定个数或者固定间隔的类别。选中后,分组栏的设置项变为可编辑的,在类别数后指定分类的个数,同时指定变量的分布情况是正态分布还是均匀分布;或者,在同等间隔后指定自动分类的间隔大小。


➢   等级:将变量取值排序后,取其秩进行分类。


➢   乘:将当前取值标准化后,乘以10再取整,最后加上一个常数,使得离散化后的最小值为1。


(4)单击按钮,弹出“MCA:缺失值”对话框,如下图所示,各项含义如下。


5.png



●    分析变量和补充变量:这两个列表分别显示了当前选入的分析变量和补充变量。变量的显示格式为“name(f)ℽ , 其中name为变量名,f为其当前的缺失值处理方法。


●    方案:该栏提供了如下3种缺失值处理方法。


➢   排除缺失值;量化后为相关性插补:指排除含缺失值的变量,是被动处理方式。所选变量含缺失值的观测对此变量的分析不作贡献;如果所有变量都采用此方法,则这些变量取值都为缺失的观测,并将被作为增补对象处理。如果输出相关矩阵,则分析后缺失值的替换方式有 两种,众数表示用类别取值的众数来取代缺失值,如果存在多个众数,取类指示最小的那个;附加类别表示用1个额外的分类值取代所有缺失值


➢   插补缺失值:是替换缺失值,是主动处理方式。


➢   排除此变量具有缺失值的对象:指排除分析变量含缺失值的观测,此法对补充变量无效。


(5)单击按钮,弹出“MCA:选项”对话框,如下图所示,各项含义如下。



6.png


●    补充对象:此栏用于设置补充观测在数据集里的记录号(行号)。有个案全距和单个个案两个方式。


➢   个案全距:选中该项,在第一个、最后一个分别指定第一个记录号和最后一个记录号,然后单击 按钮将其加入下面的补充列表。


➢   单个个案:选中该项,在其后面的输入框指定特定的记录号,然后单击按钮将其加入下面的补充列表。


●    标准化方法:该栏中的下拉列表用来选择变量或观测得分的正态方法。一个分析过程只能指定一个正态化方法,有5个可选项。


➢   主要变量:相当于简单对应分析的主要列方法。


➢   主要对象:相当于简单对应分析的主要行方法。


➢   对称:相当于简单对应分析的对称方法。


➢   自变量:相当于简单对应分析的主要方法。


➢   定制:相当于简单对应分析的定制方法。


●    标准:此栏用于设置模型的拟合标准。


➢   收敛性:该项用于指定收敛的临界值,若循环求解的最后两个模型的拟合优度之差小于设置的收敛值,则停止循环。默认值为0.00001。


➢   最大迭代:该项用于指定最大循环次数。默认值为100。


●    标注图:用于设置输出图形的显示方式。


➢   变量标签或值标签:选中该项,则显示变量标签或变量值。其下面的标签长度的限制用于指定变量标签的最大长度。


➢   变量名称或值:选中该项,则显示变量名或变量值。


●    图维数:此栏用于设置输出图形的维数,其设置方法与简单对应分析的图维数设置方法一样,参见下图。


●    配置:此栏用于设置从一个文件读入坐标的结构信息,单击按钮选择文件。文件的第一个变量,对应于当前分析中第一维的坐标;文件中的第二个变量,对应于当前分析中第二维的坐标,依次类推。下拉菜单用于指定文件里的坐标所对应的观测的起始位置,选项内容如下:


➢   无:表示不读入坐标信息,选中该项时,又件日。按钮不可用。


➢   初始值:表示对应于分析中的起始观测。


➢   固定:表示文件中的坐标信息将用来装配当前的分析变量,它们被当作补充变量处理。


(6)单击输出①…   按钮,弹出“MCA:输出”对话框,如下图所示,其用于设置多元对应分析的输出内容,各项含义如下。


7.png


●    表:此栏用于选择输出哪些表格,有如下5个选项。


➢   对象得分:包括质量、收敛标准、坐标等信息。选中后,右下角的“对象得分选项”栏变为可选状态,其中的“包括类别”列表中的分析变量,将在结果表里显示它们的类别信息;“标注对象得分”用于指定标识对象得分的标签变量。


➢   区分测量:输出每个变量、每个维度的判别度量方式。


➢   迭代历史记录:输出迭代过程中方差的变化过程。


➢   原始变量的相关性:输出初始变量取值的相关系数矩阵及其特征值。


➢   转换变量的相关性:输出变换后变量的相关系数矩阵及其特征值。


●    类别量及分摊:是量化变量列表,对其每一个维度输出类别量化的信息包括质量、标准和坐标。


●    描述统计:输出变量的频数、缺失值个数、众数等基本统计信息。


(7)单击保存心…按钮,弹出“MCA:保存”对话框,如下图所示,用于设置多元对应分析的保存选项,各项含义如下。


8.png


●    离散化数据:此栏用于设置保存离散化数据的选项。


➢   创建离散化数据:表示建立一个新的数据集来保存指定数据,在数据集名称后输入数据集的名称。


➢   写入新数据文件:表示建立一个新的文件来保存指定数据,单击按钮选择文件。


●    对象得分:此栏用于设置保存对象得分数据的选项。


➢   将对象得分保存到活动数据集:把指定数据存至当前数据集。选中后激活底部的多标定尺寸,其用于设置待保存数据的维度,有两个选项:全部单选框表示保存所有维度,第一个输入框指定待保存的最大维度。


➢   创建离散化数据与写入新数据文件:与“离散化数据”栏中的设置一样。


●    已转换的变量:此栏用于设置保存变量变换数据的选项。其中的各项设置同“对象得分” 中的设置相同。


(8)单击对象但按钮,弹出“MCA:对象图”对话框,如下图所示,用于设置对象作图的参数,各项含义如下。


9.png


●    图:此栏用于设置作图的类别。


➢   对象点:只对对象点作图。


➢   对象和质心(双标图):对对象点及其中心点作图。


●    双标图变量:此栏用于设置作行、列联合分数图的变量。


➢   所有变量:表示使用全部变量。


➢   选定变量:选中该项,激活右侧的两个列表,此时把需要的变量从“可用”列表选入“选定” 列表。


●    标签对象:此栏用于设置标识对象的标签变量。


➢   个案号:指以行号作为标签。


➢   变量:选中该项,激活右侧的两个列表,此时把标签变量从“可用”列表选入“选定” 列表,可以同时选入多个。


(9)单击变量但按钮,弹出“MCA:变量图”对话框,如下图所示,用于设置变量作图的参数,各项含义如下。


10.png


●    类别图:对选入的每个变量作一个图形,显示其各类别的中心值。


●    联合类别图:在一个图形中显示所有选入变量各类别的中心值。


●    转换图:对选入变量作最优量化值对类别指示变量的图形。在维数输入框中指定作图的维数,对每一个维数输出一个图形。选中“包含残差图” 复选框表示对每个选入的变量输出残差图。


●    区分测量:选中“ 显示图” 复选框后激活后面的选项,为指定变量输出区分度量(就是量化后变量在各维度上的方差)的图形,指定变量的方式有以下两种。


➢   使用所有变量:表示使用全部变量。


➢   使用选定变量:选中该项后,激活下面的方框,把需要使用的变量从左侧的变量列表选入其中即可。


三、多元对应分析的SPSS实现


实例二:本节仍采用如下图所示的“data13-01.sav”数据文件。现要求利用多元对应分析方法分析各位投票人的爱好、性别和成绩与各位投票人的投票倾向的关系。


11.png12.png13.png


数据文件:数据文件\Chapter13\data13-01.sav

视频文件:视频文件\Chapter13\多元对应分析.avi


(1)打开“data13-01.sav”数据文件,选择“分析” →“ 降维” →“最优刻度” ,弹出的“最佳刻度”对话框。选中“所有变量均为多重标称”和“一个集合”。


(2)单击按钮,弹出“ 多重对应分析”对话框。


(3)在“变量”列表中选中“候选人” 、“投票人性别” 、“投票人爱好”和“投票人成绩”这4个变量,单击按钮将其选入“分析变量”选框中。


(4)此时激活 按钮,选中“候选人”变量,单击它,弹出“ 定义变量权重”对话框,保持默认值“ 1” ;其他三个   变量采用同样的方法设置权重。单击按钮返回主对话框。


(5)单击输出①…按钮,弹出“输出”对话框。


(6)在“ 定量变量”列表中选中“候选人”变量,单击按钮将其选入“类别量及分摊”列表中;在“ 定量变量” 列表中选中“投票人性别”变量,单击按钮将其选入“描述统计”列表中。单击按钮返回主对话框。


(7)单击变量但按钮,弹出“变量图”对话框。


(8)选中“候选人”变量,单击 按钮将其选入“类别图” 列表中; 选中“投票人性别” 、“投票人爱好”和“投票人成绩”变量,单击 按钮将 其选入“联合类别图”列表中。单击按钮返回主对话框。


(9)其他选项采用默认值。


(10)完成所有设置后,单击按钮执行命令。


四、多元对应分析的结果分析


下表是SPSS对应分析模块的版权信息。


14.png


下表罗列了原始数据的基本使用情况。


15.png


下表给出了性别变量的编码和统计信息。


16.png


下表给出了最后一次迭代的次数、方差、方差增量等信息。表格下方显示了迭代终止的原因。


17.png


下图是“候选人”变量的类别点图。从这样的单个图形可以判断把该变量映射至二维空间后,其各个类别取值的区分程度,其他变量的图形与此类似。


18.png


下图是所有变量的类别点联合图形,其是把四个分析变量的类   别点中心坐标,在一个图形中加以显示的效果,此图形与上图所示   的简单对应分析的二维分析图类似,它根据图形中各点的邻近关系进行分类,只是多了几个变量的信息。


19.png


下图是所有变量的区分度量图形,其相当于变量量化后的值向   量与对象得分维度向量的平方相关系数,反应了维度得分与量化后变量 值的相关性大小。由此可以判断重点变量在与其相关性较大的维度上的 特征,在这个维度上的类别点一般会分得更开。从图中可以看出:投票人爱好在维度1上的值受较大关注;投票人成绩在两个维度上都需要关注;投票人性别在维度2上的值受较大关注。各个变量的区分度量在两个维度上都有较大的关注,故可知各个变量的权重值设为1较合理,不需更改权重再作分析。


20.png


综上可知:爱好运动和阅读、70~80分的同学对李运和于敏比较青睐;90分以上的同学更喜欢于敏;60~70分的同学更喜欢李运;爱好歌舞和乐器、80~90分的同学更喜欢赵峰;从性别上看,女生更喜欢李运和赵峰,男生更喜欢于敏。若出现某个变量的区分度量在两个维度上都较小,可以考虑增大该变量的权重后再作分析。



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757