数据分析网

4.6 、SPSS距离分析—零基础入门教程

微信扫码观看完整版SPSS视频课程、分析师在线答疑解惑哦~

SPSS教程 (1).png

【课程摘要】

SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,其中偏相关分析是其重要的功能之一。偏相关分析是一种用于衡量两个变量之间关系强度和方向的统计方法,同时控制其他变量的影响。SPSS提供了简单易用的界面和工具,使得偏相关分析的计算和解释更加方便和高效。通过SPSS的偏相关分析功能,我们可以计算和分析两个变量之间的关系,同时控制其他变量的影响,从而更准确地评估两个变量之间的关联程度。偏相关分析可以帮助我们确定两个变量之间的关系是否仍然存在,即使在其他变量的影响下。通过SPSS的偏相关分析功能,我们可以进行准确的统计推断,为科学研究和决策提供可靠的依据。
【详细教程】

SPSS距离分析


一、参数设置


(1)选择“分析” →“相关” →“距离” ,弹出“距离”对话框,如下图所示,各项含义如下。


1.png


●    变量列表:将左侧的源变量列表中的变量选入其中。


●    标注个案列表:将左侧的源变量列表中的变量选入其中。


●    计算距离。


➢   个案间:计算每对个案间的距离,同时还可以将一个字符串类型的变量选入“标注个案” 的矩形框中。


➢   变量间:计算每对变量之间的距离。


●    测量选项框。


➢   非相似性:计算不相似性矩阵,系统默认。


➢   相似性:计算相似性矩阵。


(2)在“测量”选项框中选择“非相似性”测量类型后,系统默认的计算方法会在按钮的右侧显示,单击按钮,在弹出如下图所示的“非相似性”对话框中可以进一步选择计算方法,各项含义如下。


2.png


●    测量栏。


➢   区间:对连续变量选项的统计量有Euclidean距离、平方Euclidean距离、切比雪夫、块、Minkowski距离和定制,系统默认的是Euclidean距离。


✧   Euclidean距离:欧式距离,是两变量或观测值之差的平方和平方根。


✧   平方Euclidean距离:欧式距离平方,是两变量或观测值之差的平方和。


✧   切比雪夫:两项取值之差的最大绝对值。


✧   块:两项取值之差的绝对值之和。


✧   Minkowski距离:两项之间的距离是各变量值之差的p次幂的绝对值之和的p次方根,选择此项,在幂下拉列表中指定p值。


✧   定制:两项之间的距离是各变量值之差的p次幂的绝对值之和的r次方根,选择此项,在幂和根下拉列表中指定p和r 的值。


➢   计数:对于计数数据的统计量有卡方度量和Phi平方度量。


✧   卡方度量:用卡方值来测度不相似性,是假设两组的频数相等的卡方检验,系统默认。


✧   Phi平方度量:考虑样本的大小,用来减少观测频   数对实际预测频数的影响,等于由组合频率的平方根标准化的卡方测量。


➢   二分类:对于二分类数据的统计量Euclidean距离、平方Euclidean距离、大小差值、模式差值、方差、形状、Lance和Williams。


下表为四格表,表示的是在二分类数据中两个特性发生与不发生的四种组合。


3.png


✧   Euclidean距离:二值欧式距离,根据四格表计算 , b, c表示的是一个特性发生,另一个特性不发生的对角线单元格,最小值为0 ,无上限。


✧   平方Euclidean距离:二值欧式距离平方,根据四格表计算(b +c ),用来计算非协调的个案的数目。 最小值为0 ,无上限。


✧   大小差值:不对称指数,取值范围0-1。


✧   模式差值:用于二分类数据的不相似性测度,取值范围0-1 ,根据四格表计算bc/n 2, n是观测量总数。


✧   方差:变异指标,根据四格表计算(b   +c)/4n   , 取值范围0-1。


✧   形状:对不匹配项的非对称性进行惩罚,取值范围0-1。


✧   Lance和Williams:根据四格表计算(b   +c   )/(2a +b   +c   ),其中a表示两个特性都出现的单元格, 取值范围为0到1。


●    转换值:可以对个案和变量进行标准化。


➢   标准化:可以再后面的选项框中选择标准化的方法,有 无、Z分数等,对二分类数据不能进行标准化,选择标 准化的方法后,需指定是“按照变量”或“按照个案”进行标准化。


●    转换测量:计算距离完成后,对结果进行转换,有以下3种方法:


➢   绝对值:对距离取绝对值。


➢   更改符号:即把不相似性测度转换成相似性测度,把相似性测度转换成不相似性测度。


➢   重新标度到0-1全距:即距离都减去最小值,再除以差值(最大值减最小值)来使距离标准化。


(3)若在“测量”选项框中选择“相似性”测量类型,单击按钮,会弹出的“相似性”对话框,如下图所示,各项含义如下。


4.png


●    测量栏。


➢   区间:对连续变量选项的统计量有pearson相关性和余弦,系统默认的是pearson相关性。


✧   pearson相关性:取值范围-1~1 ,取0表示无线性相关,系统默认。


✧   余弦:用两个向量之间的余弦值来度量相似性,范围为-1~1 ,取0表示不相关。


➢   二分类:对于二分类数据的统计量Russell   and   Rao等多种计算方法。在选择一种计算方法后,需指定存在和不存在时的变量值,系统默认的是存在时,值为1 ,不存在时值为0。


✧   Russell和Rao:二项内积法,对匹配与不匹配对都给予相等的权重,系统默认。


✧   简单匹配:匹配数与总数的比值,对匹配与不匹配对都给予相等的权重。


✧   Jaccard:相似性比例指数,不考虑联合缺失项,对匹配与不匹配对都给予相等的权重。


✧   Dice:剔除联合缺失项,给予匹配对双倍权重。


✧   Rogers和Tanimoto:一个给不匹配对双倍权重的指数。


✧   Sokal和Sneath 1:一个给匹配对双倍权重的指数


✧   Sokal和Sneath       2:一个给不匹配对双倍权重的指数,不考虑联合缺失项。


✧   Sokal和Sneath   3:匹配与不匹配的比值,取值范围为0~ ∞ , 当值未定义或大于9999.999时,会指定随意值9999.999。


✧   Kulczynski   1:联合出现项与所有不匹配数的比值,取值范围为0~ ∞ , 当值未定义或大于9999.999时,会指定随意值9999.999。


✧   Kulczynski     2:根据某个特性在一项中出现,该特性在其他项中出现的条件概率。将充当另一个项的预测变量的各个项的各个值进行平均,以计算此值。


✧   Sokal和Sneath   4:某特性出现(不出现)在另一项中的条件概率。将充当另一个项的预测变量各个项的各个值进行平均,以计算此值。


✧   Hamann:匹配数减去不匹配数,再除以总项数,取值范围为-1~1。


✧   Lambda :通过使用一个项来预测另一个项,从而与误差降低比例相对应。值范围为0到1。


✧   Anderberg's D:类似与Lambda ,取值范围为0~1。


✧   Yule's Y:是2×2表交叉比的函数,且与边际总和无关,取值范围为-1~1。


✧   Yule's   Q:是Goodman和Kruskal   γ的特殊事件,是 一个交比函数,独立于边际总计,取值范围为-1~1。


✧   Ochiai:余弦相似性测度的二元形式,取值范围为0 ~1。


✧   Sokal和Sneath   5:表示正负匹配的条件概率的几何平均数的平方,取值范围为-1~1。


✧   Phi     4点相关:Pearson相关系数的二元形式,取值范围为-1~1。


✧   离散:一个相似性指数,取值范围为-1~1。


●    转换值和转换测量含义同非相似性测量一样。


二、距离分析的SPSS实现


1 .个案间的距离分析


实例二:“data08-02.sav”数据文件是5个学生百米成绩、跳远成绩和实心球成绩,如下图所示。现要求利用距离分析来分析学生体育成绩之间的相关性。


5.png


数据文件:数据文件\Chapter08\data08-02.sav

视频文件:视频文件\Chapter08\距离分析.avi


●    个案间的非相似性测量。


(1)打开“data08-02.sav”数据文件,选择“分析” →“相关” →“距离” ,弹出的“距离”对话框,在左侧的变量列表中选中“ 百米 成绩” 、“跳远成绩”和“ 实心球成绩”三个变量,单击按钮,将其选入“变量列表” ,将“编号”变量选入“标注个案”列表。在“计算距离”栏中勾选“个案间” ,“测量”栏中选择“非相似性” ,单击按钮,弹出的“距离:非相似性测量”对话框,在“测量”栏中选择默认的Euclidean距离,因为变量间的单位不同,所以要对变量进行标准化,在“转换值”栏中选择“按照个案” ,在下拉列表中选择Z分数。


(2)完成所有设置后,单击腿按钮执行命令。


●    个案间的相似性测量。


(1)打开“data08-02.sav”数据文件,选择“分析” →“相关” →“距离” ,弹出的“距离”对话框,在左侧的变量列表中选中“ 百米成绩” 、“跳远成绩”和“ 实心球成绩”三个变量,单击   按钮,将其选 入“变量列表” ,将“编号”变量选入“标注个案”列表。在“计算距离”栏中勾选“个案间” ,“测量”栏中选择“相似性” ,单击按钮,弹出的“距离:相似性测量”对话框,在“测量”栏中选择默认的   pearson相关性,因为变量间的单位不同,所以要对变量进行标准化, 在“转换值”栏中选择“按照个案” ,在下拉列表中选择Z分数。


(2)完成所有设置后,单击腿按钮执行命令。


2 .变量间的距离分析


实例二:“data08-03.sav”数据文件是分别用三种仪器测试了一批树的高度,如下图所示。现要求利用距离分析来分析三种仪器之间的相关性。


6.png


数据文件:数据文件\Chapter08\data08-03.sav

视频文件:视频文件\Chapter08\距离分析.avi


●    变量间的非相似性测量。


(1)打开“data08-03.sav”数据文件,选择“分析” →“相关” →“距 离” ,弹出的“距离”对话框。


(2)在左侧的变量列表中选中“第一次” 、“第二次”和“第三次”三个变量,单击按钮,将其选入“变量列表” 。在“计算距离”栏中勾选“变量间” ,“测量”栏中选择“非相似性”。


(3)单击按钮,弹出的“距离:非相似性测 量”对话框,在“测量”栏中选择默认的Euclidean距离。


(4)完成所有设置后,单击腿按钮执行命令。


●    变量间的相似性测量。


(1)打开“data08-03.sav”数据文件,选择“分析” →“相关” →“距离” ,弹出的“距离”对话框。


(2)在左侧的变量列表中选中“第一次” 、“第二次”和“第三次”三个变量,单击按钮,将其选入“变量列表” 。在“计算距离”栏中勾选“变量间” ,“测量”栏中选择“相似性”。


(3)单击按钮,弹出的“距离:相似性测量”对话框,在“测量”栏中选择默认的pearson相关性。


(4)完成所有设置后,单击腿按钮执行命令。


三、距离分析的结果分析


1 .个案间距离分析的结果


从下表可以看出,个案数全部有效,无缺失值。


7.png


从下表可以看出,非相似性矩阵形式给出了两两个案之间的Euclidean距离,非相似性测度值越大说明不相似性越强;


8.png


从下表可以   看出相似性矩阵形式给出了两两个案之间的pearson相关性系数,相似性系数值越大说明相似性越强。


9.png


结合上表可以看出编号为1和2的两个同学的体育成绩最相似,其Euclidean距离最小,为0.066 ,但是其相关系数最大,为0.999;编号为1和5的两个同学的体育成绩最不相似,其Euclidean距离最大,为0.546 ,但是其相关系数最小,为0.926。


2 .变量间距离分析的结果


从下表可以看出,数据全部有效,无缺失值。


10.png


从下表可以看出,非相似性矩阵形式给出了两两变量之间的Euclidean距离,非相似性测度值越大说明不相似性越强;


11.png


从下表可以 看出相似性矩阵形式给出了两两个案之间的pearson相关性系数,相似性系数值越大说明相似性越强。


12.png


结合上表可以看出第一次和第三次两种仪器测的数据最相似,其Euclidean距离最小,为0.520 ,但是其相关系数最大,为0.999。



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757