数据分析网

6.7、SPSS系统聚类—零基础入门教程

微信扫码观看完整版SPSS视频课程、分析师在线答疑解惑哦~

SPSS教程 (1).png

【课程摘要】

SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,其中系统聚类是其重要的功能之一。系统聚类是一种无监督学习方法,用于将数据集中的样本点划分为不同的群组或簇。SPSS的系统聚类功能可以根据样本点之间的相似性,通过计算距离和合并规则,逐步将样本点聚集到不同的簇中。这种聚类分析可以帮助研究人员发现数据中的隐藏模式和结构,从而更好地理解数据集的特征和关系。通过SPSS的系统聚类功能,我们可以进行聚类分析、可视化聚类结果,并对不同簇进行进一步的分析和解释。系统聚类功能为研究人员提供了一种有效的数据探索和分类方法,有助于深入挖掘数据的潜在信息。
【详细教程】

SPSS系统聚类


一、参数设置


(1)打开数据文件,选择“分析” →“分类” →“系统聚类” ,弹出“系统聚类分析”对话框,如下图所示,各项含义如下。


1.png


●    变量列表:将左侧变量列表中的一个或多个数值型变量选入其中。


●    标注个案列表:将左侧变量列表中的一个变量选入其中作为标示变量。


●    聚类栏:指定聚类分析的类型,有以下两个选项。


➢   个案:表示对观测记录进行聚类,即Q型聚类。


➢   变量:表示对变量进行聚类,即R型聚类。


●    输出:指定聚类分析输出的内容,有以下两个复选框。


➢   Statistics:输出相似矩阵、最终分类信息等。


➢   图:勾选此项,激活按钮,输出聚类过程的冰状图等。


(2)单击statistic按钮,弹出“系统聚类分析:统计”对话框,如下图所示,各项含义如下。


2.png


●    合并进程表:输出聚类过程表,包括每一步合并的类、观测量之间的距离等信息。


●    近似值矩阵:输出各项之间的相似度矩阵。


●    聚类成员栏:指定类成员表的输出格式,有以下3个选项。


➢   无:不输出类成员表,系统默认。


➢   单一方案:输出指定类数的类成员表,在聚类数后的框中输入数值,值必须大于1 ,且小于等于参与聚类的观测记录个数或变量个数。


➢   方案范围:输出聚类个数在一定范围的类成员表,在最小聚类数框中输入最小值,在最大聚类数框中输入最大值。


(3)单击 按钮,弹出“ 系统聚类分析:方法”对话框,如下图所示,各项含义如下。


3.png


●    聚类方法


➢   组之间的链接:合并两类的依据是使两两配对之间的平均距离最小,配对的两个成员分别属于不同的类。


➢   组内的链接:合并两类的依据是当两类合并为一类时,这类中所有的成员两两之间的平均距离最小。


➢   最近邻元素:首先合并最近的或最相似的两个成员,然后用两类间最近点之间的距离来代表两类之间的距离。


➢   最远邻元素:首先合并最近的或最相似的两个成员,然后用两类间最远点之间的距离来代表两类之间的距离。


➢   质心聚类:先计算各类中所有成员的均值,然后用这些均值之间的距离来计算两类之间的距离。


➢   中位数聚类:先计算两个类之间所有配对的成员之间的距离,然后以中位数为类中心,计算两个类之间的距离。


➢   Ward的方法:最小方差法,合并两类的依据是方差最小。


●    测量


➢   区间Euclidean距离、平方Euclidean距离、余弦、Pearson相关性、切比雪夫、块、Minkowski距离和定制,系统默认的是Euclidean距离。


➢   计数:对于计数数据的统计量有卡方度量和Phi平方度量。


➢   二分类:对于二分类数据的统计量平方Euclidean距离、 大小差值、模式差值、方差、形状、简单匹配和Phi 4点相关。


●    转换值:可以对个案和变量进行标准化。


➢   标准化:可以再后面的选项框中选择标准化的方法,有无、Z分数等,对二分类数据不能进行标准化,选择标准化的方法后,需指定是“按照变量”或“按照个案”进行标准化。


●    转换测量:计算距离完成后,对结果进行转换,有3种方法。


➢   绝对值:对距离取绝对值。


➢   更改符号:即把不相似性测度转换成相似性测度,把相似性测度转换成不相似性测度。


➢   重新标度到0-1全距:即距离都减去最小值,再除以差值(最大值减最小值)来使距离标准化。


(4)单击按钮,弹出“ 系统聚类分析:图”对话框,如下图所示,各项含义如下。


4.png


●    谱系图:输出树形图,用于评估所形成聚类的凝聚性,并且可以提供关于要保留的适当聚类数目的信息。


●    冰柱:输出冰柱图,包括所有聚类或指定范围内的聚类。冰柱图显示关于在分析的每次迭代时如何将个案合并到聚类的信息。


➢   所有聚类:把聚类的每一步都表现在图中,可以查看整个聚类过程,系统默认。


➢   聚类的指定全距:指定需要显示的聚类个数范围,勾选此项,需要设置以下3个参数。


✧   开始聚类:指定起始聚类步数。


✧   停止聚类:指定终止聚类步数。


✧   排序标准:指定要连续显示的两步聚类步骤之间的步数增量。


➢   无:不输出冰柱图。


●    方向:设置冰柱图的显示方向,有垂直和水平两个选项。


(5)单击按钮,弹出“ 系统聚类分析:保存”对话框,如下图所示,该对话用于设置需要保存的结果,有如下3个选项。


5.png


●    无:不保存结果,系统默认。


●    单一方案:保存指定聚类个数的分类结果,在聚类数后的框中输入数值,值必须大于1 ,且小于等于参与聚类的观测记录个数或变量个数。


●    方案范围:保存聚类个数在一定范围的分类结果,在最小聚类数框中输入最小值,在最大聚类数框中输入最大值。


二、系统聚类的SPSS实现


实例一:“data10-02.sav”数据文件是一些省市高校教职工的情况, 如下图所示。现要求利用系统聚类对各地区的高校进行聚类。


6.png


数据文件:数据文件\Chapter10\data10-02.sav

视频文件:视频文件\Chapter10\系统聚类.avi


(1)打开“data10-02.sav”数据文件,选择“分析” →“分类” →“系统聚类” ,弹出的“ 系统聚类分析”对话框。


(2)在左侧的变量列表中选中“ 正高级” 、“ 副高级” 、“ 中级” 、“初级”和“无职称” 5个数值型变量,单击按钮,将其选入“变量列表”, 将“省份”变量选入右边的标注个案列表作为标示变量。在“ 聚类栏” 中勾 选“个案”选项,在“输出栏” 中勾选“ Statistics”和“ 图” 复选框。


(3)单击按钮,弹出的“系统聚类分析:统计”对话框。


(4)勾选“合并进程表” 复选框,在“ 聚类成员”栏中选择“方案范围” :在“最小聚类数”框中输入2 ,在“最大聚类数”框中输入5 。单击按钮返回主对话框。


(5)单击按钮,弹出“系统聚类分析:方法”对话框,所有选项均选择系统默认。单击按钮返回主对话框。


(6)单击按钮,弹出“系统聚类分析:图”对话框。


(7)勾选“谱系图” 复选框,在“冰柱栏” 中勾选“所有聚类” ,在“方向”栏中勾选“垂直”选项。单击按钮返回主对话框。


(8)单击按钮,弹出“系统聚类分析:保存”对话框。


(9)在“ 聚类成员”栏中勾选“方案范围” ,在“最小聚类数”框中输入 2 ,在“最大聚类数”框中输入5 。单击按钮返回主对话框。


(10)完成所有设置后,单击腿口按钮执行命令。


三、系统聚类的结果分析


从下表可以看出,一共18个个案参与聚类,无缺失值。


7.png


从下表可以看出,整个聚类过程,表格“ 阶段”一列表示聚类的步数,以第4行为例,此步是将第2和18类合并为一类,其中第2类首次出现是在第三步(从首次出现阶段集群中的集群1中显示数字为3),而18类是首次出现(从首次出现阶段集群中的集群2中显示数字为0),所以第4步中的第2类其实包含了第2个个案和第15个个案,所以第4步是将第 2个、第15个和第18个个案归为了第2类,而这第2类下一次合并是在第7步(下一个阶段列第4步显示的数字为7)。最后,18个观测经过17步聚为一类。


8.png


从下表可以看出,聚类个数为2~5的各个案的最终归属类别。


9.png


下图显示的是冰柱图,用柱状图的方式显示了最终聚成2~5类的聚集过程。横轴为18个个案,纵轴为聚集个数,冰柱中最长的空格长度表示当前的聚类步数,画一条横线在纵轴5处,即把18个个案聚成5类,经过了4步,5类分别是(9,5)、(17,16,14,12,18,15,2)、(11,13,10,7)、(4,6,8,3)、(1)。


10.png


下图显示的是谱系图(树状图),直观地显示了聚类的整个过程,也可以很方便的指定聚类个数的分类结果,如图中横轴5处的黑色线条,其与三条横线相交,表明将全部观测分为了3类,蓝线左侧线依然连着一起的分为一类,最终分类结果为(16, 17,4,2,15,18,12)、

(10,13,7,113,8,6,4,1)、(5,9)。


11.png


在数据窗口中,可以看到保存的“CLU5_1” 、“CLU4_1” 、“CLU3_1”和“CLU2_1” ,如下图所示,表示的是聚类数为2~5各个案的最终归属类别,等同于表10-10。


12.png


四、系统聚类的进一步分析


1 .OLAP多维数据集的SPSS实现


(1)在“ 系统聚类”运行后的数据窗口中选择“分析” →“报告” →“OLAP多维数据集”弹出“OLAP多维数据集”对话框,如下图所示,在左侧的变量列表中选中“ 正高级” 、“ 副高级” 、“ 中级” 、“初级”和“无职称” 5个数值型变量,单击按钮,选入右边的摘要变量列表,将“Average   Linkage(Between   Group)[CLU4_1]”变量选入右边的分组变量列表。


13.png


(2)完成所有设置后,单击腿按钮执行命令。2 .OLAP多维数据集的结果分析


在结果中找到OLAP多维数据集表格,双击选中,右键选择“透视托盘” ,弹出“透视托盘”对话框,将“变量”放入列,将“Average Linkage(Between Group)[CLU4_1]”和“ 统计”按序放入“行” ,将“变量”放入列,如下图所示,就得到下表。


14.png


15.png

16.png


“OLAP多维数据集” 显示了4类的各个变量的信息,结合聚合成员表发现,其中第3类各变量的平均值都高于其他几类,说明山东和江苏普   通高校的教育资源较丰富,第1类和第4类的教育资源相差不大,第2类的各变量的平均值相对较小,说明其中的7个个案(内蒙古,广西,西藏,甘肃,青海,宁夏和新疆)的教育资源较薄弱,需要加强。



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757