数据分析网

1.3、SPSS探索性分析—零基础入门教程

微信扫码观看完整版SPSS视频课程、分析师在线答疑解惑哦~

SPSS教程 (1).png

【课程摘要】

SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,它提供了丰富的功能和工具来进行数据分析。其中,探索性分析是SPSS中的一项重要功能。探索性分析旨在通过对数据的探索和可视化,发现数据中的模式、趋势和关联关系,以便更深入地理解数据。在SPSS中,我们可以使用各种统计方法和图表来进行探索性分析,如散点图、相关分析、聚类分析等。通过探索性分析,我们可以发现数据中的异常值、缺失值和离群点,了解变量之间的关系和影响,发现数据中的潜在模式和趋势。探索性分析可以帮助我们提出新的研究问题、生成假设,并为后续的深入分析和建模提供基础。通过SPSS的探索性分析功能,我们可以更全面地理解和解释数据,为进一步的研究和决策提供支持。
【详细教程】

SPSS探索性分析


探索过程既可以为所有个案也可以分别为个案组生成汇总统计和图形显示,探索性分析主要有以下几个目的。


(1)对数据进行过滤和检查,能识别离群值、极端值、数据中的缺口或其他特性。


(2)验证数据的分布特征,如对数据正态分布和方差齐性进行检验,对不满足的数据提示转换方法。


(3)描述统计量,通过输出直方图、茎叶图、箱图等来描述个案组之间差异的特征。


一、参数设置


(1)打开数据文件,选择“分析” →“描述统计” →“探索” ,弹出“探索”对话框,如下图所示,各项含义如下。


1.png


●因变量列表:从左侧的变量列表中选择一个或多个变量进入其中。


●因子列表:从左侧的变量列表中选择一个或多个用于分组的变量进入其中。


●标注个案列表:从左侧的变量列表中选择一个变量进入其中作为标示变量。


●输出选项框:用于选择输出的内容,有如下3个可选项。


➢两者都:表示输出统计量和图,系统默认。


➢statistics:表示只输出统计量。


➢   图:表示只输出图。


(2)单击statistics按钮,弹出“探索:统计”对话框,如下图所示。该对话框是用来选择统计分析量,各项含义如下。


2.png


●描述性:用于输出基本描述统计量,包括平均值、中位数、标准误差、方差、标准差、偏度和峰度等,系统默认平均值的置信区间为95% ,用户也可以可指定其他置信度。


●M-估计量:用于输出4种权重下的最大似然数,分别是休伯M估计量、Tukey双权估计量、汉佩尔M估计量和安德鲁波估计量,是样本平均值和中位数的稳健替代值,用于估计位置。


●界外值:输出5个最大值和5个最小值。


●百分位数:用于输出第5个、第10个、第25个、第50个、第75 个、第90个和第95个百分位的值。


(3)单击按钮,弹出“探索:图”对话框,如下图所示,该对话框是用来设置统计图的输出,项含义如下。


3.png


●箱图。


➢按因子级别分组:对每一个分组变量,每一个图只显示一个因变量,系统默认。


➢不分组:对每一个分组变量,每一个图并排显示所有因变量,当不同的变量代表在不同的时间度量的同一个特征时,一般选择此项。


➢无:不显示箱图。


●描述性。


➢茎叶图:用来描述频数分布,用来表示具体的变量值。


➢直方图:输出直方图。


●带检验的正态图:对数据进行正态分布检验,显示正态概率分 布图和离散正态概率图。


●伸展与级别levene检验。


➢无:不做方差齐性检验,系统默认。


➢幂估计:用来求得最佳的幂转换值,为下面的幂变换方法做铺垫。


➢已转换幂:选择此项后,可在后面的选项框中可以选择 自然对数、1/平方根、倒数、平方根、平方、立方进行 转换。


➢未转换:不做转换,直接进行方差齐性检验。


(4)单击   按钮,弹出“探索:选项”对话框,如下图所示,设置缺失值的处理方式,各项含义如下。


4.png


●按列表排除个案:对每个观测单位,只要分析中用到的变量有1个缺失值,则将该观测单位剔除,不参与所有的分析,系统默认。


●按对排除个案:只有当前分析用到的变量中含缺失值时,才将 该观测单位从当前分析中剔除。


●报告值:因子变量的缺失值被视为单独的类别,被单独分到一 组进行分析,并输出相应的结果,被标记为缺失。


二、探索分析的SPSS实现


实例三:“data04-03.sav”数据文件是一个公司474名员工一年的薪水资料,如下图所示。现要求利用探索分析对这个公司男女员工的薪水进行分析。


5.png


三、探索分析的结果分析



从下表可以看出女员工共216个样本,男员工共258个样本,没有缺失值。


6.png


从下表可以看出女员工的平均薪水为26031.92 ,标准错误为514.258 ,平均值的95%置信区间为(25018.29,27045.55),5%截尾平均值是排除掉数据首尾两端5%的变量值后得出的平均值,本例为25248.30 ,中位数为24300.00 ,标准差为7558.021 ,最小值为15750 ,最大值为58125 ,范围为42375 ,四分位距是25%的百分位数与75%的百分位数之间的距离,本例为7013 ,偏度为1.863 ,峰度为4.641 ,男员工的描述统计量同理。


7.png


从下表可以看出M-估计量中休伯M估计量、Tukey双权估计量、汉佩尔M估计量和安德鲁波估计量,4个估计量的区别就是使用的权重不同,发现女员工和男员工的4个M估计量虽然离中位数较近,但是离平均值较远,说明数据中应该有异常值。


8.png


a .加权常量为1.339。

b .加权常量为4.685。

c .加权常量为1.700 、3.400和8.500。

d .加权常量为1.340*pi。


百分位数就是将数值分成两部分,例如百分位数25代表的值就表示有25%的值比该值小,有75%的值比该值大,从下表可以得出本例的百分位数。


9.png


从下表可以看出分组后女员工和男员工薪水的5个极大值和5个极小值。


10.png


从下表可以看出Kolmogorov-Smirnov方法和Shapiro-Wilk方法检验的结果,显著性均小于0.05 ,说明女员工和男员工的薪水分布均不符合 正态分布的假设。其中Shapiro-Wilk方法只有在对样本量小于50时比较精确。


11.png

a .Lilliefors显著性校正。


从下表可以看出男女间薪水不具有齐次性,因为显著性均小于0.05。


12.png



从下图可以得出女员工和男员工薪水的分布均呈正偏态。


13.png


下图是茎叶图,图中“Frequency”表示的是变量值的频次,“ Stem”表示的是变量值的整数部分,“Leaf”表示的是变量值的小数 部分。变量值的具体计算方法是变量值=(茎+ 叶)*茎宽,如女员工薪水茎叶图第一行的变量值为15000=(1+0.5)×10000 ,第7行叶部分第13个数字为7 ,则变量值为27000=(2+0.7)×10000 ,本例茎宽(Stem Width)为10000。


14.png


下图中所示的两种正态图,一种是标准的正态概率分布图,一种是离散的正态概率分布图。


15.png


16.png


标准的正态概率分布图是使用变量的实际观测值作为横坐标,变量的期望值为纵坐标,变量值为落点。图中的斜线表示正态分布的标准线,点表示变量值,变量值越接近于斜线,则变量值的分布越接近正态分布,本例中男女员工的薪水分布不符合正态分布。


离散的正态概率分布图是使用变量的实际观测值作为横坐标,以实 际观测值与期望值的差作为纵坐标,如果数据符合正态分布,则图中的 点应该分布于图中标准线的附近。在本例中可以男女员工的薪水分布不符合正态分布。


下图所示的为箱图,箱子的上边线表示第75百分位数,下边线表 示第25百分位数,中间的线表示中位数,箱子上下的两条细横线表示的是除离群值和极值的最大值和最小值。


17.png


离群值是指离箱子的上下边线的距离为箱子高度的1.5倍至3倍的变 量值,本图中用“ ○”表示。极值是指离箱子的上下边线的距离为箱子高 度的3倍以上的变量值,本图中用“☆”表示。


从上图可以看出男女员工的薪水都有一些离群值和极值存在,表明有员工的薪水明显高于普通员工。



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757