数据分析网

2.2、Stata正态性检验和数据转换—零基础入门教程

微信扫码观看完整版Stata视频课程、分析师在线答疑解惑哦~

微信扫码-通用.jpg

【课程摘要】

在Stata中,正态性检验和数据转换是常用的数据分析技术。正态性检验用于检验数据是否符合正态分布假设,而数据转换则是对数据进行变换以满足正态分布的要求。在Stata中,我们可以使用命令进行正态性检验。常见的命令包括sktest、swilk和kurtosis,它们可以计算数据的偏度、峰度和正态性检验统计量。通过这些统计量的显著性检验,我们可以判断数据是否符合正态分布。

【详细教程】

Stata正态性检验和数据转换


关于正态性检验和数据转换,常用到sktest 、ladder 、gladder、 qladder等操作命令。


一、sktest命令的语法格式为:sktest varlist [if] [in] [weight] [,noadjust]


对于varlist 中的每个变量, sktest给出了一个基于偏度的正态性检验 和另一个基于峰度的正态性检验,然后将这两个检验合并成一个整体检 验统计量。需要提示的是, sktest至少需要8个样本观测值才能进行计算。 varlist为需要进行正态性检验的变量列表, [if]为条件表达式, [in] 用于设置样本范围, [weight]用于设置权重, [,noadjust]用于抑制Royston( 1991 )对总体卡方及其显著性水平所做的经验调整,呈现 D'Agostino所描述的未改变检验。


二、ladder命令的语法格式为:ladder varname [if] [in] [,generate(newvar ) noadjust]


ladder 的功能在于搜索幂级数的子集(Tukey    1977 ),尝试幂阶梯 上的每一种幂并逐个反馈结果是否显著地为正态或者非正态,使用户可 以非常方便地找到将变量(varname )转换为正态分布变量的有效转换   方式。 varname为需要进行正态转换的变量, [if]为条件表达式, [in]用于 设置样本范围, [weight]用于设置权重, [,generate(newvar )]保存与表   中最小卡方值对应的转换值,但不推荐使用generate() ,因为这仅仅是字 面意义上的解释最小值,从而会忽略几乎相等但可能更可解释的变换。 [,noadjust]用于抑制Royston( 1991 )对总体卡方及其显著性水平所做的   经验调整,呈现D'Agostino所描述的未改变检验。


三、gladder 命令的语法格式为gladder varname [if] [in] [,histogram   options combine   options]


gladder 的功能在于根据ladder变换的结果展示出9个变换的直方图, 从而可以更直观地看出幂阶梯和正态分布检验有效结合的结果。


四、qladder命令的语法格式为:qladder varname [if] [in] [,qnorm   options combine   options]

qladder与gladder类似,区别是qladder显示varname变换的分位数,   根据幂级数与正态分布的分位数进行比较。

varname为需要进行正态转换的变量, [if]为条件表达式,

[in]用于设置样本范围, [,histogram   options combine   options]为可选项。


下面以“数据2B”数据文件为例进行说明, “数据2B” 中设置了两个变 量,分别是province和amount ,其中的数据如下图所示。


1.png


1. sktest amount


本命令的含义是对该数据进行正态分布检验,检验结果如下图所示。


2.png


sktest命令拒绝了数据呈正态分布的原始假设。从偏度上看,Pr(Skewness)为0.0065,小于0.05,拒绝正态分布的原假设;从峰度上看, Pr(Kurtosis)为0.0804,大于0.05,接受正态分布的原假设;但是把两者结合在一起考虑,从整体上看, Prob>chi2为0.0123,小于0.05,因而拒绝正态分布的原假设。


2. ladder amount


本命令的含义是对amount变量运行ladder命令, ladder命令把幂阶梯 和正态分布检验有效地结合到了一起,它尝试幂阶梯上的每一种幂并逐个反馈结果是否显著地为正态或者非正态分布。 ladder命令的运行结果如下图所示。


3.png


3. gladder amount


本命令的含义是对amount变量运行gladder命令, gladder命令可以更 直观地看出幂阶梯和正态分布检验有效结合的结果。 gladder命令的运行 结果如下图所示。


4.png


4.qladder amount


本命令的含义是对amount变量运行qladder命令, qladder显示varname变换的分位数,根据幂级数与正态分布的分位数进行比较。qladder命令的运行结果如下图所示。


5.png






热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757