数据分析网

10.2、Stata截取回归分析—零基础入门教程

微信扫码观看完整版Stata视频课程、分析师在线答疑解惑哦~

微信扫码-通用.jpg

课程摘要

Stata是一种统计分析软件,用于数据分析和建模。在经济学和社会科学研究中,截取回归分析(censored regression analysis)是一种用于处理因为观测值被截取而导致的截断数据的方法。Stata提供了命令和函数来进行截取回归分析。通过使用这些命令和函数,可以对截断数据的影响因素进行建模和分析。在Stata中,可以使用命令如clogit进行截取回归模型的估计。这个命令允许用户根据数据的特点,选择适当的模型和估计方法,并进行参数估计、假设检验和模型诊断等操作。

详细教程

Stata截取回归分析


1.截取回归分析的功能与意义


截取回归分析是针对当因变量大于一定数值或者小于一定数值时仅能有一种取值时的回归分析方法。举例来说,如果研究某单位的薪酬情况,该单位采取封顶薪酬方式,把年薪作为因变量,那么该因变量的取值范围就低于一定值。


在截取回归分析背景下,因变量的取值范围是受到限制的,当因变量大于一定值时,以后无论程度如何,统统被记录为某一特定值,或者说一定范围的数据被压缩到一个点上,这样被解释变量y的概率分布就变成由一个离散点与一个连续分布所组成的“混合分布”。在这种情况下,通过一般的最小二乘回归分析得到的结论是不完美的,无论使用的是整个样本,还是去掉离散点后的子样本,都不能得到一致的估计。

一个典型的使用于截取回归分析的模型就是Tobit模型,数学公式为 :


1.png


在上述公式中,如果mi=1,   则yi=y¹, 否则取值为0,这时的最大似然方程如下:


2.png


我们可以运用导数法对β和σ最大化,就可以计算出极大似然估计结果。



2. 截取回归分析的Stata操作


截取回归分析的命令为tobit, 该命令的语法格式为:


tobit      depvar      [indepvars][if][in][weight][,options]

tobit为截取回归的命令, depvar为被解释变量(因变量), indepvar 代表解释变量(自变量), [if]为条件表达式, [in]用于设置样本范围,[weight]用于设置权重,[,options]为可选项,主要包括下表所示的几项。


3.png


在截取回归模型中同样可以进行预测,对应的命令及其语法格式为 :


predict [type] newvar [if][in][,statistic nooffset]

predict为预测命令, type代表新变量的类型, newvar代表生成的新变量, [if]为条件表达式, [in]用于设置样本范围, statistic代表要输出的统计量,具体选项及含义与上一节断尾回归分析相同。


在回归分析中,回归系数β是因变量Yi 随自变量增加或减少而相应增加或减少的边际效应的度量。在截取回归分析中,这一命令可以与predict命令一起使用,以探索因变量Yi 随自变量变化的边际效应。


计算不被截取的概率随自变量变化的边际效应的命令为:

mfx,predict         (pr(n<yi<m))


3. 截取回归分析示例


我们继续使用“数据10”数据文件,其中记录的是某单位90名在岗职工的年薪、加班天数、工作年限以及职称级别情况。除了已知该单位的保底工资是50000元/年外,我们增加一个条件,即该单位的封顶工资是180000元/年。


下面以年薪为因变量,以加班天数、工作年限、职称级别为自变量,开展回归分析。


打开该数据文件之后,在主界面的命令窗口中依次输入:


tobit年薪加班天数工作年限职称级别,Ⅱ(50000) ul(180000)

本命令的含义是以年薪为因变量,以加班天数、工作年限、职称级别为自变量,并设置因变量的取值下限为50000、取值上限为180000,进行截取回归分析,研究变量之间的因果影响关系。分析结果如下图所示。


4.png


从分析结果中可以看到,起始对数似然函数值Log      likelihood 为-935.03215,经过一次迭代后即达到收敛,最终的对数似然函数值Log likelihood也是-935.03215。截取回归中因变量的下限为5000(Limit:lower=50000),因变量的上限为180000(upper=180000)。   共有90个样本参与了分析,模型 LR chi2(3) 统计量为250.87, Prob > chi2为0.0000,说明模型非常显著。 伪R方 (Pseudo R2) 为0.1183。

模型的回归方程是:


年薪=775.4742*加班天数+1832.195*工作年限+8539.669*职称级别-10756.01

读者可自行对比该截取回归结果与断尾回归、普通最小二乘回归分析的结果。


predict yhat

本命令的含义是估计因变量的拟合值。


predict p, stdp

本命令的含义是估计拟合的标准误。


predict f, stdf

本命令的含义是估计预测的标准误。


edit

本命令的含义是打开数据编辑器,查看数据文件中的数据,如下图所示。


5.png


mfx, predict(e(50000,180000))

本命令的含义是计算E(y₁ 50000<y<180000)的执行结果如下图所示。



6.png


在默认情形下,我们使用mfx命令,输出的是解释变量处于均值水平时的边际效应。也就是说,针对加班天数在111.656天(结果图下方最后一列,即X列)时的边际效应,此时在年薪大于5万小于18万的区间范围内,加班天数每增加1天,就会引起年薪775.4742元的增加(观察

dy/dx列的数值),而且该边际效应也是显著的 (P> |z |=0.000)。


针对工作年限在9.34444年时的边际效应,此时在年薪大于5万小于18万的区间范围内,工作年限每增加1年,就会引起年薪1832.195元的增加,该边际效应也是显的 (P> |z |=0.036)。


针对职称级别取值为1.72222时的边际效应,此时在年薪大于5万小于18万的区间范围内,职称级别取值每增加1,就会引起年薪8539.669元的增加,该边际效应也是显著的(P> |z |=0.0

00)。


结果中还给出了条件期望y=E (年薪 |50000<年薪<180000)(predict, e(50000,180000))=107658.06,   代表着年薪在区间(50000,180000)下的条件期望是107658.06。



mfx,   predict(e(50000,180000))at(100101)

我们除了使用前面介绍的默认情况,即解释变量处于均值水平时的边际效应,还可以针对解释变量的具体取值进行设置,从而可以发现解释变量在特定取值时的边际效应。本命令在后面加了at(100   10 1) 选项,含义仍是计算E(y |n<y<m) 的边际效应,但是计算的是加班天数为100、工作年限为10、职称级别为1处的边际效应。该命令的执行结果如下图所示。


7.png


在加班天数为100、工作年限为10、职称级别为1处,年薪条件期望降低为93653.04。

针对加班天数在100天(结果图下方最后一列,即X列)时的边际效应,此时在年薪大于5万小于18万的区间范围内,加班天数每增加1天, 就会引起年薪775.4739元的增加(观察dy/dx列的数值),而且该边际效应也是显著的 (P> |z=0.000)。


针对工作年限在10年时的边际效应,此时在年薪大于5万小于18万的区间范围内,工作年限每增加1年,就会引起年薪1832.195元的增加,该边际效应也是显著的 (P> |z |=0.003)。


针对职称级别取值为1.72222时的边际效应,此时在年薪大于5万小于18万的区间范围内,职称级别取值每增加1,就会引起年薪8539.665元的增加,该边际效应也是显著的 (P> |z |=0.000)。





热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757