数据分析网

10.2、Mplus贝叶斯分析过程—零基础入门教程

微信扫码观看完整版Mplus视频课程、分析师在线答疑解惑哦~

微信扫码-通用.jpg

视频教程
【课程摘要】

Mplus是一种统计分析软件,可以进行贝叶斯分析。贝叶斯分析是一种基于贝叶斯统计理论的分析方法,通过结合先验知识和观测数据,得到后验概率分布来进行参数估计和推断。在Mplus中进行贝叶斯分析的过程包括以下几个步骤:首先,确定模型的先验分布和参数的先验分布。然后,通过Mplus提供的贝叶斯估计方法,使用观测数据来更新参数的后验分布。接下来,可以使用Mplus提供的贝叶斯模型比较指标,如Bayes factor,来比较不同模型的拟合优劣。最后,通过分析后验分布,可以得到参数的点估计和置信区间,以及其他感兴趣的统计量。

【详细教程】

Mplus贝叶斯分析过程


一、贝叶斯估计:马尔科夫链蒙特卡洛算法


得益于马尔科夫链蒙特卡洛算法(Markov Chain Monte Carlo,MCMC),贝叶斯统计得   以迅速发展和普及(Gelman et al,2004)。MCMC 是一个迭代算法,首先设置先验分布, 接着经过多次迭代产生参数的后验分布,迭代的过程形成一个马尔科夫链(chain)。 MCMC 至少需要两个开始点即两条马尔科夫链,以确保迭代过程收敛到一个稳定的后验估计。在实践中,为了确保收敛的稳定性,可以设置多个链并结合图形来判断。目前MCMC常采用吉布斯抽样(Gibbs sampler),其过程如下:


假设θ,表示第t次迭代的全部模型参数(例如,因子分析里的因子负荷,因子协方差,误差方差等参数),吉布斯抽样将θ,分成d组:θ,=(0,…,θ)


第1步(θ,102-1,…,01,data,priors)


第2步(θ210,θ3-1,…, θm-1,data,priors)


第d 步(θ10,…,θ-1,-1,data,priors)


循环上述步骤。


下面用文字简单描述这一过程。假设模型参数θ有5个(组)参数O₁O₂O₃O₄ θs,设定参数θ的初始值后,在给定θ₂O₃θ₄θs的条件下抽取θ,的条件分布,产生第一个样本;接着在给定θ₁O₃ θ₄ θs的条件下抽取θ₂ 的条件分布样本,依次抽取5个样本。当所有的5个参数都更新(update)后,重复上述步骤,反复N 次迭代后,所有参数不再变化即可判断参数收敛了。


使用吉布斯抽样有两个重要问题:确定马尔科夫链数和迭代次数。至于马尔科夫链的个数通常采用多个,Mplus默认为两个。设置多个链一来可以提高计算速度(使用多核处理器),另外也可以用于判断收敛,比如下面提到的PSR。 当多个链的结果都收敛到一个稳定的分布时(模型收敛了),后验统计量就可以计算了。但是每个链收敛的过程可能差异较大,而且在迭代的前期链内部的变异较大,如果基于整个迭代过程计算后验统计量会使结果产生偏差。因此,通常会将迭代过程分成前后两部分,前半部分的结果丢掉不用,即所谓的“煲机”或热身阶段(burn-in),只使用后半部分的迭代结果计算后验统计量。


贝叶斯估计也会存在类似极大似然估计收敛到局部解的问题。在采用极大似然估计分析混合模型时,通常使用多个起始值来避免局部最大化解,设定多个马尔科夫链与设定多个起始值类似。然而马尔科夫链的长度是由迭代次数决定的,所以确定迭代次数是判断收敛的关键。如果迭代次数太少,结果可能收敛到一个"局部"的后验分布,如下图所示。上方图是迭6000次的马尔科夫链,结果很理想,但当迭代次数增加至50000次时,结果发生逆转,而真正的收敛区域在6000次迭代后。


1.png


为了避免局部解,Depaoli等最近建议先使用一个固定迭代次数,例如50000次,如果结果收敛了,再使用加倍的迭代次数即100000次分析,如果两次的结果差异不大则说明没有出现局部解。由于局部解很难事先判断,所以最好的做法是尝试不断地加倍迭代次数,考虑到现在计算机的高性能,在时耗上这种策略也是可以接受的。


二、收敛的判断


收敛是指马尔科夫链是否达到平稳状态,如果达到了平稳状态则说明得到的样本是从目标抽样分布中抽取的样本。


由于MCMC估计时参数收敛的是一个分布而非一个固定的点,所以判断参数收敛是很困难的。由于不存在单一的统计量用以评价此种情况,贝叶斯模型中判断收敛的标准有多个,其中最常用的是对MCMC链收敛过程的图形检验即踪迹图(trance plot)。 另外,常用的还有自相关图(autocorrelation plot)、PSR和K-S检验,下面分别介绍这些方法。


(1)踪迹图


如果将多个马尔科夫链同时呈现在一张图中(软件通常使用不同的颜色标记不同的链),就可以直观地判断不同的马尔科夫链是否收敛到一个相同的平稳分布,如下图所示。


2.png


横坐标是迭代次数,纵坐标是后验估计值,在图的中心位置出现一条纵线将踪迹图分为前后相等两部分,前半部分是“burn-in”阶段,通常波动较大,后半部分结果相对稳定,用作模型收敛的判断依据。


(2)自相关图


根据MCMC抽样的特性,每次抽样只依赖于前次抽样,因此可以计算每次抽样参数间的相关系数。理论上非连续抽样之间不相关,但实际中很难实现,所以实践中通常计算间隔一定距离的抽样相关,比如每间隔10次抽样,这个间隔称为筛选间隔或抽样步长(thinning interval

or sampling lag)。如果自相关系数小于0. 1,说明抽样样本接近独立。 下图是一个自相关系数分布图,纵坐标是相关系数大小,横坐标是不同的迭代间隔次数或步长。如果自相关系数较大而且随着步长的增加相关系数会逐步减少,可以使用Mplus的Thin语句只报告间隔一定步长的结果(Muthen, 2010)。


3.png


(3)潜在尺度缩减因子


收敛可以通过潜在尺度缩减因子(Potential   Scale   Reduction,PSR; 也称为Gelman-Rubin法,来判断。


令θ表示模型中的参数(例如,方差、均值等),θ,表示第j条链的均值;θ,表示第j条链上的第i次迭代的值;θ表示所有链的总均值,PSR计算公式如下:


4.png

44.png


PSR的核心思想是:当不同链之间的变异小于链内变异时,说明不同链间的结果趋于相等,模型收敛了。 PSR也可以通过将不同链的踪迹图画在同一个图中来判断。


PSR类似组内相关系数ICC,但又有所不同。它与ICC存在如下关系:


5.png


(4)K-S检验


K-S检验是用于比较连续的单维概率分布是否相等的非参数检验方法,比PSR更严 格,在Mplus中可以在TECH8中获得每个参数KS检验结果。如果检验的p值非常小,软件会给出如下提示:


THE   KOLMOGOROV-SMIRNOV DISTRIBUTION TEST   FOR PARAMETER 52 HAS   A P-VALUE

0.0000,INDICATING DISCREPANT POSTERIOR DISTRIBUTIONS IN THE DIFFERENT MCMC CHAINS.


THIS   MAY   INDICATE   NON-CONVERGENCE   DUE   TO   AN   INSUFFICIENT   NUMBER   OF MC

MC   ITERATIONS   OR   IT   MAY   INDICATE   A   NON-IDENTIFIED   MODEL.   SPECIFY   A   LARGER

NUMBER   OF   MCMC   ITERATIONS   USING THE   FBITER   OPTION   OF   THE   ANALYSIS   COMMAND   TO   INVESTIGATE THE   PROBLEM.



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757