数据分析网

1.3、Mplus潜类别分析原理—零基础入门教程

微信扫码观看完整版Mplus视频课程、分析师在线答疑解惑哦~

微信扫码-通用.jpg

视频教程
课程摘要

Mplus是一种用于结构方程模型(SEM)的统计分析软件,其中包括了潜类别分析(Latent Class Analysis,LCA)的功能。潜类别分析是一种无监督学习方法,用于识别潜在的、互相独立的子群体。其原理是基于观测变量的概率分布,将样本分为不同的潜在类别,并估计每个类别的概率和特征。Mplus中的潜类别分析可以用于研究潜在的群体结构、探索潜在的亚群体、评估分类准确性等。通过Mplus的潜类别分析,研究人员可以深入了解数据中存在的潜在类别,并根据类别特征进行进一步的分析和解释。

【详细教程】

Mplus潜类别分析原理


LCM 是根据个体在观测指标上的反应模式即不同的联合概率来进行参数估计的统计方法。例如, 一份数学测验有10道判断题,数学能力高的个体能全部正确地回答所有题目,能力低的学生只能正确回答容易的题目,能力中等的学生能正确回答全部容易的和部分困难的题目。不同能力水平的学生在正确回答不同难易水平的题目时表现出某种相似性,因此通过学生回答题目的情况可以将其分为不同的能力水平组。 LCM分析的逻辑就是根据个体在观测项目上的反应模式将其分类。


一、 数学表达式


(1)潜类别分析模型


可以从方差分析的角度理解LCM。 方差分析的特点是将方差分解成不同的来源,常见的有组间vs.组内和被试间vs.被试内。在LCM中,可以将方差分解为类别内和类别间(Sterba,2013)。

根据局部独立性(local independence)假设,类别内的任意两个观测指标间的关联已通过潜类别变量解释,所以它们之间已没有关联。根据独立事件联合发生的概率等于单独发生概率之积的原理,在每个类别内部,多个两点计分项目的联合概率可以表示为:


1.png



上式中,y;表示个体i在指标j的两个选项y=1   或 y=0的得分。下标j表示2点计分的指标,c为潜类别变量,有h个水平。同时考虑多个类别水平时,上式扩展为:


2.png


p(c₁=h)   表示某一类别组h所占总体的比率,亦称潜类别概率。


(2)潜剖面分析模型


当观测指标为连续型变量时,LCM称作潜在剖面分析(Latent Profile Modeling, LPM)。此时,将连续指标的方差分解为类别/剖面间和类别/剖面内方差(Lazarsfeld & Henry,1968):


3.png


其中μ和a² 为剖面h 内指标i的均值和方差。P(c₁=h) 为类别概率,即每个类别个体占全体的比例。当满足局部独立性和同质假设时,上式简化为:


4.png


二、类别概率和条件概率


在LCM中,有两个非常重要的参数:潜类别概率和条件概率。潜在类别概率类似于FA中的解释方差比例。在FA中,解释方差比例说明每个因子在解释数据时所占的分量。LCM 的潜在类别概率则用于将样本分成不同比例的类别。换句话说,潜在类别概率就是用于说明各个类别的人数比例。例如,根据1000个被试在4个观测指标上的得分情况将其分成3个潜在类别,潜在类别概率为70%,25%和5%,表示第1类有700个被试,占70%;第2类有250个被试,占25%;第3类有50个被试,占5%。


条件概率指潜类别组内的个体在外显指标上的作答概率。例如,类别潜变量C有3个类别C1,C2和C3, 外显指标A有3个选项,C1 的条件概率就是计算 C1 内的个体在A的三个选项上的选择比例。以此类推,C2 和 C3 也可以计算各自在A上的条件概率,共9个(每个类别有三个)。由于T1内的个体必然在A 的三个不同选项的某个特定选项上选择,所以类别内的条件概率总和等于1,公式如下。


5.png



下表中呈现了下文探索性LCA分析时4个类别在前5个指标选项1上的条件概率和潜类别概率。


条件概率与因子负荷类似,表达潜变量与外显变量之间关系的强弱。各潜在类别的概率总和及每个外显变量的条件概率总和都为1,这是LCA模型的基本限制条件。也可以根据特定研究的相关理论对参数进行限定。


6.png


一旦最优的LCA模型拟合成功,就需要将每个个体归入不同的潜在类别。换句话说,就是确定每个个体的潜类别属性(Class Membership)。 在LCA中,采用的分类依据是贝叶斯后验概率(Posterior   Probability),公式如下。


7.png



后验类别概率是根据个体的作答类型,在LCA拟合后估计得来,其值表示个体属于某一类别的概率。常见的分类方法有3种:莫代尔分配法(Modal assignment)、比例分配法(Proportional assignment) 和虚拟类别法。莫代尔分配法根据个体后验概率的最大值将其归入特定类别。例如,某个体A在4个类别上的后验概率分别为0.80,0.10,0.05和 0.05。根据此值,A在第一类别中的概率值最高,所以应将其归入第一类。比例分配法则不直接分类而使用后验概率作为权重。虚拟类别法从后验概率分布中随机抽取一定次数的值,然后采用类似多重插补的方法得到平均的结果。 Mplus 采用的是莫代尔分配法,后验概率和个体类别归属变量可通过下表中的命令获得:


8.png


三、同质性和潜类别距离


同质性(Homogeneity)是指特定潜类别内部个体在外显变量上反应类型的一致性。 同质性高说明同一类别内个体有着相同的反应类型,反之,说明反应类型差异较大。


潜类别间隔(Latent Class Separation) 是指潜类别间差异的大小,反映在项目反应概率上则表现为不同类别个体间在所有观测指标上存在显著的差别( Collins & Lanza, 2010)。如下图所示,两个虚线的分布代表两个潜类别(实线为2个潜类别组成的混合分布)。


9.png


当潜类别间隔足够大(左图),两个分布的对称轴距离越远(均值差异越大),此时对于来自任一潜类别的个体来说,将其划分到所属类别的精确度越高。如果两个类别间的差异不明显,即潜类别间隔不够大(右图),两个分布的对称轴距离越近时,将个体精确划分到所属类别就越不容易。这里的潜类别间隔与传统因素分析里的项目区分度或因子负荷的概念类似。当指标只在某个因子上有高负荷,在其他因子上的负荷为0时, 将该指标划入某因子是非常确定的。然而如果指标在一个因子上的负荷为0.45,在另外一个因子的负荷为0.48,此时就很难将该指标划入某个单独的因子。显然,潜类别间隔的大小是影响分类精确性的重要因素,也是影响潜类别个数保留的重要变量(Lubke   &Neale,2006)。


对分类精确性有影响的另一个因素是类别内方差。在潜类别间距相同的情况下,特定类别分布的方差越大,两个分布之间重叠的部分越大,将个体划分到特定类别组就越困难,如下图a所示。; 类别分布的方差越小,两个分布之间重叠的部分越小,将个体划分到特定类别组就越容易,如下图b所示。


10.png



四、参数估计


LCM的参数估计有两种基于极大似然估计的迭代算法:


期望最大(Expectation- Maximization,EM) 和牛顿-拉夫森算法(Newton-Raphson)。


迭代算法的一般过程分成两个阶段:


第一阶段,以一个(组)开始值(Starting Values)为起点进行估计以获得最大值;


二阶段,用第一阶段的估计最大值再次进行估计,直到达到设定的聚合标准。


两种方法各有优缺点,但两种算法均容易产生局部最大化解(Local Maxima)而非总体最大化解(Global Maxima)。 解决的途径可以是设置不同的起始值估计同一模型,如果结果差异较大说明获得的结果很可能是局部最大化解。在Mplus中,程序默认第一阶段 从10个随机初始值开始估计;第二阶段,使用第一阶段获得的2个最大值进行估计。



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757