Mplus曲线增长模型
一、多水平结构方程模型的定义
嵌套或聚类数据结构破坏了许多统计模型所需的独立性假定,多水平回归模型可以用来解决独立性假设破坏的问题。然而多水平回归模型存在局限,如没有潜变量(测量 模型),不能处理测量误差;没有全局性拟合优度指标;模型较为简单,未能考虑组内和组间结构的复杂性,等等。
传统的路径分析虽然可以厘清变量之间复杂的因果关系,但没有注意到存在的嵌套结构。比如,学生阅读得分呈现较强的组内相关,利用空模型计算ICC=0.203,提示需要 关注客观存在的嵌套结构。如果我们想分析学生阅读得分在学校之间的差异多大程度上可由学校层面的变量来解释,或者进一步检验学校层面因素对于学生阅读得分校际差异的直接和间接效应,就需要纳入对数据嵌套结构的考虑,引入多水平路径分析。当然, 路径分析没有考虑测量误差。如果同时满足上述这些条件,就需要引入标准的多水平结构方程模型的框架。
实际上,多元回归、路径分析、验证性因子分析(CFA)、 结构方程(SEM)、 多水平回归模型(以下简称MLM)、 潜发展模型等多种常见模型,都可以统一到MSEM的框架之下, 视为MSEM的特例(Muthén & Asparouhov,2011)。
作为一个通用分析框架,MSEM结合了MLM和SEM的优势。 MSEM适用于嵌套数据模型,且通过各构念多观测指标测量并使用潜聚合方式形成高水平构念的设置,校正了MLM在进行情景分析时存在的测量误差和抽样误差,在方法上更具优势。
构架MSEM有两种途径:整合潜变量和测量误差到多水平回归模型,如HLM、 MLwiN;整合多水平结构包括随机截距和斜率到SEM, 如Mplus、GLLAMM。
根据Muthén & Asparouhov(2008)的定义,单水平结构方程模型测量方程为:
Y₁=v+λη;+KX;+E;
其中,i为个体指示;Y,为p×1维观测变量向量;v为p×1的截距向量;n;为 m×1维潜变量向量;λ为p×m维对m个潜变量的因子载荷矩阵;n;为m个潜变量的m×1维向量;K为q个外生协变量X;对p个观测变量Y,回归斜率构成的p×q维矩阵;X,是q个观测协变量构成的q×1维向量;ε;为p×1维残差向量,假定服从均值为0、协方差矩阵为⊙的多元正态分布。测量模型即验证性因子分析,表达了观测变量(Y;)作为潜变量(η;)、观测的协变量(X;)和残差(ε₁)的函数。
结构方程设定了潜变量之间的关系模式:
η;=α+Bη;+TX+5
其中,α为m×1 维截距项向量;B为设定潜变量之间关系的m×m维结构回归系数矩阵;T为潜变量对外生变量回归斜率系数的m×q维矩阵;η;同前;5为m×1维潜变量回归残差向量。5;中的残差假定为均值为0、协方差矩阵为业的多元正态分布。结构方程可以看作潜变量(η;)之间及与外生观测协变量(X;)和残差(s;)函数关系的表达。
MSEM可以视作SEM的拓展,为了体现组群水平随机效应,允许某些系数矩阵在不同组群之间变化(Muthen & Asparouhov,2008; Preacher et al,2011;2010)。
测量模型:
Y=v+λmg+KX,+8y (8.3)
组内结构模型(within-group structural model):
ηg=α,+Bmg+TX,+5 (8.4)
组间结构模型(between-group structural model):
η;=μ+βn;+γX+5 (8.5)
MSEM中,⊙和坐中元素假定不随组群而变化。含有模型参数的矩阵,包括、α、 λ,、K、B,、Ij既可固定,也可在组间变化。其中,j为组群指示标记,代表该参数随组群而变化。
需要注意的是,式8.5中,η,与8.3中η;不同。η,包括所有r个随机效应,堆栈式8.3 和式8.4中所有下标为j参数矩阵的随机元素(即、λ;、K、α、B、T;),这是MSEM超越SEM的最主要的创新(Preacher,2015)。 其形如:
X,为所有组群水平协变量的向量,假定为s维。X与X,也不一样,X,是所有组群层面协变量堆栈而成的s维向量。
向量μ(r×1)、矩阵β(rxr)和矩阵γ(rxs)包含所有估计的固定效应。其中,μ为r×1维固定效应向量,包含随机效应分布的均值、组间结构方程的截距;β为rXr维向量,包含潜变量及随机截距和斜率彼此之间的关系的结构回归斜率系数;γ为rxs矩阵,包含η;中 随机效应对于s各组群水平外生预测变量的回归斜率。 S;中组群水平残差服从均值为 0、协方差矩阵为业的多元正态分布(Muthen & Asparouhov,2008; Preacher et al,2010)。
上述Muthén & Asparouhov(2008)的定义方式,赋予MSEM以更大的灵活性。包含变量取值的矩阵(包括观测的Y、X,和不能观测的ηy、Es;)可在两个水平变化。后一种矩阵中的元素可以严格限定为组内变量,也可以严格限定为组间变量,或者是在两个水平均有变化的变量(Boulton,2011) 。 同时,与另一通用潜变量建模程式GLLAMM相比,Mplus具有计算效率更高、允许随机斜率等优势。
刘东等(2012)总结了相比于MLM使用MSEM的优势。包括:(1)结构方程模型或路径模型可以同时检验多重关系,并展示整个模型的拟合程度。这样通过模型对比,来提供检验假设模型与其他备选模型的机会;(2)在同一模型中检验多重关系,可以减少对模型参数和标准误估计的偏差。当进行复杂多层次关系估计时,这种情况更是如此; (3)当一个或多个变量中存在缺失值时,同时估计多重关系也有利于对缺失值进行估计, 促进模型的构建;(4)在模型估计时,结构方程模型(即潜变量模型)考虑了测量误差,这样可以更为准确地估计变量之间的关系。
二、多水平潜协变量方法与双潜多水平模型
进行多水平模型的估计,基于MLM与基于MSEM的思路存在一个重要差异,即如何看待和处理“聚合”而成的水平-2的构念。
在传统的MLM分析中,组群水平的构念经常来自于将个体层面数据聚合到组群层面构建。然而这样的处理方式经常缺乏信度,特别是各组观测数较少、ICC较小时,结果导致情境效应的估计偏差(Raudenbush et al,1991; Snijders & Bosker,1999; Bliese, 2000)。这一点从相应信度估计公式即可以看出:
其中,n是一般的组群规模;ICC为组内相关系数。
按照这种方式生成“情境变量”,实际上假定了基于水平-1变量聚合而得的水平-2变量没有测量误差,然而协变量往往带有测量误差,真实值是不可观测或潜在的(Rabe- Hesketh et al,20
03)。
对此,Muthén、Asparouhov和Lidtke等(Asparouhov & Muthen,2006; Lidtke et al, 2008;Muthén & Asparouhov,2011) 以 Raudenbush & Bryk(2002:140) 提到的一个多水平回归模型为例,指出MLM在处理协变量时存在偏差:
将式8.9、式8.10代入式8.8并整理可得:
定义"情境效应"(contextual effect)为:
X,可视作对水平-2未被直接观测构念的一个估计。实际上,协变量X,-X, 和X,可以被看作潜协变量的代理:
在式8.13、式8.14中,下标w和b分别指代组内和组间部分。基于此,在Mplus中处理多水平结构方程模型的思路即所谓“多水平潜协变量”(multilevel latent covariate,MLC)模型的思路。与之相对,传统的MLM方法,将组均值作为显变量,而不是将之作为不可观测的潜在构念,被称为“多水平显协变量”(multilevel manifest covariate,MMC)模型的方式。
潜协变量方法的基础就是各变量均可区分出不可观测部分,考虑作为潜变量。比如对于变量X, 可分解为组均值成分和个体对组均值成分的偏差,也就是组间和组内两个独立的部分(Muthén & Asparouhov,2011):
同样,Y,也可以分解为组间和组内两部分:
其中,E(X)=0,E(Y)=0;Cov(Xn,X)=0,Cov(Ym,Y,)=0。
X 和Y,是观测值,Y、Xn、Y、X,均属于不可观测的随机成分。由此,使用潜协变量方法,多水平回归模型可以表述为:
将式8.16、式8.17代入式8.18,整理可得:
据此,"情境效应"(contextual effect)即为:
Asparouhov & Muthén(2006)和 Lüdtke et al.(2008) 证明,在进行多水平回归模型分析时,与潜协变量方法相比,观测协变量方法在估计水平-1γio时不存在偏误,但在估计水平-2斜率γo时引入了偏误:
随着组群规模或ICC减小,估计偏误会增加。类似地,也可以证明,在估计情境效应时,观测协变量方法o-o对潜协变量方法β- β。的估计也存在偏误。
该结果暗示,如果β。<β,则情境效应被低估,相反则被高估。模拟研究的结果也支持数学推导的结论(Lidtke et al,2008)。
这种方法的使用不限于估计情境效应,实际上,按照Lüdtke et al(2008;2011)和Preacher et al(2011;2016) 、Preacher(2015)的概括, MSEM建模是一种“分解优先” (decomposed- first)思路。在MSEM框架下,水平-1(组内/组间两用)观测变量自动分解为组内(W)和组间(B)不同部分,从而区分出组内和组间效应。这种策略的优势在于,相对于MLM方法,将水平-1变量组间部分作为潜变量(潜组均值,实际即随机截距), 从而减少了由于在水平-2采用手工计算组均值带来的偏误。同时,对组群水平系数估计进行校正。 Mplus所运用估计方法(默认基于EM算法的MLR)满足一致性和渐进有效性 (Asparouhov & Muthen,2006; Luidtke et al,2008) 。
不过,MSEM 带有更多需要估计的参数,以牺牲效率为代价,可能会减少侦测间接效应的功效,特别是在ICC较小的情况下(Preacher et al,2011; Preacher,2015) 。
Ludtke et al(2008) 指出,虽然相对而言MLC方式估计的情境效应更有效和一致,因此优于MMC方法,然而MLC方法对水平-2样本量的要求更高。如果水平-1 和水平-2样本量处于中等水平,ICC需要非常大才推荐使用MLC。如果各组样本量都足够大时,二者的结构相近。如果水平-1样本量和入样比例都比较小,两种方法结果差异就会非常不同。平均而言,真值应落在两种方法估计的结果的区间之内。因此,推荐两种方法同时运用,如果结果差异较大,需要小心推论。
另外,如果水平-1的指标本身就是测量水平-2的构念,那么使用MLC的方式更适合。Ludtke et al(2008)具体区分了聚合构念的不同类型。依照形成性(formative)和反映性(reflective)构念的区分,聚合也可以分为形成性和反映性两种类型。在反映性聚合类型中,假定了个体水平数据和组群水平构念的同构关系。组群水平构念假定是由个体水平对应的构念测量的,参照点是组群水平构念,水平-1指标反映性聚合至水平-2构念。 举例如通过对学生的调查测量“校风”。这种情况下,应用MLC方式更适合,即使抽样比例比较大。在形成性聚合类型中,聚合过程假定组群水平变量只是一个界定充分、被聚合到水平-2的水平-1构念的指标。聚合基于离散个体的不同属性,构念主要的目的是反映水平-1个体的差异,参照点是水平-1构念,比如学生的家庭社会经济地位。此种情况下,如果抽样比例较高,样本量和ICC较大,MMC方法可以使用。当抽样比例较小,而水平-1和水平-2样本量较大时,考虑使用MLC方法。其他情况下,应该两种方法都使用, 若结果差异较大,研究者应谨慎推论。另外,如果水平-2变量对应的总体均值或比例已知(比如,学校性别比),并不存在信度问题,应采用MMC方法。
虽然上述 MMC和MLC不同思路的公式看起来较为复杂,但在Mplus中二者的代码区分起来却相当直观。从代码书写规范的角度来讲,二者的区别就在于,对于特定变量, 是否在变量声明部分(VARIABLE)设定水平- 1变量所属的层次,即指定变量属于WITHIN还是BETWEEN层次,以及在模型部分(MODEL) 是否分别在组内(WITHIN) 和 组间(BETWEEN) 设定相应的变量名。如果在VARIABLE 部分不具体指定变量属于哪一 层次,也就是属于所谓“组内/组间两用”变量(Asparouhov & Muthen,2006),那么按照MLC的思路,Mplus默认将该变量分解为组内和组间两个不相关潜协变量部分,并同时在MODEL 部分组内和组间两个层面参与建模。
传统的 MLM 模型使用的是MMC方式,只有水平-1结果变量y 的变量名同时出现在WITHIN 和 BETWEEN两个部分,属于作为“组间/组内两用”,其他协变量只属于特 定的某个层次,即所谓“组内专用”(within-only)或“组间专用”(between-only)的类型。 由于水平-1的协变量在WITHIN中定义,因此不会在水平-2方程中出现。所以,在MLM模型中,如果水平-2需要水平-1 对应的变量,需要手动将水平-1相应变量聚合(也就是取组均值或比例)到水平-2,然后指定其属于BETWEEN层面,才能参与水平-2模型建构。
水平1
水平2
这里不妨针对PISA数据中的相应变量分别以MMC和MLC建模,通过对代码和结果进行比较,增进对二者建模思路差异的认识。
使用MMC方法建模时,纳入水平-1方程的家庭社会经济地位进行了组中心化处理 (这里未预处理,而是在Mplus代码DEFINE部分进行处理),水平-2方程纳入的则是预处理的不同学校学生平均的家庭社会经济地位变量(grouphisei),同属显变量。在变量声明部分,分别指定了二者所属层次。而在运用MLC方法的模型中,参与建模的是家庭社会经济地位的原始变量。变量声明部分,没有指定变量隶属的层次。模型部分,在WITHIN层次,结果变量和预测变量分别指向Y和X, 而在BETWEEN层面,则分别指向Y;和X。
默认最大似然估计(MLR), 两种方式的输出结果见下表。
从结果来看,MMC和MLC方法在WITHIN部分的系数是一致的,γi均是1.102。然而,BETWEEN部分有较大差异,MMC方法γoi=5.065,而MLC方法γo₁=5.763。 计算情
境效应(β),MMC:5.065-1.102=3.963,MLC:5.763-1.102=4.661 (代码中也给出了通过
增加MODEL CONSTRAINT自动输出情境效应的命令)。如果MLC的估计更接近真实值
的话,那么从结果来看MMC低估了情境效应。
不过MLC针对的是单指标观测变量,虽然可以控制抽样误差但并没有考虑测量误差(Lüdtke et al,2011)。 通过强调各构念多观测指标测量并使用潜聚合方式形成水平-2构念,Marsh、Ludtke等(Marsh et al,2009;Lüdtke et al,2011; Marsh et al,2012; Morin et al,2014)将应用于情境效应分析中的MSEM称作“双潜多水平模型”(doubly latent multilevel model)。 因为这样的设置实现了同时对水平-1 与水平-2由于“题项抽样” (sampling items)造成的测量误差和由于在水平-1特征聚合构建水平-2构念过程中“个体 抽样”(sampling of persons)存在的抽样误差的校正。按照这样的标准,传统 MLM 则属于双显模型(doubly manifest model),特点是显测量、显聚合,两种误差均未考虑。如果构念采取的是单指标而非多指标测量,但通过潜聚合控制了抽样误差,属于显-潜模型(manifest-latent model)。
MLC即属于这种情况(Ludtke et al,2011)。 一些组群层面指标构建研究中常用的将各指标进行聚合后在组间进行单水平因子分析的处理方式属于典型的潜-显模型,亦即通过多指标控制了测量误差但没有通过潜聚合控制抽样误差。潜-显模型与显-潜模型同属部分校正(partial correction)模型。标准的MSEM 属于双潜模型, 各观测指标基于MLC方法进行组间/组内分解(除非严格属于特定水平的专用变量),同时各水平潜在构念基于(分解后)多指标进行估计。
上述方式赋予MSEM相对于MLM所不具备的优势。 一方面,MSEM实现了对测量误差和抽样误差双重校正,减少了由于在水平-2采用聚合组均值带来的偏误。同时,组群层面系数估计也得到校正。另一方面,MSEM在进行多水平分析时层次分明、更具灵活性。各层可以只考虑本层要素的方差,不同水平之间互相独立。比如,多水平验证性
因子分析(以下简称 MCFA)中,可允许不同水平设定具有差异的因子结构。多水平中介或调节效应分析中可方便纳入不同层面协变量进行“跨水平”中介效应分析,而不会产生传统MLM进行多水平中介效应分析(除非进行必要处理否则)会出现的组内/组间效应混淆的问题(Krull & MacKinnon, 2001; Zhang et al, 2009; Preacher et al, 2010;Preacher et al, 2011;Li & Beretvas,2013; Preacher et al,2016),相对于MLM估计更为简单也更加准确。
三、估计方法
(1)Muthén “伪平衡法”
在Muthén(Muthén,1989;1990;Muthén & Satorra,1995)的早期讨论多水平协方差结 构模型(multilevel covariance structure model)的论文中,为了处理样本非均衡(即各组样本量不同)的问题,采取一个变通的方式,设置了c参数(接近于平均的样本规模)。这种解决方式不是充分信息最大似然估计(FIML), 而是所谓有限信息最 大似然估计(LIML), 或称为“伪平衡法”(pseudo-balanced soulution)(McDonald,1994),或MUML(Muthen's ML-based maximum likelihood
estimation)(Muthen,1989;1990;1994)。 如果两层样本量都足够大,各组群样本量相差不是很悬殊,伪平衡法的估计也将与充分信息最大似然估计(FIML)接近(Muthen,1989;1990)。
近来有模拟研究(Yuan & Hayashi,2005)则指出,大样本并无助于改善不平衡数据的精确性。对于严重不平衡数据,MUML会产生有偏的标准误和显著性检验,且不会随着样本量增加而消除(Hox,2010)。
目前在Mplus中MUML法仍可以使用,但实际上有更好的方法,如MLR、WLSM(V)等(Asparouhov & Muthen,2003;Hox et al,2010)。 新方法一般采取EM算法,并不特别要求分别估计组间和组内协方差矩阵(所谓联立估计,simultaneous approach),有的允许有缺失值和随机斜率,响应变量也可以是类型变量。
(2)充分信息最大似然估计
为了处理非均衡数据和缺失值的问题,FIML被引入SEM估计。非平衡数据,视为一种不完整数据(incomplete data),适用FIML估计方法(Arbuckle,1996;Neale,2000; Bauer,2003; Bentler & Liang,2003;Liang & Bentler,2004)
目前Mplus、GLLAMM、Lisrel 等程式都可以使用FIML处理多水平结构方程模型。而且,对于组间模型(between-groups model),两阶段法(包括MUML和WLS)只能包括随机截距,而FIML还可以将随机斜率整合进来(Mehta & Neale,2005),也就是允许因子负荷跨层随机变动。
Asparouhov & Muthén(2003)提出了3种以EM为基础的最大似然法估计:ML、MLF和MLR。3种估计方法的区别主要在于标准误的估计。模拟研究表明,MLR作为稳健的充分信息ML估计,不需要正态性假定,给出非正态稳健标准误估计,因此尤其对于非正态变量分布,具有更好的表现。 MLR目前是Mplus针对多水平潜变量模型默认的估计方法。
(3)加权最小二乘法
对于类别变量和非正态数据, ML法估计需要高维数字积分,计算量很大。基于Muthén(
1984)提出的WLS方法(weighted least squares estimation), Asparouhov &Muthén (2007)提出WLSM( weighted least squares-mean-adjusted estimator)估计方法,不仅可以完成对类别变量、删节、正态分布连续变量及其组合的多水平潜变量模型的估计,而且可带有随机截距,协变量数量任意。
WLS法使用样本方差协方差矩阵S; 和Sw作为权重矩阵,得到校正的卡方和标准误估计。标准的WLS进行估计时,构造所有待估参数的渐进协方差作为权重矩阵。随着因子和样本数增加,数值积分增加,运算量增大。尤其对于非约束模型,由于参数较多,矩阵会变得很大,甚至超过样本中组群个数,导致奇异矩阵,估计不能继续。因此除非组群规模特别大, 一般采用矩阵的对角元素,即Diagonal WLS。
Mplus中有两种加权最小二乘方法:WLSM和WLSMV。 区别在于卡方的计算。如果卡方采用均值校正(mean-adjusted),则为WLSM; 如果采用均值-方差校正(mean-and variance adjusted),则为WISMV。
需要注意的是,如果使用WLSMV(以及MLMV)进行估计,模型差异检验要通过SAVEDATA中设置DIFFTEST选项实现。
(4)贝叶斯法
对于某些样本量较小、计算量巨大、迭代收敛困难的MSEM模型,可以尝试贝叶斯估计(Baldwin & Fellingham,2013; Depaoli,2015)。
Depaoli & Clifton(2015)的模拟研究表明,由于MSEM的复杂性,有时最大似然法可能造成组间方差成分为负或参数估计有偏的问题。使用Markov chain Monte Carlo(MCMC) 算法的贝叶斯法可以克服收敛问题,改善参数有偏估计。
(5)不同较方法比较
Hox(2010)指出,(基于频次框架的)几种方法相比较,伪平衡MUML法准确性较差, 尤其是对组间模型的估计。模拟分析(Hox et al,2010)表明,WLS和FIML估计接近,准确性均较MUML要好。不过,尽管在数据违反多维正态分布时MLR估计要比ML更准确,但需要更大的样本规模。样本量比较小时,不推荐使用稳健方法。
Asparouhov & Muthen(2007;2008)的模拟分析则表明,相比于EM和MCMC, WLSM(V)计算更有效率。如果潜变量是类型变量,WLSM(V) 估计优于MLR。 如果是连续的正态分布,则与MLR结果一致。几种常用方法及适用情况见下表。
四、拟合指标
结构方程模型可以提供拟合指数,以评价模型与数据的拟合程度。相比于一般的多水平回归模型,SEM也具有这样的优势。
评估模型拟合程度也是MSEM建模的重要内容。不过,由于TLI、CFI、RMSEA等常用指标源于单水平SEM, 用以MSEM的评价存在一定问题。因为这些指标是针对模型整体而言的,未能考虑MSEM的多水平结构。所以实际中常常由于高水平样本量较小,这些笼统的指标难以有效评价高水平模型的设定问题。
故而,由此计算而得的指标,如CFI(comparative fit index)和RMSEA(root-mean- square
error of approximation)等指数,可能主要反映的是水平-1的情况,对水平-2拟合差的问题缺乏敏感度( Yuan & Bentler,2007;Ryu,2008;Ryu,2014)。 即使这些指数显示拟合较差,也不清楚到底是在哪一层面较差,还是两个层面都表现欠佳。对此,出现了两种替代性方法:利用偏饱和模型分别评估不同水平模型(Ryu & West,2009)以及通过分割多水平协方差结构为多个单水平协方差结构( Yuan & Bentler,2007)。Ryu(2014)的模拟 研究支持了上述两种方法相对于传统方法的优越性。
水平特定 (level-specific) 的拟合评价对于鉴别MSEM 设定问题更具优势(Schermellehengel
et al,2014)。 对于MSEM, 目前Mplus默认输出结果中,SRMR是分水平输出的,是唯一可以分别用以评价不同水平模型的拟合程度的指标。其他拟合指标非水平特定。
进一步的模拟分析(Hsu et al,2015)表明,对于MSEM,CFI、TLI和RMSEA只能识别组内模型的误设,对模式系数(pattern coefficients)更灵敏,而 SRMR-W则对因子协方差 (factor covariance)误设更灵敏。而且在组内因子协方差误设问题上,TLI表现好于CFI和RMSEA。Hsu(2009)建议使用SRMR-W结合RMSEA和CFI评估组内模型。
另外, SRMR-B是目前唯一对组间模型误设灵敏的拟合指数,而且对因子协方差比模式系数的误设更灵敏(Hsu et al,2015)。 不过,在ICC过小的情况下,SRMR-B对组间模型误设识别敏感性降低,也不推荐使用(Hsu,2009;Boulton,2011;Hsuet al,2016)。
同时,也可以借助输出结果中卡方值、LL值进行模型比较,从而评估模型相对的改进情况。 Mplus中 ,MLM和MSEM估计方法基本通用。