劉 源 ,劉紅云
(1.北京師范大學 心理學院,北京 100875;2.香港中文大學 教育學院,香港 999077)
早在西漢時期,劉向在《戰國策·齊冊三》中就提出來的“物以類聚,人以群分”的思想傳承至今,對于總體分群的科學研究意義也在于此。當然,并不是所有的分群都像性別、出生地那樣可以直接觀測或通過測驗得到。由于觀測不到的異質性,研究者需要考慮同一個樣本或總體中的潛在群體,這就是潛類別分析(LCA)的初衷,即根據一系列的觀測變量將被試分群。然而,對于LCA的基本假設,其觀測變量和潛變量均是離散型數據,這對于被試特性的描述信息不充分[1],阻礙了潛類別分析的進一步發展。所以,潛變量量尺的拓展成為這類模型發展新的契機。
由于心理學所研究的個體特質的復雜性,潛變量技術對數據類型的要求也變得復雜。在結構方程模型、因素分析等潛變量技術下,其重要前提假設就是群體的同質性。反映在因素分析里,則假設“因素”(潛變量)是連續變量,即潛變量屬于“尺”量表。如果潛變量的量尺不能用一個連續的特質來解釋,比如人群中的“特質類型”或者發展趨勢中發展曲線不同的組,潛變量是連續變量的假設就被推翻,即潛變量屬于“類”或“群”量表,需要用到另外的模型。潛變量也和觀測變量一樣,存在一個量尺。Masyn,Henderson 和 Greenbaum[2]提出的“尺類譜(DCS)”描述了潛變量的量尺。在這個譜系上,潛變量由完全的類別變量變化到完全的連續變量,不同的潛變量數字特征類型對應了不同的分析方法。
潛變量量尺的拓展,使得潛類別模型的應用迅速拓展。研究者在不知道潛變量數據類型假設的時候,可以通過模型比較的方法探索,以確定潛變量的類型。如果在這個譜系的“尺量表”端,則使用因素分析(FA)/項目反應理論(RT),它們假設潛在特質(如FA中的因素,IRT中的被試能力水平θ)是連續變量;而另一端為“類量表”,則使用LCA模型,它假設潛變量為類別變量,總體具有不同質的特征。從“尺量表”過度到“類量表”,可以將潛變量看成其他混合型數據,根據潛變量在譜系上的不同位置,還可以使用混合因素分析(FMA)、半參數因素分析(FA)、混合半參數因素分析等不同的技術(詳見表1)。

表1 潛變量分析技術
想要宏觀地把握潛類別模型分析的技術,可以根據心理學的研究范式,從橫斷和追蹤研究兩個方面去了解各個模型的使用條件。
2.1.1 因素分析中的分類
對潛變量量尺的拓展,極大的豐富了潛類別模型的應用。所以,從這個角度出發,LCA也可以看成是一種廣義的因素分析模型(如圖1所示)。假設觀測變量都是類別(或連續)變量的情況下,LCA模型假設潛在因子是一個類別變量,在項目的反應概率量尺上有不同的類別,類內不存在變異;而IRT模型(或FA模型)則是一個假設潛在因子(能力)是連續變量的模型,在項目反應概率量尺上存在連續變化的一個群體[3]。其中,觀測變量為連續,潛變量為類別的情況,較早的研究提出“潛在剖面分析”。但是隨著LCA技術的發展,其已經將觀測變量拓展到連續變量的情形下,所以較新的研究都使用LCA代替之[4]。

圖1 幾種因素分析模型的數據假設及其比較
對于潛變量的數字特性,可以從原來的“連續”“類別”兩種極端情況推廣到“混合”模式。在尺類譜的中間,可以得到混合IRT(MIRT)或混合因素分析(FMA),潛變量是混合型,其數據特征要求總體不同質,即總體用“類”度量;同時,在每一個群體里,都可以用連續的因素來表征,即群內用“尺”度量[2]。在實際應用中,FMA假設在項目反應概率上存在不同的群類,而群類內又存在組內變異,可以解決因素分析中總體不同質的問題。
由此可知,在尺類譜上可以組合成很多較為實用的模型;不同模型假設不同,其解決的問題也不同,針對不同總體內部的形態也不同。如果分群不存在組內差異,LCA便是較好的選擇,其在認知、臨床、教育考試、心理測驗等領域有廣泛的應用[1,5]。如果分群具有組內差異,MIRT(或FMA)則是首選。它們可以廣泛地應用在臨床病理與學習障礙研究[6,7]、心理與人格測驗[8,9]等領域,旨在連續的總體中找到不同的群,并探討用不同的機制和手段分別對不同的群體進行干預。
2.1.2 多水平混合因素分析模型
前文中所提到的數據模式,均在同一層級的抽樣中產生。而在實際中,特別是在組織行為學和教育心理學領域,分層數據更為常見。這種數據就稱為多水平結構的數據,其分析方法多采用多水平模型(MLM)或多層線性模型(HLM)。在MLM中,多層數據結構違反了一般回歸分析測量誤差殘差獨立的假設,測量的變量來自于不同層級。在MLM的分析思路中,核心的思想就是將變異分解為組間變異和組內變異[10]。此后,研究者將多水平的數據應用到結構方程模型當中,衍生出了多水平驗證性因素分析模型(MCFA)等技術,并且開發出了相應的軟件(如Mplus)使得多層分析的技術得到了很好的發展。
在多水平數據的結構下,變異同樣可能存在潛在的異質性。多水平混合模型(MMM)[11]結合了多水平數據和混合模型的思路,可以探討多水平結構下數據的潛在組別或者潛在群類對結果變量(連續變量、分類變量、稱名變量等變量類型)的影響。在該模型提出之后,一系列的研究者對其估計方法做出了拓展,一般建議使用EM的估計方法或貝葉斯的估計方法。
圖2是一個橫斷研究中混合MCFA的模型示意圖。觀測變量y1-y5的方差分解為組內部分(方框)和組間部分(圓圈),需要估計隨機部分的在組內用黑點表示。fw表示組內的因子,受到潛類別變量c的直接影響。fb為組間的因子,在組間部分,c有組間的隨機效應,隨機截距便成為組間因子fb的指標。在這個模型中,組間部分的因子殘差方差為0。如果在組間存在類別c與組間因子fb之間的路徑,該模型變會變得復雜,產生許多跨級交互作用。研究者將混合MCFA模型應用到智力測驗、人格測驗、教育與學校的分層研究和臨床診斷等領域上。在此基礎上,研究者可以定義許多復雜的模型,且在不同層級上可以定義不同類別數,這使得該模型變得非常靈活。比如在混合MCFA中,研究者可以將學生對學校的滿意度在不同學校的層級內分別建模;在混合IRT模型框架下,例如在跨文化地域研究中,研究者可以針對不同國家、不同洲進行分層,以建構不同文化下的類別模型,或對學業成就進行DIF檢測。

圖2 多水平混合因素分析示意圖
2.2.1 群的調節作用:潛類別轉換分析

圖3 潛類別轉換分析模型示意圖
如果對于不同時間點分別做LCA分析,則衍生出潛類別轉換模型(LTA)。Nylund等人(2007)建議,在做LTA分析的過程中,首先就是在不同時間點分別做LCA模型(潛變量分別為c1和c2),其次使用列聯表觀察分類變化的情況,然后再分析類別c1到類別c2的轉換情況(圖3)。在這個列聯表中,研究者可以分析某一個類別的群體隨著時間的推移,其性質發生了怎樣的改變,或者在什么樣的條件下(加入協變量),哪些群體會轉變成另外一個群體。這類研究思路旨在探討個體隨時間變化的類別轉變,特別在發展心理學中很有價值。
上述研究的例子表明,協變量(貧窮水平)成為一個類別轉換的調節作用。Muthén,Muthén和Asparouhov[12]在對同一批數據的處理當中(c1和c2都有兩個類),將c1的兩個類別分別定義:第一個類自由估計;第二個類的估計中,固定了c2的第一個類對貧窮回歸系數的概率為0(即EWR轉換為LAK的概率為0),與前人得出了相同的結果。這表明,由于分析的關鍵變量(潛類別變量c1、c2和協變量X)都是分類變量,所以不僅協變量可以有調節作用,類別潛變量同樣可以分析調節作用。除此之外,他們還在此基礎上,添加另一個類別潛變量c作為高階因子,從中概括出具有不同轉換模式的群類[21]。同時,他們還將LTA與FMA模型結合,其結果比傳統LTA模型擬合更好,且能發現與前人研究不太一致的地方,都是值得進一步思考的問題。
2.2.2 增長模型中的群:潛類別增長分析與混合增長模型
和LTA不同的是,潛變量增長模型(LGM)[13]側重的并不是類別中個體隨時間的轉換,而是個體隨時間的發展趨勢。它是在追蹤研究的范式下發展起來的以研究總體發展趨勢為中心的一類統計模型。它建立在驗證性因素分析的模型基礎上,通過結構方程模型的視角,揭示指標變量、協變量與增長因子之間的關系,并且與多水平模型(MLM)[14]模型融會貫通,LGM模型和MLM之間有相互等價轉換的關系[15]。
在增長模型中的一個很重要的假設就是個體發展的同質性。同樣在實際的情景中,總體可能并非同質,且這種非同質性是無法測量的,即存在“觀測不到的異質性”。在此情況下,需要對測量個體進行分類,結合LCA衍生出兩種重要的模型:潛類別增長分析(LCGA)[16]和混合增長模型(GMM)[17]。圖4中表示了潛變量的兩種不同的假設(與圖1類似)。其中,如果模型中包涵虛線部分即GMM,如果沒有則為LCGA。不難發現,這兩種模型最主要的區別就是是否允許類內存在變異。LCGA假設類別內是同質的,不存在變異;而GMM放寬了這種限定。此外,如果在圖4中不考慮與潛變量c有關的路徑,則該模型就是一個LGM模型。所以,LGM是只有1個類的GMM模型,而LCGA模型是限定潛類別變異為零的GMM模型,二者均是GMM模型的特例。一般地,LCGA假設觀測變量也是類別變量,但是由于軟件(如Mplus)的發展,LCGA也放寬了觀測變量為類別變量的假設,只需限定GMM隨機部分為零即可[4]。

圖4 潛變量(混合)增長模型的數據假設及其比較(包含虛線部分即混合增長模型)
2.2.3 多水平混合增長模型
在追蹤數據的分析方法中,MLM方法也很常用。因為研究者可以把追蹤數據看作測量嵌套于個體的模式,這樣數據便有了多層結構。在追蹤研究中,比如增長趨勢類的研究,研究者可以將GMM與多水平數據相結合,衍生出多水平GMM模型(MGMM)。由此可知,MMM模型既可以應用于橫斷研究,也可以拓展到追蹤研究中,但是由于追蹤研究本身就存在一個嵌套數據結構(測量嵌套于個體),所以追蹤研究模型的層數比橫斷研究的多。如圖5所示,該模型中存在個體水平(第二水平)和組水平(第三水平)的協變量,且個體存在不同的類別,那么研究者就需要定義一個三水平的混合模型,其中iw和sw都是組內的增長因子,組內的協變量為x,組內類別為c;ib和sb為組間增長因子,組間協變量為w,w會對分類造成影響。Palardy和Vermunt(2010)使用MGMM的多階段增長模式對學生的數學成績進行分析。其研究中,由于既分析了增長曲線的類型,又考慮了個體水平(社會經濟地位、是否為亞洲人、黑人或西班牙人等)與學校水平(平均社會經濟地位、教師職業性等)的變量,故建立了三水平模型。按照一般多水平模型的思路,需要依次考慮不同截距和斜率的隨機部分,所以該研究中發現,如果考慮不同水平的隨機部分之后,其最后選擇的類別數目也不同。

圖5 多水平混合模型示意圖
當然,并不是所有研究都偏向于將被試進行分類。Yampolskaya等人[18]的研究便采用MMM的方法在對兒童的研究中拒絕了兩類別的模型,得出其研究樣本同質性的結論。該研究同時也指出,使用MMM模型不單可以分類,同樣可以根據統計指標(如AIC、BIC)判斷被試是否同質(關于類別選擇的問題會在下文進行探討)。盡管MMM應用價值正在逐步體現出來,但多水平模型本身比較復雜,加入各層的協變量后,交互作用特別是跨級交互作用也較為繁瑣,不易解釋,所以研究者需要對數據驅動的模型進行較為深刻的理論解釋。但是,可以推斷,在統計技術逐漸發展的當今社會,多水平模型會成為蓬勃發展的一個分支,對實證研究做出更大的貢獻。
前文描述的諸多潛變量分析技術,按照潛變量的數字特征和研究類型可以總結成表1,研究者可以根據研究的內容和數據特征靈活選用不同的潛變量分析技術,從而得到合理的可以推廣的研究結論。
在潛類別模型中,模型選擇是一個比較復雜而且一直存在爭議的問題。同樣由于混合模型數據驅動嫌疑較大,所以研究者一般都采用探索性的方法對實際數據進行分析。比如在追蹤研究中,研究者們同時使用GMM和LCGA對數據進行擬合,并且從1個類別開始,逐步增加類別,以“數據說話”代替繁瑣的理論辯解,通過鑒定指標來判斷最終模型應該取多少個類別。大多數研究者偏向使用BIC,LRT以及熵值來判斷類別的擬合情況和模型的分類情況。也有一部分研究者對數據驅動的模型提出質疑,建議運用協變量納入模型中進行模型選擇,并強調實際意義應該是研究者在分類中需要重點考察的和關心的問題。
此外也有研究者偏向使用“返回指數”(如ARI)來選擇模型。因為返回指數在計算方法上不同于其他擬合指標,其可以評價不同指標的優劣。Steinley和Brusco[19]的研究中就使用了ARI去判斷比較使用BIC分類結果和CH指數分類結果的好壞。其他一些研究者也采用ARI來判斷各種分類指數分類結果和真實類別之間的返還程度。由此可知在研究者面臨多個選擇指標的時候,ARI可以考察這些分類指標,而非僅僅考察數據。有了這個指標之后,研究者在考慮使用何種指標進行最后的模型選擇就有了更有說服力的依據。
對于模型選擇問題,未來的研究應該幾種在模擬和實證研究基礎上,為研究者們提供實際的證據。在眾多的擬合指標中,研究者應該先看什么,再看什么,最后再根據什么指標進行調整。特別是對于潛在距離不大的數據,使用GMM和LCGA的兩難選擇問題,以及模型的擬合(如BIC)與分類結果(如熵)確定性之間可能存在的相悖關系,需要進一步深入研究討論。
在上述模型中也看到了,對于潛類別c的分類效果,研究者往往希望考慮協變量的影響而并非純粹的指標變量的影響。比如在CACE效應中,研究者往往會在模型中直接加入協變量X,這樣的c的分類結果就不能由純粹的指標變量所導致。研究者就會有疑惑,潛在類別應該是由固有的指標變量決定的,還是由其他協變量相互影響而決定的?對于帶有協變量的LCA模型,也一直存在爭論:是否應該加入協變量來決定最終分類的問題?由于LCA模型固有的數據驅動之嫌,研究者也在不斷探索出較為合理的分析步驟。一般研究者認為,確定最終分類應采用指標變量。有兩種較為傳統的手段:一種是“三步法”,即先用指標變量分出類別,再根據分類結果判斷出外顯的類別指標,最后再在此基礎上分析協變量;另一種是“一步法”,即在模型估計的時候就加入協變量對類別的影響。對于后者,研究者們進行了反駁,認為加入協變量之后,模型的估計會發生變化,但是前者卻只考察了正確分類的類別,并沒有將錯誤類別的概率考察在內,故這種直接判別類別的方法沒有充分利用LCA模型的信息。Bolck,Croon和Hagenaars[20]就討論過這兩種方法的區別,針對第二步的分類誤差提出了“BCH三步法”對傳統三步法方法進行矯正;在此基礎上,Vermunt[21]總結了前人的研究并提出了更優化的“ML三步法”,認為研究者需要考慮類別變量的分類概率的影響,利用后驗概率的信息對外顯的分類結果進行矯正。在“ML三步法”中,第一步估計仍然做傳統的LCA,不添加協變量,但是需要記錄其分類后驗概率的結果;第二步根據分類的概率,計算出每個類別的發生比;第三步是在固定每個類的閾值等于發生比的基礎上,再考察協變量對預測變量的影響,這又體現了類別c的調節作用。之后,Asparouhov和Muthén[22]提出添加“輔助變量”的方式得以軟件的實現和方法的改進。
Asparouhov和Muthén認為,潛類別c和協變量X存在兩種不同的關系。一種是Vermunt[21]的“ML三步法”,X作為潛類別c的一個預測指標去預測c的分類,此時研究者需要做c對X的邏輯回歸,即潛類別回歸分析;而另一種情況是c作為預測變量對一組外顯的X預測,被稱為遠端變量。在添加了輔助變量的估計中,最后根據模型的熵值來決定應該怎樣選擇模型。他們根據模擬研究結果建議,在熵值<0.6的時候應該使用傳統的一步法,熵值介于0.6到0.8之間時應該考慮傳統的分類方法以及Vermunt的“ML三步法”,而當熵值>0.8的時候,三種方法都尚可[22]。
當然,這個規則也只是“拇指法則”。Asparouhov和Muthén在其模擬研究中,生成數據的時候使用了包涵了協變量的模型,所以該模擬結果勢必會偏向添加了輔助變量的結果。如果模型改變,輔助變量是否能繼續有效,比如在模擬的時候,生成的數據模型就不包涵協變量的數量關系,得到的結果是否還能一致的指向輔助變量的結果?對于這種剛剛興起的方法,還需更多的探索。
潛變量量尺的拓展使得潛類別模型千變萬化,衍生出各式各樣的新的模型。研究者如何在眾多模型中保證選擇恰當的模型應用到自己的研究中,需要對以下方面有所關注。
(1)潛變量和觀測變量。研究者需要清楚的了解所研究對象是否可以觀測,如果是潛在特質,需要通過哪些外顯的行為指標,這些指標是否可靠(如是否需要考慮輔助變量)。(2)連續變量和類別變量。分別從潛變量和觀測變量的角度去確定變量的性質,不同的數據特點對應了不同的統計方法(如LCA與IRT的選擇)。如果是連續變量,需不需要考慮個體差異(如LCGA與GMM的選擇,LCA和MIRT的選擇)。(3)是否含有多水平數據。如果被試存在嵌套結構,那么多水平模型便成為研究者的首選;如果這種嵌套結構不明顯(隨機效應不顯著),那么仍然可以使用原有的模型(如CFA和MCFA的選擇)。
有了上述的思想,研究者可以進一步的根據自己的研究,選擇合適的模型。在橫斷研究中,探討總體分群的問題主要采用LCA的方法,以及將LCA與傳統的因素分析、IRT相結合的FMA、MIRT等混合的方法;在縱向研究中,LTA解決群間個體的轉換規律的問題,而探討增長趨勢的類別則用LCGA或GMM等。除此之外,多水平模型的框架下同樣可以探討橫斷或追蹤研究中的分群,解決嵌套數據結構中總體不同質的問題。
當然,由于該領域還十分年輕,還有很多值得研究者探討的地方。比如在類別數量的確定上一直存在的爭論,以及協變量對分類的影響,都有待進一步的討論。潛類別模型會成為統計模型發展的一大趨勢,對于連續變量無法解決的分群的問題,以及群的轉換的問題,潛類別模型會有巨大的發展空間。
[1]張潔婷,焦璨,張敏強.潛在類別分析技術在心理學研究中的應用[J].心理科學進展,2010,18(12).
[2]Masyn K E,Henderson C E,Greenbaum P E.Exploring the Latent Structures of Psychological Constructs in Social Development using the Dimensional-categorical Spectrum[J].Social Development,2009,19(3).
[3]邱皓政.潛在類別模型的原理和技術[M].北京:科學技術出版社,2008.
[4]Muthén L,Muthén B.Mplus User's Guide(Seventh Edition)[M].Los Angeles,CA:Muthén&Muthén,2012.
[5]焦璨,張潔婷,關丹丹等.2007~2009年研究生心理學專業基礎綜合考試的潛在類別分析[J].中國考試,2010,(4).
[6]De Meyer G,Shapiro F,Vanderstichele H.DIagnosis-independent Alzheimer Disease Biomarker Signature in Cognitively Normal Elderly People[J].Archives of Neurology,2010,67(8).
[7]Muthén B.Should Substance use Disorders be Considered as Categorical or Dimensional?[J].Addiction,2006,101(Supplenent S1).
[8]Thomas M L,Lanyon R I,Millsap R E.Validation of Diagnostic Measures Based on Latent Class Analysis:A Step Forward in Response Bias Research[J].Psychological Assessment,2009,21(2).
[9]Maij-de Meij A M,Kelderman H,Van Der Flier H.Fitting a Mixture Item Response Theory Model to Personality Questionnaire Data:Characterizing Latent Classes and Investigating Possibilities for Improving Prediction[J].Applied Psychological Measurement,2008,32(8).
[10]Muthén B.Latent Variable Modeling in Heterogeneous Populations[J].Psychometrika,1989,54(4).
[11]Asparouhov T,Muthén B.Multilevel Mixture Models,in Advances in Latent Variable Mixture models[R].Hancock G R,Samuelson K M,Editors.Charlotte,NC:Information Age Publishing,2008.
[12]Muthén B,Muthén L,Asparouhov T.Latent Variable Modeling using Mplus[R].Beijing:National Survey Reserach Center at Renmin University of China,2012.
[13]Muthén B O.Beyond SEM:General latent Variable Modeling[J].Behaviormetrika,2002,29(1).
[14]Raudenbush S W,Bryk A S.Hierarchical Linear Models:Applications and data Analysis methods(2nd ed)[M].Thousand Oaks,California:Sage Publications,2002.
[15]Willett J B,Sayer A G.Using Covariance Structure Analysis to Detect Correlates and Predictors of Individual Change Over Time[J].Psychological Bulletin,1994,116(2).
[16]Nagin D S.Analyzing Developmental Trajectories:A Semiparametric,Group-based Approach[J].Psychological Methods,1999,4(2).
[17]Muthén B,Brown C H,Booil Jo K M,et al.General Growth Mixture Modeling for Randomized Preventive Interventions[J].Biostatistics,2002,3(4).
[18]Yampolskaya S,Armstrong M T,King-Miller T.Contextual and Individual-levelPredictors ofAbused Children's Reentry Into out-of-home care:A Multilevel Mixture Survival Analysis[J].Child Abuse&Neglect,2011,35(9).
[19]Vermunt J K.Latent Class Modeling with Covariates:Two Improved Three-step Approaches[J].Political Analysis,2010,18(4).
[20]Steinley D,Brusco M J.Evaluating Mixture Modeling for Clustering:Recommendations and Cautions[J].Psychological Methods,2011,16(1).
[21]Bolck A,Croon M,Hagenaars J.Estimating latent Structure Models with Categorical Variables:One-step Versus Three-step Estimators[J].Political Analysis,2004,12(1).
[22]Asparouhov T,Muthén B.Auxiliary Variables in Mixture Modeling:A 3-step Approach using Mplus[R].in Mplus Web Notes,No.15,2012.