王傳毅,查強
(1.武漢大學教育科學研究院,武漢430072;天津大學教育學院,天津300073)
基于聚類分析的高等教育系統(tǒng)多樣性測量
王傳毅1,查強2
(1.武漢大學教育科學研究院,武漢430072;天津大學教育學院,天津300073)
現(xiàn)有聚類分析測量的高等教育系統(tǒng)多樣性存在著忽略院校類別分布和類別差異程度等主要缺陷,文章提出的基于先驗分類信息、基于最佳分類數(shù)以及基于類數(shù)和距離關系的三種測量方法可對現(xiàn)有測量進行有效地改進。中國高等教育系統(tǒng)多樣性測量的案例顯示:三種測量方法具有較高的一致性。
高等教育系統(tǒng);多樣性;聚類分析;中國案例
多樣性是后大眾化時代高等教育發(fā)展的重要特征之一。系統(tǒng)多樣性對于高等教育的發(fā)展有著舉足輕重的作用。首先,在高等教育從精英化走向大眾化的今天,系統(tǒng)的多樣性有助于滿足多元化學生群體的多樣化需求;其次,多樣化的高等教育為社會弱勢群體提供了更多的入學機會;同時,多樣化的高等系統(tǒng)能夠更好地適應勞動力市場對第三級教育學位獲得者的需求。[1]因此,高等教育的擴張和多樣化往往是相伴而生的現(xiàn)象。惟其如此,如何測度一國高等教育系統(tǒng)的多樣性成為眾多政策研究者和學術界關注的一個焦點問題。本文致力于開發(fā)一種測度高等教育體系多樣性的可靠方法。有了這樣的方法,決策者可以簡潔直觀地了解特定高等教育系統(tǒng)多樣性的變化,從而尋求對策。研究者則可以迅速獲得研究新方向的信號,因此探求現(xiàn)象背后的驅動因素。本文也是一個大型課題的子項目。這個大型課題尋求將組織行為理論與大學文化(包括學科文化)的觀點結合起來,建構一個關于高等教育體系多樣性的多層次、多維度的分析框架和研究方法。
依據博恩本(Birnbaum)的界定,高等教育系統(tǒng)多樣性(Systematic Diversity)是指“高等教育系統(tǒng)中所共存的具有不同愿景、規(guī)模以及歸屬部門等方面的高等院校的類型”。[2]
簡而言之,高等教育系統(tǒng)中院校所存在的類型是系統(tǒng)多樣性的直接反映。專注于“類型”,本文認為系統(tǒng)的多樣性主要取決于三個方面:
第一,院校類型的數(shù)量。院校的種類越多,多樣性越強。反之,則越弱。
第二,院校在各個類型之間的分布情況。在院校類型數(shù)量既定的情況下,院校在各類的數(shù)量分布越均衡,說明不同類型的高等教育越“百花齊放”,多樣性越強。反之,則說明某些類型的院校發(fā)展欣欣向榮,某些類型的院校“一枝獨秀”,其系統(tǒng)多樣性越弱。
第三,院校類型之間的差異程度。在既定的種類數(shù)量下,類與類之間的差異越大,說明系統(tǒng)多樣性越強。反之類與類的同質性越強,則說明種類的分化越不明顯,系統(tǒng)多樣性越弱。
當前高等教育系統(tǒng)多樣性的測量方法基本上是圍繞一國高等教育系統(tǒng)中院校的類型總數(shù)和院校在各類型中的分布情況來展開。其研究大多采用相同的路徑:運用因子分析、判別分析、聚類分析對實證的數(shù)據(例如院校類型、各級各類學生數(shù)、經費投入和發(fā)表論文等)進行處理,得到不同的高等學校類型及院校在各類型中的分布數(shù)量,從而計算出若干衡量多樣性的指標數(shù)值。[3-9]
在衡量多樣性的統(tǒng)計量中,辛普森指數(shù)與博恩本指數(shù)是應用最多的指數(shù)。辛普森指數(shù)是每一類中的個案數(shù)除以總個案數(shù)后的平方之和,其數(shù)值介于0和1之間,越接近于0說明各類越均勻,多樣性越大,反之則越小。博恩本指數(shù)是將樣本存在的類數(shù)除以個案總數(shù),越接近于1,說明多樣性越大。[10-11]兩個指數(shù)的特征在于:第一,在既定的類的數(shù)量下,辛普森指數(shù)衡量的是各類中個案分布的均衡程度和類的多少;博恩本指數(shù)衡量的僅僅是類的多少,不同類別中個案數(shù)目的變化不會影響其數(shù)值變化;第二,當不斷納入新的個案時,二者變化也不相同。當新的個案歸屬于樣本數(shù)量較少的類別時,辛普森指數(shù)就會降低,反之則增加;只要新的個案不能獨立成為一類,博恩本指數(shù)就不會變化。相較而言,辛普森指數(shù)比博恩本指數(shù)更靈敏。計算得到的辛普森指數(shù)或博恩本指數(shù)數(shù)值可用于歷時性和共時性(國際比較)比較,從而對一國高等教育系統(tǒng)多樣性程度作出判斷。
雖然已有的方法對高等教育多樣性的測量提供了莫大的支持,但它們也并非完美無缺:
首先,廣泛用于衡量多樣性的辛普森指數(shù)與博恩本指數(shù)存在明顯的局限。雖然它們可以反映類別數(shù)多少以及高等院校在各個類別中的分布情況,但卻忽略了類別之間的相似性程度(類間距離)這一重要方面。
同時,作為一種探索性分析,聚類分析的結果并不穩(wěn)定。聚類分析衡量個案之間的距離和類別之間的距離有多種方法。選取哪一種方法并無定論,但不同方法所得出的結果往往并不完全一致。處于“模糊地帶”的個案在不同的方法下游走于不同的類別之間。因此,如何保障聚類結果的可信度和不同方法的穩(wěn)定性成為非常重要的問題。
繼而,聚類分析的不穩(wěn)定性很大程度上使基于客觀數(shù)據形成的分類摻雜了更多主觀性的因素。如何選擇最佳的聚類數(shù)?這不是一件簡單的工作。雖然統(tǒng)計學提供了一些可資參考統(tǒng)計量或運用一些圖示的方法(聚合系數(shù)圖、合并進程圖),但在現(xiàn)實操作上,這些并非十分靈驗和準確。統(tǒng)計量之間可能會對最佳的分類數(shù)產生“爭執(zhí)”,圖示的方法在很大程度上依賴于研究者的主管判斷。雖然大多數(shù)作者并未將其聚類以及類數(shù)的選擇過程在文章中進行細致的描述,但我們猜想,這一定是個艱難抉擇的過程。
此外,運用因子分析化簡指標所造成的信息損失對多樣性的歷時性對比有著負面影響。如果將各年份所有的高校納入一個數(shù)據集提取主因子,則信息的損失很可能會弱化各年份高等教育系統(tǒng)的特殊性;如果將各年份高校的數(shù)據集分別提取主因子,則損失的信息會使對比的合理性基礎產生動搖,即不同年份所形成的高校分類是建立在不同的信息基礎之上,直接對比缺乏現(xiàn)實意義。
3.1基于先驗分類信息的多樣性測量
一般而言,一國政府、公眾或是第三方組織都會依據質量、地位或功能等標志對該國高等教育系統(tǒng)中的院校形成一個大致穩(wěn)定的分類。這種分類為高等院校貼上了醒目的標簽,并往往與其資源獲得相聯(lián)系。然而,高等院校的發(fā)展除了受到外部的影響,還遵循著自身的發(fā)展邏輯。院校傳統(tǒng)、學科文化以及院校內學術共同體的建構等多個方面也對院校發(fā)展產生著至關重要的影響。因此在院校發(fā)展的過程中,有的院校打破了既有的“標簽”形成了新的種類,從而對一國高等教育系統(tǒng)的多樣性產生影響。
因此,本文認為可將一國高等教育系統(tǒng)現(xiàn)有的種類數(shù)量和分類標準作為聚類分析所需設定的類數(shù)和指標,對系統(tǒng)內高等院校進行再分類,獲得院校在各類中的分布情況,從而利用相應的統(tǒng)計量測算出系統(tǒng)多樣性的程度。
在統(tǒng)計量的選擇方面,辛普森指數(shù)是一個不錯的選擇。然而,正如上文所言,辛普森指數(shù)只是依據樣本在各類別中的分布情況對多樣性做出判斷,各類之間的差異程度并未反映在內。幸好,統(tǒng)計學中的偽F統(tǒng)計量(Calinskiand Harabasz Pseudo F)為各類之間的差異程度的測量提供了途徑。
偽F統(tǒng)計量是聚類分析中所形成各組之間的組間差異平均值與組內差異平均值之間的比值。[13]應用于分析高等教育系統(tǒng)的多樣性,偽F統(tǒng)計量可以有效地彌補辛普森指數(shù)的不足,用類別之間差異的大小作為測量多樣性的另一個重要指標。在類數(shù)和組內差異既定的情況下,組間差異越大,偽F統(tǒng)計量越大,這表明各類高等院校之間的差異程度增大;在類數(shù)和組間差異既定的情況下,組內差異越小,偽F統(tǒng)計量越大,這表明相較于其它類別的高等院校,各類別中高等院校的同質性越強,即各類高等院校之間的差異相對更為顯著。
依據辛普森指數(shù)和偽F統(tǒng)計量的定義,辛普森指數(shù)數(shù)值和高等教育系統(tǒng)的多樣性呈反比,辛普森指數(shù)越小,多樣性越強;偽F統(tǒng)計量和高等教育系統(tǒng)的多樣性呈正比,偽F統(tǒng)計量越大,多樣性越強。
綜上所述,基于先驗分類信息的多樣性測量方法如圖1所示:依據先驗信息設定高等院校的類別數(shù)量和聚類指標,運用快速聚類(K-means Cluster和K-medians Cluster)的辦法獲得樣本院校在各個類別的分布信息以及類與類之間的差異程度,在此基礎上計算辛普森指數(shù)和偽F統(tǒng)計量從而測量高等教育系統(tǒng)的多樣性.

圖1 基于先驗分類信息的多樣性測量方法
3.2基于最佳分類數(shù)量的多樣性測量
雖然在既定的類別數(shù)量條件下,辛普森指數(shù)和偽F統(tǒng)計量能夠表征出一國高等教育系統(tǒng)多樣性的程度,但問題依然存在于既定的類數(shù)是否就是真實的、合理的類數(shù)。若非如此,則進行快速聚類所得到的各類院校分布就會有失偏頗,依據該分布計算得出的辛普森指數(shù)和偽F統(tǒng)計量就難以真實地反映高等教育系統(tǒng)的多樣性。
本研究的聚類方法為K均值聚類(K-means)和K中位數(shù)聚類(K-medians)。兩種聚類方法各具優(yōu)勢。K均值聚類能夠充分利用已聚集成類的個案的所有信息;K中位數(shù)聚類能夠在很大程度弱化極端個案對類重心計算的影響。
如何判斷兩種聚類方法的結果具有最大的一致性?我們建議的步驟如下:
(1)分別運用K均值聚類和K中位數(shù)聚類對一國高等院校進行分類,將類數(shù)設定為N,得到各院校在兩種聚類方法下的類別信息;
(3)將每一行(或每一列)中數(shù)值最大的xij作為K均值聚類下第i類與K中位數(shù)聚類下的第j類判斷一致的高等院校數(shù),并將其除以每一行(或每一列)的高等院校總數(shù),即,該比例為在第i類(或第j類)上K均值聚類與K中位數(shù)聚類的一致性指數(shù);
(4)求出i類(或j類)一致性指數(shù)的均值和方差。均值代表兩種聚類方法對高等院校類別數(shù)判斷的整體一致性水平,方差代表兩種聚類方法對類別判斷一致性的差異程度。
(5)依據一致性指數(shù)的均值和方差選取最佳的分類數(shù)。最佳的分類數(shù)應使一致性指數(shù)的均值最大、方差最小。
綜上,基于最佳分類數(shù)的多樣性測量方法如圖2所示:

圖2 基于最佳分類數(shù)量的多樣性測量方法
3.3基于類數(shù)與距離關系的多樣性測量
在既定的類別數(shù)量下,辛普森指數(shù)和偽F統(tǒng)計量能夠表征出一國高等教育系統(tǒng)多樣性的程度。即使既定的類數(shù)不是現(xiàn)實存在的合理類數(shù),我們也能依據不同聚類方法的穩(wěn)定性找出合理的分類數(shù)。但我們仍缺乏一種有效的方法能夠將類數(shù)和距離共同作為多樣性的測量途徑。基于此,本研究試圖放開對類數(shù)所做出的先驗假定,也不尋求最佳的分類數(shù),而是從聚類過程中類數(shù)和類間距離的關系入手來表征高等教育系統(tǒng)的多樣性。
本研究將采用層次聚類(HierarchicalCluster),依據指標計算出各個高校之間的距離,并將每個高校視為一類,然后按照高校與高校之間的距離進行聚類合并。先將距離較小的若干高校合并成一類,再逐步將距離較大的高校納入其中。隨著距離的增大,越多越多的高校聚集成類,類的個數(shù)也就相應減少,直到最后所有的高校聚為一類。
在此方法中,高等教育系統(tǒng)的多樣性不再是通過一個數(shù)值來衡量,而是一個基于類數(shù)與距離函數(shù)關系式的類數(shù)和距離的值域:(1)當類數(shù)固定時,高校之間的距離大小;(2)當高校之間的距離固定時,類數(shù)的多少。(1)和(2)等價,(2)是(2)的反函數(shù)。
其中特別需要注意的是,高校數(shù)量的多少會對類數(shù)產生最直接的影響,至少從層次聚類的第一步來看,高校數(shù)量越多、初始的類別也越多。特別是當我們對一國高等教育系統(tǒng)的多樣性進行歷時性對比和共時性對比(國際對比)時,比較絕對的類數(shù)不具有現(xiàn)實意義。因此,我們采用的是相對類數(shù),即樣本所聚集成的類別占樣本數(shù)(也就是最初的類數(shù))的比例。
為簡化分析,本研究將相對類數(shù)固定為25%、50%和70%,即當所形成的類的數(shù)量分別占總樣本數(shù)量的25%、50%和75%時各高校之間的距離大小作為高等教育系統(tǒng)多樣性的度量。
綜上所述,基于類數(shù)和距離關系的測量方法見圖3:

圖3 基于類數(shù)和距離關系的測量
我們對上述方法的適用性進行驗證。同時,為考察三種方法之間的一致性,我們以1998年(大規(guī)模擴招之前)和2011年(高等教育體系擴張塵埃落定、新的發(fā)展規(guī)劃剛剛實施之時)兩個時間節(jié)點的中國高等教育系統(tǒng)作為進行比較。若三種方法對兩個時間節(jié)點的中國高等教育系統(tǒng)多樣性的判斷均一致,則我們認為分析結果是穩(wěn)健的,方法之間能夠很好地“達成共識”。
本研究選取的指標及其數(shù)據來源見表1。我們對各指標的數(shù)據按照不同的年份進行了標準化處理,使之不受到各指標量綱及單位的影響,成為服從均值為0,標準差為1的正態(tài)分布。

表1 聚類指標及其數(shù)據來源
4.1基于先驗分類信息的多樣性測量
中國教育主管部門曾在上個世紀50年代將高等院校明確劃分為12類:綜合類、理工類、農業(yè)類、林業(yè)類、醫(yī)藥類、師范類、語文類、財經類、政法類、體育類、藝術類和民族類。此后各類統(tǒng)計工作均沿用這一分類方式。
基于此,我們將12類作為中國高等教育系統(tǒng)中院校的分類的先驗信息,考察1998年和2011年兩個時間點上各院校在此12類中的分布情況。
為盡可能保證多樣性測量的穩(wěn)定性,我們將分別采用K均值聚類和K中位數(shù)聚類兩種快速聚類方法,聚類的距離分別采用Euclidean距離和Euclidean Square距離。這樣我們就得到具有不同方法和度量距離的4(2*2)次聚類結果。此外,K均值聚類和K中位數(shù)聚類的結果也受到其初始聚類中心的影響,故我們隨機選擇初始聚類的中心進行聚類,并將此過程重復10次,得到10次隨機選擇其初始聚類中心的分類結果,將10次聚類結果的辛普森指數(shù)和10個偽F統(tǒng)計量數(shù)值求均值。(結果見表2、表3,其中“E”是指Euclidean距離;“ES”是指Euclidean平方距離)

表2 基于先驗分類信息多樣性測量的辛普森指數(shù)和偽F統(tǒng)計量
辛普森指數(shù)的分析結果顯示:當固定為12類時,無論運用K均值聚類方法還是K中位數(shù)聚類方法,無論采用Euclidean距離還是Euclidean平方距離,2011年的辛普森指數(shù)數(shù)值都明顯小于1998年的辛普森數(shù)值。這說明以高等院校在各個類別中分布的均衡性來看,2011年高等教育系統(tǒng)的多樣性要高于1998年。
偽F統(tǒng)計量的分析結果顯示:當固定為12類時,無論運用K均值聚類方法還是K中位數(shù)聚類方法,無論采用Euclidean距離還是Euclidean平方距離,2011年的偽F統(tǒng)計量數(shù)值都明顯大于1998年的偽F統(tǒng)計量數(shù)值。這說明,2011年高等院校各個類別之間的差異較之于1998年更為明顯。
綜上所述,基于先驗分類信息的多樣性測量,2011年中國高等教育系統(tǒng)的多樣性比1998年中國高等教育系統(tǒng)的多樣性要強。
4.2基于最佳分類數(shù)的多樣性測量
本文分別運用K均值聚類和K中位數(shù)聚類對各年份的個案進行分析。我們將關注類數(shù)從5逐次變?yōu)?0,考察兩種方法對個案歸屬判斷的一致性大小。
我們將不同類數(shù)所求得的一致性大小的均值和標準差歸納于表3。正如上文所言,均值越大代表著兩種聚類方法的一致性越高,標準差越小代表著兩種聚類方法的一致性越穩(wěn)健。依據此原則,表3中的13類和5類為2011年中國高等院校最佳的分類數(shù)。當類數(shù)為13類時,兩種聚類方法的一致性均值達到74.23%,標準差為0.1480;當類數(shù)為5類時,兩種聚類方法的一致性均值達到75.69%,標準差為0.1747。較之于5類,13類的分類方式雖然均值遜于5類,但標準差小于5類,說明13類的分類方式更穩(wěn)健。同時,類數(shù)少的分類方式較之于類數(shù)多的分類方式一般而言往往具有更高的一致性。因此,我們將2011年中國高等院校的最佳分類數(shù)定為13類。
對于1998年的中國高等教育系統(tǒng),9類和5類為2011年中國高等院校最佳的分類數(shù)。當類數(shù)為9類時,兩種聚類方法的一致性均值達到74.89%,標準差為0.1808;當類數(shù)為5類時,兩種聚類方法的一致性均值達到75.80%,標準差為0.1696。雖然9類的分類方式在均值和標準差上的表現(xiàn)均略遜于5類,但我們仍傾向于選擇類數(shù)較大的分類方式。因此,我們將1998年中國高等院校的最佳分類數(shù)定為9類。(詳見表3)

表3 不同類數(shù)聚類結果一致性的均值與標準差
綜上所述,基于最佳分類數(shù)的多樣性測量,2011年中國高等教育系統(tǒng)的多樣性強于1998年中國高等教育系統(tǒng)的多樣性。
4.3基于距離和類數(shù)的多樣性測量
依據基于距離和類數(shù)的多樣性測量方法的步驟,我們運用層次聚類法(Hierarchical Cluster)計算出各高等院校之間的距離,并將其逐步合并。為驗證聚類結果的穩(wěn)健性,我們對院校間相似性的度量仍采用Euclidean距離和Euclidean平方距離。聚類方法是應用最廣的類平均法(Average Linkage)。當高等院校所聚集成的類數(shù)分別為總樣本數(shù)的75%、50%和25%時,個案之間的距離大小則是其系統(tǒng)多樣性的直接反映。(結果見表4,其中“E”是指Euclidean距離;“ES”是指Euclidean平方距離)

表4 各年份相對類數(shù)所對應的院校間距離
無論固定的相對類數(shù)為75%、50%還是25%,1998年高等院校之間的距離均小于2011年高等院校之間的距離。即使更改距離類型,結果保持不變。(詳見表4)這表明在控制了院校總數(shù)的情況下,當以相同的類數(shù)來劃分高等教育系統(tǒng)內院校的歸屬時,2011年各類之間的距離比1998年各類之間的距離要大。換而言之,按照固定的類間距離(相似性)對高等院校進行分類,2011年高等院校所形成的種類比1998年更多。
本文圍繞高等學校的類數(shù)、院校在各類間的分布以及類與類之間的距離設計了三種方法測量高等教育系統(tǒng)的多樣性。基于先驗分類信息的多樣性測量方法運用關注樣本在各類別分布均衡性的辛普森指數(shù)和關注各類別之間距離相對大小的偽F統(tǒng)計量對1998年和2011年中國高等教育系統(tǒng)多樣性進行判斷,在使用不同的快速聚類方法和選取不同的距離計算方式的情況下,兩個統(tǒng)計量的判斷結果完全一致;基于最佳分類數(shù)的多樣性測量本身就是為尋求不同分類方法的“共識”所設計,其所提供的判斷標準(均值最小、標準差最大)能夠較為清晰地辨識出2011年和1998年最佳的分類數(shù)分別為13類和9類,從而反映出不同年份中國高等教育系統(tǒng)多樣性的變化趨勢;基于距離和類數(shù)的多樣性測量本身重現(xiàn)了聚類的全過程,在相對類數(shù)處于不同水平時,2011年各類之間的距離始終大于1998年的距離。三種測量方法均顯示2011年中國高等教育系統(tǒng)的多樣性強于1998年,這表明三種方法之間具有高度的一致性。
[1]Van Vught FA.Mapping the Higher Education Landscape:Towards a European Classification Of Higher Education[M].Dordrecht:Spring?er,2009.
[2]Birnbaum R.Maintaining Diversity in Higher Education(1sted.)[M]. San Francisco:Jossey-Bass,1983.
[3]King J.The Typology of Universities[J].Higher Education Review, 1970,2(3).
[4]Smart J.C,Elton C F.Goal Orientations of Academic Departments:A TestofBiglan'sModel[J].Journalof Applied Psychology,1975,60(5).
[5]Tight M.Institutional Typologies[J].Higher Education Review,1988,20(3).
[6]Tight M.University Typologies Re-examined[J].Higher Education Review,1996,29(1).
[7]Carnegie Foundation for the Advancement of Teaching a Classifica?tion of Institutions of Higher Education[R].Princeton,NJ:CFAT,1987.
[8]Carnegie Foundation for the Advancement of Teaching[R].A Classifi?cation of InstitutionsofHigher Education.Princeton,NJ:CFAT,1994.
[9]Carnegie Foundation for the Advancementof Teaching.The Carnegie Classification of Institutions of Higher Education[R].Princeton,NJ: CFAT,2000.
[10]Huisman J.Differentiation,Diversity and Dependency in Higher Ed?ucation[J].Utrecht,the Netherlands:Lemma,1995.
[11]Huisman J,Meek V,Wood F.Institutional Diversity in Higher Edu?cation:A Cross-National and Longitudinal Analysis[J].Higher Edu?cation Quarterly,2007,61(4).
[12]Calinski T,Harabasz J.A Dendrite Method for Cluster Analysis[J]. Communicationsin Statistics,1974,(3).
(責任編輯/易永生)
G40-058
A
1002-6487(2016)19-0032-05
王傳毅(1985—),男,四川成都人,副教授,高級調查分析師,研究方向:教育統(tǒng)計。查強(1966—),男,加拿大人,教授,研究方向:比較教育和高等教育。