姜英英+李晉明


摘要:本文針對學院綜合實力建立評價指標體系,采用偏最小二乘通徑模型,確定潛變量與觀測變量之間的關系,建立學院綜合實力的評價指數,并以北京某高校9個學院為例,收集實際數據,進行實證分析。通過偏最小二乘通徑模型,計算了模型的通徑系數和各個學院的綜合實力的得分并進行排名,從而對影響學院綜合實力的因素進行分析,對學院的發展策略提出建議。
關鍵詞:偏最小二乘通徑模型;學院綜合實力;評價指數
中圖分類號:G642.0 ? ? 文獻標志碼:A ? ? 文章編號:1674-9324(2015)23-0168-02
第一章 引言
當今人類社會已邁入了知識經濟時代,經濟與科技的全球化競爭日益激烈。大學作為知識創造和傳播的中心日益成為人們關注的焦點,而中國的大學及其體系也正在飛速發展。大學要有好的發展策略,必須綜合考慮各個學院的綜合實力,搞清楚學院存在哪些方面的不足。因此,制定一個學院的綜合實力評估指數對于幫助學校制定適合各個學院的發展策略來說至關重要。目前研究通常的做法是采用一系列相關的指標進行替代解釋,結構方程模型和偏最小二乘通徑模型都可以解決這個問題。但相對于結構方程模型基于樣本協方差矩陣進行建模的思路,偏最小二乘模型采用的是一系列一元或多元線性回歸的迭代求解。其優點主要是無需對觀測變量做特定的概率分布假設,不存在所謂的模型不可識別問題,對樣本點容量的要求也十分寬松,能很好地解決指標之間的多重共線性等。因此,本文選擇偏最小二乘通徑模型來建立學院綜合實力評估指數。
第二章 偏最小二乘通徑模型
偏最小二乘通徑模型是伍德于1975年提出的,用以分析多組變量集合之間的線性統計關系。它的特點是:模型假設條件較少,實用性較強。偏最小二乘通徑模型也由測量模型和結構模型組成。其中,測量模型(外部模型)用來描述顯變量和隱變量之間的關系;而結構模型(內部模型)用來描述隱變量之間的關系,其模型路徑圖見圖1。
在圖1中,x ?與x ?、x ?∶x ?和x ?與x ?分別為3組外生顯變量,對應的外生隱變量分別為ξ ?、ξ ?和ξ ?;y ?與y ?和y ?∶y ?分別為2組內生顯變量,對應的內生隱變量為η ?和η ?。以上顯變量和隱變量之間構成測量模型;而ξ ?、ξ ?、ξ ?和η ?、η ?之間則構成結構模型。另外,δ ?∶δ ?、ε ?∶ε ?表示測量誤差,ζ ?和ζ ?表示結構方程的誤差項。
1.模型結構與假設條件。設有J組顯變量,每組含有P ?個變量,則每組顯變量可以表示為:X ?=(X ?,x ?,…,x ?)(j=1,2,…,J)
通常假定顯變量x ?(j=1,2,…,J;h=1,2,…,p ?)都基于n個共同的觀測點,并且每個變量都是中心化的。每組顯變量X ?所對應的隱變量為ξ ?(j=1,2,…,J),并且假定,隱變量ξ ?是標準化的,即均值為0、方差為1。
1.1測量模型。在測量模型中,一組顯變量X ?和對應的隱變量ξ ?之間的關聯關系由下式來表示:
x ?=λ ?ξ ?+ε
其中:ε ?為隨機誤差項。該式需要滿足假設條件
E(x ?|ξ ?)=λ ?ξ ?。
該假設條件說明殘差ε ?均值為0,并且與隱變量ξ ?不相關。
偏最小二乘通徑分析認為,在反映方式中,一組顯變量只反映事物某一方面的特征,即這組顯變量所反映的隱變量是唯一的。滿足上述假定的一組顯變量被認為是唯一維度的。
1.2結構模型。結構模型描述不同隱變量δ ?之間的因果關系,通常由一組線性方程組來表示,即:ξ ?= ?β ?ξ ?+ζ
其中,ζ ?為隨機誤差項。由預測指定性條件知,同樣假設殘差ζ ?的均值為0,并且與ζ ?不相關。
2.模型的估計。偏最小二乘通徑分析通過迭代的方法對隱變量進行估計,然后,根據模型的設定,對顯變量和隱變量之間的關系方程進行估計。一般有兩種方法:外部估計和內部估計。
3.偏最小二乘通徑模型計算步驟。綜上所述,偏最小二乘通徑分析采用迭代的算法來計算隱變量,最后,根據隱變量的估計值,計算測量模型和結構模型,具體步驟如下:
第1步:取向量Y ?的初始值等于x ?。
第2步:計算Z ?的估計值Z ?=( ?e ?Y ?) ?,其中:
e ?=sign(r(Y ?,Y ?))。
第3步:根據Z ?的估計值,計算權重向量ω ?= ?X ? ? ?Z ? .
第4步:利用得到的ω ?,計算新的Y ?=( ?ω ?x ?) ?=(X ?ω ?) ?。
再回到第2步,直到計算收斂為止,以最終得到的Y ?作為對隱變量ξ ?的估計值 ? ?。從而可以采用偏最小二乘回歸模型估計測量模型 ? ?=λ ? ? ?。對于內生隱變量ξ ?,有 ? ?= ?β ? ? ?。
第三章 學院綜合實力評價模型的初步構建
結合本高校的特點,建立如下模型。每個潛變量由圖2中所示的相關顯變量來描述,考慮到學院規模人數不一樣,為使結果更客觀公正,每個顯變量都是采用百分率來計算的,以更好地刻畫人均情況,使結果更客觀公正。
第四章 模型數據的描述性分析
本文以北京某高校為基礎經過實際訪問調查咨詢等,搜集了本模型所需數據,其中共有15個顯變量,共有9個學院,見表4。通過相關統計量檢驗數據是否具有顯著的正態分布特點;進行相關分析,掌握觀測變量之間的相互影響關系。
1.數據的偏度、峰度分析。利用SPSS軟件對數據進行分析,輸出幾個描述統計量,包括均值、標準差、偏度、峰度,可以大致了解數據的分布特征。
2.數據的正態性檢驗。為了檢驗數據是否呈正態分布,設樣本容量為n,當8≤n≤50時,可以使用夏皮洛—威爾克(Shapiro-Wilk)檢驗進行有效的正態性檢驗。注意:SPSS輸出的是雙邊檢驗的p值,需要除以2,顯著性水平為0.05。
若 ?≤0.05,就可以拒絕原假設。經過計算,對
x ?,x ?,x ?,x ?這四個變量來說,可以拒絕原假設,即它們不滿足正態分布。
3.數據的相關性分析。為了分析數據內部的聯系,可以分析數據之間的相關性。在此利用SPSS軟件對這15個變量x ?∶x ?進行相關性分析。
4.小結。經過分析,這15個變量有的不服從正態分布,并且變量之間存在多重相關性,且樣本量只有9個,小于變量的個數。由于以上原因,可以得出偏最小二乘通徑模型比結構方程模型能更有效地解決本文中建立學院綜合實力評估指數的問題。
參考文獻:
[1]吳喜之.統計學:從數據到結論[M].北京:中國統計出版社,2006.endprint