李 鵬
(福州大學經濟與管理學院 福建 福州 350116)
?
多指標面板數據因子分析方法研究
李 鵬
(福州大學經濟與管理學院 福建 福州 350116)
目前,國內學者在多指標面板數據因子分析方面的研究較少,而面板數據是常用的一種數據形式,因子分析是常用的一種綜合評價方法。本文把多指標面板數據和傳統因子分析結合起來,將面板數據各個時間截面數據按時間順序平鋪展開形成一個大截面數據,然后對此進行傳統因子分析,減少了因子分析的次數,也能提取多指標面板數據的重要信息。
多指標;面板數據;因子分析
因子分析在1904年由Chales Spearman提出,它將多個變量綜合為少數幾個因子。目前,它的主要有兩個應用:一是得到因子得分進行排序,即將多個變量降維成一個綜合的變量,該變量保留了之前多個變量的所有信息,可以根據該變量的大小對評價對進行排序;二是對因子進行分類,即根據相關性大小把原始變量分組,使得同組內的變量之間相關性較高,而不同組的變量之間相關性則較低。
(一)單指標面板數據
單指標面板數據的數據格式可用二維表或者矩陣表示。
設總體共由N個樣品,每個樣品的特征用一個指標X來表示,時間長度為T,則Xi(t)表示第i個樣品在t時間的指標值。
截面數據的數據格式也是用一個二維表來表示的,設總體共由N個樣品,每個樣品的特征用p個指標來表示,則Xij表示第i個樣品第j個指標的數值。
(二)多指標面板數據
1.多指標面板數據的數據格式
多指標面板數據的結構要復雜一些,不同于單指標面板的數據可以由一個簡單的二維表來表示,用三維表來表示。多指標面板數據除了具有截面維度和時間維度外,還增加了指標維度,因此多指標面板數據實際上是一張三維表格,如表1所示。研究總體共有N個,每個樣品的特征用p個指標表示(X1,X2,…,Xj,…,Xp),時間長度為T,則Xij(t)表示第i個樣品第j個指標在t時間的數值。

表1 多指標面板數據[1]
矩陣表示為:

2.多指標面板數據的幾個統計量
下面給出多指標面板數據的幾個統計量,在多指標面板數據因子分析中需要用到這幾個統計量。
(1)第j個指標的均值
(1)
(2)第j個指標在t時間的均值
(2)
(3)第j個指標的方差

(3)
(4)第j個指標在t時間的方差

(4)

設X=(X1,…,Xp)’是觀測的隨機向量。
傳統因子分析的基本步驟如下[2]:
(1)計算樣本均值和樣本方差
(2)原始數據標準化
由于研究問題中所選取的各個指標的單位可能存在差異。為了消除不同指標之間由于量綱不同造成的誤差,使評價指標相互可比,因此須對各指標的原始數據進行標準化處理,最大程度減小研究結果的誤差。數據標準化之后,得到相關系數矩陣R。
(3)適用性檢驗
因子分析方法的核心思想之一是對原有指標進行縮減,從原始變量中的信息重疊部分提取因子,以達到減少變量個數的目的。因此,因子分析方法要求原始變量之間有較強的相關關系。通常使用KMO檢驗和巴特利特球型檢驗等方法對變量之間相關性進行檢驗,當指標具有統計顯著性時,則表示通過了因子分析模型的適用性檢驗。
(4)求相關系數矩陣R的特征值和標準化特征向量
記λ1≥λ2…≥λp≥0為R的特征值,其相應的單位正交特征向量為l1,l2,…,lp。
(5)求因子的載荷矩陣A
求出各個因子載荷的值是運用因子分析進行綜合評價的關鍵,常用的因子載荷求解方法包括主成分分析法、主軸因子法、最小二乘法、極大似然等。
根據累計貢獻率要求確定因子載荷矩陣,確定公因子的個數m。

(6)求因子得分和綜合得分
在建立起因子模型之后,則需要考察模型每一個變量之間的相互關系,那么就需要計算因子得分來實現這一目的。因子得分就是指公共因子在每一個變量上的得分,這需要找到提取公共因子時用原始變量和公共因子之間建立的線性表達式,通過將原始變量的標準化數據值代入表達式中,就可以求出各個因子的得分。
[1]王培,王焱鑫,崔巍.面板數據的因子分析[J].貴州大學學報(自然版),2009,26(6):10-13.
[2]王學民.應用多元分析[M].上海財經大學出版社,2014.
[3]董鋒,譚清美,周德群.多指標面板數據下的企業R&D能力因子分析[J].研究與發展管理,2009,21(3):50-56.
[4]任娟.多指標面板數據融合聚類分析[J].數理統計與管理,2013,32(1):57-67.
李鵬(1990-),男,漢族,湖北荊門市人,管理學碩士,福州大學經濟與管理學院,研究方向:創新管理與評價。