文/ 蘇思琦 郭學軍
隨著社會經濟發展,人力資本越來越受關注。這是由于人力資本合理投資在經濟發展中占據重要地位。人力資本投資重要性主要體現在低素質勞動轉換為高素質勞動力,推動人口質量的整體提高。目前,已有學者對人力資本水平與經濟發展的相關關系進行研究,并取得較好的研究成果。但在目前研究中,很少以數據清洗的方式進行研究。
在現有研究中,有學者構建了方便簡單的區域人力資源發展水平評價指標體系[1],有學者建立了內部層、關聯層、調控層三類指標,形成一個綜合評價指標體系[2-3]。本文在相關學者研究基礎上,將人力資本分為三個大類, 見表1。

表1 評價人力資本水平體系
人力資源三大指標體系:教育水平、醫療水平、研究與創新以及相應二級指標體系物理指標等存在一定差別,在數據利用時,需對數據進行處理。
1. 數據來源。本文選取《國家統計年鑒》(1999-2018)中,與人力資本有關的各項數據。
2. 數據預處理。 我國醫療機構2002 年的數據為1005004 個,到2003 年突然下降到806243 個,有理由懷疑存在一定異常值。假設醫療衛生機構變量服從正態分布,t檢驗準則決定離群點取舍。T 檢驗統計量為:

其中,xd為離群點,第j 個變量的平均值xj和標準差Sj。
其中,

醫療衛生機構不含離群點的平均值和標準差分別為:

在顯著水平0.01 條件下,離群點不在拒絕域中,保留此離群點。
經數據清洗處理后,選取10 個主要指標作為人力資本水平。為消除量綱影響,對數據進行標準化處理。第j 個指標或者變量標準化,即:

其中,xij表示第j 個變量的第i 次觀測,表示xij標準化后的值。經過標準化數據的相關系數矩陣判斷變量的相關程度。相關系數矩陣ρ的第i行第j列元素計算公式為:

經計算得到多數變量之間具有較強相關性,且各指標之間的信息重疊也很多。因此,將這10 個變量綜合成幾個少數變量,這里進行R 型因子分析。
初始特征值第一列為特征值,第二列為方差貢獻率,第三列為累計方差貢獻率。前兩個累計方差貢獻率已達到97.336%,選三個公共因子包含的原始數據的絕大部分信息。由原來10 個變量轉換成2 個綜合變量,在此基礎上,計算綜合因子。第一個因子的權重:


表2 綜合排名
表3 中第一因子排名基本和綜合排名相同,這是由于第一因子對綜合得分貢獻最大。從得分排名可看出,2004 ~2015 順次由低到高,符合社會經濟發展實際情況。從整體上看,中國經濟一直高速發展,但2003 年排名發生逆轉,該年國內暴發非典型性肺炎,經濟發展受到重創,疫情結束后,再次轉向經濟建設。2010 年,上海世博會舉行,成為走向世界又一個重大契機,也為剛經歷金融危機的中國帶來發展機會。
GDP 是衡量經濟發展重要指標,根據因子分析建立其模型,進行預測非常重要。
1.GDP 模型構建
設Y 表示隨機變量GDP,用因子分析模型得出的得分矩陣作為設計矩陣,公共因子為一般變量。建立隨機變量Y 與一般變量F1,F2的線性回歸模型為:

經計算得P 值近似為0,說明回歸方程系數顯著,F1、F2對Y 具有顯著影響。F 統計量服從自由度為(2,14) 的F分布,在顯著水平為0.05 的條件下,查表的F 臨界值為3.74,F 統計量大于臨界值,據此可以認定回歸方程顯著。
2.GDP 模型預測
利用建立的回歸模型預測2016 年~2018 年的GDP,與實際GDP 進行對比,以檢驗模型是否可靠。2016 年實際GDP 為1.31013,置信水平為0.05 條件下點估計值為1.34357, 預 測 區 間 為[1.20512,1.48202]。2017 年 實際GDP 為1.61595,置信水平為0.05 條件下點估計值為1.62606, 預 測 區 間 為[1.41827,1.83386]。2018 年 實際GDP 為1.91745,置信水平為0.05 條件下點估計值為1.85973,預測區間為[1.37900,2.34046]。點估計值與實際值相差并不大,且都在預測區間內,此時認為模型可靠準確,可后續預測。
從GDP 回歸模型中可以明顯地看出,GDP 與第一因子和第二因子均相關,但與第一因子相關關系更強,這說明教育、醫療和技術的投入越多,GDP 值越大,經濟發展水平越高。要進一步提高人力資本水平還要加大對教育的投入。教育投資不僅可以提高人們文化水平和生活品位,而且可以使受教育者在現代社會發展和激烈的競爭中掌握一定技能。