代金輝,馬樹才,劉宏巖
(1.遼寧大學 經濟學院,沈陽 110031;2.山東工商學院 數學與信息科學學院,山東 煙臺 264005;3.煙臺大學 生命與科學學院,山東 煙臺 264005)
社會發展已經成為世界各國所面臨的共同話題。所謂社會發展,主要包括生產關系和生產力兩方面的發展。近年來,人們對社會發展的認識已經上升到了新的高度,不再一味地追求GDP的增長,經濟增長是社會發展的手段而不是發展的目的,提高人民群眾的經濟福利才是發展的根本宗旨。與此同時,對各省域社會發展水平的綜合評價也引起各界的高度關注,為了全面、真實、客觀地反映我國社會發展實際,合理設立統計指標體系,本文從“民生發展”的核心理念出發,著重于人民生活和醫療衛生方面建立社會發展水平評價體系,利用聚類分析和因子分析法對2015年我國省域社會發展水平進行比較與綜合評價。
根據“十三五”規劃綱要提出的社會發展建設的基本目標,遵循統計指標體系構建的統一性、易獲性、功能性及完全性原則,本文從經濟、人民生活、教育、科技、精神文化、醫療衛生六個方面入手,最終形成由21個具體指標構成的社會發展評價體系,著重于經濟與人民生活和醫療衛生方面,體現了“以人為本”的核心理念,突出我國醫療衛生事業的建設與發展,指標體系見表1。
2.1.1 聚類分析模型
聚類分析一般分為樣品聚類和變量聚類。樣品系統聚類法(Hierarchical Clus-tering),其原理是先將所有n個樣品看成不同的n類,然后將性質最相近(即距離最近)的兩類合并成一類,再從這n-1類中找出最接近的兩類加以合并,以此類推,直至所有的樣品被合并為一類。詳細步驟如下:

表1 社會發展水平統計指標體系
第一步:選擇分析變量。設原始觀測數據矩陣為:

第二步:數據標準化。標準化公式為:


第四步:在聚類方法的選擇上,選擇類間平均距離連接法,即:

假設聚類到某一步,將類Gp和類Gq合并為新類Gr,則任一類Gk與Gr的距離為:

第五步:繼續第三步和第四步,直至所有樣品歸為一類為止。最后根據研究對象的背景知識,按照某種分類標準或者分類原則,得出最終的分類結果。
2.1.2 因子分析模型
假設共有n個樣本,p個指標,X=(X1,X2,…,Xp)'為可觀測的隨機向量,要找尋的公因子為f=(f1,f2,…,fq),則因子分析模型如下:

在實際操作中,因子分析主要通過如下步驟進行:
步驟1:對初始變量標準化,然后求出所有標準化后變量的相關矩陣R=(rij)p×p,其中:

步驟2:提取因子,根據特征根和特征向量,確定所選取的因子數目及各個因子。
步驟3:因子旋轉,得到因子載荷矩陣,便于更好地解釋。
步驟4:計算最終的因子得分,利用模型對每一個樣本計算因子得分,進而進行綜合評價。
選取人均地區生產總值X1,而沒有選用總量GDP,體現了以人為本的科學發展理念;固定資產投資總額X2,它是能夠反映固定資產的投資規模、比例關系、使用方向和速度的綜合性指標;選取第三產業生產總值X3,即服務業生產總值,一個地區社會發展水平越高,其服務業應該越趨完善;城鎮居民可支配收入X4,直接影響當地居民的生活質量;選取農村居民家庭人均純收入X6,反映的是一個地區農村居民的平均收入水平;每萬人擁有公共交通車輛X9,指按城市人口計算的每萬人平均擁有的公共交通車輛標臺數,它是公共交通運營車數除以城區人口與城區暫住人口的和所得;R&D經費占GDP比重X12,反映了一個地區的科技實力及可持續發展能力;指標X16、X17、X18…X21反映的是各省市自治區的醫療衛生方面,這些指標與人們生病住院息息相關,具有很高的實用性,選擇這些指標可以表現各地區醫療衛生的綜合狀況。
本文指標體系中21個指標的具體數據均來源于《中國統計年鑒(2016)》,指標均選用正指標,并對原始數據進行標準化處理所得。
通過SPSS軟件對所搜集的原始數據進行聚類分析,可得聚類分析樹狀圖(圖略),由樹狀圖原理,將距離較近的合并成一類,按樹狀圖中的距離10為標準進行分類,可見分成3類或4類較為合理。再結合實際社會發展情況,最終確定將我國31個省、市、自治區社會發展水平分成3類,具體分類情況見表2。

表2 分類情況匯總
經檢驗KMO統計量為0.904>0.5,再由巴特萊球型檢驗,可知各變量相關程度較高,故適宜作因子分析。接下來對標準化的數據進行因子分析,得出初始因子模型并對其旋轉,給出公共因子表達式并作評價。
表3(見下頁)為解釋總方差表,表中顯示第一個因子的特征根為9.496,大約占總方差的46.721%,第二個因子與第三個因子的特征根分別為5.018與1.953,也大于1,分別解釋了總方差的23.897%與9.301%,第四個因子的特征根為0.881,雖然解釋了總方差的4.195%,但是根據過程提取特征根大于1的原則,綜合考慮確定Factor過程提取前三個因子,三個因子的特征根共占方差的82.419%,符合因子分析方法的公因子確定原則,所以提取三個公因子是完全合理的。
利用前三個特征值建立因子載荷矩陣,并對其實行方差最大化旋轉,結果如下頁表4所示。
由表4可以看出,第一公因子f1在X1(人均地區生產總值)、X4(城鎮居民可支配收入)、X5(城鎮居民家庭平均每人全年現金消費支出)、X6(農村居民家庭人均純收入)、X7(農村居民家庭平均每人現金消費支出)、X8(農村居民家庭居住住房價值)、X9(每萬人擁有公共交通車輛)上的載荷值都很大。這些指標變量主要反映我國各省、市、自治區的居民收入、消費水平、住房及出行方面,f1可以看作是反映各地區居民的“生活質量”標準的公因子。

表3 因子解釋總方差情況

表4 旋轉后的因子載荷矩陣
第二公因子f2在X2(固定資產投資總額)、X3(第三產業生產總值)、X10(普通高等學校數)、X11(普通高等學校在校學生數)、X12(R&D經費支出占GDP比重)、X14(出版物發行機構數)、X16(新型農村合作醫療參加人數)及X20(門診服務情況診療人次數)上的載荷較大,這些指標變量主要反映我國各地方政府在固定資產、第三產業、教育、科研及醫療保險方面的資金支出與收入,f2可以看作是反映我國各地區地方政府在社會發展上的“資金投入”占經濟總量的比例的公因子。
f3在X17(每千人口醫療衛生機構床位)、X18(出院者平均住院日)、X19(每百門急診入院人數)、X21(急診病死率)上有較大的載荷,這些指標變量主要反映我國各省、市、自治區醫院的設施水平、住院和門診服務及醫療技術,f3可以看作反映我國各地區的“醫療衛生”水平的公因子。
為了對2015年我國31個省、市、自治區社會發展水平進行綜合評價,需要給出綜合得分。首先根據系數矩陣將三個公因子表示為21個指標的線性函數形式,得到因子得分函數式,再以各因子的方差貢獻率占三個因子總方差貢獻率的比重作為權重進行加權匯總,得到各省、市、自治區的綜合得分F,輸出結果見表5。根據前面的各個公共因子合理的解釋,結合各個省、市、自治區在三個公共因子上的得分以及綜合得分,就可以對全國社會發展水平進行評價分析了。

表5 社會發展水平綜合得分
表5輸出的是我國31個省、市、自治區在三個不同的公共因子上的得分表和排序,以及各地區綜合評價得分情況。其中f1、f2、f3為各地區在三個公共因子上的得分,從f1得分與名次上看,我國首都北京名列第一,其次便是上海、浙江、天津、江蘇、廣東,公因子f1主要反映我國各省、市、自治區的居民收入、消費水平、住房及出行方面,在這些方面上,北京、上海、浙江、天津、江蘇、廣東這些城市的居民收入高,消費水平國際化,人均地區GDP總量在全國也是名列前茅,即這些地區居民“生活質量”比較高。
從f2得分與名次上看,山東占據首位,其次是江蘇、河南、廣東、四川,而北京、上海分別位居第26、21名,f2主要反映我國各地方政府在固定資產、第三產業、教育、科研及醫療保險方面的資金支出與收入。從指標數據上看,山東、江蘇兩省在我國各地區中高校數目最多,高校在校生最多,R&D經費支出占GDP比重最大,新型農村合作醫療參加人數也較多。而北京參加新型農村合作醫療人數僅有200萬左右,相比于山東、江蘇數目相差甚遠,北京作為一個直轄市,高校數目91所,是江蘇162所高校數目的0.56,相應的高校在校生,北京有60.36萬左右,山東、江蘇地區有171萬左右,可見山東、江蘇地區用于農村醫保、科教事業上的資金比重高于北京,地方政府在社會發展上更加注重“資金投入”。
從f3得分與名次上看,北京位居第一,接著是上海、浙江、江蘇、山東、廣東地區。f3中主要反映我國各省、市、自治區醫院的設施水平、住院和門診服務及醫療技術。在這些方面,北京的每萬人口醫療衛生機構床位數相比其他地區較多,有11.16張,僅次于新疆15.03;北京的出院者平均住院日長達10.9日,在全國各地區名列第一;北京地區的醫院急診病死率僅為0.1%,急診病死率在全國各地區也是較低的,即“醫療衛生”水平較高。
從綜合因子F得分上看,綜合評價排名首位的是北京,其次是上海、浙江、江蘇地區,位居末尾的是海南、貴州、甘肅、西藏等地區。綜合因子F的得分是根據各地區在f1、f2、f3三個公共因子上的得分為基礎而得出的分數,因此占據前位是北京、上海、浙江、江蘇等地區,位居末尾的是海南、貴州、甘肅、西藏地區。海南之所以位居28名,從固定資產投資總額、第三產業生產總值上來看,海南2014年固定資產投資總額達到3112.23億元,第三產業增加值達到1815.23億元,僅高于寧夏、青海、西藏地區,遠次于其他省份。海南的普通高等學校數僅為17所,也僅高于寧夏、青海、西藏地區,遠低于其他地區,普通高等院校在校學生數自然遠不如其他地區,而且在R&D經費支出占GDP比重上,海南省僅高于西藏省,次于其他地區。
綜上,據2015年統計數據可知,北京、上海、浙江、天津、江蘇、廣東地區居民收入高,消費水平國際化,居民“生活質量”較高;山東、江蘇、河南、廣東、四川地方政府在固定資產、第三產業、教育、科研及醫療保險方面的資金支出與收入較高,農村醫保、科教事業發展好;北京、上海、浙江、江蘇、山東、廣東醫院的設施水平、住院和門診服務及醫療技術水平高,醫療衛生事業發展好;綜合排名,北京、上海、浙江、江蘇地區名次靠前。
[1]向蓉美.建立衡量網絡經濟的指標體系[J].統計與決策,2003,(3).
[2]殷克東,陳斐.中國沿海地區社會發展水平動態變遷的測度[J].統計與決策,2010,(9).
[3]郭萬山,魏永德,霍玉璽.主成分分析在研究冠心病病因中的應用[J].遼寧大學學報:自然科學版,1994,(5).
[4]王青,王娜.民生統計指標體系的構建與評價[J].統計與決策,2014,(17).
[5]張立軍,任英華.多元統計分析實驗[M].北京:中國統計出版社,2008.
[6]楊俊,關毅璋,梁勇.廣東省經濟發展狀況的統計分析[J].數學的實踐與認識,2016,(16).
[7]代金輝,馬樹才.人口老齡化對居民消費行為影響效應的實證檢驗[J].統計與決策,2016,(21).
[8]李剛.青島市區域社會發展水平綜合評價研究[J].中國統計,2014,(1).