黎詩梅 李雄英
摘要通過主成分分析方法,選取2006、2011和2016年廣東省各市郵電業(yè)務數(shù)據(jù),對廣東省21個地級市的郵政和通信事業(yè)發(fā)展狀況進行分析和發(fā)展水平層次劃分,從時間和地域空間兩個維度對廣東省各地區(qū)郵電業(yè)發(fā)展情況進行排名分組.結果表明,當前廣東省各地區(qū)郵電業(yè)發(fā)展狀況存在顯著的地區(qū)差異.
關鍵詞產(chǎn)業(yè)經(jīng)濟學;地區(qū)差異;主成分分析;郵電業(yè);廣東省
中圖分類號F603 文獻標識碼A
Study on Post and Telecommunications Industry
Development in Guangdong Province Based
on Principal Component Analysis
Shimei Lia , Xiongying Lib
(a School of finance, b School of Statistics and Mathematics , Guangdong University
of Finance and Economics, Guangzhou, Guangdong510320,China )
AbstractBased on the post and telecommunications industry business data of 21 prefecture-level cities in Guangdong province in 2006, 2011 and 2016, principal component analysis method has been applied to analyze and give a ranking order of 21 prefecturelevel cities in terms of their post and telecommunications industry development levels from two dimensions of time and geographical space. The results showed that the regional differences among prefecturelevel cities of Guangdong province were obvious.
Key wordsindustrial economics; regional differences; principal component analysis; post and telecommunications industry; Guangdong province
1引言
郵政和通信是重要的國民經(jīng)濟部門,同時也是社會服務部門,與人們?nèi)粘I蠲芮邢嚓P,關系到人民群眾的切身利益.21世紀以來,廣東省郵電業(yè)開始快速發(fā)展,郵電業(yè)務總量從2000年的757.22億元增加到2016年的6892.41億元,年均增長率達到14%.與此同時,隨著科學技術的進步和互聯(lián)網(wǎng)、快遞等產(chǎn)業(yè)的興起,廣東省郵電業(yè)務的結構和規(guī)模發(fā)生了顯著的變化,這體現(xiàn)在移動電話、互聯(lián)網(wǎng)、快遞等相關指標數(shù)據(jù)的大幅度上升,成為評判一個地區(qū)郵電業(yè)發(fā)展水平的重要指標,如互聯(lián)網(wǎng)寬帶接入用戶從2000年的216.41萬戶增長到2016年的2851萬戶,年均增長率達到17%,函件、報刊以及本地電話等傳統(tǒng)業(yè)務規(guī)模逐漸縮減.廣東省作為我國現(xiàn)代化進程最快的地區(qū)之一,其郵政和通信事業(yè)的發(fā)展也領先國內(nèi)大部分地區(qū),但其發(fā)展存在一定的地區(qū)差異.依據(jù)《廣東統(tǒng)計年鑒》,計算2006、2011和2016年各地級市郵電業(yè)務總量占全省總量比重.結果顯示,近十年間,廣州、深圳以及東莞的郵電業(yè)務總量約占全省的50%,各地區(qū)間郵電業(yè)務總量差距較大,且逐年擴大.
“十三五”時期是郵政深化改革、轉型升級的重要時期,《郵政業(yè)發(fā)展“十三五”規(guī)劃》提出“三個全面”、“三個突出”和“六個注重”,更加明確行業(yè)發(fā)展方向,推動我國由郵政大國向郵政強國邁進.及時調(diào)整廣東省郵電業(yè)發(fā)展結構,使各地區(qū)的郵電業(yè)務趨向平衡,并朝著更優(yōu)更強的方向前進是時代發(fā)展的必然趨勢.因此,研究該省各地區(qū)郵電業(yè)的發(fā)展狀況顯得尤為必要.
近年來,已有不少學者針對郵電業(yè)的地區(qū)差異問題展開研究.吳建民等(2008)[3]運用相關分析法,分析我國郵政發(fā)展的省際差異,并指出經(jīng)濟收入是影響各地區(qū)郵政發(fā)展的空間差異的最終決定因素.康國棟等(2008)[4]采用時間序列和空間差異相結合的方法,分析了近 20 年來我國郵電業(yè)的發(fā)展,通過對我國 31 個省區(qū)人均郵電業(yè)務量的分析,將其劃分為5個等級,結果發(fā)現(xiàn)人均郵電業(yè)務量與人均 GDP 呈正相關關系.在此基礎上,以人口和人均 GDF 為變量,建立了我國郵電業(yè)的地域需求模型,發(fā)現(xiàn)科技進步和經(jīng)濟發(fā)展是我國各省區(qū)郵電需求的關鍵增長因素.曹小曙和李琳娜(2009)[5]利用基尼系數(shù),分析廣東省郵電通信業(yè)務量 1980~2006 年的變化趨勢,在此基礎上,選取1985年、1995年和2005年3個時間斷面,利用因子分析剖析郵電業(yè)務水平的空間分布格局,進而構建郵電通信發(fā)展指數(shù)P,反映各市的郵電通信發(fā)展速度.封燁等(2017)[6]通過對全國與省域層面的郵政函件業(yè)務量及人均函件量的時空演變及影響因素的分析,揭示了郵政函件業(yè)務在大陸31個省市的空間分布極不均衡等現(xiàn)象.
在此,以先前學者的研究成果為基礎,把廣東省21個地級市作為研究對象,分別選取2006、2011和2016年廣東省各市郵電業(yè)務指標,利用R語言統(tǒng)計分析軟件,采用主成分分析法,研究廣東省郵政與通信事業(yè)發(fā)展的空間差異,并展現(xiàn)各地區(qū)郵電業(yè)發(fā)展水平的排名趨勢.通過相關分析和層次劃分,有助于找出當前廣東省郵電業(yè)在地區(qū)差異問題上具體表現(xiàn),最終找到平衡區(qū)域差異的途徑.
2研究方法
多元統(tǒng)計分析是數(shù)理統(tǒng)計學中的一個重要的分支學科,是一種綜合分析方法.重要的多元統(tǒng)計分析方法有:回歸分析、判別分析、聚類分析、主成分分析、因子分析、多元方差分析等.蘇為華(2012)[7]認為,從評價方法看,應用與關注最多的方法依然是多元統(tǒng)計綜合評價方法與運籌優(yōu)化方法.文獻數(shù)量最多的前十位分別是: 聚類分析、因子分析、主成分分析、AHP 法、模糊評價、判別分析、綜合指數(shù)、功效系數(shù)、DEA、灰色系統(tǒng)評價等.
在研究廣東省21個地級市郵電業(yè)發(fā)展狀況中,采用的研究方法為主成分分析法.
2.1主成分分析法
主成分分析是將多指標化為少數(shù)幾個綜合指標的一種統(tǒng)計分析方法,由 K.Pearson(1901)提出,再由 Hotelling(1933) 加以發(fā)展起來.主成分分析是通過降維技術把多個變量化為少數(shù)幾個主成分的方法,這些主成分保留原始變量的絕大部分信息,它們通常表示為原始變量的線性組合.通過主成分分析,可以從事物錯綜復雜的關系中找出一些主要成分,從而能有效利用大量統(tǒng)計數(shù)據(jù)進行定量分析,揭示變量之間的內(nèi)在關系,得到一些對實物特征及其發(fā)展規(guī)律的深層次啟發(fā),把研究工作引向深入.
主成分分析的計算步驟如下:
(1)求標準化數(shù)據(jù)的相關矩陣.
(2)求相關矩陣的特征值和特征向量.
(3)計算方差貢獻率與累積方差貢獻率:每個主成分的貢獻率代表了原數(shù)據(jù)總信息量的百分比.
(4)確定主成分:設 C1,C2,…,CP 為p個主成分,其中前m個主成分包含的數(shù)據(jù)信息總量(即其累積方差貢獻率)不低于80%時,可取前m個主成分來反映原評價對象.
(5)用原指標的線性組合來計算各主成分得分.以各主成分對原指標的相關系數(shù)(即載荷系數(shù))為權,將各主成分表示為原指標的線性組合,而主成分的含義則由各線性組合中權數(shù)較大的指標的綜合意義來確定,即
Cj=μj1χ1+μj2χ2+…+μjpχp,j=1,2,…,m.
該式稱為主成分得分函數(shù), 由它來計算每個樣品的主成分得分.若取m =2,則將每個樣品的p個變量代入上式即可算出每個樣品的主成分得分C1和C2,并將其在平面上做主成分得分的散點圖,進而對樣品進行分類或對原始數(shù)據(jù)進行更深入的研究.
(6)綜合得分與排名.以各主成分的方差貢獻率為權,將其加權求和得到綜合得分.
C=λ1C1+λ2C2+…+…λmCmλ1+λ2+…+λm=∑mj=1WjCj.
這里Wj 是主成分的權重,利用總得分就可以得到得分名次[8].
在廣東省21個地級市郵電業(yè)發(fā)展狀況的研究中,如何科學、合理地對各地區(qū)郵電業(yè)發(fā)展狀況進行綜合評價和分析,是當前調(diào)整廣東省郵電業(yè)發(fā)展結構中的一個重要問題.反映廣東省各地區(qū)郵政和通信事業(yè)發(fā)展狀況的指標眾多,各指標間差別各異,針對多指標統(tǒng)計問題,蔣亮,羅漢(2003)[9]指出通過采用主成分分析法選取評價的綜合指標,能在數(shù)據(jù)信息損失最少的原則下構建主成分綜合評價模型,抓住客觀事物的主要矛盾,對客觀事物作出綜合評價,從而增強評價結果的客觀性.因此,將主成分分析法應用于廣東各地區(qū)郵電業(yè)發(fā)展差異的研究是科學的和可行的.
2.2指標選取
反映廣東省各地區(qū)郵政和通信事業(yè)發(fā)展狀況的指標眾多,同時,各地區(qū)之間的情況各異,統(tǒng)計的指標難以統(tǒng)一.為此,綜合考慮指標的性質和影響程度以及指標數(shù)據(jù)獲取的難度后,從中國統(tǒng)計出版社出版的 《廣東統(tǒng)計年鑒》獲得2006、2011和2016年廣東省21個地級市郵電業(yè)發(fā)展的基本數(shù)據(jù),選取了7項指標:
x1:郵政業(yè)務總量(億元);
x2:函信件(萬件);
x3:報刊累計數(shù)(萬份);
x4:快遞(萬件);
x5:移動電話用戶(萬戶);
x6:本地電話用戶(萬戶);
x7:通信業(yè)務總量(億元).
其中,以x1表示郵政規(guī)模,以x2、x3和x4反映郵政業(yè)務量情況,以x5和x6反映電信業(yè)務量情況,以x7表示電信規(guī)模.
所用數(shù)據(jù)來自2007、2012和2017年《廣東統(tǒng)計年鑒》,也可在廣東統(tǒng)計信息網(wǎng)直接下載。
2.3分析工具
R是一種編程語言,也是一種用于數(shù)據(jù)處理、統(tǒng)計分析以及制圖的軟件系統(tǒng).相較于SPSS、SAS等統(tǒng)計學或數(shù)學專用的軟件,R更便捷、簡單,有利于廣大初學者掌握,而更為重要的是,R軟件是一個完全免費的自由軟件.近年來,由于其優(yōu)秀的多種統(tǒng)計學及數(shù)字分析功能,R得到越來越多的關注.
在此,將基于R語言的主成分分析函數(shù)展開相關分析.
3數(shù)據(jù)分析
通過R語言的主成分分析,將指標的原始數(shù)據(jù)標準化后建立相關系數(shù)矩陣,分別求出2006、2011以及2016年的相關系數(shù)矩陣的特征值、方差貢獻率及累計方差貢獻率見表1,和主成分載荷見表2.
主成分的選取一般要滿足兩個原則,一是主成分對應的特征值>1,特征值越大代表重要程度越大;二是前m個主成分的累計方差貢獻率不低于80%.由表1可以得知,2006,2011和2016年第一個主成分的特征值分別為2.587,2.569和 2.571,遠遠大于要求的1.此外,累積方差貢獻率分別為95.625%,94.307%和94.437%,大于85%的標準,故選取第一個主成分即可反映原來7個指標所反映的絕大部分信息,此時原有變量信息丟失較少,大大簡化了計算,分析效果比較好.因此在此使用第一個主成分構成了原指標數(shù)據(jù)的主成分,并進行下一步分析.
表2是第一個主成分因子載荷矩陣,從中可以分別看到2006、2011和2016年所選定的第一主成分與原始變量的相關系數(shù),主成分的載荷值越大,說明此變量對主成分的解釋越多,影響越大.可以看出,在2006、2011以及2016這3年間,各個變量的系數(shù)都為負,而且各數(shù)值相差不大,第一主成分在每個變量上具有相近的載荷,說明每個變量對主成分的貢獻都差不多,第一主成分基本反映了這些原始變量的信息.其中,2006年,第一個主成分中所包含的原始變量郵政業(yè)務總量以及通信業(yè)務總量變量的系數(shù)最大,同時達到0.382,說明這兩個變量對第一主成分影響最大, 郵政業(yè)務總量以及通信業(yè)務總量能夠綜合代表第一主成分的發(fā)展狀況.2011和2016年, 相關系數(shù)最大的都是通信業(yè)務總量,由此看出,隨著移動互聯(lián)網(wǎng)、大數(shù)據(jù)、物聯(lián)網(wǎng)等新型信息服務的發(fā)展,通信業(yè)務總量保持加速增長勢頭,通信業(yè)在社會經(jīng)濟中占據(jù)越來越重要的位置.
由表2主成分載荷矩陣得到各年份第一個主成分得分,分別建立主成分綜合評價模型如下:
F2006=-0.382x1-0.376x2-0.375x3-0.378x4-0.377x5-0.376x6-0.382x7,
F2011=-0.381x1-0.377x2-0.355x3-0.382x4-0.375x5-0.386x6-0.388x7,
F2016=-0.381x1-0.378x2-0.351x3-0.380x4-0.384x5-0.384x6-0.387x7.
4綜合得分以及排名
遵循主成分分析步驟,用原指標的線性組合來計算各主成分得分,可以得到2006、2011和2016年廣東省21個地級市郵電事業(yè)發(fā)展狀況的主成分得分,結果見表3.
根據(jù)表3中的綜合排名,大體上可以將廣東省21個地級市郵電業(yè)的發(fā)展層次劃分為高發(fā)展區(qū)、中等發(fā)展區(qū)和低發(fā)展區(qū).同時,依據(jù)《廣東統(tǒng)計年鑒》(2017)對廣東各地區(qū)經(jīng)濟發(fā)展水平的劃分,將各地級市歸類為珠江三角洲、東翼、西翼和山區(qū)等區(qū)域.
從2006年的排名情況看,廣東省郵電業(yè)高發(fā)展區(qū)包括廣州、深圳、東莞、佛山、江門、中山和汕頭,它們的排名都在整體排名的前7名.其中,除了汕頭外,排名較高的地區(qū)都屬于經(jīng)濟發(fā)展水平高的珠江三角洲區(qū)域;中等發(fā)展區(qū)包括惠州、湛江、珠海、茂名、揭陽、梅州和肇慶,它們的排名都在平均排名附近;低發(fā)展區(qū)包括韶關、陽江、清遠、潮州、河源、汕尾和云浮,它們的排名在整體排名的后10位,其中有4個地區(qū)屬于經(jīng)濟發(fā)展水平較落后的山區(qū).
根據(jù)2011年的排名情況,不同地區(qū)所處的層次發(fā)生了變化.與2006年相比,高發(fā)展層次的地區(qū)發(fā)生的變化較小,原先處于中等發(fā)展區(qū)的惠州市新增到高發(fā)展區(qū),而原先處于高發(fā)展區(qū)的汕頭市降到中等發(fā)展區(qū),高發(fā)展區(qū)包含的其它地區(qū)排名不變.中等發(fā)展區(qū)的包含的地區(qū)發(fā)生的變化也不大,除了已提及的惠州市和汕頭市以外,增加了原先處于低發(fā)展區(qū)的清遠市,同時,肇慶市由先前的中等發(fā)展區(qū)降到低發(fā)展區(qū),除此之外,低發(fā)展區(qū)所包含的地區(qū)與2006年相比沒有不同,可見,原屬于珠江三角洲區(qū)域的肇慶市在郵電業(yè)遇到發(fā)展的瓶頸,最終拖了珠江三角洲的后腿.
與2011年相比,2016年不同地區(qū)的郵電業(yè)所處的發(fā)展層次發(fā)生了細微的變化.高發(fā)展區(qū)所包含的地區(qū)及其排名保持不變,而原先處于低發(fā)展層次的肇慶市的排名升到中等發(fā)展層次,原先處于中等發(fā)展層次的清遠市降到低發(fā)展層次.此時,廣東省各地級市的郵電業(yè)發(fā)展差異及相關排名已趨向穩(wěn)定.
5結論
通過運用主成分分析法對廣東省21個地級市的郵電業(yè)發(fā)展的研究,可以得知,當前廣東省各地區(qū)郵電業(yè)發(fā)展狀況存在顯著的地區(qū)差異.這首先體現(xiàn)在經(jīng)濟發(fā)達、基礎設施完善的珠江三角洲地區(qū)擁有發(fā)展郵電業(yè)得天獨厚的條件和需求,而經(jīng)濟較落后、地處偏遠的部分區(qū)域排名總體靠后.以2016年各地區(qū)排名和層次劃分的情況為例,除了肇慶市和珠海市屬于中等發(fā)展區(qū),其余珠江三角洲地區(qū)都位居高發(fā)展區(qū).其次,東翼和西翼各地區(qū)大都位于郵電業(yè)發(fā)展的中等層次,而山區(qū)各地區(qū)大都位于低發(fā)展層次.因此,盡管歷年來整體上廣東省各地區(qū)郵電業(yè)的業(yè)務量以及相關指標數(shù)據(jù)不斷增長,但無法回避的現(xiàn)實是,廣東省郵電業(yè)的地區(qū)發(fā)展水平越來越不平衡.與此同時,在時間上各地區(qū)郵電業(yè)不平衡的發(fā)展狀況越發(fā)明顯.這主要體現(xiàn)在,隨著時間的推移,各地級市郵電業(yè)發(fā)展的差異及相關排名漸趨穩(wěn)定.從2006、2011和2016年各地區(qū)的排名情況看,高發(fā)展層次發(fā)生排名變動的情況越來越少,盡管近年來,珠海市和汕頭市郵電業(yè)發(fā)展越來越成熟以及相關排名漸趨穩(wěn)定,但仍無法躋身高發(fā)展層次.與此同時,處于低發(fā)展區(qū)的汕尾和陽江的排名不進反退.這表明,可能在很長一段時間內(nèi),廣東省各地區(qū)的郵電業(yè)發(fā)展水平以及排名情況不會發(fā)生變動,地區(qū)間郵電業(yè)發(fā)展的差異會越來越明顯.
參考文獻
[1]廣東統(tǒng)計信息網(wǎng).廣東統(tǒng)計年鑒[M].北京:中國統(tǒng)計出版社,2001-2017.
[2]劉欽普.數(shù)理統(tǒng)計方法在河南地市經(jīng)濟發(fā)展水平和分區(qū)研究中的應用[J].數(shù)理統(tǒng)計與管理,2002(2):10-15.
[3]吳建民,王為民,趙寶柱,丁疆輝.中國郵政發(fā)展的省際差異及其影響因素分析[J].郵政研究,2008(2):9-11.
[4]康國棟,孫根年,王美紅.我國郵電業(yè)發(fā)展的地域需求模型研究[J].統(tǒng)計與決策,2008(16):95-97.
[5]曹小曙,李琳娜.廣東省郵電通信業(yè)發(fā)展空間差異變動[J].地理研究,2009,28(1):182-190.
[6]封燁,孫中偉,王巖巖.我國郵政函件業(yè)務的時空演變及其影響因素[J].物流科技,2017,40(1):7-14.
[7]蘇為華.我國多指標綜合評價技術與應用研究的回顧與認識[J].統(tǒng)計研究,2012,29(8):98-107.
[8]王斌會.多元統(tǒng)計分析及R語言建模[M].廣州:暨南大學出版社,2011:184-194.
[9]蔣亮,羅漢.我國東西部城市經(jīng)濟實力比較的主成分分析[J].經(jīng)濟數(shù)學,2003(3):48-53.
[10]林海明,杜子芳.主成分分析綜合評價應該注意的問題[J].統(tǒng)計研究,2013,30(8):25-31.
[11]王中,鄧瓊,王躍恒.基于多元統(tǒng)計分析的城市競爭力研究[J].經(jīng)濟數(shù)學,2017,34(3):30-34.
[12]成亞利,王波.基于聚類分析的中國郵電產(chǎn)業(yè)業(yè)務分布研究[J].物流科技,2014,37(10):23-26.
[13]羅時超,李曦染.基于主成分分析的農(nóng)村居民消費性支出研究——以中國31個省市為例[J].重慶工商大學學報(自然科學版),2012,29(11):22-26.
[14]孫夢瑤.基于主成分分析法的我國省級地區(qū)郵政業(yè)務發(fā)展研究[J].現(xiàn)代城市,2017,12(4):27-30.