何春雨 柴嘯龍 李雄英




【摘? 要】針對我國區(qū)域科技產(chǎn)出水平不平衡這一現(xiàn)象,論文選擇反映科技產(chǎn)出水平的若干相關(guān)指標(biāo),利用穩(wěn)健主成分分析來反映我國31個省、自治區(qū)和直轄市的科技產(chǎn)出水平,根據(jù)穩(wěn)健綜合主成分得分直觀地反映了我國區(qū)域之間科技產(chǎn)出水平的不平衡性。最后根據(jù)以上分析,論文給出了提高我國科技產(chǎn)出水平以及減少我國各省份科技產(chǎn)出水平差異的相關(guān)政策建議。
【Abstract】In view of the phenomenon of imbalance of regional science and technology output level in China, this paper selects some relevant indicators reflecting the science and technology output level, uses robust principal component analysis to reflect the science and technology output level of China's 31 provinces, autonomous regions and municipalities. According to the robust comprehensive principal component score, this paper intuitively reflects the imbalance of science and technology output level among regions in China. Finally, according to the above analysis, this paper gives relevant policy suggestions to improve China's science and technology output level and reduce the difference of science and technology output level among provinces in China.
【關(guān)鍵詞】穩(wěn)健主成分分析;差異性;科技產(chǎn)出
【Keywords】robust principal component analysis; difference; science and technology output
【中圖分類號】G322;C812? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻(xiàn)標(biāo)志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號】1673-1069(2022)01-0142-03
1 引言
科技是國之利器,國家賴之以強(qiáng),企業(yè)賴之以贏,人民生活賴之以好,這是習(xí)近平總書記在中國科學(xué)技術(shù)協(xié)會第九次全國代表大會中強(qiáng)調(diào)的,說明科技水平的提高對國家、企業(yè)、人民的發(fā)展尤為重要。科技產(chǎn)出作為科學(xué)研究的最終目的,其發(fā)展水平的高低在很大程度上也代表了該國家、企業(yè)的經(jīng)濟(jì)發(fā)展水平。因此,如何提高我國各省份的科技產(chǎn)出水平成為一個值得關(guān)注的話題。國內(nèi)已有許多學(xué)者對其進(jìn)行了深入的探討。劉闖、高琴琴(2011)針對科技綜合評價方法的缺陷,提出了一種新的科技產(chǎn)出評價方法,即在因子分析的基礎(chǔ)上構(gòu)造了FA-AHP組合賦權(quán)模型,結(jié)果表明:我國大多數(shù)省份的科技產(chǎn)出績效未能達(dá)到平均水平。王慶豐(2013)收集了評價區(qū)域科技績效的相關(guān)指標(biāo),并使用偏最小二乘通徑模型對我國科技績效進(jìn)行綜合評價,實證結(jié)果表明:我國各省份之間的科技績效存在較大的差異。
當(dāng)前,人們獲取的數(shù)據(jù)中通常存在離群值,而離群值的存在往往會使利用傳統(tǒng)方法計算得到的結(jié)果不符合實際情況,傳統(tǒng)主成分分析也同樣存在這一問題。針對這一現(xiàn)象,國內(nèi)外學(xué)者將傳統(tǒng)主成分分析與穩(wěn)健統(tǒng)計的思想相結(jié)合以抵消或削弱離群值的影響,如Hubert、Rousseeuw(2005)通過模擬實驗和實證分析均表明通過穩(wěn)健方法更能得到貼近實際情況的結(jié)果。
因此,本文首先引入穩(wěn)健統(tǒng)計的思想,借鑒Hubert、Rousseeuw提出的ROBPCA算法與傳統(tǒng)主成分分析方法相結(jié)合,構(gòu)建出穩(wěn)健主成分分析方法,以達(dá)到減少或者消除離群值影響的目的,從而使得主成分分析的結(jié)果較為貼近實際情況;其次,通過穩(wěn)健綜合主成分得分可以更直觀地反映我國區(qū)域科技產(chǎn)出水平的不平衡問題;最后結(jié)合結(jié)果提出提高我國科技產(chǎn)出水平和減少我國各省、自治區(qū)和直轄市的科技產(chǎn)出水平差異的相關(guān)政策建議。
2 區(qū)域科技產(chǎn)出水平不均衡的研究
2.1 傳統(tǒng)主成分分析的不穩(wěn)健性及穩(wěn)健主成分分析的原理
2.1.1 傳統(tǒng)主成分分析的原理及其不穩(wěn)健性
主成分分析是一種有效的降維方法,它能夠較為充分地提取高維數(shù)據(jù)中的信息,假設(shè)有1個n×p的數(shù)據(jù)矩陣Xn×p,其中,n為樣本容量;p為數(shù)據(jù)維度。主成分分析的基本步驟如下:
從傳統(tǒng)主成分分析的基本步驟可以看出,模型的計算中最重要的一個步驟是計算樣本的均值和協(xié)方差矩陣,而這兩個統(tǒng)計量是不穩(wěn)健統(tǒng)計量,即對離群值比較敏感,從而導(dǎo)致傳統(tǒng)主成分分析方法對離群值的抗差性較差。換言之,當(dāng)數(shù)據(jù)中存在離群值時,應(yīng)用傳統(tǒng)主成分方法得到的結(jié)果與真實情況之間會產(chǎn)生較大的偏差,而人們獲取的社會科學(xué)的數(shù)據(jù)中普遍存在離群值。因此,相關(guān)人員有必要對傳統(tǒng)主成分分析進(jìn)行穩(wěn)健改進(jìn)。
2.1.2 穩(wěn)健主成分分析的原理
由上文分析可知,傳統(tǒng)主成分分析方法易受離群值影響,從而導(dǎo)致計算結(jié)果與實際情況不符。針對這一現(xiàn)象,本文將傳統(tǒng)主成分分析方法與穩(wěn)健統(tǒng)計的思想相結(jié)合,使用前人所構(gòu)建的穩(wěn)健主成分分析方法(ROBPCA算法),以達(dá)到抵抗離群值的影響的作用。同時,使用此方法分析我國區(qū)域科技產(chǎn)出水平不均衡的原因。ROBPCA算法的主要原理如下:
①采用投影尋蹤算法(Project Pursuit),在不損失信息的情況下,對數(shù)據(jù)矩陣進(jìn)行降維。
②使用Fast-MCD算法得到降維數(shù)據(jù)矩陣的穩(wěn)健協(xié)方差矩陣和穩(wěn)健均值向量。
③計算穩(wěn)健相關(guān)系數(shù)矩陣,并計算穩(wěn)健樣本相關(guān)系數(shù)的特征方程,得到前n個穩(wěn)健主成分。
④計算前n個穩(wěn)健主成分的穩(wěn)健綜合主成分得分。
2.2 影響科技產(chǎn)出的指標(biāo)選取
科技產(chǎn)出是通過科技活動產(chǎn)生的各種形式的科技成果,是進(jìn)行科學(xué)研究的最終目的,各個省份的科技產(chǎn)出也反映了各個省份的科技實力。影響區(qū)域科技產(chǎn)出水平的因素有很多,主要包括經(jīng)過授權(quán)的專利、發(fā)表的論文和著作,等等。因此,本文選取了2011-2016年的R&D項目(課題)數(shù)(單位:項)、出版科技著作(單位:種)、國內(nèi)專利申請授權(quán)數(shù)(單位:件)、核準(zhǔn)注冊商標(biāo)(單位:件)、科普圖書出版總冊數(shù)(單位:萬冊)以及發(fā)表論文數(shù)(單位:篇)這6個指標(biāo)數(shù)據(jù),并運用穩(wěn)健主成分分析來綜合反映各個區(qū)域科的技產(chǎn)出水平,數(shù)據(jù)來源于EPS全球統(tǒng)計數(shù)據(jù)平臺。
2.3 基于穩(wěn)健主成分分析的區(qū)域科技產(chǎn)出水平不均衡的研究
為說明我國各個地區(qū)科技產(chǎn)出水平的不平衡,首先采用穩(wěn)健主成分分析方法對各區(qū)域科技產(chǎn)出水平的總體情況進(jìn)行闡述,隨后通過穩(wěn)健主成分分析得到的各個穩(wěn)健主成分的累積方差貢獻(xiàn)率,如表1所示。
由表1可知,根據(jù)累計方差貢獻(xiàn)率大于等于80%的原則,本文選擇第一主成分來反映總體信息,前一個主成分得分情況如圖1所示。
由圖1可知,北京、江蘇、廣東、浙江、上海等省市均在第一主成分上有較高的得分,這些省份主要分布在東部沿海地區(qū),這說明東部沿海地區(qū)有較高的科技產(chǎn)出水平,而相對落后的西部地區(qū),如西藏、青海、寧夏等地區(qū)的第一主成分的得分較低,因此,通過圖1可大致判斷我國各省份的科技產(chǎn)出水平存在著不均衡的現(xiàn)象。
在此基礎(chǔ)上,通過各個穩(wěn)健主成分的得分來綜合評價各個省份的經(jīng)濟(jì)發(fā)展情況,各省份的穩(wěn)健主成分綜合得分及排名如表2所示。
由于原始數(shù)據(jù)矩陣經(jīng)過了標(biāo)準(zhǔn)化,因此,當(dāng)穩(wěn)健主成分的綜合得分大于0,說明該區(qū)域的科技產(chǎn)出水平在全國平均科技產(chǎn)出水平以上,若穩(wěn)健主成分綜合得分小于0,則說明該區(qū)域的科技產(chǎn)出水平在全國平均科技產(chǎn)出水平以下。由表2可知,有17個省份在全國平均科技產(chǎn)出水平以上,而有14個省份在全國平均科技產(chǎn)出水平以下。同時可以發(fā)現(xiàn)北京的綜合評分排名第一,其綜合得分為5.72,即北京的科技產(chǎn)出水平最高,這主要是北京自身得天獨厚的因素使然,與北京作為我國的文化、政治、經(jīng)濟(jì)中心,且擁有著較高的資源優(yōu)勢休戚相關(guān)。綜合排名較高的地區(qū)還有江蘇、廣東、浙江、上海等,這些省市主要分布在東部沿海地區(qū),這說明我國東部沿海地區(qū)的科技產(chǎn)出水平較高。科技產(chǎn)出水平較低的地區(qū)主要有西藏、青海、寧夏等,其綜合得分分別為-1.63、-1.58、-1.43,而這些省份主要分布在西部地區(qū),這說明了西部地區(qū)科技產(chǎn)出水平相對較為落后,需要進(jìn)一步提高這些省份的科技發(fā)展水平,值得重點關(guān)注。其余省市,如安徽、湖南、重慶等主要分布在我國的中部地區(qū),科技產(chǎn)出水平適中。因此,綜合上述分析可知,我國區(qū)域之間的科技產(chǎn)出水平存在著不均衡且科技產(chǎn)出水平有從東南沿海地區(qū)到西北地區(qū)逐漸遞減的趨勢。
考慮到穩(wěn)健主成分分析只能反映我國31個省、自治區(qū)、直轄市的科技產(chǎn)出水平,并沒有對我國各地區(qū)科技產(chǎn)出水平進(jìn)行劃分。因此,本文通過“自然間斷法”將我國科技產(chǎn)出水平劃分為5個水平,分別為-1.6~-0.7、-0.7~-0.1、-0.1~0.5、0.5~1.9、1.9~5.7。
具體來說,處于科技產(chǎn)出最高水平的省市有北京、江蘇、廣東、浙江、上海、湖北、山東,其穩(wěn)健主成分綜合得分為1.9~5.7;處于科技產(chǎn)出較高水平的省份有四川、河南、遼寧、陜西、湖南、安徽,其綜合得分為0.5~1.9;處于科技產(chǎn)出第三水平的省市有河北、福建、重慶、黑龍江、吉林、天津,其綜合得分為-0.1~0.5;科技產(chǎn)出水平相對落后的地區(qū)有江西、云南、廣西、內(nèi)蒙古,其綜合得分為-0.7~-0.1;科技產(chǎn)出水平最為落后的省份有甘肅、山西、貴州、新疆、海南、寧夏、青海、西藏,其綜合得分為-1.6~-0.7。同時可以發(fā)現(xiàn)處于科技產(chǎn)出第一水平的省市有6個,并且大部分布在東部沿海地區(qū),而處于科技產(chǎn)出第五水平的也有6個地區(qū),主要分布在西部地區(qū)。我國科技產(chǎn)出水平總體上呈現(xiàn)出從東南沿海地區(qū)到西北地區(qū)遞減的趨勢,與我國經(jīng)濟(jì)水平提升情況基本相一致,這也符合我國經(jīng)濟(jì)現(xiàn)狀和基本國情。
3 結(jié)論及政策建議
本文通過穩(wěn)健主成分分析得到各區(qū)域之間的科技產(chǎn)出情況,并基于穩(wěn)健主成分得分直觀反映我國區(qū)域科技產(chǎn)出水平存在不均衡的現(xiàn)象,且發(fā)現(xiàn)科技產(chǎn)出水平有著從東南沿海地區(qū)到西北地區(qū)逐漸遞降的趨勢。
綜合以上研究,為提高我國各地區(qū)的科技產(chǎn)出水平和減少我國各省份之間科技產(chǎn)出水平的差異,可以從以下方面入手:
①根據(jù)各區(qū)域的科技產(chǎn)出水平可知,西部地區(qū)的科技產(chǎn)出水平相對落后于其他地區(qū),因此,為提高西部地區(qū)的科技產(chǎn)出水平,國家有必要采取相應(yīng)政策來加強(qiáng)和扶持西部地區(qū)科技產(chǎn)出水平的提高,從而提升西部地區(qū)的科技產(chǎn)出水平。
②根據(jù)各區(qū)域的科技產(chǎn)出水平可得,東部沿海地區(qū)具有較高的科技產(chǎn)出水平,且大部分地區(qū)具有較高的經(jīng)濟(jì)發(fā)展水平,因此,對于東部沿海地區(qū),可以通過加強(qiáng)對高科技人才的培養(yǎng)、加強(qiáng)高新技術(shù)的內(nèi)外交流等方式來提高科技產(chǎn)出水平。同時,東部沿海地區(qū)應(yīng)該起到帶動科技產(chǎn)出活力的作用,并多與鄰近省份進(jìn)行科技合作,從而促進(jìn)我國科技產(chǎn)出水平的提升。
③從總體上看,仍有較多的省份處于我國平均科技產(chǎn)出水平以下,為提高我國各省份科技產(chǎn)出水平,我國可以加大科技創(chuàng)新的投入力度,大力發(fā)展高等教育進(jìn)行人才培養(yǎng),從而提高我國各省份的科技活力。
【參考文獻(xiàn)】
【1】劉闖,高琴琴.基于FA-AHP組合賦權(quán)模型的科技產(chǎn)出績效評價研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2011,32(1):30-34.
【2】王慶豐.基于偏最小二乘通徑模型的我國區(qū)域科技績效綜合評價[J].統(tǒng)計與決策,2013(6):111-113.
【3】Mia Hubert,Peter J Rousseeuw.ROBPCA: A New Approach to Robust Principal Component Analysis[J].Technometrics,2005,47(1):64-79.
【4】Mia Hubert,Peter Rousseeuw,Tim Verdonck.Robust PCA for skewed data and its outlier map[J].Computational Statistics and Data Analysis,2008,53(6):2264-2274.
【5】李雄英,顏斌.穩(wěn)健主成分聚類方法的構(gòu)建及其比較研究[J].數(shù)理統(tǒng)計與管理,2019,38(5):849-857.
【6】王斌會,陳一非.基于MCD的穩(wěn)健主成分算法及其實證分析[J].數(shù)理統(tǒng)計與管理,2006(4):462-468.
【7】王斌會.穩(wěn)健主成分分析方法研究及其在經(jīng)濟(jì)管理中的應(yīng)用[J].統(tǒng)計研究,2007(8):72-76.
【8】李雄英,王斌會.穩(wěn)健夏普單指數(shù)模型的構(gòu)建及其比較研究[J].數(shù)理統(tǒng)計與管理,2020,39(3):544-555.