秦薇 萬忠 康樂



摘要?針對目前我國在農業科技創新能力評價中時間維度研究缺失、指標選取過多、指標相關性不足的現狀,該研究采用主成分分析法,將影響農業科技創新能力的眾多因素進行降維,從而找出重要影響因素作為支持向量機模型的輸入層,建立精度更高、數據需求量更少、計算時間更短的農業科技創能力評價模型。運用該模型得到我國2005—2016年農業科技創新能力水平,得出農業科技創新能力由投入產出以及研發能力共同決定。最后,根據該研究結果提出提升我國農業科技創新能力的相關建議。
關鍵詞?農業科技創新;評價指標;主成分分析;支持向量機
中圖分類號?S-058文獻標識碼?A
文章編號?0517-6611(2019)16-0245-05
doi:10.3969/j.issn.0517-6611.2019.16.070
開放科學(資源服務)標識碼(OSID):
Evaluation?of?Innovation?Ability?of?Agricultural?Science?and?Technology?in?China?Based?on?Principal?Component?Analysis?and?Support?Vector?Machine
QIN?Wei1,2,3,WAN?Zhong1,3,KANG?Le1,3?(1.Institute?of?Agricultural?Economics?and?Rural?Development,GAAS,Guangzhou,Guangdong?510640;2.Agricultural?Information?Institute?of?CAAS,Beijing?100081;3.Key?Laboratory?of?Urban?Agriculture?in?South?China,Ministry?of?Agriculture,Guangzhou,Guangdong?510640)
Abstract?In?view?of?the?current?situation?of?lack?of?time?dimension?research,excessive?selection?of?indicators?and?insufficient?correlation?of?indicators?in?the?evaluation?of?agricultural?science?and?technology?innovation?ability?in?China,we?used?principal?component?analysis?(PCA)?to?reduce?the?dimensionality?of?many?factors?affecting?the?innovation?ability?of?agricultural?science?and?technology,to?find?out?the?important?factors?as?the?input?layer?of?SVM?model,establish?the?evaluation?model?of?agricultural?science?and?technology?innovation?ability?with?higher?accuracy,less?data?demand?and?shorter?calculation?time.This?model?was?used?to?obtain?the?level?of?agricultural?science?and?technology?innovation?ability?in?China?from?2005?to?2016.According?to?the?results,it?is?found?that?the?innovation?ability?of?agricultural?science?and?technology?is?determined?by?the?input?and?output?as?well?as?the?research?and?development?ability.Finally,according?to?the?results?of?this?study,some?suggestions?are?put?forward?to?improve?the?innovation?ability?of?agricultural?science?and?technology?in?China.
接下來,對經過標準化及檢驗的數據進行主成分分析?,即使用主成分分析法為因子選取的方法,并采用正交旋轉法使得因子更具有解釋性,這里基于特征值大于1提取主成分,得到累積特征值占總方差的比重(表2)。可以看到2個主成分的累積貢獻率就已經達到了89.2%,因此2個主成分能夠代表原來的9個變量,于是初步確定提取m=2個主?成分。
從旋轉后的因子載荷矩陣(表3)可以看出,第一主成分在X?1(R&D人員比例)、X?2(研發機構平均經費投入)、X?3(R&D人均經費投入)、X?5(重點實驗室人員占比)、X?6(R&D人均經費支出)、X?7(重大科技成果)、X?9(發表科技論文篇數)這7個指標上具有較大的載荷;第二主成分在X?4(R&D課題數)、X?8(專利申請數)2個指標上具有較大載荷。根據觀察,在第一主成分上具有較大載荷的變量和農業科技創新的投入和產出具有很強的關系,所以將第一主成分定義為農業科技創新投入產出能力因子;第二主成分上有較強載荷的變量和研發能力具有一定關系,所以將第二主成分定義為農業科技創新研發能力因子。最終確定2個主成分。再由表2可知,第一主成分的累計方差貢獻率為67.334%,即農業科技創新投入產出能力是影響農業科技創新能力的主要因素;第二主成分,農業科技創新研發能力對農業科技創新能力的影響緊隨其后。
最后,確定各主成分表達式,從而得到農業科技創新能力綜合評價函數。主成分表達式系數由因子載荷矩陣的數據除以主成分相對應的特征根開平方得到,且根據上述過程可知,2個主成分的特征根分別為6.071和1.956,于是主成分表達式如下:
Z?1=0.403×ZX?1+0.284×ZX?2+0.398×ZX?3+0.124×ZX?4+?0.381×ZX?5+0.393ZX?6+0.379×ZX?7-0.112×ZX?8+?0.355×ZX?9
Z?2=-0.059×ZX?1-0.158×ZX?2+0.024×ZX?3+0.671×ZX?4+?0.183×ZX?5+0.155×ZX?6-0.037×ZX?7+0.683×ZX?8-?0.009×ZX?9
其中Z?1,Z?2分別為第一主成分和第二主成分,ZX?1、ZX?2、ZX?3、ZX?4、ZX?5、ZX?6、ZX?7、ZX?8、ZX?9依次分別為標準化后的指標?數據。
再由2個主成分的貢獻率0.674和0.217,得到農業科技創新水平綜合評價函數:
Y=0.258×ZX?1+0.157×ZX?2+0.273×ZX?3+0.229×ZX?4+?0.296×ZX?5+0.298×ZX?6+0.248×ZX?7+0.072×ZX?8+?0.237×ZX?9
根據上述綜合評價函數,即可得到2005—2016年我國農業科技創新水平情況(表4)。
2.2?基于支持向量機(SVM)的評價體系的驗證與完善
支持向量機(support?vector?machine)方法是建立在結構風險最小原理以及統計學習理論的VC維理論基礎上的,是根據有限的樣本信息在模型學習能力(即無錯誤地識別任意樣本地能力)和復雜性(即對特定訓練樣本的學習精度)之間尋求最佳折中,以期獲得最好的推廣能力。在機器學習領域,支持向量機是一種有監督地學習,針對線性及非線性、分類及預測問題,支持向量機均能有效的解決。且相比于其他分類預測方法來說,支持向量機有正確率高、不存在過度學習等優點。
基于主成分分析法構建模型的結果,選取結果的60%作為訓練集,40%作為測試集,并將投入產出能力(Z?1)、研發能力(Z?2)作為輸入變量,綜合能力Y作為目標值,進行線性支持向量機方法的模擬,得到預測變量重要性對比圖(圖1)以及預測-實測對比圖(圖2)。
由圖1、2可知,2個主成分作為輸入變量對于模型的構建都不可或缺,且利用支持向量機構建的模型所產生的預測值與實際期望值基本一致。利用訓練好的支持向量機對2005—2016年我國農業科技創新水平進行綜合評價。
由表5可知,以綜合能力Y作為訓練支持向量機的目標值,投入產出能力和研發能力作為支持向量機的輸入變量,運用支持向量機方法對我國2005—2016年農業科技創新水平進行評價,所得的結果與排名和利用主成分分析法所得到結果與排名基本一致,從而說明利用主成分分析法與支持向量機相結合的方法進行農業科技創新水平的評價,減少了支持向量機在構建模型時的復雜度,消除了主觀因素對模型的影響,并提高了支持向量機的學習速率以及泛化能力,最終進一步保證并增加了模型的準確性。
3?農業科技創新能力評價分析
3.1?農業科技創新能力影響因素分析
根據上述研究,農業科技創新能力主要由農業科技創新投入產出能力和農業科技創新研發能力共同作用決定。其中,投入產出能力的方差貢獻率達到67.4%為科技創新能力的主要影響因素;研發能力的方差貢獻率為21.7%,為次要影響因素。對投入產出能力影響最強的因素為R&D人員比例;而對研發能力影響很強的因素為專利申請數和R&D課題數;綜合2個能力作用得到的農業科技創新能力中影響最強的因素則為R&D人均經費支出[17]。
3.2?2005—2016年我國農業科技創新能力評價
2005—2016年我國農業科技創新能力變化趨勢見圖3。觀察可得,2005—2016年我國農業科技創新能力總體呈上升趨勢。其中,研發能力在2009年前一直處于高于投入產出以及綜合能力的正數水平狀態,此后經過明顯下降至負數水平,然后上升一直較緩慢,直到2013年重新恢復正數水平;投入產出水平在2005—2016年一直保持上升態勢,2009年超過研發能力,2010年從負數水平達到正數水平;綜合能力總體處于上升趨勢,到2011年后達到正數水平。具體對比發現,投入產出能力及綜合能力上升態勢較明顯,而研發能力在2008年間發生過1次較大程度下降,并在2009年降至負數,該時期綜合能力的上升也明顯減緩,水平開始低于投入產出能力。此后,研發能力的上升較平緩,直到2013年間才重新達到正數水平,綜合能力也是在相同時期恢復至2009年前高于投入產出能力的水平。最終在2016年研發能力才達到與2008年下降前相同水平,此時綜合能力也同時恢復到下降前的相對水平。通過對原始數據的觀察,發現對研發能力產生重要影響的專利申請數在2008—2009年有過1次非常明顯的下降。反觀歷史信息發現,我國《專利法》在該時間段進行過1次較大程度修訂,此后專利申請數量便一直處于較低水平,這也就解釋了研發能力產生明顯下降狀況的?原因[18]。
4?結論與建議
(1)該研究從農業科技創新投入產出及研發3個方面出發建立了我國農業科技創新能力評價指標體系,為我國農業科技創新能力評價提供了依據,并根據該體系得到2005—2016年我國農業科技創新能力時間維度的對比[19]。
(2)將主成分分析法與支持向量機相結合,先將影響我國農業科技創新能力的因素通過主成分分析法進行了一定程度的降維,然后在此基礎上運用支持向量機對降維后的數據進行訓練,建立了一個有效的基于主成分分析-支持向量機的我國農業科技創新能力評價模型,通過輸入新的數據可以快捷、準確地分析出我國農業科技創新能力的發展狀況。
因此,根據上述研究結果提出以下建議:
(1)建立健全農業科技創新能力評價指標體系,對農業科技創新能力相關數據的統計需要更加全面,同時,在空間與時間維度上均需要建立科學合理的農業科技創新能力評價指標體系,并不斷嘗試加入新的指標與方法對該體系進行完善,在此基礎上形成相關規則,養成定期考核,定向自查改進的習慣。
(2)農業科技創新能力的提高需要抓重點、補不足,根據研究結果,要想提高農業科技創新能力,最重要的就是提高投入產出能力,尤其是研究人員的比例以及研究經費,除此之外,針對2008—2009年研發能力下降導致綜合能力上升減緩這一情況,建議推動農業科技成果的創造與農業相關專利的申請,鼓勵農業相關工作者們積極投入到農業科技成果的創造之中,對于已經產生的科技成果給予一定的重視,對于符合專利申請條件的,相關部門應全力支持其申請工作。
(3)農業科技創新能力提升要全面進行,農業科技創新能力的評價是由多個指標因素共同作用的結果,需要全方位共同協調才能使得農業科技創新能力得到更快、更穩定的?提升[20]。
5?討論
研究證明了利用主成分分析法與支持向量機相結合的方法對農業科技創新能力進行評價不僅是有效、可行的,還可以縮減訓練時間,提高收斂速度和精度,具備信息需求量少、計算精度高等優點。但需指出的是,該研究所選取的指標一定程度受限于數據的可獲取性,不能完全涵蓋所有農業科技創新能力評價的相關指標,但隨著研究的深入,指標的選取也會進行相應的完善,以期得到該模型的最佳效果。
參考文獻
[1] 蔣和平,劉學瑜.我國農業科技創新體系研究評述[J].中國農業科技導報,2014,16(4):1-9.
[2]?張淑輝,郝玉賓.農業科技成果低轉化率的主要原因探討[J].理論探索,2014(1):98-101.
[3]?盧江勇,蔣和平.我國農業科技創新能力實證研究[J].中國農業科技導報,2008,10(S1):78-85.
[4]?曹瓊,李成標.基于熵權TOPSIS法的農業科技創新能力評價:以湖北省為例[J].南方農業學報,2013,44(10):1751-1756.
[5]?張莉俠,俞美蓮,王曉華.農業科技創新效率測算及比較研究[J].農業技術經濟,2016(12):84-90.
[6]?梁凱,龔祖文,和平.基于支持向量機和因子分析法的配電網線損計算[J].電工技術,2018(22):53-56.
[7]?李遠遠,梅紅波,任曉杰,等.基于確定性系數和支持向量機的地質災害易發性評價[J].地球信息科學學報,2018,20(12):1699-1709.
[8]?王肖芳.基于因子分析-BP神經網絡的河南省生態農業效益評價[J].經濟經緯,2015(4):37-42.
[9]?萬忠,吳美良,林佩珍,等.科技進步在東莞農業發展中的作用[J].農業現代化研究,2000,21(6):337-340.
[10]?楊宗霄,毛智杰,楊本渤,等.基于因子分析與神經網絡的輸電網安全評價[J].電網技術,2009,33(14):26-30.
[11]?盧文喜,初海波,王喜華,等.基于因子分析的Hopfield神經網絡在水質評價的應用[J].水土保持通報,2012,32(1):197-200,237.
[12]?孟嘉偉.基于BP人工神經網絡的水質評價模型[D].天津:天津大學,2010.
[13]?王江思,馬傳明,王文梅,等.基于SPSS和GIS的BP神經網絡農用地適宜性評價[J].地質科技情報,2013,32(2):138-143.
[14]?朱慶鋒,徐中平,王力.基于模糊綜合評價法和BP神經網絡法的企業控制活動評價及比較分析[J].管理評論,2013,25(8):113-123.
[15]?王碧云.大學科研創新力評價及中國提升策略研究[D].武漢:武漢大學,2016.
[16]?耿迪.高校科技創新能力評價研究[D].武漢:武漢理工大學,2013.
[17]?尤丹君.京津冀區域科技創新能力評價研究[D].石家莊:河北經貿大學,2014.
[18]?李洪文,黎東升.農業科技創新能力評價研究:以湖北省為例[J].農業技術經濟,2013(10):114-119.
[19]?尹偉華,張亞雄.我國工業企業自主創新能力分析[J].調研世界,2016(2):3-9.
[20]?黃紅星,劉曉珂,萬忠.科技引領廣東農業供給側結構性改革的思路和方向[J].江西農業學報,2018,30(11):147-150.