王春嬉, 甘娟, 馬龍
(西安航空學院 經濟管理學院,陜西 西安 710077)
近年來,我國對于科技創新的支持力度不斷加大。科學技術是第一生產力,全方位提升科技創新的各個流程對于我國科技興國的戰略具有重要意義。隨著科技產業的規范化,科技項目、成果的轉化效率受到了更多的重視。與基礎研究不同,一個科技成果只有創造出社會和經濟效益才有更大的研究價值。因此需要將科技成果的轉移預測進行前置,在科技項目立項前就進行完備的可行性評估,保證科技項目的實用價值[1-6]。據統計,我國每年均會產生大量的科技論文、科學專利。然而與發達國家相比,我國的專利轉化率僅有10%,遠低于歐美發達國家50%-60%。大量的科技成果僅僅停留在理論研究階段,嚴重脫離社會生產實際,因此迫切需要提高科技成果的轉化效率[7-13]。
綜合以上分析,本文結合科技成果轉移的流程與當前的科技產業發展背景,提取了影響科技成果轉移效率的相關影響變量。基于自組織神經網絡構建科技成果轉移效率的預測模型,然后搜集主流的科技行業實際科技項目相關數據進行模型的效果仿真[14-16]。
對于傳統的神經網絡,其神經元及隱藏層的數目均是固定的,訓練過程中只會改變模型前向傳播的權重和偏置;此外,傳統的神經網絡對于高特征維度的訓練任務適應性較差,會因為輸入特征維度的增長造成網絡結構復雜化以及網絡的過擬合。因此對于高維數據的輸入需要首先完成到低維空間的映射,以降低網絡的復雜度。自組織神經網絡(SOM)既可以保留樣本之間的拓撲映射,又能夠降低輸入特征空間的維度,其內部連接如圖1所示。

圖1 自組織神經網絡結構
圖1給出了一個二維輸入,3×3輸出的自組織神經網絡。在SOM網絡中,其關鍵步驟包含2步:首先是數據信號沿著神經元和神經的正向傳播。通過正向傳播,網絡得到當前輸入樣本下的輸出值;其次是誤差的反向傳播,每一次的正向傳播后,網絡會比對實際輸出與期望輸出,將誤差反饋至神經元和神經,進行傳播參數的調整。因此,SOM網絡訓練的關鍵在于傳播參數的調整策略的獲取。
對于d維數據,當SOM網絡的輸出維含有M=m×m個神經元,則每個維度的數據均要對應一個權重向量。此時,權重向量的維度也為d,M則可表示為式(1)。
W={wi|wi∈Rd,i=1,…,M}
(1)
SOM網絡經過多次迭代進行網絡的訓練,每一次迭代均包含競爭、合作2個過程。通過競爭找到最佳匹配單元為式(2)。
(2)
其中,x(t)代表第t次迭代的輸入。競爭完成后,對最佳匹配單元和鄰域的神經元權重進行調整,實現網絡的自組織為式(3)。
wi(t+1)=wi(t)+hci(t)[x(t)-wi(t)]
(3)
式中,用hci(t)定義該神經元鄰域內用于保存拓撲關系的更新機制。對于二維網格,其鄰域范圍如圖2所示。

圖2 二維網格的合作示意圖
圖中,圓形區域內的神經元即為最佳神經元的合作神經元。本文的更新機制采用的是高斯函數,即式(4)。
(4)
自組織網絡在訓練過程中不斷調整每個節點連接的權值,從而篩選出更多的獲勝神經元。并通過合作保持獲勝神經元在與鄰域內其他神經元的聯系,從而保證網絡的拓撲結構穩定。
自組織神經網絡通常采用1.1中所述的自適應過程進行網絡的訓練。這一訓練過程具有較好的抗干擾性和輸出結果的穩定性,但計算復雜度較高,模型的輸出結果在輸入模式較少時與輸入樣本的輸入順序相關性較高。因此為了獲得網絡參數的最優調整策略,本文引入了誤差的反向傳播算法,輔助網絡的訓練。對于神經網絡,其輸出層的輸出可記為式(5)。
ok=f(netk),k=1,2,3,…,l
(5)
其中,netk為式(6)。
(6)
在神經網絡的隱藏層為式(7)。
yj=f(netj),j=1,2,…,m
(7)
其中,netj為式(8)。
(8)
在誤差反向傳播時,對于輸入向量[x1,x2,x3,…,xp],結合其訓練樣本存在理想的輸入目標向量[d1,d2,d3,…,dp]。在網絡的正向傳播下,網絡存在輸出值(xp,yp)。此時,可以得到網絡的實際輸出和訓練樣本的理想輸出均方差為式(9)。
(9)
對于網絡的每一個訓練樣本,計算其均方差,可得到整個網絡的總誤差為式(10)。
(10)
根據梯度下降準則,對于權值向量ωsp則有式(11)。
(11)
根據誤差的反向傳播,在輸出層和隱藏層對權值進行修正,記t為模型訓練的迭代次數,則輸出層為式(12)。
(12)

(13)

(14)
同理,可得到隱藏層的權重調整計算式為式(15)。
(15)

(16)

(17)
科技項目是高新技術企業的核心生產力,提前評估科技成果的轉移效率對于高新企業進行項目前期投入與后期融資具有重要意義。為了合理評估科技項目的轉移效率,需要構建合理的評價體系。本文從我國風險投資的發展現狀出發,結合科技項目評估的前期、中期、后期及跟蹤評價4個流程。從科技成果項目本身、承擔科技成果項目的企業能力、科技項目的經濟可行性和成果項目管理團隊4個角度,建立了預測評價體系如圖3所示。

(a)
根據圖3可知,在使用自組織神經網絡進行成果的轉移預測時,采用分級的指標體系,共包括4個一級指標和14個二級指標。在劃分一級指標時,從科技項目的風險、項目承擔企業的經營績效、項目經濟可行性、項目管理團隊水平4個角度出發;在劃分二級指標時共包含R0-R3、Q0-Q2、W0-W3、T0-T2等14個輸入特征。
結合這些輸入特征,本文進行模型訓練和測試樣本的搜集。文中獲取、統計2013—2019年之間航空、生物、計算機、芯片、電子、通信6個行業75家企業的724個科技成果從立項到發布過程中的各項投入及獲利情況,并對這些企業的生產經營狀況與承擔科技項目運營的團隊進行統計,將這些數據作為模型訓練和測試的樣本集。
基于以上的數據集和模型,對算法的仿真環境與模型參數進行設計。由于本文在模型仿真時涉及的數據集規模較小,對于計算機硬件的水平要求較低。文中使用的模型仿真環境如表1所示。

表1 算法仿真環境
對于自組織神經網絡需要結合模型的訓練數據集的規模、輸入的特征數、輸出結果合理設置模型的參數。其中,最重要的參數包括權值的調整策略、學習率、鄰域函數等。網絡的建立包括排序和收斂兩個階段,通常將前1 000次訓練作為排序階段。經過排序階段將神經元之間的連接權值置為有序;然后在收斂階段降低模型的學習率,直至接近于0,以保證模型的訓練誤差穩定在可接受的范圍內。結合自組織網絡的訓練特性以及本文模型的應用場景,文中模型的訓練參數設置如表2所示。

表2 自組織網絡參數設置
本文以科技成果轉化后的實際社會收益作為評估模型的預測效率輸出結果,以模型的預測誤差作為模型性能的評價指標。為了對比不同模型間的性能,本文實驗部分的仿真環境采用機器學習算法中經典的訓練樣本和測試樣本以2.5∶1的比例來劃分數據集。在仿真過程中,使用全部樣本中524個項目作為模型的訓練樣本,使用剩余200個項目作為模型的測試樣本。
為了更優的評估算法的性能,本文選擇當前科技成果評估中常用的模糊分析算法作為對比評價算法。模糊分析算法與文中算法在不同行業中對于科技成果預測的誤差如表3所示。
從表3可以看出,本文算法在預測誤差上較模糊分析法有較大程度的優化。科技項目的平均相對誤差來看,模糊分析法的平均誤差為13.72%,文中算法誤差為7.31%,降低了6.41%。從行業類別來看,兩個算法對于航空業的預測精度最高,對于計算機、芯片行業預測精度較低。從行業發展的角度看,航空業雖為高科技行業,但行業發展較為成熟、科技成果的評價體系較為完善。科技成果多為政府大型企業直接參與,本身就有較高的成果轉換率,因此具有更高的預測精度;而計算機、芯片行業是朝陽產業,其科技產品創新性較強,需要更多的時間接受市場的檢驗。

表3 算法誤差統計(按行業)
為了評估科技成果轉移效率隨著時間的變化情況,本文將訓練、測試樣本按照成果轉移的年份進行了統計,統計結果如表4和圖4所示。

表4 算法誤差統計(按年份)

圖4 算法誤差隨年份變化
從表4和圖4可以看出,本文算法在按年份統計時,誤差也優于模糊評價法。從年份的變化來看,科技項目的轉化成果預測精度逐年降低。這說明隨著科技項目的投入增大,整個科技行業更加重視對于科技項目的調研、風險評估,這意味著整個高科技產業在向好的方向發展。
科技成果的轉移是科技項目落地、產生社會價值的重要一環,本文從科技成果項目本身、承擔科技成果項目的企業能力、科技項目的經濟可行性和成果項目管理團隊管理水平等多個角度建立了科技成果的評估體系,基于自組織神經網絡對科技成果的轉移效率進行預測。從預測精度看,文中的預測值較現有的模糊評價算法有明顯的提升,可以為科技項目提供可靠、有效的可行性評估。