汪杰
(北京化工大學,北京 100089)
社會的發(fā)展離不開科技的進步,科學技術是第一生產(chǎn)力,我國每年均在鼓勵社會各界進行科技創(chuàng)新,社會每年都在產(chǎn)生著大量科技成果??萍汲晒霓D(zhuǎn)化是科技成果變?yōu)樯鐣a(chǎn)力、創(chuàng)造價值的重要一步,科技成果的轉(zhuǎn)化過程主要包含3 個步驟,分別是基礎研究、技術研究與產(chǎn)品研究。首先在基礎研究上,科研院所通過相關基礎理論的研究在某一領域形成知識形態(tài);接著研發(fā)部門根據(jù)市場信息進行技術研發(fā),將理論轉(zhuǎn)化為技術,形成準商品;最終在產(chǎn)品研發(fā)階段,技術產(chǎn)品轉(zhuǎn)移至生產(chǎn)企業(yè),企業(yè)經(jīng)產(chǎn)品孵化,借助規(guī)模化的成品產(chǎn)生社會價值[1-6]。
科技成果的轉(zhuǎn)移是一項涉及面廣、流程復雜的系統(tǒng)工程,在這一過程中,會花費大量的人力、財力資源。若能夠在科技成果孵化為產(chǎn)品之前即可通過智能化的算法預測其社會收益,則對于科學合理地進行科技項目立項、規(guī)劃科技投資具有重要的指導意義[7-16]。基于以上目的,該文對科技成果的轉(zhuǎn)移預測進行了相關研究,并對科技成果的轉(zhuǎn)移流程進行數(shù)學建模,同時介紹該文使用的感應學習網(wǎng)絡理論,使用生產(chǎn)中的實際數(shù)據(jù)進行仿真,從而驗證該文模型與算法的有效性。
在該文的引言階段,已對科技成果轉(zhuǎn)化的各個階段內(nèi)容進行了簡要說明。該文的目的在于通過引入先進的計算機算法,利用科技成果轉(zhuǎn)化過程中的多方面數(shù)據(jù),預估成果轉(zhuǎn)移的社會效益。因此,仍需對上述過程進行數(shù)學化的抽象。通過研究發(fā)現(xiàn),從數(shù)學建模的角度出發(fā),科技成果的轉(zhuǎn)移過程可以分為成果的形成、小型試驗、中期試驗與產(chǎn)品誕生4 個階段。為了承接這4 個階段中的數(shù)據(jù)流,該文設計了科技成果轉(zhuǎn)移過程流程圖,如圖1 所示。
圖1 中包含4 個子系統(tǒng)與系統(tǒng)間的數(shù)據(jù)流向,這4 個子系統(tǒng)分別是針對科技成果進行技術研發(fā)的子系統(tǒng)H1;對科技成果進行技術改進的子系統(tǒng)H2;進行中期試驗的中試轉(zhuǎn)化系統(tǒng)H3 與進行新產(chǎn)品生產(chǎn)的系統(tǒng)H4。每個子系統(tǒng)均有其需要的初始啟動費用Wi;在各個系統(tǒng)實驗中,又會引入新的經(jīng)費投入Qi;在科技成果轉(zhuǎn)移過程中,每個階段均會產(chǎn)生一定的成果Ri;系統(tǒng)中還存在表征成果轉(zhuǎn)移效率的變量Ki。系統(tǒng)的變量說明如圖2 所示。
在圖2(d)中,根據(jù)其定義方法,計算方式如下:

圖1 科技轉(zhuǎn)化流程建模

圖2 系統(tǒng)中變量說明

1.1節(jié)中建立了科技成果轉(zhuǎn)移的數(shù)學模型,該模型可以定量描述科技成果轉(zhuǎn)移過程中的數(shù)據(jù)流向。為了通過這些數(shù)據(jù)流向準確地預測一項新的科技成果的社會效益,需要再引入計算機智能算法,該文使用的計算機智能算法是感應神經(jīng)網(wǎng)絡。在機器學習理論中,將無監(jiān)督的神經(jīng)網(wǎng)絡稱為感應神經(jīng)網(wǎng)絡,而自組織神經(jīng)網(wǎng)絡即是一個典型的感應神經(jīng)網(wǎng)絡,其基本結構如圖3 所示。

圖3 自組織神經(jīng)網(wǎng)絡結構
自組織神經(jīng)網(wǎng)絡的學習過程分為3 個子過程:競爭、合作與自適應。
1)競 爭
對于一個自組織網(wǎng)絡,其輸入為x、輸入層到競爭層的連接向量wj分別可以記為式(2)。

其中,網(wǎng)絡在競爭層中有l(wèi) 個單元,式(2)中的j=1,2,…,l。
競爭的依據(jù)為x與wj間的歐式距離或余弦距離。x與wj間距離最小的輸入向量為競爭的勝利者,其對應的輸入神經(jīng)元被選擇為當前網(wǎng)絡的輸入神經(jīng)元。兩種距離各自的計算方法,如式(3)所示。

2)合 作
競爭僅是確立了最佳的輸入神經(jīng)元,但一個網(wǎng)絡僅依靠一個神經(jīng)元是不具備較強的分類性能。因此,自組織神經(jīng)網(wǎng)絡還會在最佳神經(jīng)元的鄰域內(nèi)選擇合作神經(jīng)元。該鄰域以最佳神經(jīng)元為圓心,以距離hj,i為半徑,該鄰域的確定依托于兩個條件:
1)當鄰域內(nèi)的神經(jīng)元到最佳神經(jīng)元的距離di,j=0 時,hj,i最大;
2)hj,i是關于di,j的單調(diào)遞減函數(shù)。
根據(jù)上述的兩個條件,該文選擇的di,j與hj,i關系函數(shù)為Guass 函數(shù),如式(4)所示。

通過引入式(3),使得hj,i只受合作神經(jīng)元與最佳神經(jīng)元距離影響,剔除了最佳神經(jīng)元坐標變換引起的抖動。對于二維的神經(jīng)元網(wǎng)格,其di,j的計算方法如式(5)所示。

在自組織神經(jīng)網(wǎng)絡訓練的過程中,為了保證訓練的效果,可以將式(4)中ξ設置為關于訓練時間的變量,如式(6)所示。

其中,n=0,1,2…。根據(jù)式(6),hj,i的最終形式可寫為式(7)。

3)自適應
自適應過程是指在訓練過程中,網(wǎng)絡連接權值隨誤差反向傳播而更新,隨著網(wǎng)絡自適應進程的推進,自組織網(wǎng)絡逐漸達到理想的輸出。在每一次迭代中,權值的變化定義如下:

其中,η是網(wǎng)絡的學習率;g(yj)是一個線性函數(shù),如式(9)所示。

將yi寫成(yj)=hj,i(x)。此時,Δwj如式(10)所示。

最終可以得到n到n+1 時刻權值wj(n+1)的變化公式,如式(11)所示。

基于以上分析,將自組織神經(jīng)網(wǎng)絡與科技成果轉(zhuǎn)移預測的系統(tǒng)模型相結合,設計基于感應學習網(wǎng)絡的科技成果轉(zhuǎn)移預測模型的方法流程,如圖4所示。
該文選取的數(shù)據(jù)是某科技集團的30 個科技項目。在數(shù)據(jù)的預處理上,按照圖1 的數(shù)據(jù)模型進行整理,并將數(shù)據(jù)進行歸一化。在數(shù)據(jù)集的劃分上,選取其中20 組作為模型的訓練數(shù)據(jù)、10 組作為測試數(shù)據(jù)。模型的參考函數(shù)選擇K-G 多項式,其形式如下:

圖4 算法流程圖

式(10)中,共包含5 個初始模型,初始模型的集合為式(13)。

隨后,根據(jù)圖4 將輸入向量交叉并獲得神經(jīng)元,每個神經(jīng)元均有一個函數(shù)序列,如式(14)所示。

在此過程中,神經(jīng)元的復雜性從y=A0開始遞增,每一次遞增的過程中,通過最小二乘法確定神經(jīng)元的系數(shù),判定標準為PESS,如式(15)所示。
根據(jù)圖1 中的科技成果轉(zhuǎn)移數(shù)據(jù)流程,共包含了H1、H2、H3、H4 4 個子系統(tǒng)。每個子系統(tǒng)均可用一個自組織網(wǎng)絡進行描述,通過圖4 的流程,可以得到4 個訓練好的自組織網(wǎng)絡。以H1 技術研發(fā)子系統(tǒng)為例,得到的網(wǎng)絡模型如圖5 所示。

圖5 H1網(wǎng)絡參數(shù)結構
圖5 所示技術研發(fā)子系統(tǒng)的網(wǎng)絡參數(shù),如表1所示。

表1 模型參數(shù)
使用得到的自組織網(wǎng)絡與剩余的5 組測試數(shù)據(jù)進行網(wǎng)絡性能的測試,為了更直觀地評估模型性能,使用回歸分析模型進行對比。表2 中給出了這5 個科技項目的實際社會收益、在回歸分析法下及感應學習模型下的預測收益;表3 給出了兩個模型的相對誤差。

表2 科技項目轉(zhuǎn)移效益預測結果 單位:億元

表3 算法誤差統(tǒng)計
可以看出,該文提出的算法在該組數(shù)據(jù)下的平均相對誤差為2.23%,相較于回歸分析法的4.24%提升了約2%,誤差的最大值為3.12%,而回歸分析法的最大誤差為5.71%。文中算法的誤差在平均值附近波動較小,在針對某一項目進行預測時,更接近其真實值。但值得注意的是,回歸分析法的預測結果大多小于實際的社會效益,數(shù)據(jù)具有較好的一致性。使用回歸分析法進行預測時,只要將其預測值進行一定量的增加,即可接近實際的科技項目轉(zhuǎn)移獲得的社會收益。
該文對于科技成果的轉(zhuǎn)移過程進行了抽象化的數(shù)學建模,該模型可以準確地描述轉(zhuǎn)移過程中復雜的數(shù)據(jù)流向。該文模型的提出,方便了計算機智能化算法在科技成果轉(zhuǎn)移領域的應用。在未來,科學地分析科技成果的轉(zhuǎn)移效率對于科技項目立項、研發(fā)經(jīng)費投入均具有重要的指導意義。