999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于DTGA-BP組合模型的區域創新能力評價①

2020-05-22 04:46:46李晨陽劉春霞黨偉超白尚旺潘理虎
計算機系統應用 2020年5期
關鍵詞:創新能力分類模型

李晨陽,劉春霞,黨偉超,白尚旺,潘理虎,2

1(太原科技大學 計算機科學與技術學院,太原 030024)

2(中國科學院 地理科學與資源研究所,北京 100101)

區域創新能力是提升區域綜合競爭力的核心內容,其日益成為衡量一個地區國際競爭力和經濟發展實力的重要指標.黨的十九大報告把區域創新置于更加突出位置.為落實"互聯網+"理念,實現互聯網發展和區域創新能力評估的結合成為近年來研究的熱點.同時推動區域創新驅動發展,構建自主創新能力評價的計算機軟件也是大勢所趨[1–5].

目前對創新能力的評價研究方法主要包括兩大類:基于層次分析法、灰色理論法、專家打分法等傳統主觀賦值法,基于BP 神經網絡模型等機器學習算法的評價方法.Banda W 等[6]運用改進了權重賦值的AHP 層次分析法進行風險分析,彌補了傳統層次分析法在體系指標選取的不足;Chuang TY 等[7]采用模糊綜合評價法評估教育環境,特別是教育數字游戲環境下的創新;Huang ZL 等[8]運用因子分析和SPSS 軟件,綜合評價了環海地區的區域技術創新能力,并提出了一些政策建議,以提高環渤海地區的區域創新能力;Zhao SL 等[9]從創新主體的角度出發,運用層次分析法和聚類分析法對中國區域協同創新能力進行評價;楊宏進[10]運用多元統計分析方法,淘汰與評估不相關或相關性很小的指標,組成具有代表性指標;崔銘等[11]運用改進后的BP 神經網絡對專家思維進行模擬,提升了高校教師創新能力評估的效率;梅強等[12]將BP 神經網絡模型引入到高新技術企業自主創新能力評估中,并證實這一方式較傳統方式科學客觀、速度快擬合精度高.岳琪等[13]通過改進后的GA-BP 神經網絡混合模型進行高效教學質量的評價,使用熵值法優化初始權重,自適應遺傳算法優化神經網絡的參數,實驗表明該模型能高效完成教學質量評價.但是這些研究大多采用傳統主觀賦值法或單一模型評估方法,仍存在如下問題:(1)采用主觀賦值方式對各研究創新指標進行權重確定,相關結果極易受主觀因素的干擾,致使其缺少系統性合理性及客觀性.(2)使用單一神經網絡模型,出現對輸入參數的選擇沒有有效的方法、易陷入局部極小值、學習收斂速度慢等問題,得到的結果的精確性有待提高.

基于上述分析,本文采用機器學習算法,提出了DTGA-BP 組合模型對區域自主創新能力進行評估.首先利用決策樹對BP 神經網絡的輸入層節點進行特征選擇,再根據決策樹和神經網絡之間存在的對應關系確定神經網絡隱藏層節點數,進而改進BP 神經網絡的結構;最后利用遺傳算法在全局擇優方面的優勢對BP 神經網絡的初始權重進行調整.經實驗分析對比,本課題提出的組合模型適用性更好、精度更優,收斂能力更強.

1 BP 神經網絡模型

反向傳播(Back Propagation,BP)神經網絡是神經網絡算法中運用最為廣泛的分類模型之一.由于其使用范圍的不斷變大,BP 神經網絡開始顯示出一些自身不能解決的問題,例如易陷入局部極小值、學習收斂速度慢、對輸入參數的選擇沒有有效的方法等[14–16].

BP 神經網絡模型的設計主要包括輸入層、隱藏層和輸出層,其結構如圖1所示.通過梯度下降法進行學習與改正以達到均方差最小的效果,之后在訓練過程中不斷調整權值.學習過程分為如下幾步.

圖1 BP 神經網絡結構

Step 1.輸入訓練集樣本數據,根據BP 神經網絡的結構以及確定的權值和閾值,計算輸入層到輸出層各層神經元的輸出值.

Step 2.計算預測輸出值和期望輸出值的誤差,不斷調整輸入層到隱藏層的權重和隱藏層到輸出層的權重.

Step 3.重復Step 1 及Step 2,當達到規定范圍內誤差值或訓練次數結束,則學習完成.

訓練過程分如下幾步:

Step 1.初始化權重.公式如下:

其中,n為輸入層節點個數,m為隱藏層節點個數,s為學習步數,Wj(t)為學習t步后的權值矩陣;

Step 3.計算實際輸出值.公式如下:

Step 4.更新各神經元的權值.公式如下:

其中,β表示學習速率,β ∈[0,1],用來更新速度.

Step 5.重復Step 2,當達到規定范圍內誤差值或訓練次數結束,則訓練完成.

2 DTGA-BP 組合模型

DTGA-BP 組合模型即利用決策樹算法和遺傳算法優化BP 神經網絡:通過決策樹算法改進神經網絡輸入參數的選擇和結構;利用改進了選擇策略和交叉變異操作的遺傳算法來優化神經網絡的初始權值.核心思想是利用優化后的BP 神經網絡建立區域自主創新能力評估分類模型.

通過使用決策樹算法對神經網絡的結構進行改進可以降低神經網絡結構的復雜度,在不影響分類精度的情況下縮短訓練時間,操作簡單方法易實現.并且結合優化后的遺傳算法,克服了傳統BP 神經網絡容易陷入局部最優等缺點,使得初始權重更加合理.DTGABP 算法流程如圖2所示.

圖2 DTGA-BP 算法流程圖

2.1 基于決策樹改進BP 神經網絡的結構

評估模型使用單隱藏層神經網絡結構,因此,對于神經網絡結構的改進主要是確定隱藏層節點數目.傳統的確定隱藏層節點數目的方法并不能有效解決BP神經網絡結構復雜的問題.受“熵網絡”[17]的啟發,本文采用生成的決策樹中最長規則鏈的非葉子節點的個數作為隱藏層節點的個數,可以降低模型復雜度減少訓練時間.

首先利用C4.5 決策樹算法生成一棵決策樹,用于判斷酒的類別,數據集使用UCI 機器學習庫上下載的wine 數據集.該數據集包含13 個特征屬性,例如Alcohol(酒精度),Malic acid(蘋果酸含量)等,其值都為連續值;然后根據屬性條件進行判斷,自根節點到葉子結點分類;通過計算信息增益值以及剪枝策略最終生成的決策樹如圖3所示.

圖3 C4.5 算法構造的決策樹

由圖3可知,決策樹的葉子結點個數為5,最長規則鏈中的非葉子節點個數為3,由此,按照輸入層節點個數,隱藏層節點個數,輸出層節點個數的結構構造的BP 神經網絡分別為3-5-1 和3-3-1.初始權重統一采用標準正太分布公式確定.訓練后再隨機產生200 組測試集,進行了5 次試驗,結果如表1所示.其中,節點數=3 為本文采用的確定隱藏層節點數目的方法,節點數=5 是通過“熵網絡”所確定的隱藏層節點數目.從分類結果可以看出,本文采用的確定隱藏層節點的個數的方法相比傳統的“熵網絡”方法,能夠在加快收斂速度的同時降低誤差.

表1 不同隱藏層節點個數的分類結果

2.2 基于遺傳算法確定BP 神經網絡的初始權重

一般利用遺傳算法(Genetic Algorithm,GA)全局搜索的特點來解決BP 神經網絡由于初始權值調整不當而產生的局部尋優的問題.但傳統的遺傳算法在優化方面仍然存在搜索效率低、速度慢等問題.因此本文采用改進了選擇算子和交叉、變異操作的遺傳算法確定神經網絡的初始權重.改進后的遺傳算法流程圖如圖4所示.

圖4 改進后的遺傳算法流程圖

2.2.1 優化選擇算子

遺傳操作中,選擇策略多種多樣.采用恰當的選擇策略可以提升整個遺傳算法的性能.因此選擇算子既要防止種群"早熟"導致的局部最優,還不能過于發散難以收斂,需要進行平衡,基于此本文采用改進后的選擇算子方式.

首先根據適應度函數計算每個個體適應度值,通過排序后只保留前2/3 個體,淘汰適應度值小的后1/3 個體,然后再將保留下的個體數的前1/3 種群數作為父本,最終只對中間的1/3 個體進行遺傳操作,計算這些種群個體的選擇概率,公式如下:

其中,p為個體選擇概率,q為最優選擇概率,N為種群個數,k為個體的序列號,k=1,2,3,···,N/2,T為當前迭代次數.這樣既保留了優良父本基因又將適應度低的個體淘汰掉,達到了平衡種群個體的目的,最終可以得到全局最優解.在進化初期,種群間個體差異度大,相應的得到的q值也大,只有這樣才能保證適應度大的個體被選擇到的概率大,從而為種群選擇到優良個體.但隨著種群不斷進化,種群數量不斷變少,個體間的差異也逐漸減小,此時得到的q值也應該減小.基于此分析,按照式(5)計算q值:

其中,qmax表示最優個體選擇概率,qmin為最壞個體選擇概率,M為迭代總次數.

按照這種方式進行選擇算子操作,既將適合度最高的個體留存到下一代種群,最優個體不會被遺傳操作淘汰,保證全局收斂;也將每次記錄下的最壞個體適應度值進行比較,把適應度更低的留下后加入到新種群中.通過將最優保存策略和最壞保存策略相結合,可以降低選擇誤差,保持種群的多樣性,有益于得到最優解.

2.2.2 改進交叉、變異操作

傳統的自適應類遺傳算法,其交叉與變異的隨機機率會更大,會干擾遺傳算法中某個體的質量,從而使得遺傳算法陷進局部最優.并且當交叉與變異的個體適應水平達到最高值時,其交叉與變異概率可能性就不會存在,種群個體將處在完全停滯的狀態.針對此問題,本文采用改進后的的交叉率Pc和 變異率Pm進行遺傳操作,公式如下:

fa表示個體平均適應度,fm表示個體最大適應度.其中 a rcsin(fa/fm)是 隨著fa的變化而快速變化的,因此,選用 arcsin(fa/fm)作為判斷條件能很好的判斷種群適應度間的分散程度.又因為 sin(π/6)=1/2,當arcsin(fa/fm)≥π/6時fa/fm≥1/2表 明此時fa接 近fm.最后再根據 π/12≤arcsin(fa/fm)≤π/3這一條件確定是否先進行交叉操作,若不符合條件則先進行變異操作.本文采用的方式解決了傳統遺傳變異操作總是先進行交叉后進行變異導致的產生優良個體速度慢,甚至會破壞優良個體等問題.

3 實驗分析

3.1 數據來源描述

實驗數據來源《中國城市創新報告》、《中國區域創新能力評價報告》和《中國區域創新監測報告》.采用2011–2018年共8年全國各城市的區域創新指標數據,每個樣本數據包含42 個屬性.實驗數據整理在Excel 表中,部分實驗數據如圖5所示.

圖5 實驗數據截圖

將樣本數據中的4/5 作為訓練數據,1/5 作為測試集.通過計算各個屬性的信息增益值,排序之后,選擇了與分類結果相關度大的前20 個屬性作為最優特征組合,組成神經網絡的輸入參量.同時用Matlab 中的歸一化函數mapminmax,將輸入層與輸出層信息歸一化到[–1,1]之間,訓練之后對數據進行反歸一化處理.采用Matlab2011 來對代碼進行編寫,執行代碼的主機處理器型號是IntelPentiumDualE2220,主頻值是2.4 GHz,內存大小是1 GB.

3.2 實驗結果對比分析

3.2.1 特征選擇方法對比

生成決策樹的過程中,剪枝技術是為了有效避免噪聲數據的干擾、提高分類精度的一種關鍵技術,而且不同程度的剪枝會得到不同結果的分類精度.根據實驗發現在修剪程度為86 時達到最高,之后下降.因此將剪枝程度控制在85–90 之間.具體情況如表2所示.依照表2,在生成最優決策樹時選擇86 作為剪枝度值,然后計算各屬性的信息增益率值進行排序,取前20 個屬性作為最優特征組合,結果如圖6所示.

表2 不同程度剪枝的分類正確率(%)

圖6 特征屬性信息增益率排序

依照圖6內容所得的實驗結論,將前20 個屬性作為BP 神經網絡的輸入參數,與未經過特征選擇的BP 神經網絡模型進行對比,具體見圖7所示.通過決策樹分類算法進行特征選擇后,可以增加BP 神經網絡模型的分類精度,這說明本文通過特征選擇方式能有效降低噪聲數據的影響,提高分類的穩定性.

圖7 均方差對比圖

3.2.2 單一模型與組合模型的對比

實驗按照如下參數建立訓練模型:輸入層神經元數目為相關度大的前20 個最優特征屬性;隱藏層的神經元數目通過決策樹優化后為12 個;輸出層的神經元數目為1 個;種群規模為100,進化次數為200 次,個體交叉率和基因變異率分別60%和2%.為突出本文提出的DTGA-BP 組合模型的優越性,分別從誤差、收斂速度、分類精度幾方面與GA-BP,BP 分類模型做比對.

BP,GA-BP 和DTGA-BP 3 個模型的誤差隨迭代次數變化的曲線如圖8所示.

圖8 3 種模型的誤差隨訓練次數的變化情況

由圖8可知BP 模型和GA-BP 模型在迭代次數大約為150 次時開始逐漸收斂,但GA-BP 模型的誤差低于BP 模型.而DTGA-BP 模型在迭代100 次后趨于穩定,且收斂后的誤差要低于GA-BP 模型,GA-BP 模型要達到與DTGA-BP 模型相同的誤差需要更多的訓練次數.尤其與BP 模型相比,優化后的DTGA-BP 模型無論在訓練次數還是誤差方面都好很多.由圖8、圖9可以看出通過DTGA優化后的BP 神經網絡在收斂過程中很穩定,說明改進神經網絡結構和初始權值后的分類模型克服了易陷入局部最優的缺陷,神經網絡會逐漸接近全局最優.

圖9 3 種模型的誤差對比

3 種模型的平均評估精度結果如表3.BP 神經網絡模型的平均精度為57.18%,GA-BP 模型的平均評價精度為78.71%,而基于決策樹和遺傳算法優化的BP神經網絡模型的平均評價精度為98.22%,結合表4得到,DTGA-BP 組合模型在分類精度上相比GA-BP提高了20%,相比單一BP 模型提高了41%.由此看出DTGA-BP 組合模型的評價結果精度更高.MAE(平均絕對誤差),RMSE(均方根誤差)的計算公式如下:

表3 3 種模型平均精度對比

表4 3 種模型指標對比

4 結束語

本文圍繞區域自主創新能力評價問題展開研究,針對當特征屬性較多時,BP 神經網絡出現的結構復雜、收斂速度慢和易陷入局部最優等問題,提出一種決策樹遺傳算法優化BP 神經網絡的組合模型.首先通過對各個特征屬性計算信息增益率,排列順序后選出最優組合特征,以此降低噪聲數據對神經網絡模型的影響;其次通過生成的決策樹的最長規則鏈的非葉子結點來確定隱藏層節點數,以此優化神經網絡的結構,能夠在加快收斂速度的同時降低誤差;最后通過改進后的遺傳算法優化神經網絡的初始權重,采用最優保存策略與最壞保存策略相結合的選擇算子方式以及非線性的交叉變異概率值,保證了種群多樣性和收斂性.結果證明DTGA-BP 組合模型實現了對專家經驗的自學習,并且在訓練時間、收斂度、分類精度等方面相比傳統的人工評估以及單一模型評估方式均有優勢.

猜你喜歡
創新能力分類模型
一半模型
高中數學課堂教學中創新能力的培養
分類算一算
創新能力培養視角下的無機化學教學研究
化工管理(2021年7期)2021-05-13 00:44:44
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
推進軟件產業創新能力提升
信息化建設(2019年2期)2019-03-27 06:23:58
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 中文字幕欧美日韩| 国产清纯在线一区二区WWW| 青青青草国产| 欧美日韩成人在线观看| 久一在线视频| 伊人色综合久久天天| 91在线激情在线观看| 91成人在线免费观看| 久久a级片| 手机永久AV在线播放| 免费人成网站在线高清| 国产Av无码精品色午夜| 美女无遮挡被啪啪到高潮免费| 四虎永久在线| 亚洲天堂免费在线视频| 无码专区第一页| 欧美一级在线| 国产精品成人观看视频国产| 91最新精品视频发布页| AV无码无在线观看免费| 伊人成人在线| 国产91全国探花系列在线播放| 亚洲大尺码专区影院| 久久亚洲黄色视频| 色综合激情网| 亚洲av无码牛牛影视在线二区| 欧美一级高清片久久99| 亚洲色精品国产一区二区三区| 婷婷午夜天| 久热re国产手机在线观看| 大陆精大陆国产国语精品1024 | 午夜色综合| 亚洲AV无码乱码在线观看裸奔| 日韩精品一区二区三区swag| 97久久精品人人做人人爽| 97国产在线观看| 精品视频在线观看你懂的一区| 免费va国产在线观看| 久久情精品国产品免费| 精品日韩亚洲欧美高清a| 青青青国产精品国产精品美女| 丁香五月婷婷激情基地| 婷婷亚洲视频| 亚洲天堂网站在线| 一级毛片在线播放| 日韩欧美国产综合| 麻豆精品在线| 国内精品久久人妻无码大片高| 亚洲午夜福利在线| 91毛片网| 成人精品亚洲| 91免费在线看| aaa国产一级毛片| 另类重口100页在线播放| 国产成人资源| 免费一级无码在线网站| 少妇被粗大的猛烈进出免费视频| 亚洲一区黄色| 91亚洲精品第一| 欧美曰批视频免费播放免费| 亚洲欧洲日韩综合色天使| 欧美精品xx| 在线日韩日本国产亚洲| 久久久久国产精品免费免费不卡| 大陆精大陆国产国语精品1024| 老司机久久99久久精品播放| 国产精品亚洲αv天堂无码| 欧美精品高清| 色综合久久综合网| 国产成人久久综合777777麻豆| 呦女亚洲一区精品| 狠狠色狠狠色综合久久第一次| 9966国产精品视频| 亚洲天堂日韩av电影| 欧美日本在线一区二区三区| 久久国产精品夜色| 在线99视频| 久热中文字幕在线| 国产精品网拍在线| 国产aⅴ无码专区亚洲av综合网| 亚洲天堂色色人体| 国产正在播放|