999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進的ReliefF-BPNN分類模型

2023-06-15 17:00:48李雨沛王新利
計算機時代 2023年6期
關鍵詞:分類

李雨沛 王新利

摘? 要: 提出了一種改進的ReliefF-BPNN分類模型。該模型使用ReliefF算法和交互增益權重,來最大程度地保留相關特征與交互特征;同時在BP神經網絡模型的誤差函數中加入正則化項防止過擬合。實驗表明,改進的ReliefF-BPNN在大多數數據集上的分類準確率高于90%,其精度相對于其他傳統模型更高。

關鍵詞: 特征選擇; ReliefF算法; 交互增益; BP神經網絡;分類

中圖分類號:TP181? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2023)06-20-05

Improved ReliefF-BPNN classification model

Li Yupei, Wang Xinli

(College of Science, University of Shanghai for Science and Technology, Shanghai 200093, China)

Abstract: In this paper, an improved ReliefF-BPNN classification model is proposed. It uses the ReliefF algorithm and interaction gain weights to maximize the retention of correlation and interaction features. Meanwhile, a regularization term is added to the error function of BP neural network model to prevent overfitting. Experiments show that the classification accuracy of the improved ReliefF-BPNN is higher than 90% on most data sets, and its accuracy is higher than that of other traditional models.

Key words: feature selection; ReliefF algorithm; interaction gain; BP neural network; classification

0 引言

近年來,各種數據的爆發式增長,影響了數據的準確分類。面對高維的數據,特征選擇是一個行之有效的方法。

特征選擇有三種常用的方法,分別是包裹法、嵌入法、過濾法[1]。其中,過濾法評價準則簡單、運算效率高,應用范圍廣[2]。ReliefF算法作為過濾法的一種,具有權重計算更簡單且運行效率更高的優點,被廣泛應用于特征選擇[3]。另一方面,BP神經網絡模型有諸多優點,如強自適應性,魯棒性、非線性映射等,是一種使用面很廣的分類模型,但是當模型的訓練數據過少或數據存在噪聲時會使分類模型產生過擬合現象[4]。許多研究者對BP神經網絡的參數做出優化來避免這一現象[5],例如將模擬退火算法和元啟發式算法混合調整參數[6]、將自適應遺傳算法應用于優化參數[7]等,但是應用不同的算法對BP神經網絡進行優化往往計算復雜度高,實驗難度大。

盡管ReliefF算法計算特征權重是根據特征在同類中的差異和特征在不同類中的差異來選擇特征,合理考慮了特征與不同類別的相關性,但特征之間與類別還有一個不可忽視的關系,即特征的交互。一般來說,交互特征單獨與類別無關,一旦將它們組合在一起,卻又與類別很相關。保留交互特征是有利于分類的,而ReliefF算法忽視特征之間的交互,極大地影響特征選擇的效果,進而影響分類。利用信息度量標準的互信息方法能夠有效地度量特征之間的交互,許多特征選擇算法是使用基于互信息的方法來度量特征的交互,最大程度地保留交互特征來優化特征選擇的效果,進而提高分類準確率[8]。

本文在上述研究的基礎上,提出了一種改進的ReliefF-BP神經網絡分類模型。用ReliefF算法進行選擇,選擇出與類別相關大的特征,再使用標準化的交互增益權重,盡可能保留交互特征;然后采用加入[L1]正則化項的BP神經網絡模型。與其他改進相比,該模型不僅結構簡單,還能有效防止過擬合,提高分類的精度。與其他6種算法進行對比試驗,結果表明,該模型的性能明顯優于其他算法。

1 預備知識

1.1 ReliefF算法

ReliefF算法[9]的主要思想是,根據計算樣本點的最近鄰分布,計算特征權重值,選擇出權重值較大的特征。從訓練集[M]中隨機選擇樣本[A],再從和樣本[A]同類的樣本集中找到[k]個近鄰樣本,同時在每個與[A]不同類別的樣本集中尋找[k]個近鄰樣本,然后根據以下規則更新權重:

[ωX=ωX-j=1kdiffX,Ai,Hjnk]

[+C≠ClassAPC1-PClassAi×j=1kdiffX,Ai,Mjnk] ⑴

其中,[ωX]表示特征[X]的權重,其初始值為0,[n]表示迭代次數;[Ai]表示第[i]次迭代隨機選擇樣本;[k]表示選取的近鄰個數;[Hj]表示樣本[Ai]同類中的最近鄰樣本;[Mj]表示樣本[Ai]不同類中的最近鄰樣本;[ClassAi]表示樣本[Ai]所在的類別;[PC]表示第[C]類的先驗概率;[diff(X,A1,A2)]表示樣本[A1]和樣本[A2]在特征X上的差別。

1.2 特征的交互

交互信息利用互信息來度量特征之間的交互,交互信息又稱為交互增益(Interaction Gain, IG),指的是三方或者多方的交互作用,三方交互增益[10]的定義如下:

[IGfi;fj;C=Ifi,fj;C-Ifi;C-Ifj;C]? ⑵

其中,[Ifi,fj;C]表示特征[fi]和[fj]與類別C的聯合互信息。當[IGfi;fj;C<0]或者[IGfi;fj;C=0]時,說明特征[fi]和[fj]提供了相似信息或者與類別無關;當[IGfi;fj;C>0]時,表示特征[fi]和[fj]組合提供的信息量大于特征[fi]和[fj]分別提供的信息量之和,說明特征[fi]與[fj]具有交互性。

1.3 BP神經網絡模型

BP神經網絡模型[11]的拓撲結構有三個層次,分別是輸入層、隱藏層和輸出層。輸入層的節點由輸入樣本的特征個數決定,輸出層的節點由分類結果決定。隱藏層的層數和節點一般由人工決定。BP神經網絡模型結構如圖1所示。

圖1? BP神經網絡拓撲圖

其中,[x1,x2,…,xn]表示輸入層神經元節點,即樣本的特征;[y1,y2,…,ym]表示輸出層神經元節點,即輸出的標簽;[b11,b12,…,b1k]表示第一層隱藏層的節點;[bn1,bn2,…,bnk]表示第n層隱藏層的節點;[γ]表示輸入層節點到隱藏層節點的權值;[ω]表示隱藏層節點到輸出層節點的權值。

2 改進的ReliefF-BPNN分類模型

2.1 基于特征交互的ReliefF算法

在⑵式的基礎上引入標準化的交互增益來度量特征的交互。標準化的交互增益(Standardized Interaction Gain, SIG)定義如下:

[SIGfi;fj;C=IGfi;fj;CHfi+Hfj,SIGfi;fj;C∈0,1]? ⑶

在式⑴基礎上,加入標準化后的交互增益權重,即為特征[Xi]的總權重公式為:

[ωXi=1Nj=1NSIGXi;Xj;C+ωXi]? ⑷

將式⑷作為權重更新的算法稱為基于特征交互的ReliefF算法,即I-ReliefF算法,其步驟如算法1所示:

[算法1 I-ReliefF算法 輸入:特征集[F=f1,f2,…,fn],類別集[C=C1,C2,…Cm],閾值[k]

輸出:特征子集S

1. 初始化特征子集[S=?];

2. Fori=0 to |F|

3. 根據公式⑶計算在所有F中特征之間的標準化交互增益權重

4. 根據公式⑴計算在所有F中特征的權重值

5. Endfor

6. For i=0 to |F|

7. 根據公式⑷計算保留特征的總權重值

8. Endfor

9. 對特征集S中保留的特征的總權重值進行降序排列,選擇出系數值大的特征組成新的樣本數據集 ]

2.2 加入正則化項的BP神經網絡模型

在BP神經網絡的誤差函數計算公式中加入正則化項,改進后的誤差函數為:

[E=1Ni=1NYi∧-Yi2+αω1]? ⑸

N表示訓練樣本的個數;[Yi∧]表示第i個樣本的預測輸出值;[Yi]表示第i個樣本的實際輸出值;[α]表示正則化系數;[ω]表示所有層向下層神經元傳遞時的權值組成的矩陣。

2.3 I-ReliefF-BPNN模型的建立

基于改進ReliefF-BP神經網絡模型將簡化后的數據分為70%訓練樣本和30%測試樣本,訓練樣本應用于訓練該模型,測試樣本用于檢驗模型的分類精度。算法2描述了I-ReliefF-BPNN模型的基本步驟:

[算法2 I-ReliefF-BPNN模型算法 輸入:數據集D,學習率[η]

輸出:類別C,誤差e

1.采用均值替代法對存在缺失值的數據集進行填補,接著做歸一化處理。再對數據集使用I-ReliefF算法進行特征選擇,將選擇出的特征組成新的樣本數據集。

2.創建網絡

3.訓練網絡

Repeat for D

正向傳播

反向傳播

Until for 達到結束條件

4.使用網絡

5.預測數據歸一化 ]

3 實驗

3.1 數據集與數據集的處理

實驗數據集:美國加州大學歐文分校提供的UCI數據庫分別是[D1](WDBC數據集)、[D2](LungCancer數據集)、[D3](HeartDisease數據集)、[D4](Cervicalcancer數據集)、[D5](Lymphography數據集)、[D6](DivorcePredictors數據集)、[D7](Sonar數據集)、[D8](Arrhythmia 數據集)、[D9](Bonemarrowtransplant:children數據集)、[D10](Dermatology數據集)、[D11](Hepatitis數據集)、[D12](HorseColic數據集)、[D13](PrimaryTumor數據集)、[D14](RiskFactorprediction of Chronic Kidney Disease數據集)、[D15](Hill-valley數據集)、[D16] (Madelon數據集)。表1介紹了16個數據集的樣本個數、特征數和類別個數。

本文采用均值替代法對存在特征值缺失的數據集進行填補并做歸一化處理;對于連續數據集,將連續數據集離散化。本文使用K-means算法進行聚類,k值根據類別個數確定,根據聚類的結果,將同一簇的記錄并合并成一組中。

3.2 實驗結果與分析

為了驗證本文提出的模型的有效性,選取RF、SVM、BPNN、I-ReliefF-SVM、mRMR-BPNN、ReliefF-BPNN這6個分類模型與本文提出的I-ReliefF-BPNN模型進行對比。本實驗中BP神經網絡的迭代次數設置為1000,學習率設置為0.02,權值的初始化范圍為-0.5到0.5之間。表2和表3表示16個數據集的分類準確率、[F1]指數。分類準確率和[F1]指數越高,分類效果越好。

如表2所示,本文提出的I-ReliefF-BPNN模型相較于6種分類模型的平均分類準確率在16組數據集上有明顯提高。注意到BPNN的分類準確率相較于SVM和RF分別平均高6.25%、4.24%,表明BPNN相較于傳統分類器分類精度更高;I-ReliefF-BPNN與mRMR-BPNN、ReliefF-BPNN相比,準確率分別平均高5.83%和3.48%,表明本文提出的I-ReliefF算法相比于其他特征選擇算法,更有利于BP神經網絡的分類。

如表3所示,本文提出的I-ReliefF-BPNN模型在16組數據集上[F1]指數較BPNN平均高0.0544,較ReliefF-BPNN平均高0.0673,較mRMR-BPNN平均高0.0911,較I-ReliefF-SVM平均高0.1078,較SVM平均高0.1206,較RF平均高0.1128,說明本文提出的模型在分類上更具優勢。

4 結論與展望

本文提出了一種改進的ReliefF-BP神經網絡模型,即I-ReliefF-BPNN模型。考慮到醫療診斷數據集中,許多診斷指標之間存在交互,選取關于醫療診斷方面的數據集進行實驗驗證。從16組數據集的實驗結果來看,該模型中的I-ReliefF算法與傳統的特征選擇方法相比,從后續的分類中可看出此算法有效提高了分類的準確率;模型中改進的BP神經網絡分類模型與其他同類型的分類方法相比,分類精度明顯提高,兩者結合其分類能力相比于其他分類模型在分類準確率,[F1]指數更高。

但是,I-ReliefF-BPNN模型存在一些不足之處,主要有以下兩點:①I-ReliefF-BPNN模型運行時間相較于BP神經網絡模型更長;②本文提出的模型在某些不平衡數據集上[F1]指數不高,分類效果并不理想。因此,未來仍需進一步優化搜索算法,縮短整個算法的運行時間;針對不平衡數據集,考慮將不平衡數據處理方法加入本模型中,提高不平衡數據集上的分類效果。

參考文獻(References):

[1] Dia S, Guilermo, Cortes L, et al. A review of algorithms to

computing irreducible testors applied to feature selection[J]. Artificial Intelligence Review,2022

[2] 李郅琴,杜建強,聶斌,等.特征選擇方法綜述[J].計算機工程

與應用,2019,55(24):10-19

[3] Song Y ,Si W Y, Dai F F , et al .Weighted reliefF with

threshold constraints of feature selection forimbalanced data classification[J]. Concurrency and computation: practice and experience,2020,32(14)

[4] 沈波,謝兆勛,林少輝,等.醫藥衛生領域人工神經網絡研究中

文文獻可視化分析[J].海峽預防醫學雜志,2021,27(5):73-76

[5] Sofian K, MOHAMAD A, AZMI A , et al. Backpropagation

neural network optimization and software defect estimation modelling using a hybrid Salp Swarm optimizer-based Simulated Annealing Algorithm[J]. Knowledge-Based Systems,2022,244

[6] Zhang J X,Qu S R. Optimization of backpropagation

neural network under the adaptive genetic algorithm[J]. COMPLEXITY,2021

[7] Yan C R, Chen Y Z,Wan Y Q, et al. Modeling low- and

high-order feature interactions with FM and self-attention network[J]. Applied Intelligence,2020,51

[8] Chen T,Yin H Z,Zhang X L, et al.Meng. Quaternion

factorization machines: alightweight solution to intricate feature interaction modeling[J]. IEEE transactions on neural networks and learning systems,2021

[9] Fan H Y, Xue? L Y, Song Y, et al.A repetitive feature

selection method based on improved ReliefF for missing data[J]. Applied Intelligence,2022,52(14)

[10] Wang L X, Jiang S Y.A feature selection method via

analysis of relevance, redundancy,and interaction,Expert systems with applications,volume 183,2021,115365

[11] 王麗,陳基漓,謝曉蘭,等.基于混沌天牛群算法優化的神經

網絡分類模型[J].科學技術與工程,2022,22(12):4854-4863

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 日韩精品一区二区三区大桥未久| 亚洲美女一区二区三区| 天天操精品| 国产中文在线亚洲精品官网| 久久久久久久久18禁秘| 亚洲一区毛片| 亚洲国产中文欧美在线人成大黄瓜 | 五月激情婷婷综合| 自偷自拍三级全三级视频 | 欧美久久网| 欧美午夜在线视频| 亚洲欧洲天堂色AV| 国产中文一区二区苍井空| 日韩av电影一区二区三区四区| 日韩AV无码一区| 丁香综合在线| 国产激情在线视频| 亚洲无线观看| 国产白浆一区二区三区视频在线| 亚洲黄色高清| 国产精品亚欧美一区二区| 亚洲欧洲日本在线| 亚洲精品无码在线播放网站| 国产菊爆视频在线观看| 99久久精品国产精品亚洲| 亚洲丝袜中文字幕| 人人看人人鲁狠狠高清| 狼友av永久网站免费观看| 亚洲Aⅴ无码专区在线观看q| 免费 国产 无码久久久| 国内熟女少妇一线天| 成人国产精品网站在线看| 亚洲人成亚洲精品| 亚洲日本中文字幕天堂网| 黑人巨大精品欧美一区二区区| 亚洲人人视频| 一级福利视频| 亚洲欧美在线看片AI| 国产亚洲精品97AA片在线播放| 欧美日韩亚洲国产主播第一区| 中文字幕人成人乱码亚洲电影| 欧美一区二区三区香蕉视| 亚洲av无码牛牛影视在线二区| 欧美伦理一区| 人妻精品久久无码区| 国产系列在线| 久久免费视频播放| 国产最新无码专区在线| 婷婷成人综合| 日韩二区三区无| 精品国产自| 国产农村妇女精品一二区| 免费毛片a| 日韩中文欧美| 色综合天天娱乐综合网| 亚洲精品成人福利在线电影| 国产菊爆视频在线观看| 亚洲欧美日韩中文字幕在线| 欧美成人精品一级在线观看| 久久久久免费精品国产| 亚洲综合色区在线播放2019| 国产黄色片在线看| 国产精品嫩草影院av| 欧美a在线看| 99久久亚洲综合精品TS| 一本大道东京热无码av | 国产毛片久久国产| 成人日韩视频| 综合五月天网| 2021国产精品自拍| 91网址在线播放| 欧美日韩资源| 国产原创第一页在线观看| 亚洲综合九九| 日韩毛片在线视频| 久久这里只有精品66| 色综合激情网| 亚洲人成网站色7777| 91精品国产自产在线老师啪l| 国产精品亚洲αv天堂无码| 亚洲一区免费看| 中文无码精品A∨在线观看不卡 |