999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多層次降維的頭頸癌圖像特征選擇方法*

2020-04-15 09:45:42程天藝王亞剛潘曉英
計算機與生活 2020年4期
關鍵詞:分類特征

程天藝,王亞剛,龍 旭,潘曉英

1.西安郵電大學 計算機學院,西安 710121

2.陜西省網絡數據分析與智能處理重點實驗室,西安 710121

1 引言

癌癥作為世界常見病種之一具有極高的致死率,其中頭頸癌(head and neck cancer,HNC)因其原發部位和病理類型之多,居全身腫瘤之首。同時,由于頭頸部包括人體的多數重要器官組織,解剖關系復雜,對于此類癌癥的治療也就尤為困難。因此,對患者進行精準的生存期預測是當前癌癥問題的關鍵[1]。

目前常見的生存期預測多從基因組學數據入手[1-4]。然而,除此之外,病理圖像、臨床信息等其他癌癥數據也與頭頸癌的生存期預測關系密切。大量的研究表明,病理圖像中包含豐富的癌癥生存期預測相關信息,可以直接反映癌癥的類型、區別腫瘤的良惡性以及腫瘤的組織病理分級等,這些信息均與頭頸癌預后,尤其是生存期的狀態有著直接聯系[5],在癌癥的生存期預測中扮演著十分重要的角色[6-7]。目前己有一些基于病理圖像的癌癥生存期預測工作成功提出。Wang 等人提取出166 個病理圖像形態學特征并用于非小細胞肺癌的分類和生存期預測[6]。其后,Yu 等人進一步采用CenProfiler[8]工具從2 186張肺癌患病理圖像中提取出包含更全面圖像信息的9 879 維特征[7]。然而,采用現有工具提取出的圖像特征,存在數據維度較高而樣本數相對于特征而言較少的鮮明特點。這些數據中常包含不相關或冗余特征[9],對現存機器學習算法處理小樣本高維數據的效果造成影響,通過特征選擇來降低數據維數是解決該問題的一種有效途徑。

特征選擇作為一種常用的降維方法可分為兩類[10]:基于相關性的過濾式特征選擇和基于搜索的啟發式特征選擇。基于相關性的過濾式特征選擇通過樣本的統計屬性來評價特征子集對于分類目標所起的作用,由此選擇出最優特征子集。它不將任何分類器納入到評估標準,相對于后續分類算法具有極強獨立性,可避免高維數據所造成的較高的分類算法運行成本。但同時,這種統計方法不能保留特征間關聯性對分類結果的影響。此類型下常見的特征選擇算法包括Relief[11]、MRMR(minimum-redundancy maximum-relevancy)[12]、Mitra 基于特征相似性進行的特征選擇[13]、CFS(completely fair schedule)[14]和FCBF(fast correlation-based filter)[15]等。

另一類是基于搜索的特征選擇,這類算法中常采用啟發式搜索方式來尋找最優特征子集[16],這種方式選出的特征子集保障了特征對分類目標的共同影響。然而基于搜索的特征選擇受搜索空間的影響,在高維問題上表現較差。近年來,由于進化算法優秀的全局搜索能力及通用性,眾多研究者將目標放在了通過改進各類進化算法來進行特征空間的搜索上。Zhang 等人[17]將骨干粒子群算法結合最近鄰算法應用于特征選擇。Vieira 等人[18]用決策樹來進行特征選擇,采用遺傳算法來尋找使得決策樹分類錯誤率最小的一組特征子集。Xue 等人[19]在粒子群算法中引入了三種新的初始化機制、個體和全局最優更新機制,在特征數量和分類性能上均有提高。

針對頭頸癌病理圖像特征提取后產生的高維度小樣本問題,本文提出一種基于ReliefF-HEPSO 的多層次特征選擇算法。

(1)ReliefF-HEPSO 算法將過濾式特征選擇算法與啟發式搜索算法相結合,構建多層次框架。在高維環境下,由于啟發式搜索算法存在篩選精度低,效率低下的問題,引入過濾式特征選擇算法,從而縮小搜索空間,提升搜索精度,降低算法運行時間。

(2)混合二進制進化粒子群算法(hybrid binary evolutionary particle swarm optimization,HEPSO)使用進化神經策略(evolutionary neural strategies,ENS)來改進傳統的二進制粒子群算法(binary particle swarm optimization,BPSO),并將其應用在頭頸癌圖像特征上。該算法通過ENS 使得粒子突變產生新的粒子種群,豐富了粒子種群多樣性,從而使得算法能夠跳出局部最優解,提升搜索效率。

(3)HEPSO 采用決策樹(decision tree,DT)分類器的分類準確率作為算法的目標函數(即評價準則),驗證了ReliefF-HEPSO 算法在頭頸癌病理圖像特征數據上的有效性。ReliefF-HEPSO 算法以較快速度尋找到使得分類性能較高且特征個數較少的病理圖像特征子集。

2 ReliefF-HEPSO 多層次病理圖像特征選擇

本文提出融合ReliefF 和HEPSO 的多層次的病理圖像特征選擇算法——ReliefF-HEPSO。如圖1 所示,對于頭頸癌數據特征集,首先使用對應特征的平均值以補全整個樣本集,并將經過數據預處理后的數據集輸入到ReliefF-HEPSO 中;其次通過ReliefF提取數據的低維特征并將其作為HEPSO 的輸入,不斷迭代得到最優特征子集;最后將經過特征選擇的數據集劃分為測試集和訓練集,其中訓練集用來訓練決策樹分類器的相關參數,測試集則被送入固定參數的決策樹分類模型中,從而得到頭頸癌數據的分類結果。

Fig.1 Multi-level pathological image feature selection algorithm flow圖1 多層次病理圖像特征選擇算法流程

2.1 ReliefF 算法

ReliefF 算法是一種基于隨機選擇特征權重搜索的特征選擇方法[11],它根據單個特征與數據類別的相關性,給予特征不同的權重,將高于指定閾值或滿足某種判定條件的特征作為候選子集,其余特征被移除。特征的權重根據式(1)來更新。

其中,Ri是每次從訓練樣本集U中任意選擇的一個樣本,H、M(C)分別是在Ri的同類樣本集和不同類(設為C類)樣本集中分別找出的p個近鄰樣本,近鄰樣本個數p的選取由數據集的實際情況決定,p>0且小于類別樣本中的最小值,本文p∈[0,14],P(C)為C類樣本數占樣本總數的概率,M為抽樣次數。

患者的病例圖像特征同時存在連續值和離散值兩種類型,當第k個特征的屬性是連續值時,根據式(2)計算樣本Ra和樣本Rb在第k個特征上的絕對差值。

當第k個特征的屬性是離散值時,根據式(3)進行計算。

如果Xi和Hj在某個特征上的距離小于Xi和Mj(C)的距離,diff(k,Ri,Hj)<diff(k,Ri,Mj(C)),表明該特征對區分同類和不同類樣本是有益的,應當增加該特征的權重;反之,則降低該特征的權重。迭代m次,得到各特征的最佳權重。

w(k)越大,表示該特征的分類能力越強,對特征權重進行篩選,若w(k)>?,?為特征閾值,保留第k個特征作為候選特征,否則刪除該特征。重復該過程直至i個特征全部遍歷完成。

2.2 二進制粒子群算法(BPSO)

為解決離散問題的需求,Eberhart 等人[20-21]提出基于二進制編碼的離散粒子群優化算法(BPSO)。該算法通過模仿生物種群(鳥類)的覓食行為,將待優化問題的解空間對應于鳥類的飛行空間,將每只鳥抽象為一個粒子,用以表示候選解。

每個粒子被視為搜索空間中的一個搜索個體,僅具有兩個屬性:速度和位置。粒子的當前位置表示為待優化問題的一個候選解,粒子的飛行過程則是該個體的搜索過程。粒子的飛行速度根據粒子歷史最優位置和種群歷史最優位置進行動態調整。BPSO 算法不斷迭代,更新粒子的速度和位置,最終得到滿足終止條件的最優解。

針對高維度特征選擇問題,BPSO 存在兩個主要不足:第一,BPSO 中每次迭代產生的粒子,即使確定為非最優粒子也無法被剔除,仍然參與算法的迭代過程,這一行為大大增加了計算資源的浪費;第二,在BPSO 中更優的粒子在每一次迭代結束時會丟棄所有有價值的信息,并在下一次迭代開始時再次被隨機初始化,這樣的行為模式與算法在整個演變過程中始終追蹤局部最佳和全局最佳的目標相矛盾,極易使得BPSO 陷入局部極小值。

因此,本文采用進化神經策略(ENS),通過粒子突變產生新的粒子種群,豐富種群多樣性,同時丟棄失敗粒子,降低算法時間復雜度。

2.3 混合二進制進化粒子群算法(HEPSO)

2.3.1 進化神經策略(ENS)

進化神經策略(ENS)是Chellapilla 等人在數學游戲中學習的一種適當策略[22]。該策略由m個神經網絡pi(i=1,2,…,m)組成,每個網絡中均存在一個自適應參數向量σi(j),σi(j)的每個分量對應一個權重或偏置值,它們負責管理搜索神經網絡的新突變參數的步長。權重或偏置值通過在[-2,2]上的均勻分布抽樣產生。

對于每個父輩pi來說,后代可以通過式(4)、式(5)來創建。

其中,Nj(0,1)是每一個j重新采樣的標準正態分布,Nw表示權重和偏差的最大數量,并且。

2.3.2 BPSO 的改進算法HEPSO

m個粒子的種群中每個粒子i在K維空間的位置和速度都可表示為一個矢量。

位置向量Xi={Xi1,Xi2,…,Xik} 表示候選特征子集,Xik表示第i個粒子的第k個特征;

速度向量Vi={Vi1,Vi2,…,Vik}表示選擇該特征子集的概率,即粒子位置Xi分配為1 的概率。

HEPSO 算法中首先對粒子的位置向量和速度向量隨機初始化,根據式(6)、式(7)更新粒子的速度向量,根據式(8)更新位置向量。

其中,n為迭代次數;rand() 為0~1 之間的隨機數;pbestik為粒子i的個體最優值;pbestgk為粒子的種群最優值;w為慣性系數,w∈[2.1,8.0]決定了粒子先前速度對當前速度的影響程度,調節w的大小可以起到平衡粒子群算法全局搜索能力和局部搜索能力的作用[23]。

適應度函數是HEPSO 算法中評價特征子集優劣的重要指標,如式(9)所示,自定義適應度函數f(pi)為分類器的準確率。適應度函數的輸入表示具有所選特征子集的粒子(即Xi向量中標記為1 的特征),然后基于所選特征子集構建DT 分類器。適應度函數的輸出設置為分類器的分類準確率。

其中,TP(true positives)是樣本被分類器正確地劃分為正例的個數,TN(true negatives)是被正確地劃分為負例的個數,F為樣本總數。

本文將特征選擇思想引入最優化搜索算法中,利用混合二進制進化粒子群算法(HEPSO),結合BPSO 與ENS,在迭代過程中通過父輩與子代之間的突變豐富粒子種群的多樣性,同時種群個體之間的協作和信息共享也使得能夠更好地尋找最優特征集合。

Fig.2 HEPSO particle mutation network圖2 HEPSO 算法粒子突變網絡

如圖2 所示,每次迭代時,對適應度函數值進行排序,保留前一半更優適應值對應的獲勝粒子,優化的個體(或解)直接遺傳到下一代通過BPSO 繼承其全部信息,視為精英粒子。而剩下的具有最低適應度函數值的失敗粒子將被丟棄。在獲勝粒子的基礎上,根據式(4)、式(5)進行突變產生新的粒子,并與原有父輩pi中的精英粒子組合,形成下一次迭代的新種群。

粒子i在HEPSO 算法中的演化過程如圖3 所示。

Fig.3 Particle evolution process in HEPSO圖3 粒子在HEPSO 算法中的演化過程

ENS 中的突變特性是通過使粒子“飛入”新的搜索空間來幫助粒子群體多樣化從而達到豐富種群多樣性的目的,解決了BPSO 在迭代過程中產生的局部最優解問題。同時,來自BPSO 父輩突變后產生相同數量的粒子將被用來填補被丟棄后粒子的空白。這些新粒子繼承了父輩的認知特征,這將反過來增強ENS 的競爭力和多樣性。

第k+1 次粒子狀態更新結束后,對粒子個體最優值和種群最優值進行更新,局部最優pbest和全局最優gbest的更新方式如式(10)、式(11)、式(12)所示。

HEPSO 算法的步驟如下所示:

步驟1 隨機初始化HEPSO 算法的參數PID,包括粒子數m,迭代次數n,鄰域大小[-a,a],常參數c1、c2等。

步驟2 隨機選擇一組粒子并初始化粒子位置random(Xik,Vik),即隨機選擇特征向量。

步驟3 根據式(9)計算所有粒子的適應度函數f(pi)。

步驟7 根據式(6)~式(8)更新精英粒子的位置與速度,合并父輩精英粒子與突變粒子為下次迭代的子代粒子群。

步驟8 若當前迭代次數j≥n,結束迭代循環,轉步驟9;否則轉步驟3。

步驟9 輸出種群最優gbest作為問題最優解,求得最優特征集合。

2.4 ReliefF-HEPSO 多層次特征選擇算法

算法流程如圖4 所示,首先對數據集進行預處理,將處理后的數據送入ReliefF 算法中,計算每個特征權重并以此進行排序,選擇特征權重較大的特征作為候選特征子集。其次初始化HEPSO 參數,以決策樹分類器的分類準確率為適應度函數,對其降序排列。其中排序前一半的粒子作為精英粒子保留,更新當前迭代的個體極值位置和全局極值位置,而剩下粒子在精英粒子的基礎上進行突變,產生新的子代粒子群,從而參與更新全局最優。重復這個過程,直到滿足迭代終止條件,生成最優特征子集。

設ReliefF-HEPSO 的迭代次數為n,粒子數為m,其中ReliefF 算法的特征總個數為N,抽樣次數為M,選取近鄰樣本數為p,則執行ReliefF 算法的時間復雜度為O(M×max(N×p,N2))。設執行ReliefF 算法后保留特征個數為K1,HEPSO 算法的時間復雜度為。傳統BPSO 算法無需進行適應度函數的排序以及新粒子的突變,設其特征個數為K2,則時間復雜度為O(n×m×K2)。由于HEPSO算法中的K1經過ReliefF 算法做低維特征選擇,遠低于BPSO 中使用全部特征的K2,且m通常小于K1、K2,因此HEPSO 的時間復雜度小于BPSO。此時,ReliefF-HEPSO 的時間復雜度為:

Fig.4 ReliefF-HEPSO multi-level pathological image feature selection algorithm圖4 ReliefF-HEPSO 多層次病理圖像特征選擇算法

在空間復雜度方面,本文ReliefF-HEPSO 算法的HEPSO 比標準BPSO 算法在每次迭代中增加了常數量級的中間變量,如式(4)、式(5)中的σi(j)、等,以及與之相關的臨時變量的存儲,空間復雜度有所升高,但由于在迭代前使用ReliefF 算法大幅減少HEPSO 算法中作為輸入的粒子向量長度,縮小存儲空間,因此空間復雜度相比標準BPSO 算法仍有所降低。

在現代化技術支持下,建立智慧園區的總體構想,綜合考量地塊信息化差異。其一,應用系統層,主要包括園區控制云、園區管理云和園區服務云;第二,應用支撐平臺層;其三,網絡通信層;其四,智能感知層;其五,基礎設施層。

3 實驗結果

3.1 實驗數據

實驗數據采用由美國加州醫院提供的真實患者數據集,其中關于患者個人敏感信息已被剔除,使用之前對數據集進行預處理。原始數據為患者的RT 病理圖像,圖像格式為dicom 的CT 圖像,如圖5 所示。

通過Ibex 軟件[24]從患者的CT 圖像中提取出數據形狀為[59,1 387]的csv 格式文本數據。其中59 指共59 名患者作為樣本參與預測,1 387 指提取出的圖像特征共1 387 維。

每條患者數據包含形狀、圖像直方圖強度、灰度共生矩陣、鄰域強度差矩陣、灰度級游程長度矩陣和強度直方圖高斯擬合共6 種特征類別。每類中通過不同的圖像特征提取方法提取出圖像特征,例如,形狀中根據二元掩模中的相鄰體素的3D 連通性來計算ROI 凸包的體積。每種方法對應1 個屬性,共產生1 387個特征屬性。全部特征的具體描述見文獻[24]。

由于數據集為真實病例數據,其中存在部分信息缺失問題,使用整列特征的平均值來進行補全。對于部分特征屬性,為避免某些數值較小的屬性被隱藏掩蓋,提高精度,對數據進行標準化處理。

醫院原始數據給出的59 名患者的生存期(按月計算)分布如圖6 所示。根據相關醫學文獻及醫生經驗分析,將59 名患者的生存期劃分為3 類,分別用0、1、2 表示。其中,0~18 個月為第一類,用0 表示,共24 人;18~36 個月為第二類,用1 表示,共15 人;36~150 個月為第三類,用2 表示,共20 人。每類標簽占總數的比例分別為41%、25%、34%。

3.2 實驗設計

本文實驗環境為Windows10 64 位操作系統,處理器為Intel i5-8250U,2.6 GHz,安裝內存RAM 4.00 GB。軟件環境pycharm 編譯器,python3.5。

Fig.6 Label distribution of survival time圖6 生存期標簽分布

為了驗證ReliefF-HEPSO 算法在頭頸癌病理圖像特征選擇上的有效性和優越性,本文分別與未降維、特征降維方法——PCA、ReliefF 算法、混合鯨魚優化算法(whale optimization algorithm-simulate anneal,WOA-SA)[25]、二進制粒子群算法(BPSO)、混合二進制進化粒子群算法(HEPSO)、ReliefF-BPSO 進行對比實驗。

其中,WOA-SA、BPSO、HEPSO、ReliefF-BPSO和ReliefF-HEPSO 這5 種模型的最大迭代次數n取100。WOA-SA 模型其他參數根據文獻[24]設置。BPSO、HEPSO 模型參數設置:種群規模m=50,學習因子c1=c2=0.5,慣性系數w=2.5,粒子最大速度Vmax=4,最小速度Vmin=-4。ReliefF-BPSO、ReliefF-HEPSO參數設置:抽樣次數M=5,閾值?=30 293.46,近鄰樣本數p=10,其他參數與BPSO、HEPSO 模型相同。ReliefF 參數:抽樣次數M=5,閾值?=50 588.91,近鄰樣本數p=10。

3.3 結果分析

針對Ibex 軟件提取后的頭頸癌病理圖像特征數據集,實驗使用原始數據(即未降維數據)、PCA、ReliefF、WOA-SA、BPSO、HEPSO、ReliefF-BPSO 和ReliefF-HEPSO 共8 種模型,分別得到真實數據集下的最優特征集合,并使用決策樹分類模型作為分類器。

測試采用5 折交叉驗證,計算正確率(accuracy)、精度(precision)、召回率(recall)、F1 分數(F1-score)和運行時間(單位:s),并通過比較8 種模型的多項分類性能指標及其特征子集規模,說明算法在特征選擇和分類預測方面的能力。

決策樹分類模型有以下分類性能評價指標:

(1)正確率

正確率是最常見的評價指標,accuracy=(TP+TN)/(P+N)。通常來說,正確率越高,分類器越好。其中,TP指被正確地劃分為正例(P)的個數,即實際為正例且被分類器劃分為正例的實例數(樣本數);TN是被正確地劃分為負例(N)的個數,即實際為負例且被分類器劃分為負例的實例數。

(2)精度

精度是精確性的度量,表示被分為正例的示例中實際為正例的比例,precision=TP/(TP+FP) 。其中,FP(false positives)指被錯誤地劃分為正例的個數,即實際為負例但被分類器劃分為正例的實例數。

(3)召回率

召回率是覆蓋面的度量,度量有多少個正例被劃分為正例,即所有正例中被分對的比例,recall=TP/(TP+FN)=TP/P。其中,FN(false negatives)指被錯誤地劃分為負例的個數,即實際為正例但被分類器劃分為負例的實例數。

(4)F1 分數

F1 分數,也稱為綜合分類率,它被定義為精確率和召回率的調和平均數,F1=2×precision×recall/(precision+recall)。本文實驗為3 分類,因此為了綜合多個類別的分類情況,評測系統整體性能,采用宏平均F1(macro-averaging)。宏平均F1 先對每個類別單獨計算F1 值,再取這些F1 值的算術平均值作為全局指標。由于宏平均F1 平等對待每一個類別,因此它的值易受到稀有類別的影響。

由表1 可得,PCA、ReliefF、WOA-SA、BPSO、HEPSO、ReliefF-BPSO、ReliefF-HEPSO 算法選取的特征子集規模較未降維前,分別減少93%、93%、57%、48%、51%、97%和98%。且在降維比例最低98%時,ReliefF-HEPSO 算法達到最佳的分類效果83%。

Table 1 Number of features under different algorithms表1 不同算法下的特征個數

PCA 和ReliefF 算法在降維率均為93%時在數據集上分類準確率分別為67%、75%,且均比未降維前數據分類效果好。因此,在本文數據集上,使用特征選擇算法獲得的分類性能效果較好。

在相同迭代條件下,HEPSO 的分類準確率為75%,比BPSO 高出9 個百分點,同時特征的降維率也提高了3 個百分點,特征個數相比BPSO 的720 個減少至675 個。ReliefF-BPSO 在降維率為97%時取得81%的準確率,ReliefF-HEPSO 的降維率為98%時,準確率為83%,特征個數相比ReliefF-BPSO 的42 個減少了52.4%。因此,HEPSO 比傳統BPSO 在本文數據集上表現更好,以較高降維率取得較好分類性能。無論是BPSO、ReliefF-BPSO 還是HEPSO 與ReliefFHEPSO 相比,使用ReliefF 算法先進行低維特征選擇的算法均能取得更好降維率并提升分類準確率。

WOA-SA 算法是Mafarja 在2017 年提出用于特征選擇的啟發式算法,并在UCI經典數據集中有較好表現效果。相同迭代條件下,由表1 可知,WOA-SA在降維率和準確率上分別為57%、70%,雖比傳統BPSO算法的表現較好,但仍遜色于本文提出的ReliefFHEPSO 算法。

BPSO、HEPSO、ReliefF-BPSO、ReliefF-HEPSO的降維率分別為48%、51%、97%和98%時,分類準確率為66%、75%、81%、83%。隨著降維率的提高,分類準確率也隨之升高。但WOA-SA 中,降維率為57%時,分類準確率卻僅有70%。因此,降維率與分類準確率成正比的關系,僅在一定區間范圍內成立。隨著降維率的升高,分類準確率在一定時刻達到最高,其后存在降低的可能性。

從運行時間角度分析,在相同迭代次數下,BPSO、HEPSO、ReliefF-BPSO、ReliefF-HEPSO 的運行時間分別為31.79 s、22.99 s、16.63 s、10.84 s,ReliefF-BPSO 和ReliefF-HEPSO 的運行時間分別比BPSO 和HEPSO 提高15.16 s、12.15 s 且沒有降低分類性能。HEPSO、ReliefF-HEPSO 相比BPSO、ReliefFBPSO 運行時間也有所提升。由此可知,使用ReliefF算法先做低維特征選擇能大幅減少運算時間,且保持較好分類準確率。

綜上所述,ReliefF-HEPSO 算法在本文數據集上的特征選擇能力優秀,能得到更小比例的特征子集;并且在原本千維級別特征的基礎上,算法僅使用2%左右比例的特征即可達到最佳分類性能,運行時間也最短。因此,ReliefF-HEPSO 算法在較短時間內,既使得取得的特征子集規模更小,又能夠保證獲得最高分類性能,該算法很好地減小了數據規模,獲得更高分類準確率,減少算法運行時間。

Fig.7 Characteristic heatmap圖7 特征熱力圖

Table 2 Comparison of classification performance of different feature selection and dimensionality reduction algorithms表2 不同特征選擇和降維算法的分類性能對比

8 種算法在決策樹的多標簽分類器下的分類性能如表2 所示。ReliefF-HEPSO 算法在各項度量參數上較之未降維、PCA、WOA-SA、BPSO、HEPSO、ReliefFBPSO 算法均有大幅提高。ReliefF-HEPSO 在分類準確率、召回率、F1 參數上較之ReliefF 算法有所提升,只有分類精度與ReliefF 算法基本持平。ReliefFHEPSO 在分類準確率、分類精度、F1 參數上較之ReliefF-BPSO 算法均有提升,在召回率上保持近似。ReliefF-HEPSO 算法較之未進行降維前的預測準確率提高33 個百分點。由上述結果可知,經過ReliefFHEPSO 算法進行頭頸癌病理圖像特征選擇后的數據多項分類性能均得到了優化,整體表現優于其他算法。

圖7 所示為最終選取的20 維特征的heatmap圖像。

綜上所述,ReliefF-HEPSO 算法能夠有效地去除特征冗余,獲得規模更小的特征子集,并且在整體性能上優于同類算法,經其輸出的特征子集更加精簡和有效。因此,本文提出ReliefF-HEPSO 多層次特征選擇算法,并將其運用到頭頸癌病理圖像特征的選擇中是可行的。經過特征選擇后的病理圖像特征可用于設計個體化放射治療以潛在改善臨床結果。

4 結束語

本文將特征選擇方法運用于頭頸癌患者的病理圖像特征的研究中,提出了一種基于ReliefF-HEPSO的多層次特征選擇方法。該算法首先利用ReliefF算法對病理圖像的形態學特征進行快速降維,然后用特征權重較大的特征候選子集初始化粒子群,決策樹分類器(DT)的分類準確率作為特征子集的評價函數,將離散二進制粒子群算法(BPSO)與進化神經策略(ENS)相結合,通過多次迭代得到最優特征子集。實驗表明,與PCA、ReliefF、WOA-SA、BPSO、HEPSO、ReliefF-BPSO 這6 種模型比較,ReliefFHEPSO 算法更能有效剔除冗余特征,篩選出高相關性的病理圖像形態學特征,在保證83.3%的分類準確率情況下,達到98%的降維率,同時保持較快的運算速度。ReliefF-HEPSO 算法構造了過濾型與搜索型算法相結合的多層次混合模型,不僅能夠快速降低數據維度,而且能夠自動確定最優特征子集,該算法為解決小樣本高維問題提供了一種行之有效的方法。

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 欧美日韩国产在线观看一区二区三区| 国产在线98福利播放视频免费| 国产精品视频系列专区| 国产精品视频999| 久久精品一卡日本电影| 无套av在线| 91无码视频在线观看| 国产女同自拍视频| 国产成人在线小视频| 色妞永久免费视频| 免费一级α片在线观看| 精品人妻无码中字系列| 久久无码av三级| 老司机久久99久久精品播放| 白浆视频在线观看| 亚洲熟女中文字幕男人总站| 久久女人网| 日韩欧美高清视频| 毛片免费视频| 午夜国产精品视频| 国产爽爽视频| 福利视频一区| 51国产偷自视频区视频手机观看| 91香蕉国产亚洲一二三区| 妇女自拍偷自拍亚洲精品| 天天综合色天天综合网| 国产97视频在线观看| 第一区免费在线观看| 97在线免费| 一区二区自拍| 国产精品成人啪精品视频| 热久久这里是精品6免费观看| 成人在线天堂| 久久久黄色片| 国产精品大尺度尺度视频| 亚洲无码37.| 国产精品美人久久久久久AV| 99热这里只有精品免费| 亚洲系列中文字幕一区二区| 亚洲黄色激情网站| 91精品国产91欠久久久久| 日韩欧美91| 日韩av无码DVD| 国产成+人+综合+亚洲欧美| 找国产毛片看| 98精品全国免费观看视频| 国产精品蜜芽在线观看| 综合人妻久久一区二区精品| 日本成人福利视频| 亚洲另类第一页| 欧美不卡视频一区发布| 囯产av无码片毛片一级| 欧美怡红院视频一区二区三区| 亚洲一区二区在线无码| 99在线视频网站| 色哟哟精品无码网站在线播放视频| 久久精品视频一| 欧美日韩动态图| 欧美专区在线观看| 中文字幕人妻av一区二区| 97国产成人无码精品久久久| 久久综合亚洲色一区二区三区| 操国产美女| 永久免费无码日韩视频| 欧美在线视频a| 国产精品无码制服丝袜| 国产十八禁在线观看免费| 日韩高清在线观看不卡一区二区 | 国产精品2| 超薄丝袜足j国产在线视频| 亚洲综合日韩精品| 亚洲中文字幕在线观看| 免费高清自慰一区二区三区| 久久国产精品影院| 亚洲天堂成人在线观看| 欧美日韩一区二区在线播放| 亚洲精品无码在线播放网站| 97se亚洲综合在线| 国产在线98福利播放视频免费| 成人一级黄色毛片| 亚洲国产91人成在线| 亚洲欧美综合另类图片小说区|