999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進K-SMOTE隨機森林算法在地震信息發布安全風險評估中的應用研究

2025-02-11 00:00:00李亞龍何琳萬杰潘丹孫靜
地震工程學報 2025年1期
關鍵詞:信息模型

摘要:

為有效地提高地震監測、預警、災情評估等信息發布的安全性提出一種改進型K-SMOTE隨機森林(RF)方法構建地震信息安全風險評估模型。該模型通過改進K-SMOTE算法中運用混合采樣獲得均衡度高的樣本集,然后使用隨機K折交叉驗證方法進行樣本劃分與模型優化,最終實現目標安全風險等級評估。對實際地震信息發布案例進行評測,文章所提方法構建模型評估準確率為92%,模型精確率和查全率分別為0.81和0.92,模型泛化能力強,能有效用于地震信息發布安全風險評估。本研究為完善地震信息發布安全評估體系、改進地震信息發布環境、降低安全風險提供了參考。

關鍵詞:

地震信息發布; 風險等級評估; 改進K-SMOTE; 隨機森林; 隨機K折交叉驗證

中圖分類號: P319.56""""" 文獻標志碼:A"" 文章編號: 1000-0844(2025)01-0168-10

DOI:10.20000/j.1000-0844.20230517002

Application of the improved K-SMOTE random forest algorithm

to the safety risk assessment of seismic information release

LI Yalong1,2, HE Lin1, WAN Jie1, PAN Dan1, SUN Jing1

(1. Anhui Earthquake Agency, Hefei 230031, Anhui, China;

2.Anhui Mengcheng National Geophysical Observatory, Mengcheng 233527, Anhui, China)

Abstract:

The safe, timely, and effective dissemination of special information such as earthquake monitoring, early warning, disaster assessment, and emergency is crucial for maintaining social safety and stability. This paper proposed an improved K-means synthetic minority oversampling technique (K-SMOTE) combined with the random forest method to effectively assess the safety risks associated with the release of this information and address potential weak links. A seismic information safety risk assessment model was then established, using the improved K-SMOTE algorithm to generate a well-balanced sample set. Finally, the random K-fold cross-validation method is applied to divide the samples and optimize the model, enabling the assessment of risk levels for target safety. Using an actual earthquake information release case as an example, the model proposed in this paper achieves an evaluation accuracy of 92%. The precision and recall of the model are 0.81 and 0.92, respectively, showing its strong generalization capability. These results indicate that the model is highly effective for assessing the safety risks associated with earthquake information release. This research provides valuable insights for improving the seismic information safety assessment system, enhancing the environment for publishing seismic information, and reducing safety risks.

Keywords:

seismic information release; risk level assessment; improved K-SMOTE; random forest; random K-fold cross validation

0 引言

地震發生后,地震監測信息、預警信息、災情評估信息的發布會在社會層面產生重大影響[1]。保障地震監測、預警、災情評估等信息發布業務的安全穩定,確保重大地震發生時信息發布的安全可靠,是近年來地震信息安全領域研究的重點之一。為此,地震業務工作者開展了多種措施,從地震監測數據產出源頭到系統運行及業務信息發布等各個環節進行安全防控,如增加網絡安全防護策略、提升地震發布信息準確性、加強業務人員技能培訓等。但地震信息發布安全風險涉及因素較多,目前尚沒有成熟完整的方法體系用于地震信息發布安全風險評估。

針對安全風險指標體系建立、風險等級評估、風險防控,國內外學者已在不同領域開展研究并取得了較多成果。文獻[2-5]分別將故障樹分析(Fault Tree Analysis,FTA)法與層次分析(Analytic Hierarchy Process,AHP)法、三角模糊函數分析(Triangular Fuzzy Function,TFF)法等結合開展了鐵路安全風險、飛行著陸事故致險因素分析、地震預測指標體系效能評估等研究;文獻[6-8]基于貝葉斯網絡(Bayesian Network,BN)分析方法開展了城市信息安全、鋼結構工程安全、典型自然災害引起的電網跳閘事故風險等方面的安全評估;文獻[9]詳細介紹了隨機森林算法在分類預測建模中的優勢;文獻[10-12]基于隨機森林算法開展地震誘發滑坡易發性評估、地下水位長期預測、工業過程運行狀態評價的研究。上述方法在特定領域可以有效地開展預測評估,但也存在一定的局限性。其中,FTA方法可根據目標事件追溯原因事件,但無法對目標總體安全情況進行判別;AHP法可以分析評估目標的總體安全風險水平,但是在評估過程中人的主觀因素較重,而定量數據較少,比較、判斷以及結果的計算過程較粗糙;BN分析方法則適合研究復雜的不確定性問題且結構建模過程復雜;隨機森林(Random Forest,RF)法可以同時處理定量信息和定性信息且對缺失數據不敏感,但在分類預測多維不平衡數據時,分類性能準確度大幅降低。

在地震信息發布安全風險評估,不僅包含具體數值的定量指標,還包含通過語義定性描述的變量指標,且地震信息發布安全風險評估樣例存在不平衡性,導致評估等級高和較差的樣例數占比較少。本文使用FTA分析方法可以理清安全風險要素并構建地震信息發布安全風險評估指標體系,通過RF法對各指標相關性、重要度進行分析,設計出基于RF法的地震信息發布安全風險評估方法。為了提升RF算法的精度,采用K型少數合成采樣技術(K-means Synthetic Minority Oversampling Technique,K-SMOTE)算法混合采樣提高樣本集的均衡度并使用隨機K折交叉驗證方法對RF模型進行改進,以提高地震信息發布安全風險評估的準確性和有效性,評估方法流程如圖1所示。

1 地震信息發布安全風險指標體系構建

FTA是選擇目標風險事件作為頂事件,自上而下、一層層的尋找頂事件的直接原因事件和間接原因事件直到找到基本原因事件,并用邏輯圖把這些事件之間的邏輯關系表達出來,形成有向的故障樹模型(FTA模型)。FTA模型可以直觀地反映目標風險事件與中間事件及基本原因事件的關聯,從而了解目標風險產生的原因,并且找到最好的方式降低風險,為制定風險管控措施提供參考。

地震信息發布涉及地震監測、預警、災情評估、應急等多方面業務信息,影響因素較多且覆蓋面廣,任何層面的風險原因不僅與相應業務系統儀器/設備的故障有關,還與人員技術水平、管理制度流程、信息評估指標、社會層面影響有關。因此在分析頂層事件的目標風險原因過程中,應綜合考慮人員、基礎設施、外部環境等各方面因素,遍歷各個業務信息發布過程中產生的事件、事故、故障信息及日常管理中的監測信息可以作為事件分析的依據。此外,同一系統產生的同一故障,其對應的原因事件也可能存在較大區別。例如,地震監測系統無法接收地震監測儀器產生的數據,可能是地震監測儀器出現故障,也可能是網絡設備出現故障。因此,在FTA分析建模過程中需綜合考慮各個地震業務系統的特點。

分析2010—2022年地震監測、預警、災情評估、地震應急等信息發布相關的事件或事故,分別從基礎設施、信息管理、數據安全、用戶風險、政策制度等層面進行調查,逐層分析得到基本原因事件,根據各層事件因果關系,采用相應的邏輯符號進行連接,構成的故障樹分析結果如圖2所示。

在對地震信息發布安全風險源分析的基礎上,遵循系統性、規范性的原則,并邀請地震相關業務領域專家對各層指標進行評估,刪除關聯度較低的指標,補充遺漏的指標,最終構建一套包含5個一級指標、11個二級指標、36個三級指標在內的地震信息發布安全風險評估指標體系,如表1所列。

2 隨機森林算法及其改進

2.1 隨機森林算法

隨機森林指的是利用多棵樹對樣本進行訓練并預測的一種分類器[13]。該分類器最早由Leo Breiman和Adele Cutler提出,其實質是對決策樹算法的一種改進,是將多棵決策樹合并在一起,采用重采樣技術(bootstrap),從訓練集里面有放回地采集固定個數的樣本,每棵樹建立并依賴于一個獨立抽取的樣本。森林中的每棵樹具有相同的分布,分類誤差取決于每一棵樹的分類能力和它們之間的相關性,分類結果按所有決策樹投票多少形成的分數而定。RF具有極好的準確率,能夠有效地運行在大數據集上,可以在不降維的情況下處理高維特征樣本,對數據集的適應能力強,目前已用于多種問題的分類及預測[14-15]。

隨機森林的算法可以用如下幾個步驟概括:

(1) 從原始訓練樣本集N中有放回的抽樣選取n(n≤N)個樣本作為一個訓練集。

(2) 用抽樣得到的樣本集生成一棵決策樹。在生成的每一個結點,隨機不重復地在樣本M個特征中選擇m(mlt;M)個特征并利用這m個特征分別對樣本集進行劃分,找到最佳的劃分特征,m通常取小于等于log2(M)+1的最大正整數。

(3) 重復步驟(1)到步驟(2)共k次,k為隨機森林中決策樹的個數。

(4) 用訓練得到的隨機森林對測試樣本進行預測,并用票選法決定預測的結果。

步驟(2)中,使用基尼(Gini)指數來衡量特征重要性并篩選特征。假設有J個特征X1,X2,X3,…,Xj,I棵決策樹,C個類別,特征為Xj的Gini指數評分用VIM(Gini)j表示,代表某個特征在RF所有決策樹中節點分裂不純度的平均改變量。第i棵樹節點q的基尼指數計算公式為:

GI(i)q=∑|C|c=1∑c′≠cP(i)qcP(i)qc′=1-∑|C|c=1(P(i)qc)2(1)

式中:Pqc表示節點q中類別c所占的比例。

特征Xj在第i棵樹節點q的重要性,即節點q分枝前后的Gini指數變化量為:

VIM(Gini)(i)jq=GI(i)q-GI(i)l-GI(i)r (2)

式中:GI(i)l和GI(i)r分別表示分枝后兩個新節點l 和 r的Gini指數。

如果,特征Xj在決策樹i中出現的節點為集合Q,那么Xj在第i顆樹的重要性為:

VIM(Gini)(i)j=∑q∈QVIM(Gini)(i)jq (3)

VIM(Gini)j=∑Ii=1VIM(Gini)(i) (4)

歸一化處理,Xj在森林中重要性為:

VIM(Gini)j=VIM(Gini)j∑Jj′=1VIM(Gini)j′ (5)

2.2 算法改進

需要指出的是,使用隨機森林算法來處理高維不平衡數據時,主要有以下不足:(1)處理不平衡數據時,分類結果較偏向于多數類,使得算法分類精度降低;(2)隨機森林算法中采用簡單交叉驗證的方式來避免過擬合,但是這種方式只使用一次數據集且在驗證集上計算出來的最后的評估指標與原始分組有很大關系。因此,為解決特征之間的冗余及數據分布不均衡問題,提高算法的分類精度,本文提出了基于混合采樣和隨機K折交叉驗證相結合的改進隨機森林算法。首先通過改進K-SMOTE算法對高維不平衡數據集進行預處理,達到均衡原始數據集的目的,然后使用隨機K折交叉驗證對均衡后的數據集進行樣本劃分,構建新的訓練集和測試集用于模型訓練,提升算法的泛化能力。

2.2.1 改進K-SMOTE算法的混合采樣

SMOTE算法[16]主要解決樣本數據分類不平衡的問題,其基本思想是將樣本按目標標簽進行分類,并在少數類樣本中隨機插入人工合成的樣本,根據樣本的不平衡率設置各類樣本需要合成的數量,從而使各類樣本分布平衡。SMOTE算法是一種k近鄰算法,它從少數類樣本X的k個近鄰樣本中隨機選擇樣本Xi,并根據式(6)合成新的人工樣本。

Xnew=X+rand(0,1)×(Xi-X) (6)

式中:Xnew為新合成的樣本;rand(0,1)表示產生一個0到1的隨機數,經SMOTE算法混合采樣后的均衡數據集為Dnew。

針對傳統SMOTE算法隨機采樣易出現邊界模糊的問題[17],此次研究中,引入聚類算法[18]進行改進。大致實現流程如下:使用K-means方法對整個樣本空間實施聚類操作,以確定少數類中各簇的分布狀態,然后計算各個簇的聚類中心,在簇內中心與簇內樣本的連線上根據式(7)進行插值增加人工樣本數據。

Xnew=ti+rand(0,1)×(X-ti),i=1,2,…,N(7)

式中:X∈ti,Xnew為新插值的樣本;ti為簇心;X是以ti為簇心聚類中的原始樣本。

傳統SMOTE算法合成樣本的數量是根據少數類樣本與多數類樣本之間的不平衡率來確定的。本文提出的改進K-SMOTE算法將各類樣本的分類準確率作為平衡條件,在迭代采樣過程中,使用RF模型的分類準確率對過采樣數量進行動態更新。樣本的過采樣率用M表示,如下式所示:

M=Macu_minMacu_max (8)

式中:Macu_min為分類正確的少數類樣本數量,Macu_max為分類正確的多數類樣本數量。

改進K-SMOTE算法充分利用樣本的內在特性,從而使合成的少數類樣本與多數類樣本分類準確程度保持一致,也使得合成的樣本具有更高的識別率,整體混合采樣流程如下:

(1) 構建RF模型,輸入少數類樣本Smin、變量i=0,計算過采樣權重Mwei(M×Smin);

(2) 使用K-SMOTE算法生成新樣本Xnew并更新Smin;

(3) i=i+1,若ilt;Mwei,返回步驟(2),否則,輸出平衡數據集Dnew。

2.2.2 隨機K折交叉驗證改進

只對已知數據集進行訓練得到的模型對未知數據的預測表現較差,這種情況稱為“過擬合”。過擬合的出現表明模型未學習到數據中的本質規律。隨機森林算法中采用簡單交叉驗證的方式來避免過擬合。比如:將樣本按比例分為兩部分,70%的樣本用于訓練模型;30%的樣本用于模型驗證,這種方式只是一定程度提升了算法的泛化能力,為了解決簡單交叉驗證的不足,本文基于隨機K折交叉驗證方法對算法進行改進,步驟如下:

(1) 首先,采用隨機方式打亂均衡數據集為Dnew的順序,再將樣本集分為k個不同的訓練集和測試集的組合;

(2) 依次遍歷這k個樣本集,每次把測試集樣本作為驗證集,其余所有樣本作為訓練集,采用隨機森林算法進行模型的訓練和評估;

(3) 最后把k次評估指標的平均值作為最終的評估指標。

通過設置隨機數種子使每次數據拆分的樣本數相同,以保證交叉驗證的統一性。樣本集拆分及訓練流程如圖3所示。

該方法采用隨機的方式構建樣本集,每個樣本集訓練得到的模型計算獲得的結果用Ei表示,k次評估指標的平均值作為交叉驗證后的最終評估值。通過隨機K折交叉驗證可以促使模型從多方面學習樣本,避免模型陷入局部極值。

3 地震信息發布安全風險評估

3.1 樣本數據來源

地震監測、預警、災情評估、地震應急等多種地震信息發布業務系統在推廣使用前,均邀請了行業專家針對信息發布的各個環節進行評分,并給出綜合的評估結果。部分重要的行業信息發布系統按照等級保護要求,需進行定級備案并進行安全等級評估。通過收集2010—2022年地震信息業務系統的專家評分情況,按照地震信息發布安全風險評估指標體系構建樣本集。地震信息發布安全等級按綜合評估情況進行分級,分級標準如表2所列。

訓練和測試樣本共計671例,每個樣例包含12個指標(11個二級指標及評估等級),按評估等級進行標簽分類,具體樣例數量如下:

(1) 安全程度高,包含63例(9.4%);

(2) 安全程度較高,包含136例(20.3%);

(3) 安全程度合格,包含344例(51.2%);

(4) 安全程度較差,包含128例(19.1%)。

由于不同時期地震信息業務系統信息發布所涉及的安全風險評估參考指標不同,部分指標值缺失,對于缺失值超過3個的視為自動丟棄,剩余按同一類別均值進行補全,處理后的剩余樣本數量為603例。使用改進的K-SMOTE算法對處理后的樣本集進行混合采樣,構建新的數據集樣例數為1 191。其中,安全程度高292例,安全程度較高301例,安全程度合格302例,安全程度較差296例,基本達到各類樣本數據均衡。

3.2 評估指標相關性分析

構建指標集合C={C1,C2,…,Cn},n=11,Ci為地震信息發布安全風險評估指標體系中的二級指標。在RF樣本特征劃分中需要選擇相對獨立的樣本特征以避免模型的過擬合,為增加模型的適用范圍,選取地震信息發布安全風險評估指標體系中的11個二級指標進行斯皮爾曼相關系數分析,計算中對兩個指標x,y成對的取值分別按照從小到大(或者從大到小)順序編秩,x,y∈C;xj,yj表示指標樣本值經編秩后第j個值;公式如下:

rs=1-6∑nj=1(Rj-Qj)2n(n2-1) (9)

式中:Rj代表xj的秩次;Qj代表yj的秩次;Qj為xj、yj的秩次之差;n為樣本量。找到與目標值相關性最大的幾個特征,且這幾個特征之間的相關性要低,各個指標特征相關性矩陣為:

Rmn表示指標Cm與指標Cn之間的相關性系數。根據式(10)可以看出,地震信息發布評估等級與各指標分數呈負相關,系統安全、應用安全、網絡安全、內容安全、知識水平等5個指標特征對于評估等級影響較大;系統安全與知識水平、應用安全與網絡安全,兩組中的特征之間相關性明顯,在特征劃分時應避免同時使用,以免增加信息的冗余性。

3.3 模型構建

將樣本數據源中數據進行處理,按照評估指標構建樣本集,基于K-SMOTE算法混合采樣獲得均衡數據集,然后使用隨機K折交叉驗證生成k個不同的樣本集;實驗中k=5,決策樹數量ntree=100,劃分最大特征數m=5,決策樹最大深度max_depth=3,葉子節點最少樣本數min_samples_leaf=5,對每個樣本集使用改進的隨機森林算法構建獨立模型;使用構建的模型對各樣本集中的測試集進行分類預測,綜合各個模型的結果平均后得到地震信息發布安全等級。模型構建流程如圖4所示。

3.4 實驗結果分析

3.4.1 模型評價

使用分類準確率、精確率、查全率對模型進行評價,計算結果如表3所列。

將樣本按模型評估等級進行分類,精確率表示評估結果為該等級的樣本中,實際等級與評估結果一致的樣本所占比重,此模型評估精確率均值為0.81,說明模型在給定的樣本集中具有有效的分類能力;將樣本按實際等級進行分類,查全率表示實際是該等級的樣本中,評估結果與實際等級一致的樣本所占比重,樣本的查全率均在90%以上,平均查全率為0.92,體現了該模型具有在給定的樣本集中尋找相關樣本的能力;F1分數是統計學中用來衡量模型精確度的一種指標,它同時兼顧了分類模型的精確率和召回率,安全等級為2、3的F1分數均在86%以上,體現了該模型對于這兩個等級的樣本具有較強的評估能力,由于原始樣本中等級為1、4的樣本數量較少,對模型評估產生了一些影響,但整體評價均在85%以上。模型評估整體準確率為92.2%,驗證了本文所提方法在地震信息發布安全風險評估中的有效性。

3.4.2 指標權重分析

通過模型計算得到指標的權重并按二級指標全局權重的大小進行排序,如表4所列。

由表4可知,二級指標中應用軟件安全的權重占比最高,其次分別為物理安全、網絡安全、系統安全。總體來看,信息發布安全風險主要集中在基礎設施、信息管理以及數據安全這三個層面,用戶安全風險和政策環境安全風險對地震信息發布安全影響占比較小,在日常工作中針對權重占比較高的指標應重點關注,采取預防措施以防止風險加劇。

3.4.3 ROC分析

對于分類模型而言,我們不僅關心其預測的準確度,更關心下面兩個指標:命中率(所有分類等級為x的樣本中被預測為x的比率)和假警報率(所有實際分類等級不為x的樣本中被預測為x的比率),也即通過兩者繪制的受試者工作特征(Receiver Operating Characteristic,ROC)曲線來評判模型。我們希望在相同閾值的情況下,假警報率盡量小,命中率盡可能的高,也即ROC曲線盡可能的陡峭,其對應曲線下的面積(Area Under Curve,AUC)值盡可能的高。為進一步驗證所提方法的評估性能,將改進K-SMOTE隨機森林方法與傳統隨機森林方法通過ROC曲線進行對比分析,如圖5所示。

從圖中可以看出,改進K-SMOTE隨機森林方法與傳統隨機森林方法曲線下面積均大于0.85,說明隨機森林模型在地震信息發布安全風險評估中是可行的。與傳統隨機森林方法相比,改進K-SMOTE隨機森林方法ROC曲線更靠近左上角,評估的準確性更高。

3.4.4 實際樣例測試

為進一步驗證本文方法的實用性,以安徽省地震局地震綜合業務系統信息發布安全風險作為評估進行驗證。該系統是集安徽省地震速報、前兆、應急及綜合服務為一體的地震信息發布系統,目前已邀請專業的信息安全技術有限公司完成對該系統信息發布的安全風險測評工作,測評綜合得分為75.46,評估結果“合格”。本文按照地震信息發布安全風險評估指標體系三級指標進行量化,再由安徽省地震信息網絡學科組專家參考量化指標對二級指標進行打分,使用本文提出的算法進行評估,計算得到信息發布風險等級為3,與專業測評結果一致,部分評估情況如表5所列,C1~C11為二級指標。

4 討論

地震監測、預警、前兆、應急等業務工作均有獨立的系統體系,各個業務系統的安全風險狀態評價也只局限于特定領域,尚沒有完整地震信息發布安全風險評估體系。但地震信息發布需要總體考慮各個業務體系的安全情況,任一環節的疏漏都可能產生嚴重的影響。為客觀評估地震信息發布安全風險情況,本研究分析2010—2022年地震監測、預警、災情評估、地震應急等信息發布相關的事件或事故,分別從基礎設施、信息管理、數據安全、用戶風險、政策制度等層面進行調查,逐層細化為基礎指標,構建地震信息發布安全風險評估指標體系。該體系可將地震監測、預警、應急等信息發布業務系統和工作流程量化為具體指標,直觀地展示地震信息發布業務安全狀態。

收集整理2010—2022年地震業務相關軟硬件系統資料及安全定級評分情況,參照地震信息發布安全風險評估指標體系構建樣本集,有效樣本數量為603例。鑒于隨機森林算法分類預測的優異性能,采用該算法構建地震信息發布安全風險評估模型。該模型采用的樣本特征與地震信息發布安全風險評估指標體系中的二級指標相對應,為提升樣本集中的樣本平衡性,使用改進K-SMOTE算法對原始樣本混合采樣,增加新的人工樣本,最終的數據集樣例數為1 191。通過分析評估指標的相關性,找出相關性明顯的指標,模型構建特征劃分中避免了相同指標的使用,提高了模型的獨立性。實驗結果驗證了所提算法可有效用于地震業務信息發布安全風險評估,且與單獨使用隨機森林構建的模型相比,評估準確率提升2.8%(ROC曲線圖中因進位關系顯示為3%),后續將基于該方法研制地震信息發布安全風險評估軟件,進一步推進研究成果的應用實踐。

5 結語

本研究系統地闡述了地震信息發布安全風險評估指標體系構建過程。基于地震信息發布真實數據,采用改進K-SMOTE混合采樣方法解決樣本不平衡問題,并通過隨機K折交叉驗證改進隨機森林算法,構建地震信息發布的安全風險評估模型。實驗結果表明:該模型可以有效用于地震信息發布安全風險等級評估及指標權重分析,有助于改進地震信息發布過程中的薄弱環節。與傳統隨機森林算法相比,本文提出的模型泛化性更好、準確性更高,為地震信息發布的安全風險評估提供了一種新的方法。

參考文獻(References)

[1] 伍國春.日本近現代地震及其次生災害的社會影響[J].地震學報,2012,34(3):408-414.

WU Guochun.Social impacts exerted by earthquakes and their secondary disasters in contemporary and modern Japan[J].Acta Seismologica Sinica,2012,34(3):408-414.

[2] 劉敬輝.基于FTA-AHP的鐵路安全風險綜合評估方法[J].中國鐵道科學,2017,38(2):138-144.

LIU Jinghui.Synthesized risk assessment method for railway safety based on FTA-AHP analysis[J].China Railway Science,2017,38(2):138-144.

[3] 陳登凱,張獻,朱夢雅,等.載人密閉艙室FTA-FBN舒適度評估方法[J].哈爾濱工業大學學報,2023,55(4):100-106.

CHEN Dengkai,ZHANG Xian,ZHU Mengya,et al.Comfort evaluation method of FTA-FBN for manned closed cabin[J].Journal of Harbin Institute of Technology,2023,55(4):100-106.

[4] 陳農田,李俊輝.基于TFF-FTA方法的飛行進近著陸事故致險因素分析[J].安全與環境學報,2021,21(5):2101-2106.

CHEN Nongtian,LI Junhui.Analysis for the causative factors resulting in the approaching and landing accidents based on the TFF-FTA method[J].Journal of Safety and Environment,2021,21(5):2101-2106.

[5] 張琳琳,聶曉紅,郭寅.基于AHP的新疆天山中東段中強地震預測指標體系及效能評估[J].地震工程學報,2017,39(增刊1):53-59.

ZHANG Linlin,NIE Xiaohong,GUO Yin.Evaluation of effectiveness of prediction indicators for medium-strong earthquakes in mid-eastern segment of Tianshan,Xinjiang,China,based on analytic hierarchy process[J].China Earthquake Engineering Journal,2017,39(Suppl01):53-59.

[6] 高凱,鄒凱,蔣知義,等.智慧城市信息安全風險評估指標體系構建[J].現代情報,2022,42(4):110-119.

GAO Kai,ZOU Kai,JIANG Zhiyi,et al.Construction of an indicator system for information security risk assessment of smart city[J].Journal of Modern Information,2022,42(4):110-119.

[7] LEU S S,CHANG C M.Bayesian-network-based safety risk assessment for steel construction projects[J].Accident Analysis amp; Prevention,2013,54:122-133.

[8] BIAN H F,ZHANG J,LI R X,et al.Risk analysis of tripping accidents of power grid caused by typical natural hazards based on FTA-BN model[J].Natural Hazards,2021,106(3):1771-1795.

[9] SPEISER J L,MILLER M E,TOOZE J,et al.A comparison of random forest variable selection methods for classification prediction modeling[J].Expert Systems with Applications,2019,134:93-101.

[10] 賀海浪,盧育霞,池佩紅.基于遷移學習的青藏高原東北緣地震誘發滑坡易發性評估模型[J].地震工程學報,2023,45(3):724-734.

HE Hailang,LU Yuxia,CHI Peihong.Assessment model of earthquake-induced landslide susceptibility based on transfer learning in the northeastern margin of the Qinghai-Tibet Plateau[J].China Earthquake Engineering Journal,2023,45(3):724-734.

[11] KOMBO O,KUMARAN S,SHEIKH Y,et al.Long-term groundwater level prediction model based on hybrid KNN-RF technique[J].Hydrology,2020,7(3):59.

[12] 常玉清,孫雪婷,鐘林生,等.基于改進隨機森林算法的工業過程運行狀態評價[J].自動化學報,2021,47(9):2214-2225.

CHANG Yuqing,SUN Xueting,ZHONG Linsheng,et al.Industrial operation performance evaluation of industrial processes based on modified random forest[J].Acta Automatica Sinica,2021,47(9):2214-2225.

[13] POLIKAR R.Ensemble learning[M]//Ensemble Machine Learning.New York,NY:Springer New York,2012:1-34.

[14] BELGIU M,DRGUT L.Random forest in remote sensing:a review of applications and future directions[J].ISPRS Journal of Photogrammetry and Remote Sensing,2016,114,24-31.

[15] PAUL A,MUKHERJEE D P,DAS P,et al.Improved random forest for classification[J].IEEE Transactions on Image Processing,2018,27(8):4012-4024.

[16] 張天翼,丁立新.一種基于SMOTE的不平衡數據集重采樣方法[J].計算機應用與軟件,2021,38(9):273-279.

ZHANG Tianyi,DING Lixin.A new resampling method based on smote for imbalanced data set[J].Computer Applications and Software,2021,38(9):273-279.

[17] 石洪波,陳雨文,陳鑫.SMOTE過采樣及其改進算法研究綜述[J].智能系統學報,2019,14(6):1073-1083.

SHI Hongbo,CHEN Yuwen,CHEN Xin.Summary of research on SMOTE oversampling and its improved algorithms[J].CAAI Transactions on Intelligent Systems,2019,14(6):1073-1083.

[18] 郭朝有,許喆,馬硯堃,等.面向不平衡數據集融合Canopy和K-means的SMOTE改進算法[J].科學技術與工程,2020,20(22):9069-9074.

GUO Chaoyyou,XU Zhe,MA Yankun,et al.The improved SMOTE algorithm fusion canopy and K-means for imbalanced data sets[J].Science Technology and Engineering,2020,20(22):9069-9074.

(本文編輯:任 棟)

猜你喜歡
信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
一個相似模型的應用
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 国产激情无码一区二区三区免费| 日本在线亚洲| 欧美成人精品高清在线下载| 欧美亚洲激情| 一区二区三区四区在线| 亚洲欧美一级一级a| 日本高清免费不卡视频| 欧美日本视频在线观看| 久久semm亚洲国产| 国产又爽又黄无遮挡免费观看 | h视频在线观看网站| 热99re99首页精品亚洲五月天| 国产欧美日韩综合一区在线播放| 四虎永久在线精品影院| 色色中文字幕| 在线观看无码a∨| 午夜日b视频| 色综合五月婷婷| 色综合久久88色综合天天提莫| 极品国产在线| 青草精品视频| 秋霞午夜国产精品成人片| 亚洲日韩高清在线亚洲专区| 91毛片网| 色135综合网| 88av在线播放| 成人午夜久久| 一区二区在线视频免费观看| 国产原创第一页在线观看| 毛片网站在线看| 亚洲中文无码h在线观看| 久久婷婷色综合老司机| 欧美成人影院亚洲综合图| 日韩第八页| 国产免费网址| 国产一区二区三区日韩精品| 日韩免费毛片视频| 欧美精品啪啪| 麻豆精品在线播放| 91丨九色丨首页在线播放 | 久久青草免费91线频观看不卡| 久久99国产精品成人欧美| 热这里只有精品国产热门精品| 97在线免费| 国产日本一线在线观看免费| 色综合热无码热国产| 国产精品高清国产三级囯产AV| 亚洲欧美日韩成人在线| 日韩 欧美 小说 综合网 另类| 国产在线观看成人91| 国产av剧情无码精品色午夜| 思思热在线视频精品| 精品福利国产| 亚洲一区二区三区香蕉| 日韩视频免费| 亚洲国产亚洲综合在线尤物| 九色综合伊人久久富二代| 综合五月天网| 久久亚洲精少妇毛片午夜无码| 手机看片1024久久精品你懂的| 亚洲AV色香蕉一区二区| 国产美女丝袜高潮| 欧美福利在线观看| 综合色88| 久久国产精品无码hdav| 一本大道香蕉中文日本不卡高清二区| 欧美精品色视频| 中国成人在线视频| 午夜无码一区二区三区在线app| www.亚洲天堂| 国产精品成人第一区| 97综合久久| 久久女人网| 精品人妻一区无码视频| 精品久久久久久久久久久| 91成人在线免费视频| 国产视频自拍一区| 无码AV高清毛片中国一级毛片| 亚洲中文字幕在线观看| 污网站在线观看视频| 国产超薄肉色丝袜网站| 人妻无码中文字幕第一区|