摘要:現今數據分析鄰域面臨的大規模、多屬性、混合型數據集較為普遍,對分析算法提出了較高的要求。粗糙集算法能在大量特征屬性中篩選出重要屬性,可以用于優化神經網絡的輸入數據,能夠降低運算難度,提高算法性能。
關鍵詞:粗糙集;神經網絡;屬性約簡
在處理屬性多、屬性為混合型的數據時,要求選用的數據分析方法要有著能夠篩選屬性與處理混合型屬性的優點,而1982年被Pawlak教授提出的粗糙集理論,在被深化研究發展后,已廣泛的應用于屬性約簡、知識獲得、分類器設計等方面,比較適合在繁雜的屬性集之中篩選出影響決策的關鍵屬性。但傳統的粗糙集理論只能用來處理分類型數據,即數據本身為離散型的,對待連續的數值型數據,一般采用離散化的方法將數據轉化為離散型,但轉化過程中不可避免的損失數據信息,影響數據分析結果。為此研究人員引入鄰域粗糙集某型來進行混合型屬性的數據集的屬性約簡,鄰域粗糙集的屬性約簡算法一般采用前向貪心搜索的策略,通過計算全局屬性的重要度,測試屬性加入候選集合對結果帶來的影響,依次判斷最優集合,這種算法能夠大大降低鄰域粗糙集屬性約簡的計算復雜度,使該方法的應用更廣泛。
在航材專業內對于粗糙集方法的應用早有先例,例如利用超平面或超曲面的間接連續屬性離散化的方法對數據進行離散化后進行屬性約簡,對飛機故障情況進行認定,設計自修復飛行控制效能評估系統與建立飛機備件需求量的相關研究 。如針對航材的混合型屬性,提出采用Gower距離與PAM聚類算法對器材進行聚類,對每一類進行分析,用粗糙集對數據進行離散化從而建立的啟發式航材訂貨模型使用粒子群優化算法求解不同區間的權重最優值,有著不依賴與保障人員主觀經驗、智能確定訂購計劃擺脫繁瑣工作的優點。也有采用粗糙集對航材的混合屬性集進行約簡,篩選出影響航材儲存品種的關鍵屬性,從已有經驗中提取規則,結果可以用來判斷航材是否需要進行儲備,有比較高的準確度,但相關屬性較為抽象 。
粗糙集與神經網絡相結合的方法在各領域中一直是專家學者研究的方向之一,也是近年來的熱點問題。如在大型系統中的故障預警,如電信設備之中,用粗糙集對數據進行屬性約簡大幅度減少輸入層神經元節點個數,優化算法結構,提高設備故障與經診斷的效率與準確率,通過算例與傳統的BP神經網絡計算結果進行對比,經粗糙集屬性約簡優化的神經網絡在預測的準確性和運算速度方面都有著絕對的優勢 。也可以采用遺傳算法對粗糙集屬性約簡過程和神經網絡模型計算過程進行優化,憑借遺傳算法全局尋優的特點能夠避免模型計算陷入局部極值點,提高運算的準確率 。相似的方法也可用于對大型醫療設備的故障預警之中,可以提前預測故障發生,為醫護人員與維修工程師提供決策支持,降低不良影響 。在預測方面,通過層次分析法初步建立屬性體系,再用粗糙集進行屬性約簡,將結果帶入神經網絡,能大大提高預測的準確程度,避免無關因素的干擾,在預測在途車輛運行風險 、宿舍樓內短期用電量 、大學生能否順利完成學業 、短期風速預測 等方面都有著一定的應用。由于預測方面的需求,算法所處理的往往是動態數據,可以采用Elman神經網絡,相比較于傳統的靜態前向反饋神經網絡如BP神經網絡,Elman神經網絡多了一層關聯層,有更強的動態處理能力,并更適合與時間序列相結合建立預測模型。粗糙集與神經網絡相結合還能夠用來進行評價,如對地鐵施工風險建立評價模型 ,選用更加適用于小樣本數據的REF神經網絡,在系統集成中可以考慮與BP神經網絡進行互補。在電信企業,可以用該方法對用戶是否存在流失風險進行建模評級 。也可以用來對小麥品種進行分類 ,若數據集符合要求可以建立雙隱含層的神經網絡提高分類的準確率。在生產企業中,該方法可以為服務商的選擇和安全庫存量的確定提供依據 。在區域性的企業管理中也有一定的應用前景 ,如對區域內企業的綠色發展數據進行分析,對企業進行評級,便于管理。該方向同樣也是國外學者的研究熱點,今年成果如粗糙集優化的小波神經網絡來評估室內空氣質量 ,粗糙集優化的模糊神經網絡預測大型離心壓縮機葉片壽命 ,粗糙集優化神經網絡用于提取分類規則 ,粗糙集優化神經網絡對柴油機故障的預測 ,粗糙集優化的模糊小波神經網絡對電力變壓器故障診斷的研究等等。
參考文獻:
[1]張寧.基于鄰域粗糙集的屬性約簡算法研究[D].湖南大學,2017.
[2]安若銘,索明亮.鄰域粗糙集在屬性約簡及權重計算中的應用[J].計算機工程與應用,2016,52(07):160-165.
[3]何亞群.基于粗糙集的智能決策理論與應用研究[D].南京航空航天大學,2005.
[4]周家萱,徐常凱.基于粗糙集全局離散和粒子群算法的啟發式航材訂貨模型[J].空軍工程大學學報(自然科學版),2019,20(04):33-38.
[5]韓俊騫,何亞群,李繼軍.基于混合屬性值的航材庫存品種確定方法[J].數學的實踐與認識,2019,49(19):139-144.
[6]韓玉,張作剛,張海軍.基于粗糙集和神經網絡的艦載直升機航材消耗預測研究[J].艦船電子工程,2017,37(09):96-99.
[7]萬玉成,王科,袁文君.基于粗糙集理論的航材可修件報廢決策分析[J].戰術導彈技術,2010(01):63-66+103.
[8]徐立坤,李建路.基于粗糙集改進的BP神經網絡設備故障預警研究[J].計算機與數字工程,2020,48(07):1710-1714.
[9]陳艷,王琪,王佳慶,蔣佳旺,李林獻.粗糙神經網絡數據挖掘技術在大型醫療設備故障預警中的應用研究[J].
[10]吳佳懋,李艷,符一健.基于粗糙集-混沌時間序列Elman神經網絡的短期用電量預測[J].電力系統保護與控制,2019,47(03):23-30.
[11]王常紅.基于Rough集的教學預警模型[D].武漢科技大學,2013.
[12]尹東陽,盛義發,蔣明潔,李永勝,謝曲天.基于粗糙集理論-主成分分析的Elman神經網絡短期風速預測[J].電力系統保護與控制,2014,42(11):46-51.
[13]孫斐,趙金先,孟瑋,蔣克潔.粗糙集-RBF神經網絡的青島地鐵施工風險評價模型研究[J].青島理工大學學報,2020,41(04):9-16.
作者簡介:任宇軒;男;1996年10月;吉林白城;漢;本科;碩士研究生;控制科學與技術