柳林溪
(貴州電網有限責任公司計量中心, 貴州,貴陽 550000)
隨著信息化技術的發展,物聯網技術日益受到重視,諸多專家學者在監測與預警方面進行了研究,主要包括社會風險的監測預警、燃氣管道的監測預警以及不同行業風險的監測預警。大多數的風險監測預警都是采用簡單的閾值預警方式,難以在早起階段快速做出反應。部分專家[1-3]利用STM32采集監測數據,實現簡單的數據存儲異常報警功能。還有部分專家[4-6]提出在監測的過程中建立監測點,通過對多個監測點的實時數據的監測,實現關鍵情況的判斷,建立監測點監測預警模型。也有部分專家學者[7-9]考慮了監測對象的狀態,認為不同的監測對象應考慮的情況是不同的,所以提出了實時動態監測模型,但是對于動態的監測更多的是停留在理論層面上。由此可知,目前在風險的動態監測預警方面普遍結合物聯網技術,但是動態監測更多的是從理論層面上驗證可行性,實際應用性仍需要摸索。因此,本研究在物聯網監測數據的基礎上,利用模糊控制算法優化隨機森林方法,建立模糊隨機森林模型,實現風險的動態監測預警。
數據的動態監測預警結果主要是由采集終端、邊緣計算和云平臺組成。其中,采集終端主要是由傳感器感知數據,邊緣計算是由智能網關對感知的數據進行處理,最后通過云平臺,利用模糊隨機森林算法建立監測預警模型,實現信息的可視化。整體架構如圖1所示。

圖1 整體架構
隨機森林算法是一種集成學習的方法。隨機森林是由多顆CART樹組成的強學習器,通過統計所有弱學習器的輸出,得到預測結果,對缺失特征不敏感,與其他機器學習算法相比,隨機森林算法泛化能力更強,準確率更高[10-12]。模糊控制算法基于模糊數學,以模糊集合理論、模糊語言和模糊邏輯為基礎,通過語言變量和模糊條件語句等方法,將自然語言轉換成對應規則,基于這些規則對系統進行控制[13-15]。
本研究將模糊控制算法和隨機森林算法結合,設計一種動態監測預警方法。該方法將隨機森林模型中特征重要度較高的數據作為模糊控制算法的輸入,通過模糊控制算法獲得基于專家經驗的風險斷結果,然后將獲得的結果替代隨機森林模型中特征重要度較低的數據,從而減少輸入數據中的干擾信息,提高輸入數據與風險等級的相關性。以優化后的數據作為隨機森林模型的輸入進行訓練,獲得模糊-隨機森林模型,進而得到風險預警等級。模糊-隨機森林算法的結構如圖2所示。

圖2 算法結構
算法整體執行的步驟如下。
Step 1 將無線傳感器采集到的數據進行預處理,實現數據格式轉換、去除冗余數據。
Step 2 實現數據的歸一化處理,設定xo為歸一化結果,xk為當前數據,xmin為樣本數據的最小值,xmax為樣本數據的最大值,公式如下:
(1)
Step 3 將數據分為訓練集和測試集兩部分,對模型進行訓練,得到隨機森林模型的屬性重要度和預測數值。
Step 4 根據屬性重要度實現數據的模糊化處理。
Step 5 將處理后的數據進行模型的輸入,得到最終的模型預測效率和數據特征重要度。
將數據集以7∶3的比例劃分為訓練集和測試集,數據集共計400條。將數據集放入模型進行大范圍的訓練,利用訓練后的模型實現風險的預測,并確定數據對隨機森林模型預測結果的重要度特征。將本研究提出的模糊-隨機森林模型和傳統的隨機森林模型進行比對,驗證不同模型預測的準確率,模型對比效果如圖3所示。

圖3 模型的對比效果
同時,比較了模糊-隨機森林模型、MLP神經網絡模型和SVM模型在測試集中的效果,將數據分為10組,如表1和圖4所示。通過比較可知,模糊-隨機森林模型相較其他模型的預測準確率情況。

表1 模型準確率對比數據表

圖4 比較分析
通過比較分析可知,模糊-隨機森林的準確率平均為82.7%,MLP神經網絡模型的準確率為78.3%,SVM模型的準確率為76%。由此可知,模糊-隨機森林模型的準確率相對較高。
本研究利用物聯網技術,將無線傳感器和邊緣計算、云平臺充分結合,通過智能化的手段和方法實現風險的監測預警,并在風險分析的過程中建立模糊-隨機森林模型,實現風險的有效識別。通過實驗對比可知,模糊-隨機森林模型與傳統的隨機森林模型相比,算法的準確率得到了提升,具有一定的實際應用性。