



摘 要:為解決孤立森林算法檢測大壩異常數據時因不能識別數據間趨勢性和相關性而造成數據誤判的問題,提出基于平滑閾值與孤立森林的大壩監測數據異常檢測算法。首先利用小波變換提取時序數據的趨勢項,然后使用ARMA 模型對提取的趨勢項數據確定動態閾值區間,最后利用孤立森林算法檢測出散落在閾值區間外的異常值。以貴州省畢節市夾巖水利樞紐工程混凝土面板堆石壩為例,分別對大壩壩基、壩體、周邊縫及面板4 個部位監測數據進行檢測,驗證算法效果。結果表明:與傳統孤立森林算法相比,基于平滑閾值與孤立森林的算法對壓力、觀測房沉降量、開合度、應力的誤判率分別降低了12.2、13.4、7.1、8.0 個百分點。
關鍵詞:小波變換;ARMA 模型;孤立森林;異常檢測;大壩;畢節市夾巖水利樞紐工程
中圖分類號:TV698.1 文獻標志碼:A doi:10.3969/ j.issn.1000-1379.2025.03.022
引用格式:張瑜,秦學,彭浩.基于平滑閾值與孤立森林的大壩監測數據異常檢測[J].人民黃河,2025,47(3):141-145.
隨著大壩建設規模的不斷擴大,保障大壩安全成為重要挑戰[1] 。現今許多大壩因長時間運行而存在老化和損壞情況,加之維護不足或缺乏定期檢查,導致大壩出現各種潛在問題。通過檢測大壩的異常數據可以及早發現問題并解決,以確保大壩的安全運行。目前在大壩監測數據異常檢測領域,已有多種檢測方法并取得良好效果[2-3] ,但仍存在合理選擇測值范圍、實驗數據服從特定的概率分布[4] 以及進行特定訓練和擬合[5] 等適應性問題。孤立森林算法在處理低維度、異常點相對較少的時序數據方面有很大優勢,但無法捕捉數據的時序相關性。另外,孤立森林算法對于噪聲數據比較敏感,噪聲數據可能會被誤判為異常點[6] 。將ARMA 模型與孤立森林算法結合, 利用ARMA 模型生成動態閾值[7] ,根據歷史數據走勢和預測結果不斷調整閾值,可以更加靈活地適應數據的變化。
本文提出一種基于平滑閾值與孤立森林的大壩監測數據異常檢測方法,首先利用小波變換提取大壩監測數據中的趨勢項,達到平滑數據的效果;然后利用ARMA 模型計算出動態閾值區間,衡量數據的波動性;最后采用孤立森林算法對處于閾值區間外的數據點進行異常檢測。