徐黃鎮 杜文輝 沈峰敏 張福康
摘 ?要:隨著我國經濟社會的高速發展,特征設備在工業制造、交通建設、能源動力、城市管理、文化旅游等多個行業領域對中得到了廣泛使用,已經成為我國經濟社會發展必不可少的重要組成部分。然而,特種設備在使用過程中存在許多潛在的安全風險,其危險系數較高。為了有效預防特種設備在使用過程中出現安全事故,本文提出了一種基于半監督多視角聚類的特種設備安全預警方法(SM-MVC)。該方法一方面通過特種設備多源數據融合提高安全預警的準確度,另一方面通過結合低秩表示方法對多源數據中的噪聲進行處理,增強了對異常設備的判別能力。最后,通過在多個公開數據集和真實數據集上的仿真實驗驗證了本文方法的有效性。
關鍵詞:特種設備安全預警;半監督聚類;多視圖聚類;非負矩陣分解;低秩表示
1引言
隨著我國經濟社會的高速發展,特征設備在工業制造、交通建設、能源動力、城市管理、文化旅游等多個行業領域對中得到了廣泛使用,直接影響百姓生產和生活的方方面面,已經成為我國經濟社會發展必不可少的重要組成部分。然而在我國目前的特種設備管理模式中,特種設備的安全運行仍然依賴于操作和監管人員的專業素質水平。因此,需要利用現代人工智能技術推動特種設備安全監管模式創新,降低由于人工因素誘發的特征設備安全問題,提高特種設備自動化、智能化安全監管能力。
為了解決上述問題,本文提出了一種基于半監督多視角聚類的特種設備安全預警方法(SM-MVC),該算法的目的是利用多源數據,從特種設備的歷史數據中找出影響設備故障因素之間的關系,并根據這些關系對特種設備的進行分級預警。該方法可以利用已有的標簽信息在多視角空間對數據進行聚類。
2相關工作
國內的特種設備安全監管大數據平臺主要通過匯聚不同數據源的數據資源進行安全監管,其核心在于通過對特種設備基礎數據、質監監管數據、檢驗業務數據、業主數據、維保數據等數據資源的收集.采用決策樹方法對多源數據進行利用,時間復雜度較小,但如果數據存在噪聲,生成分支過多算法導致過分擬合。
雖然結合人工智能技術和特種設備安全監管任務的研究正在快速發展,但是相關研究工作并沒有考慮融合多平臺的多源數據,其理論基礎仍然比較薄弱。提出在電梯的全生命周期中需要收集其結構化、非結構化的多源數據,才能為進一步的數據處理和分析奠定基礎。提出了一種基于特種設備多源大數據質量評價方法,為后續大數據分析及一體化集成服務提供質量保障。本文首先基于多視圖的非負矩陣分解,實現特種設備多源數據的融合,其次通過低秩表示方法,對復雜的多源數據進行處理,消除數據中的噪聲影響,實現特種設備安全狀態的自適應分類,從而提高對特種設備安全預警的準確度。
3基于半監督多視角聚類的特種設備安全預警方法
為了解決傳統特種設備安全預警方法無法將已有設備特征信息利用的情況。本文提出的基于低秩半監督多視角聚類的特種設備安全預警方法。
3.1原理和目標
基于半監督非負矩陣分解,我們一方面引入圖表示矩陣S捕捉每個數據源中的結構信息,另一方面為了降低多源數據中的噪聲影響,引入低秩表示對融合目標進行處理,通過最小化如下目標函數實現多源數據融合:
(9)
其中 代表多視圖數據集, 和 分別表示通過分解得到的是基矩陣和表示矩陣。 矩陣表示是半監督約束矩陣。在目標函數中,為了進一步增強融合目標S的魯棒性,我們提出了基于質心的正則化方案,最終算法模型如下所示:
(10)
3.3優化算法
在目標函數中包括多個變量,為了實現目標函數的最小化,我們采用ADMM迭代法進行優化求解。
Step1:固定變量 , 和 更新
通過引入拉格朗日乘數 ,約束 ,對L1求 的偏導數:
(11)
通過設置 并使用KKT條件令 ,我們得到了 的更新規則:
(12)
Step2:固定變量 , 和 更新
通過引入拉格朗日乘數 ,約束 。通過設置 并使用KKT條件[13]令 ,我們得到了 的更新規則:
(13)
Step3:固定變量 , 和 更新
引入輔助變量 ,對 求偏導,得到:
(14)
的更新規則如下:
(15)
Step4:固定變量 , 和 更新
對公式(22)求偏導 ,得到:
(16)
算法的詳細步驟如算法1所示。通過最小化目標函數,實現多源數據融合,獲取魯棒的融合目標 。最后通過對 使用譜聚類獲得數據的簇劃分。在此基礎上,結合半監督樣本信息對每類的安全等級進行劃分。當某個類包含大量高風險樣本時,我們將該類其余樣本劃分為高風險設備,當某個類包括少量高風險樣本時,我們將其余樣本劃分為中風險設備,當某個類內不存在高風險設備時,該類其余樣本屬于低風險設備。由此我們可以實現對特種設備安全風險的預警。
算法1:半監督多視角聚類 SM-MVC
輸入:數據集 ,低秩參數 ,視圖權重 ,矩陣因子的維數 ,標簽樣本數比例 ,標簽矩陣A
Step 1. For v=1:num_view
Step 2. ? ?初始化 矩陣
Step 3. End for
Step 4. While not converged do
Step 5. For v=1:num_view
Step 6. ? ?通過公式(12),更新變量
Step 7. ? ?通過公式(13),更新變量
Step 8. ? ?通過公式(16),更新變量
Step 9. End for
Step10. End while
輸出:融合目標
4仿真實驗
本文的比較方法包括多種多視圖聚類方法:多視圖共生圖聚類(MCGC),多視角聚類圖學習(MVGL),基于低秩稀疏分解的魯棒多視圖譜聚類(RMSC),非負矩陣分解(NMF),基于圖正則化的非負矩陣分解(GNMF),受限非負矩陣分解(CNMF)。
4.1實驗數據集
本文采用了uci-digit1、3-sources2、MSRC_v13、BBCSport4、BBC4五個仿真數據集和一個真實電梯數據集Elevator。uci-digit數據集:包含手寫數字0到9的2000個樣本,共有10個類。3-Sources數據集:包含來自BBC、Reuter、guardian新聞文章的數據集,使用其中169篇。MSRC-v1數據集:包含240張共8個類別的圖像,本實驗選擇7個物體共計210張。BBCSport數據集:包含來自2個不同領域的544條體育新聞。BBC數據集:包含來自BBC新聞的685份文檔,可以分為5類。Elevator數據集:包含來自湖州市特種設備檢測研究院提供的2020年曳引驅動載貨電梯的運行數據。該數據集共包含358份樣本,每個電梯樣本包括生產數據、環境數據和檢修數據3個數據源。
4.2實驗結果
算法中主要包含2個主要參數λ和r,分別用于控制低秩的程度和于控制半監督標簽的百分比。在實驗中,各視圖均設置相同權重系數。實驗結果如圖1所示,我們首先從區間[0.001,0.01, 0.1,1.0,10]選擇最佳參數λ,然后借助最佳參數從對應區間選擇最佳參數 ,其余參數保持一致。
為了避免算法中隨機初始化引起的誤差,本次實
驗每種算法在數據集上均運行十次,采用“平均值(標準差)”的格式進行展示。相比以RMSC為代表的多視角聚類算法,我們的方法在聚類精度上均取得最優,這證明了我們的方法具有更好的性能,聚類結果更加魯棒。
為了驗證我們的半監督多視圖聚類方法SM-MVC對特種設備安全預警的效果,我們從湖州市2020年曳引驅動載貨電梯的運行數據中提取出包含三個數據源的電梯數據集。該數據集共包含358份樣本,每個電梯樣本包括生產數據、環境數據和檢修數據3個數據源。實驗過程中半監督標簽比例為 [0.1,0.2,0.3,0.4]。
5總結
為了將已有的特種設備樣本利用起來以提高安全預警能力。本文提出了SM-MVC算法,將已知設備信息作為標簽信息加入。在標簽信息的幫助下,我們的模型首先會將具有相同標簽的樣本合并到同一新的表示中。同時,利用低秩表示,有效的避免了數據收集過程中噪聲造成的干擾。通過在仿真數據集和真實數據集上的實驗結果,證明了算法的有效性。
參考文獻
[1]蘇超,容爍.特種設備安全監管大數據平臺研究[J].物聯網技術,2020,10(07):59-62.
[2]王新浩,羅云,李桐,黃西菲.基于大數據的特種設備宏觀安全風險預警方法研究[J].中國安全生產科學技術,2018,14(04):160-166.
[3]徐斌, 李琳, and 鐘珞, “面向大數據的智慧電梯分析預警平臺,” 武漢理工大學學報(交通科學與工程版), no. 41, pp. 359–362, 2017.
[4]劉佳璐 and 賈中輝, “基于大數據的電梯維保智能管控云平臺的設計與實現,” 中國電梯, vol. 030, no. 016, pp. 39-42,64, 2019.
姓名:徐黃鎮,出生年月:1987年01月,性別:男,民族:漢,籍貫:浙江省湖州市,學歷:本科,職稱:工程師,從事工作:特種設備檢驗。