王素麗
(華南理工大學廣州學院 計算機工程學院, 廣州 510800)
設備界面是很多電子設備的重要構件,界面故障會導致電子設備無法人工操控[1],并且一旦界面出現故障,會帶來很多衍生問題.識別設備界面故障數據屬性可為檢測故障類型及故障維修提供重要依據,檢測并分析故障屬性是界面設備正常運行的重要前提[2-3],識別設備系統故障數據屬性勢在必行.
段禮祥等[4]針對設備故障數據識別,將加權支持向量機(C-SVM)引入至故障數據屬性識別中.綜合考慮數據樣本之間距離、故障數據類內距離及不均衡性等問題,對二叉樹結構進行優化,實現最終故障數據屬性識別,但該方法識別精度較低.王浩亮[5]提出基于移動學習的海量光纖斷點故障數據識別方法,設計了一種適用于高頻與低頻信號的去噪函數,通過增加信號轉換斷接振幅的方法實現海量光纖斷點故障識別.該方法的識別率較高,但整體過程較為復雜.為有效解決當前相關方法中的問題,本文提出了基于人機交互界面的故障數據屬性識別方法.
為采集界面故障數據,可利用計算機來輔助完成,具體操作步驟為:界面故障數據信號經AD轉換之后,傳輸至DSP中進行處理,并將處理結果緩存至雙口RAM中,再利用USB傳送至CF卡中存儲.數據采集過程中,DSP是主控制器,主要功能為采集和處理及顯示指令與數據傳輸情況,還能夠處理小鍵盤中使用者指令.LCD顯示與小鍵盤合并構成數據采集體系的人機交互模塊,小鍵盤便于使用者的指令輸入與控制.
本文通過離群熵檢測故障數據噪聲,并對其進行提取.在特定的數據集合S中,假設噪聲數據集為O,則正常數據集為S′=S-O.計算離群熵,取正常噪聲數據集O和數據集S′,其中各個數據需要獲取數據每一維屬性的信息增益,而通過對樣本進行訓練即可準確地得到各個屬性的增益.在開始進行噪聲檢測時,先對一個包含正常數據和噪聲數據的訓練集進行分析,從而獲得各個屬性的信息增益.本文設計的數據噪聲檢測提取過程如圖1所示.

圖1 噪聲檢測框圖Fig.1 Block diagram of noise monitoring
1.3.1 消噪處理
故障數據消噪是提高數據屬性識別精準性和降低識別復雜度的有效操作.依據數據功率譜存在的特性可將其中的噪聲劃分成白噪聲與有色噪聲[6].在界面故障識別與診斷過程中,故障數據采集量化誤差是一定會存在的.當輸入的故障信號比較復雜且量化時間間隔比較小時,量化誤差值可以當作一個均勻分布下的平穩白噪聲數據.在界面中,可能還存在各種諧波,這些諧波頻譜主要集中在某一個點或者某些頻率點,這就導致諧波高頻分量比較豐富,隸屬有色噪聲.
當前比較常用的消除和抑制噪聲的干擾濾波法為自適應濾波法和最優估計法.此類噪聲消除法雖然在一定程度上降低了噪聲,但也使故障信號峰值變得平滑,而峰值中一般會包含故障類型的關鍵信息[7].綜上,在進行故障檢測與診斷過程中,采用上述方法消噪會影響故障判斷.
小波分析能夠對信號時域、頻域并行分析,可有效將信號中突變信號與噪聲信號分離,故將其應用在界面故障數據消噪中.利用小波分析法去除白噪聲的主要步驟如下:
1) 針對含有白噪聲的界面信號實行多尺度的小波變換.通常情況下采用二進小波等母小波函數,多尺度小波在分解過程中,尺度變化一般會選擇指數變化分布規律,也可采用多分辨率分解方式.尺度的分解層數一般定義為3~4.
2) 在各尺度上找到模極大值所在位置.
3) 判斷各模極大值位置是否為奇異點或白噪聲.根據尺度變化呈現出的規律可知,奇異點模極大值會在兩個鄰居尺度分解層次間隨著尺度不斷增大而增大,設模值間比值為a,則在實際判斷過程中,可取值定義為(0.85~1)a.根據模極大值位置判斷各模極大值為奇異點或白噪聲.將各模極大值和其他各個層次相對應位置的模極大值進行對比,大于各個模極大值都是信號奇異點;反之則是白噪聲[8].保存各尺度上奇異點相應模極大值,并將各尺度的噪聲模值定義為0,以此消除白噪聲.
4) 對消除白噪聲后的小波分解最終結果實行重構操作,以此獲取的信號即為白噪聲抑制和清除之后的原始信號.
依據上述過程即可將數據中的白噪聲消除,并將奇異點保存.界面數據信號中存在有色噪聲,但利用上述方式無法很好地去除.界面故障數據屬性識別過程中,有色噪聲去除相應舉措如下:
1) 假設已經掌握有用信號數據頻譜范圍,那么將包含噪聲的原始數據進行小波分解,并在分解最終結果中,將有用頻譜范圍內的數據信號保留下來,其他強制設置為0,再將小波重構結果當作原始信號去噪后的真實信號.
2) 假設已經得到噪聲信號頻譜的整體波動范圍,且其與真實信號頻譜波動范圍無重疊現象,則對包含噪聲的信號實施小波分解操作,然后將噪聲頻譜范圍中的所有信號強制設置為0,再重構信號,并將最終結果定義為去噪后真實信號.
1.3.2 消噪信號離散化處理
假設存在一維觀測信號,其表達式為
f(t)=s(t)+n(t)
(1)
式中:s(t)為界面原始信號,n(t)為方差是σ2的白噪聲.對式(1)中的f(t)進行離散化處理,獲取N點離散信號f(n),n=0,1,…,N-1,則其小波變換可表示為
(2)
式中:W(j,k)為小波系數;k為波數;j為常數.實際應用過程中,式(2)計算較為繁瑣,且小波函數通常無顯著性表達,故本文將小波變換采用遞歸形式表達為
S(j+1,k)=S(j,k)h
(3)
W(j+1,k)=W(j,k)g
(4)
式中:h、g為與尺度函數φ(t)、小波函數ψ(t)相對應的低通與高通濾波值;S(j,k)為尺度系數,則對應信號重構表達式為

(5)

1.4.1 滑動窗口設置
在故障數據屬性識別過程中,由于故障數據之間具有相似性,故采用滑動窗口技術來區分.在滑動窗口中滑過的數據集合可以通過一個三維數據矩陣X(I×J×K)描述,I為變量數,J為采樣點數量,K為批量數量,本文將該矩陣展開為二維矩陣形式X′(I×K),數據矩陣分塊示意圖如圖2所示.
滑動窗口技術主要是通過一個動態性可調整的窗口對所有工況樣本進行控制,并以此反映出工況的變化,還能夠控制樣本集合的大小,可有效提升故障數據屬性及識別查全率.
1.4.2 故障數據屬性相似度計算
利用滑動窗口對故障數據相似性分析的過程如下:
1) 對去噪的海量數據進行分塊,并將窗口長度設置為L′,閾值設為η1和η2.
2) 對窗口進行更新,選取窗口中的所有數據,將窗口數據的主成分矩陣設置為M′.采樣少

圖2 故障數據矩陣分塊示意圖Fig.2 Schematic partition of fault data matrix
數類樣本,構建待選數據屬性池,并將相對應的主成分矩陣定義為T′.
3) 計算目標數據和窗口數據主成分相似性因子,即
(6)
式中,k′為故障數據集合中最重要的主元數量.將式(6)計算結果與閾值η1進行對比,若SP>η1,則將窗口數據保存至待選數據緩存池中;若SP<η1,則重復步驟2).
4) 計算目標數據和待選數據之間的距離相似因子Sd,即
(7)
式中:e為噪聲離散值;z為窗口平滑參數.將式(7)計算結果與閾值η2進行對比,若Sd>η2,則將故障數據歸納至相似屬性數據集合中;若Sd<η2,則重復該步驟,一直到所有故障數據歸納至相對應的數據集合中.
本文仿真實驗環境為:電腦配置為Windows7、64位操作系統,硬盤內存容量為1 TB,Intel Core-i5處理器;在Powerbuilder 9.0軟件上進行故障數據識別測試,選取150個軟件自帶的ASA后臺數據庫(adaptive server anywhere 8.0)數據作為測試樣本,形成一個完整的界面故障數據屬性識別體系.在開展故障數據屬性分析過程中,將待識別的原始故障數據樣本傳輸至故障數據屬性識別體系中,各測試樣本均與一個輸出向量相對應.所設置的實驗參數為:單階低通與高通濾波器的衰減率分別為每倍頻6 dB,每十倍頻20 dB;電阻為1 000 Ω,電容為0.1 μF,截止頻率為159.3 Hz;尺度系數為1,小波系數為1.5;窗口長度為 2cm,閾值η1為35,閾值η2為50;實驗過程中,以識別復雜程度、識別精度及查全率為實驗指標對方法可行性進行驗證.
復雜系數具體計算公式為
(8)
式中:TS為識別數據實際耗時;Tv為單位識別數據耗時定額.仿真得到的不同方法識別復雜系數結果如圖3所示.

圖3 不同方法識別復雜度對比Fig.3 Comparison of recognition complexity with different methods
圖3中,本文方法數據屬性識別方法復雜系數明顯小于其他文獻方法,識別復雜系數介于0.4~0.52之間;文獻[4]方法在運行過程中,對數據存在的噪聲信號等方面考慮較少,噪聲信號增加了識別復雜度,導致文獻[4]方法的識別復雜系數介于0.47~0.92之間;文獻[5]方法由于算法步驟復雜,導致整體識別復雜度在0.9~1.2之間.本文方法利用人機交互的形式采集數據,并采用小波分析法對其中的噪聲信號進行抑制與清除,為降低故障數據屬性識別復雜度提供了有利依據.
識別精度D是表示故障識別結果與故障真實情況的接近程度,其計算表達式為
(9)
式中:GS為準確識別故障屬性個數;GV為總體故障個數.仿真得到的不同方法識別精度對比結果如圖4所示.

圖4 不同方法識別精度對比Fig.4 Comparison of recognition accuracy with different methods
由圖4可知,與其他方法相比,本文方法運行準確率呈現出了很強的優勢.文獻[4]方法的識別精度波動較大,平均識別精度在53%;文獻[5]方法的識別精度可穩定在75%左右;而本文方法平均識別精度可達91%.本文方法采用滑動窗口進行界面故障數據屬性識別,該技術通過一個動態性可調整的窗口對所有工況樣本進行控制,不僅能夠反映出工況產生的變化,還能夠控制樣本集合的大小,有效提高了故障數據識別精度.
查全率R表示識別出相關的故障數據量與總量的比率,其計算公式為
(10)
式中:HS為識別故障數據個數;HV為數據總量.仿真得到的不同方法查全率對比結果如圖5所示.

圖5 不同方法查全率對比Fig.5 Comparison of recall rates with different methods
分析圖5可知,本文方法平均查全率可達到95%,而文獻[4]方法查全率均在80%以下,文獻[5]的方法查全率可達到90%,但不穩定.本文方法將采集到的數據噪聲信號劃分成有色噪聲和白噪聲,并利用小波分析法進行了剔除,在提高識別精度的基礎上,對于無噪聲干擾的數據進行識別,能夠增加故障數據屬性識別查全率.
界面故障數據屬性識別一直是設備檢修與維護的重點研究方向,為更好地解決當前方法存在的問題,本文提出基于人機交互的界面故障數據屬性識別方法.故障數據屬性識別過程中,利用人機交互技術采集數據,結合計算機操作來輔助完成界面故障數據的采集,有效快速提取故障數據,解決傳統方法數據提取慢的問題.在去除數據噪聲時,考慮到數據流的動態性,結合滑動窗口實現數據屬性分類識別,提高數據流的傳輸速度,實現數據屬性分類識別.實驗結果表明,所提方法性能較為完善,具有可行性.