馬大中 胡旭光 孫秋野 鄭君 王睿
隨著信息和通信技術(shù)的不斷進步與發(fā)展,工業(yè)系統(tǒng)依靠智能化的檢測執(zhí)行設(shè)備、可靠的網(wǎng)絡(luò)通信以及高度集成的決策分析信息促使工業(yè)系統(tǒng)物理設(shè)備及信息空間的聯(lián)系更加緊密.異構(gòu)空間融合發(fā)展的過程衍生出靈活高效的信息物理系統(tǒng)(Cyberphysical systems,CPS)[1-3].由于系統(tǒng)具有實時、高效、高性能的特點,同時能夠有效地實現(xiàn)工業(yè)過程穩(wěn)定有效的監(jiān)測與控制,信息物理系統(tǒng)成為未來工業(yè)4.0計劃的核心基礎(chǔ).
作為工業(yè)信息物理系統(tǒng)的典型應(yīng)用,輸油管網(wǎng)系統(tǒng)已經(jīng)從管道自動化網(wǎng)絡(luò)發(fā)展成融合管道設(shè)備、通信體系以及信息網(wǎng)絡(luò)的復(fù)雜智能化網(wǎng)絡(luò)體系.由于輸油管網(wǎng)在保障能源供應(yīng)、維護能源安全方面具有重要價值,因此在日常生產(chǎn)調(diào)度中需要實時監(jiān)測管網(wǎng)物理空間異常情況[4].文獻[5]采用泵狀態(tài)、閥門開度以及管道設(shè)計參數(shù)等變量建立管道模糊分類模型,從而完成對管道運行狀態(tài)的判斷分類.文獻[6-7]從單條管道壓力時間序列出發(fā)對泄漏異常情況進行診斷和定位,文獻[6]采用結(jié)構(gòu)相似度準則判斷泄漏情況并且確定泄漏位置,同時文獻[7]通過馬爾科夫鏈提取管道壓力數(shù)據(jù)特征進行異常檢測并且采用相似性和連續(xù)小波定位方法找出泄漏源位置.文獻[8]將小波提取的管道壓力拐點時間作為特征對雙支持向量機進行訓(xùn)練完成對管道泄漏點的定位.隨著管網(wǎng)信息物理系統(tǒng)進一步發(fā)展,系統(tǒng)內(nèi)部產(chǎn)生與累積了海量過程數(shù)據(jù),機器學(xué)習(xí)方法由于其強大的數(shù)據(jù)挖掘能力,迅速的分析速度以及良好的泛化性能[9-11],尤其是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)自主挖掘圖像深度特征的能力,因而廣泛用于管道系統(tǒng)中,為管網(wǎng)系統(tǒng)的異常檢測、分析和運行等提供了直接或輔助的決策.文獻[12]提出一種融合一維卷積神經(jīng)網(wǎng)絡(luò)和支持向量機的方法檢測管網(wǎng)泄漏情況.文獻[13]通過卷積神經(jīng)網(wǎng)絡(luò)對管道漏磁圖像進行訓(xùn)練,進而識別出管道的缺陷區(qū)域和非缺陷區(qū)域.通過對卷積神經(jīng)網(wǎng)絡(luò)增加視覺轉(zhuǎn)化層,文獻[14]可以準確地辨識不同形狀和大小的缺陷特征.除了對缺陷進行識別以外,文獻[15]使用卷積神經(jīng)網(wǎng)絡(luò)對管道焊縫法蘭組件進行識別,并且結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)對漏磁圖像具有良好的位移和畸變魯棒性.
此外隨著管網(wǎng)系統(tǒng)物理空間和信息網(wǎng)絡(luò)深度融合和實時交互,信息網(wǎng)絡(luò)的功能不斷升級改造使得管網(wǎng)系統(tǒng)的可觀測性不斷增強,管網(wǎng)系統(tǒng)的功能和作用范圍得到極大擴展.但是與此同時,信息網(wǎng)絡(luò)也增加了管網(wǎng)系統(tǒng)的復(fù)雜性和不確定性,給管網(wǎng)系統(tǒng)帶來新的安全問題.信息網(wǎng)絡(luò)的異常會導(dǎo)致管網(wǎng)系統(tǒng)設(shè)備失去控制造成甩泵、閥門關(guān)斷等緊急運行情況,如果處置不當(dāng)甚至?xí)T發(fā)連鎖故障使得管網(wǎng)全線停輸[16-17].文獻[18]對管道SCADA系統(tǒng)信息傳輸中斷的原因及保護措施進行了全面的分析.由上述文獻可知,對信息傳輸中斷或者數(shù)據(jù)傳輸錯誤異常進行快速檢測具有重要意義,及早發(fā)現(xiàn)信息異常能夠避免重大安全事故的發(fā)生.
綜上所述,為了能夠區(qū)分管網(wǎng)不同空間異常變化情況,本文以管網(wǎng)系統(tǒng)信息數(shù)據(jù)為基礎(chǔ),提出一種數(shù)據(jù)特征融合的管網(wǎng)信息物理異常診斷方法.通過對站場信息數(shù)據(jù)構(gòu)建信息增維協(xié)方差矩陣實現(xiàn)數(shù)據(jù)特征的融合.在利用矩陣特征值分布情況實現(xiàn)信息異常判斷的同時,將矩陣最大特征向量轉(zhuǎn)換成的圖像作為輸入,通過卷積神經(jīng)網(wǎng)絡(luò)完成不同物理異常的分析.本文創(chuàng)新點在于:
1)提出一種基于數(shù)據(jù)特征融合的管網(wǎng)信息物理異常診斷方法.首先通過信息增維協(xié)方差矩陣最大特征值對管網(wǎng)不同異常類型情況進行檢測和分析,進而在此基礎(chǔ)上通過矩陣最大特征向量映射的圖像完成對物理異常的分析.
2)針對管網(wǎng)系統(tǒng)的海量信息數(shù)據(jù),采用隨機矩陣譜理論實現(xiàn)數(shù)據(jù)特征的構(gòu)建.通過管網(wǎng)各個站場信息數(shù)據(jù)構(gòu)建信息增維協(xié)方差矩陣數(shù)據(jù)特征,從而能夠在有效地降低數(shù)據(jù)輸入量的基礎(chǔ)上對管網(wǎng)進行實時分析.
3)采用集中–分布協(xié)同檢測形式完成對管網(wǎng)異常情況的檢測.通過信息增維協(xié)方差矩陣最大特征值完成管網(wǎng)異常情況的判斷,然后通過選取的管網(wǎng)全部站場的矩陣最大特征向量完成物理異常診斷,從而實現(xiàn)站場異常診斷與信息物理異常分類的有機結(jié)合,提高了異常診斷響應(yīng)能力.
本文其余內(nèi)容安排如下:第1節(jié)根據(jù)管網(wǎng)特性對站場數(shù)據(jù)進行梳理,建立起管網(wǎng)的信息物理系統(tǒng)模型;第2節(jié)介紹基于信息增維協(xié)方差矩陣的管網(wǎng)信息物理異常診斷方法;第3節(jié)通過仿真實例驗證本文所提出方法的有效性;最后,給出了本文的結(jié)論.
輸油管網(wǎng)模型是信息物理異常診斷的基礎(chǔ),所建立的模型結(jié)構(gòu)既要從全局上描述整個系統(tǒng),又要兼顧各個站場在系統(tǒng)中的功能和地位.輸油管網(wǎng)具有網(wǎng)絡(luò)狀拓撲結(jié)構(gòu)并且管道內(nèi)油品具有方向性,因此本文采用有向拓撲圖理論進行研究分析.假設(shè)管網(wǎng)系統(tǒng)表示為有向圖,其中(n為節(jié)點數(shù)目),(m為邊連接數(shù)目).在管網(wǎng)信息物理系統(tǒng)中,節(jié)點表示站場物理及信息節(jié)點,并且不同節(jié)點通過連接邊完成能量及信息流傳遞,最終實現(xiàn)管網(wǎng)系統(tǒng)的平穩(wěn)運行和完成額定輸油計劃.
管網(wǎng)圖論模型是設(shè)備硬件等物理組元和管道數(shù)據(jù)等信息組元的綜合反映,同時也是系統(tǒng)集成的基礎(chǔ).因為管網(wǎng)信息物理系統(tǒng)是一個融合物理實體設(shè)備與信息數(shù)據(jù)網(wǎng)絡(luò)的海量異構(gòu)系統(tǒng),所以從物理信息融合交互角度對管網(wǎng)的數(shù)據(jù)結(jié)構(gòu)進行劃分,具體結(jié)構(gòu)如圖1所示.
在物理網(wǎng)絡(luò)中,節(jié)點表示實際存在的數(shù)據(jù)站場并且通過長距離密閉輸油管道實現(xiàn)油品的輸送.在實際輸油管網(wǎng)系統(tǒng)中,通常采用管道兩端壓力和流量評價和分析管網(wǎng)運行情況,因此本文定義用于管網(wǎng)系統(tǒng)異常分析的信息數(shù)據(jù)為壓力、流量.定義t時刻站場k的信息數(shù)據(jù)zk(t)為

其中,h(x)為非線性測量函數(shù),為站場k的測量向量,α為測量噪聲,站場編號k=1,2,···,n.

圖1 管網(wǎng)信息物理系統(tǒng)結(jié)構(gòu)Fig.1 CPS structure of pipeline network
因為信息節(jié)點矩陣Dk(Dk∈Rnk×ts)每一行表示為信息數(shù)據(jù)的時間序列,因此為了能夠突顯信息數(shù)據(jù)的變化以及保持數(shù)據(jù)變化的連續(xù)性,對矩陣Dk(Dk∈Rnk×ts)行向量依次增維次,構(gòu)成如式(4)所示的增維矩陣.

為提高采集的數(shù)據(jù)可靠性,管網(wǎng)會安裝多個設(shè)備采集同一信息數(shù)據(jù),所以同一采樣時刻信息數(shù)據(jù)可以描述為向量zk(t)

其中,j為采集同一信息數(shù)據(jù)量的設(shè)備個數(shù).
多元信息網(wǎng)絡(luò)是由實際物理設(shè)備采集到的實時信息數(shù)據(jù)構(gòu)成的,用于判斷和分析管道的運行狀態(tài).因為管網(wǎng)系統(tǒng)為有向圖結(jié)構(gòu),為了能夠?qū)崟r反映站場數(shù)據(jù)流情況,定義nk維的站場信息節(jié)點向量為

其中,z(t)in為站場k的進站信息數(shù)據(jù)向量,為站場k的出站信息數(shù)據(jù)向量.p和f分別表示為站場壓力和流量,上標in和out分別表明數(shù)據(jù)的采集點為進站位置和出站位置.
假設(shè)管網(wǎng)系統(tǒng)信息節(jié)點向量dk(t)通過ts次采樣后構(gòu)成行為信息數(shù)據(jù),列為時間長度的矩陣Dk(Dk∈Rnk×ts).為進一步通過管網(wǎng)信息數(shù)據(jù)情況判斷出管網(wǎng)異常情況,本文將站場信息節(jié)點向量dk(t)進行增維實現(xiàn)突出信息數(shù)據(jù)變化情況的目的.由于管網(wǎng)中各個站場的壓力變送器、流量計設(shè)備類型及數(shù)量各不相同,所以設(shè)置增維變量,根據(jù)實際管網(wǎng)站場情況對信息節(jié)點矩陣實現(xiàn)不同程度地增維.
為了闡述本文提出的異常診斷方法,本節(jié)以站場k的信息物理異常診斷為例進行說明,并且定義物理異常為工況調(diào)整和泄漏,信息異常為信息傳輸中斷和信息傳輸錯誤.在第1節(jié)建立管網(wǎng)信息物理系統(tǒng)增維矩陣的基礎(chǔ)上,依據(jù)隨機矩陣理論[19]構(gòu)建信息增維協(xié)方差矩陣.接著通過站場信息增維協(xié)方差矩陣最大特征值的變化區(qū)別出物理異常和信息傳輸錯誤異常,最后通過矩陣最大特征向量融合映射成的圖像完成不同物理異常的區(qū)分.

其中,tb為系統(tǒng)允許的最大數(shù)據(jù)中斷時間.
在確保站場k數(shù)據(jù)可靠性的基礎(chǔ)上,將隨機噪聲引入矩陣保證信息數(shù)據(jù)間的獨立性,減少由于增維過程帶來的數(shù)據(jù)高度一致性,從而完成構(gòu)建信息增維協(xié)方差矩陣的第一步.構(gòu)建的信息增維矩陣如下所示.

其中,Ak為增加的隨機噪聲幅值,G為標準高斯噪聲矩陣.

其中,i=1,2,···,,t=1,2,···,ts,分別為矩陣第i行的均值和標準差.

根據(jù)隨機矩陣MP律可知,當(dāng)管網(wǎng)系統(tǒng)處于平穩(wěn)運行狀態(tài)時,信息數(shù)據(jù)不會出現(xiàn)明顯地變化,矩陣特征值的分布滿足[19]

因此為了檢測站場k的信息傳輸異常和物理異常情況,本文采用矩陣最大特征值分析判斷站場k的信息數(shù)據(jù)變化情況,當(dāng)站場最大特征值滿足下式時,表明ts時刻站場k發(fā)生異常情況.

其中,γ為設(shè)定的異常閾值,λset為預(yù)先定義的增維協(xié)方差矩陣的最大理論特征值.
根據(jù)輸油管網(wǎng)特性可知,當(dāng)站場k的信息增維矩陣最大特征值滿足式(10)時,需要進一步綜合管網(wǎng)其余站場信息數(shù)據(jù)進行物理信息異常的分析.為了能夠區(qū)分信息異常和物理異常,首先定義最大站場數(shù)據(jù)傳輸時間tg為

其中,tthr為數(shù)據(jù)傳輸延遲時間,站場數(shù)據(jù)傳輸時間為


圖2 管網(wǎng)卷積神經(jīng)網(wǎng)絡(luò)模型Fig.2 CNN structure of pipeline network
其中,Lkg為站場k和g間的管道長度,vkg為站場間負壓波速.
當(dāng)相鄰站場g的信息增維協(xié)方差矩陣經(jīng)過長度為tg的采樣時間后未滿足式(10),則表明ts時刻站場k的信息數(shù)據(jù)改變是由信息傳輸錯誤異常引起的.
在信息增維協(xié)方差矩陣特征值實現(xiàn)信息異常判斷的基礎(chǔ)上,為了對物理異常進行分析,本文采用卷積神經(jīng)網(wǎng)絡(luò)進行物理異常類型的識別.首先從管網(wǎng)站場的信息增維協(xié)方差矩陣最大特征向量中選取維的最大特征向量,然后將選取的最大特征向量按照管網(wǎng)站場輸油順序進行排列,將tn秒數(shù)據(jù)構(gòu)成維度為的矩陣;接著根據(jù)矩陣內(nèi)的數(shù)值情況將矩陣內(nèi)元素映射為0~255范圍內(nèi)的數(shù)字,從而得到維的灰度圖;最后通過偽彩色變換實現(xiàn)灰度圖向RGB圖像的轉(zhuǎn)換.在得到輸入圖像后,通過卷積神經(jīng)網(wǎng)絡(luò)的卷積核和池化窗進行特征自主提取,使最大特征向量包含的信息經(jīng)過非線性模型轉(zhuǎn)化為更抽象的特征,最終完成物理異常的識別[20-21].
針對管網(wǎng)系統(tǒng)物理異常分類問題構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)如圖2所示,由4個卷積層、4個批正則化層、4個池化層、1個全連接層以及1個Softmax回歸層組成.
圖2中的卷積層包含卷積運算和非線性運算兩種計算結(jié)構(gòu),卷積層圖像的特征向量是由卷積核的尺寸決定的,將上一層的輸出與當(dāng)前層32個大小為5×5的卷積核進行卷積運算,然后通過激活函數(shù)對卷積結(jié)果進行非線性運算,也就是說通過非線性函數(shù)和加入偏置項得到最終當(dāng)前層的輸出特征映射Xc+1.

為了能夠提升卷積神經(jīng)網(wǎng)絡(luò)的模型擬合能力,在圖2卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中加入批正則化層,對卷積層輸出特征進行正則化處理,使得圖像數(shù)據(jù)特征的分布更加均勻.
接著池化層的每個神經(jīng)元對局部接收區(qū)域進行池化操作,起到二次特征提取及實現(xiàn)非線性降采樣運算的作用,進而得到池化層輸出圖像的特征向量.本文中池化層的池化窗大小為2×2,步長為2,并且神經(jīng)元表達式為

其中,down(·)為最大值池化函數(shù).Φ 和b分別為權(quán)重系數(shù)向量和偏置系數(shù)向量.
在經(jīng)過12層網(wǎng)絡(luò)的圖像特征提取之后,將特征圖輸入到具有1024個神經(jīng)元的全連接層,通過全連接將提取的特征圖連接成一個一維向量.進而將其輸入到Softmax回歸層進行物理異常的分類.
基于上述分析可知:當(dāng)站場k信息數(shù)據(jù)發(fā)生改變時,根據(jù)信息增維協(xié)方差矩陣最大特征值和最大特征向量的變化可以診斷出管網(wǎng)信息物理異常,并且基于數(shù)據(jù)特征的管網(wǎng)異常診斷方法的流程圖如圖3所示.
為了驗證所提方法的有效性,本文采用Matlab完成對不同算例數(shù)據(jù)的仿真及分析.并且每個算例中均包含不同類型的異常樣本及診斷過程的描述.所有測試結(jié)果均在一臺配備Intel Core i7-6700CPU、8GB內(nèi)存的計算機上實現(xiàn).并且仿真數(shù)據(jù)選取某輸油管網(wǎng)近5年的工況調(diào)整數(shù)據(jù)、放油測試以及調(diào)試時產(chǎn)生的信息異常數(shù)據(jù).為了能夠滿足卷積神經(jīng)網(wǎng)絡(luò)對于樣本的要求,本文通過對現(xiàn)有物理異常數(shù)據(jù)的泛化實現(xiàn)樣本數(shù)量的增加.所以最后訓(xùn)練和測試卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集共包含26500個數(shù)據(jù)樣本,其中物理異常工況調(diào)整樣本為14000個,不同程度地泄漏樣本為12500個.在管網(wǎng)輸送油品到各個站場時,管網(wǎng)調(diào)控中心及相應(yīng)站場會對站內(nèi)閥門、主輸泵等設(shè)備進行操作,由于此類操作有時會使管網(wǎng)信息數(shù)據(jù)產(chǎn)生類似泄漏情況的變化,并且可能會傳播到管網(wǎng)沿線其他站場,所以在本文中定義由正常操作引起的數(shù)據(jù)改變?yōu)楣r調(diào)整樣本;泄漏樣本定義為管網(wǎng)放油測試以及程序調(diào)試時通過閥室及站內(nèi)調(diào)節(jié)閥模擬產(chǎn)生的管網(wǎng)泄漏數(shù)據(jù).訓(xùn)練樣本和測試樣本分別為總樣本數(shù)量的80%和20%.為了模擬實際現(xiàn)場情況,檢驗?zāi)P偷姆夯芰?在測試過程中,將部分工況調(diào)整及泄漏樣本作為未知樣本進行測試,其比例占全部測試樣本的20%.仿真參數(shù)為:管網(wǎng)站場增維矩陣的維度為30×60,站場信息增維協(xié)方差矩陣的最大特征向量的維度為30×30,,tn=300,因此卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像維度是60×300,最大允許數(shù)據(jù)中斷時間tb為10s以及最大傳輸延遲長度tthr為3s.異常閾值γ為1.2,管網(wǎng)信息增維協(xié)方差矩陣最大理論特征值λset為0.1.卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)為初始化學(xué)習(xí)率為10-4,損失函數(shù)為交叉熵函數(shù),最大迭代次數(shù)為20次,卷積層權(quán)重系數(shù)向量參數(shù)由卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練獲得,其余參數(shù)如圖2所示.
為了說明本文提出的檢測方法對信息傳輸中斷異常的有效性,以圖4所示的管網(wǎng)某管道調(diào)試時的壓力曲線為例進行說明.管道上、下游站場分別為管網(wǎng)中的第2個和第3個分輸站場.管道下游站場通過式(5)進行分析計算,當(dāng)采樣時刻達到326s時,計算第317s至第326s的增維矩陣的數(shù)據(jù)可靠性,發(fā)現(xiàn)下游站場數(shù)據(jù)滿足式(5),因此判斷下游站場發(fā)生信息傳輸中斷異常.
此外,選取如圖5所示的管網(wǎng)站場2和站場3的異常壓力曲線對信息傳輸錯誤異常進行說明.從圖5中得知:采樣時間為324s時,下游站場壓力由1.748MPa下降至1.746MPa,超過了平時壓力波動范圍.
基于數(shù)據(jù)特征融合的異常診斷方法首先通過式(5)驗證增維矩陣滿足數(shù)據(jù)可靠性,進而采用式(6)~(8)構(gòu)建信息增維協(xié)方差矩陣和.通過圖6(a)可知,在采樣時間ts=325s時,站場3的信息增維協(xié)方差矩陣最大值為0.1294,超過了式(10)所設(shè)定的閾值0.12.因此,判斷下游站場(站場3)發(fā)生異常情況.為進一步確定異常類型,對上游站場(站場2)的壓力進行分析.當(dāng)上游站場采樣時間超過最大站場數(shù)據(jù)傳輸時間tg=61s時,通過圖6(a)可知上游站場信息增維協(xié)方差矩陣的最大值在此時間段內(nèi)并未超過閾值.因此根據(jù)圖3流程圖可知,下游站場(站場3)發(fā)生信息傳輸錯誤異常.
選取如圖7所示的管網(wǎng)工況調(diào)整曲線對工況調(diào)整的物理異常進行檢測.
按照第2節(jié)所示診斷流程,首先分別對管網(wǎng)6個站場進行數(shù)據(jù)預(yù)分析,然后再構(gòu)建站場信息增維協(xié)方差矩陣.接著通過式(10)得到管網(wǎng)6個站場的信息增維協(xié)方差矩陣的最大特征值.管網(wǎng)站場最大特征值計算結(jié)果如圖8所示.通過圖8可知,站場4的最大特征值在800s時超過設(shè)置的閾值.然后根據(jù)圖3所示流程圖判斷其他站場的最大特征值曲線,通過圖8其余站場最大特征值曲線發(fā)現(xiàn)相鄰站場均在不同時間發(fā)生最大特征值改變,因此判斷站場4發(fā)生物理異常.

圖3 管網(wǎng)信息物理異常診斷流程圖Fig.3 Flowchart of pipeline network for cyber-physical abnormity diagnosis
然后選取管網(wǎng)站場信息增維協(xié)方差矩陣最大特征向量組成60×300維的矩陣.如圖9所示,為了判斷物理異常類型,首先將最大特征向量構(gòu)成的矩陣通過灰度圖映射為彩色圖,接著將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,通過之前訓(xùn)練好的網(wǎng)絡(luò)得到站場4發(fā)生的物理異常為工況調(diào)整.卷積神經(jīng)網(wǎng)絡(luò)對于圖7所示的異常壓力曲線的分析結(jié)果與實際工況調(diào)整相符(站場4進行輸油調(diào)壓).

圖4 管道信息中斷壓力曲線Fig.4 Pipeline cyber interrupt pressure

圖5 管道信息錯誤壓力曲線Fig.5 Pipeline cyber error pressure
信息物理異常診斷方法除了需要對工況調(diào)整作出準確地識別以外,還需要對管網(wǎng)站場發(fā)生的泄漏情況進行分析.因此本算例通過站場2放油測試產(chǎn)生的壓力曲線(圖10)進行泄漏異常診斷.
通過圖10可知,站場2壓力曲線從380s附近開始下降,并且從圖11可以看出站場2的最大特征值從382s開始超過了設(shè)定的閾值.并且在430s時站場3的最大特征值呈現(xiàn)出上升趨勢.兩個站場在最大站場數(shù)據(jù)傳輸時間內(nèi)相繼出現(xiàn)最大特征值上升的情況,表明管網(wǎng)發(fā)生物理異常.

圖6 管道壓力最大特征值曲線Fig.6 Max eigenvalue curves of pipeline pressure
為了進一步判別該異常的類型,在經(jīng)過251s的采樣后,將管網(wǎng)站場信息增維協(xié)方差矩陣的最大特征向量轉(zhuǎn)化為如圖12所示的RGB圖像.利用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)對該圖像進行圖像特征提取,卷積層1和卷積層4得到的圖像特征向量如圖12所示.在完成特征提取后,將一維特征向量輸入到Softmax回歸層,最終得到站場2的物理異常類型為泄漏.

圖7 管網(wǎng)工況調(diào)整壓力曲線Fig.7 Pipeline network operation adjustment pressure

圖8 管網(wǎng)壓力最大特征值曲線Fig.8 Max eigenvalue curves of pipeline network pressure

圖9 卷積神經(jīng)網(wǎng)絡(luò)輸出特征圖Fig.9 Output feature of CNN

圖10 管道泄漏壓力曲線Fig.10 Pipeline leakage pressure
在管網(wǎng)物理泄漏異常診斷當(dāng)中,異常診斷方法需要識別出站場出現(xiàn)的緩慢泄漏情況.因此,選取如圖13所示的站場3和站場4的壓力變化曲線進行闡述.該變化曲線是由閥室開閥放油測試產(chǎn)生的.

圖11 管道壓力最大特征值曲線Fig.11 Max eigenvalue curves of pipeline network pressure

圖12 卷積神經(jīng)網(wǎng)絡(luò)輸出特征圖Fig.12 Output feature of CNN
如圖13所示,在采樣時刻ts=450s附近,上、下游站場壓力開始緩慢下降并且壓力下降值小于0.01MPa.對管網(wǎng)6個站場的信息節(jié)點矩陣通過增維變量進行增維,經(jīng)過式(5)~(10)分析得到如圖14所示的站場3和站場4的最大特征值曲線:在480s附近,上、下游站場最大特征值均超過最大特征值異常閾值1.2,表明站場4發(fā)生物理異常情況.接著將管網(wǎng)6個站場的信息增維協(xié)方差矩陣最大特征向量轉(zhuǎn)化為圖15所示的輸入層圖像.然后通過圖2所示的卷積層提取圖像特征,接著將提取到的一維特征向量輸入到圖2所示的Softmax回歸層中進行判別,最后得到站場4的物理異常是由泄漏引起的.

圖13 管道泄漏壓力曲線Fig.13 Pipeline leakage pressure

圖14 管道壓力最大特征值曲線Fig.14 Max eigenvalue curve of pipeline network pressure

圖15 卷積神經(jīng)網(wǎng)絡(luò)輸出特征圖Fig.15 Output feature of CNN
綜合算例二的結(jié)果可知,通過數(shù)據(jù)特征融合的信息物理異常診斷方法能夠有效地判斷出不同的物理異常類型.為了檢驗卷積神經(jīng)網(wǎng)絡(luò)對工況調(diào)整及泄漏異常的識別能力,對測試樣本進行50次實驗,在50次統(tǒng)計測試實驗中,全部測試樣本中工況調(diào)整樣本數(shù)量為2800個,泄漏樣本的個數(shù)為2500.并且統(tǒng)計結(jié)果如表1所示.

表1 物理異常統(tǒng)計結(jié)果Table 1 The statistical result of physical abnormity
從表1可以看出工況調(diào)整樣本的錯誤分類數(shù)為104個,并且泄漏測試樣本的錯誤分類數(shù)為145個.兩種物理異常的判斷結(jié)果均在95%附近,表明卷積神經(jīng)網(wǎng)絡(luò)對于不同物理異常樣本的識別有著較好的分類效果.如果在訓(xùn)練過程中包含全部物理異常類型的樣本,那么測試精度會達到99%以上.
為了進一步表明文中提出方法在實際應(yīng)用中的優(yōu)勢,將本文提出的方法和參考文獻[7]、反向傳播神經(jīng)網(wǎng)絡(luò)(Back propagation neural network,BPNN)、支持向量機 (Support vector machine,SVM)的方法進行了對比.
在仿真對比中,參考文獻[7]采用發(fā)生物理異常的管道兩端壓力進行分析,并且采用相同的樣本對BPNN、SVM 進行訓(xùn)練,其中BPNN是由三層神經(jīng)網(wǎng)絡(luò)組成,隱含層神經(jīng)元的個數(shù)為6,并且隱含層的傳遞函數(shù)為tan-sigmoid;SVM的核函數(shù)為徑向基函數(shù),并且通過網(wǎng)格搜索算法來優(yōu)選SVM參數(shù).不同方法間的精度對比結(jié)果如表2所示.

表2 不同方法物理異常精度對比Table 2 Comparison of accuracy among different methods
從表2中可以看出,本文所提的方法在兩種物理異常的識別中均優(yōu)于其他三種方法.由于成品油是在密閉管道內(nèi)輸送,壓力會隨著距離不斷衰減,參考文獻[7]主要針對單條管道進行異常檢測,所以該方法無法對管網(wǎng)沿線的操作進行有效地識別,從而導(dǎo)致誤報警出現(xiàn).因此,該方法對于工況調(diào)整和泄漏的識別精度較低.BPNN和SVM方法采用管網(wǎng)數(shù)據(jù)進行識別,所以方法靈敏度、特異度以及準確率都比參考文獻[7]要高.雖然三種不同的方法均能夠得到較好的效果,但是靈敏度、特異度以及準確率均低于本文所提的方法.出現(xiàn)該現(xiàn)象的原因在于卷積神經(jīng)網(wǎng)絡(luò)的輸入為管網(wǎng)信息增維協(xié)方差均值的最大特征向量圖像,而非手工提取的特征,信息更加全面,能夠挖掘出隱藏在圖像背后的深層特征.
此外,為了對比不同方法間的計算量,測試時間定義為方法得到一次樣本結(jié)果所需的平均計算時間.不同方法的訓(xùn)練時間及測試時間結(jié)果如表3所示.

表3 不同方法物理異常計算時間對比Table 3 Comparison of computing time among different methods
從表3中可以看到,本文所提方法的訓(xùn)練時間比另外三種方法的時間要長.其原因在于本文所提的方法需要將信息增維協(xié)方差矩陣的最大特征向量轉(zhuǎn)化成圖像,進而使用卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練和測試,并且卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)及結(jié)構(gòu)較為復(fù)雜,所以訓(xùn)練時間較長.因為網(wǎng)絡(luò)訓(xùn)練是離線進行的,所以不同的訓(xùn)練時間對于在線實時檢測來說是一樣的.雖然本文提出的方法是采用管網(wǎng)數(shù)據(jù)進行測試,測試時間較長,但是仍然沒有超過1s.
因此,本文提出的方法能夠兼顧管網(wǎng)異常診斷精度以及實時性,能夠在較短的時間內(nèi)準確地判斷出運行情況,從而確保管道的安全.
針對管網(wǎng)不同類型的信息物理異常,本文提出一種基于數(shù)據(jù)特征融合的管網(wǎng)信息物理異常診斷方法.從信息網(wǎng)絡(luò)角度將站場壓力、流量作為信息數(shù)據(jù)進行分析,通過對信息數(shù)據(jù)增維的方式突出信息數(shù)據(jù)的變化情況.接著通過構(gòu)建的信息增維協(xié)方差矩陣預(yù)分析以及矩陣最大特征值的變化情況得到不同信息異常類型的分析結(jié)果.當(dāng)多個站場最大特征值發(fā)生改變時,將協(xié)方差矩陣最大特征向量映射的二維圖像作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,最終實現(xiàn)對站場工況調(diào)整和泄漏兩種不同物理異常的分析.通過大量實際數(shù)據(jù)樣本的仿真研究表明,本文提出的方法能夠有效地檢測管網(wǎng)信息物理異常情況.
此外為了能夠提高測試精度,可以采用增加訓(xùn)練樣本以及多次多折交叉驗證進行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練.雖然本文提出的方法能夠診斷出管網(wǎng)信息物理異常,但是需要進一步確定泄漏源位置.因此下一步的研究方向為繼續(xù)研究深度學(xué)習(xí)機理,進一步探索泄漏源位置定位方法.