999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

供熱管網運行數據異常校正方法研究

2020-11-18 02:15:42郭佳昌薛普寧周志剛
煤氣與熱力 2020年11期
關鍵詞:模型

郭佳昌, 蘭 蕓, 薛普寧,周志剛, 劉 京

(1.哈爾濱工業大學建筑學院,黑龍江哈爾濱150006;2.哈爾濱工業大學,寒地城鄉人居環境科學與技術工業和信息化部重點實驗室,黑龍江哈爾濱150006;3.中國中車長春軌道客車股份有限公司,吉林長春130062)

1 概述

21世紀的互聯網時代,信息化發展成為我國供熱行業發展和進步的焦點,其中信息采集和傳輸已經成為供熱系統不可或缺的一部分。但目前對于這樣海量的“大數據”,利用方式仍停留在簡單的統計分析階段,沒有讓這些數據體現真正的價值。供熱數據深度挖掘的實現,不僅對數據數量有所要求,數據質量也必須有所保證,因此在供熱系統運行數據庫中篩選異常數據,進一步甄別數據異常的真偽,研究數據校正是實現供熱大數據真正價值的基礎,對于供熱“智能化”和“智慧化”發展有著重要的意義。本研究的目的在于探尋供熱管網數據采集系統上傳信息的數據校正方法,識別出其中含有的錯誤信息,并將其值修正至合理范圍。校正后的數據應能夠更準確地描述供熱管網實際運行狀況,以便研究人員對數據進行更深入的信息挖掘,獲得難以觀察的管網運行規律,優化調節方案以及診斷系統故障等。

在暖通空調領域,許多學者也開展了數據校正技術的研究。崔治國等人[1-2]提出了1種基于k-means聚類算法的空調運行數據判別方法。Chen等人[3-5]則在研究空調系統冷水機組故障診斷問題時提出將小波分析用于數據去噪處理的方法。吳蔚沁[6]結合了閾值法和k-means算法進行數據異常標定和識別,采用KNN算法進行異常修復,構建了1套公共建筑能耗監測數據校正方法。楊東雄[7]提出了1種基于BP神經網絡和k-means聚類算法的誤差甄別方法。李思璐[8]則遵循著化工領域數據校正技術的發展路線,研究比較了3種非穩態系統數據在線校正的方法,并得出了中值濾波法更適用于供熱管網數據的過失誤差偵破。

為了實現供熱管網中異常數據的校正,本文建立空間管網水力計算模型對運行數據源進行拓展,根據仿真所得數據源建立基于孤立森林的異常檢測模型以及基于BP神經網絡的異常識別模型,對異常數據進行替換。然后,基于訓練后的模型對實際工程數據進行驗證。

2 研究方法

2.1 水力仿真模型模擬運行數據集構建

① 水力仿真模型

通過建立供熱管網的水力計算模型,可以仿真不同的運行工況,由此獲得符合熱網運行規律且完備合理的拓展數據集,可以為數據校正方法提供數據基礎和評估依據。

實際供熱系統是由熱源、供水管網、回水管網和熱力站(熱用戶)組成的空間管網。根據圖論理論,可以將其簡化為只包含管段和節點2類元素的有向連通圖。管段是管網中流量和管徑均不發生變化的管道。節點是管段的端點,也是一些管段的交點。恒定流動的供熱系統的水力工況滿足基爾霍夫第一定律(質量守恒)和第二定律(能量守恒),即與任一節點相關聯的所有管段的管段流量代數和等于該節點的節點流量,以及任一回路的管段壓降代數和為0。基于此,可以構建如下水力仿真模型[9],見式(1)~(7):

AG=Q

(1)

BΔP=0

(2)

ΔP=ΔPw-ΔPp

(3)

ΔPw=SGdiaaG

(4)

ΔPp=C0+C1G+C2GdiaaG

(5)

式中A——基本關聯矩陣,n-1行,b列。其中n表示供熱系統的節點數目,b表示管段數目

G——管段質量流量列向量

Q——節點質量流量列向量

B——獨立回路矩陣,b-n+1行,b列

ΔP——管段壓力降列向量

ΔPw——管段阻力損失列向量

ΔPp——水泵揚程列向量

S——管段阻力特性系數對角矩陣

Gdiaa——管段質量流量的絕對值對角矩陣

C0——水泵特性系數列向量

C1,C2——水泵特性系數對角矩陣

矩陣A中元素aij的取值為

(6)

矩陣B中元素bkj的取值為

(7)

② 運行數據集的構建

利用式(1)~(7)對3類運行工況進行水力仿真,研究不同工況下管段流量與節點壓力的變化特征。構建供熱系統見圖1。該供熱系統是由1個熱源和6個熱力站構成的環狀供熱系統,其中ni為節點名稱,P為熱源名稱,ui為熱力站名稱。管段數目b為25,節點數目n為14。管段的水流方向以及環路的方向見圖2。熱源及熱力站的設計參數包括設計流量、熱源內部阻力損失以及管段設計阻力系數。供回水管段的設計參數包括管段長度、管段直徑、局部阻力折算系數以及管段設計阻力系數。供熱系統通常在熱源和各熱力站安裝有流量、壓力傳感器,因此,本文選取熱源質量流量、供水壓力以及各熱力站一次側質量流量、一次側供、回水壓力構建運行工況數據集。

圖1 供熱系統

圖2 算例平面圖

3類運行工況指:熱源集中運行調節、熱力站局部調節以及管網泄漏。

首先通過改變循環水泵調速比來模擬集中運行調節方案。此外,在熱源集中運行調節方案兩個相鄰階段之間,增添過渡調速比的工況,來模擬集中調節的過程。

改變熱力站阻力特性來模擬熱力站局部調節。對不同的管段和節點設定漏水率,來模擬節點與管段泄漏。對正常工況數據組替換其中某幾個(不超過5個)元素為隨機數,來模擬粗大誤差。添加的隨機誤差符合高斯分布。

2.2 基于孤立森林的數據異常檢測模型

① 用于孤立森林異常檢測模型的數據集構建

采用2.1節中的數據集構建方法,構建管網模擬運行數據集,稱為數據集A,包含4 349條數據記錄,每條數據記錄包含6個熱力站和熱源的管段質量流量和供回水壓力共20個數據。其中有211條異常數據記錄,由于運行工況變化導致的過程異常數據記錄共158條,隨機添加粗大誤差的測量異常數據記錄共53條。

② 孤立森林異常檢測模型

建立基于孤立森林的數據異常檢測模型可以從數據集中挖掘出異常的數據。孤立森林通過孤立對象來檢測異常,而不依賴任何距離和密度的測量和計算。它的算法選擇的是一種二叉樹結構,稱為“孤立樹(iTree)”,異常對象易受孤立,因此更容易被隔離在孤立樹的根部附近,即終止路徑長度更短,而正常點更容易被隔離在孤立樹更深層。這就是使用此方法檢測異常的方法基礎[10]。根據模擬運行數據集,以熱力站u1的所在管段質量流量以及進出口節點壓力為研究對象,其供熱運行數據記錄4 349條,異常數據占比約5%。

從模擬運行數據集中抽取每條數據中熱力站u1的管段質量流量、入口節點壓力和出口節點壓力,構成數據集B。

模型的構建分為訓練階段和評估階段。訓練階段,先從數據集B中隨機抽取一部分數據作為子采樣,用子采樣數據構造孤立樹。子采樣大小φ為256[11],孤立樹數量t為100,樣本污染率為10%。

評估階段,將數據集B作為待檢測的數據遍歷孤立樹,計算觀測對象在不同孤立樹的終止路徑長度,即樣本點從孤立樹的根節點到最后一片葉子節點所經歷的邊的數量。然后集成所有樹,計算平均路徑長度,即樣本點經歷所有孤立樹后終止路徑長度的平均值。最后對平均路徑長度歸一化處理后,得到該條記錄的異常分數。最后將所有數據記錄按照異常分數從高到低排列,把異常分數較高的440條數據記錄列為可疑數據對象,進一步探究其異常形成機制。

對于孤立森林算法模型的評價采用受試者工作特性曲線,簡稱ROC曲線[12],見圖3。它是以誤診率(FPR)為橫坐標,真正類率(TPR)為縱坐標,其中TPR反映的是在所有實際為異常的樣本中,被正確地判斷為異常的比率。FPR反映的是在所有實際為正常的樣本中,被錯誤地判斷為異常的比率。ROC曲線是通過改變異常分數的分數線生成的。ROC曲線上面的每一個點對應的是一個特定的異常分數線,高于異常分數線的記錄,認為是異常數據,反之則為正常數據。ROC曲線越靠近左上角說明分類模型的準確性越好。

圖3 基于孤立森林的異常檢測模型的ROC曲線

AUC值的定義為ROC曲線下的面積,一般為0.5~1。不同分類模型的ROC曲線可能交叉,難以比較分類結果優劣,用AUC值可以更直觀地獲知哪個模型的分類效果更好。模擬運行數據集采用孤立森林方法分類后計算得AUC值為0.978,說明建立的模型對于異常檢測的分類效果很好。

2.3 基于BP神經網絡的數據異常分類模型

建立基于BP神經網絡的數據異常分類模型,可以對經過異常檢測模型獲得的懷疑對象,進一步探究其背后的異常機制,以篩選出非供熱管網因素導致的真正的異常。BP神經網絡處理模式識別問題從數學本質上來講就是構建一種輸入與輸出之間的映射,而映射關系無需明確的數學表達,神經網絡模型通過對訓練樣本的學習,掌握其中的映射關系,測試樣本輸入訓練好的神經網絡模型就可以得到正確的輸出結果[13]。

本文采用含有3隱層的5層BP神經網絡結構。輸入層代表數據入口,負責接收輸入數據,輸出層代表模型出口,負責神經網絡的預測結果輸出。隱層連接輸入層與輸出層,對輸入向量進行特征提取,坐標變換后構成新的向量傳遞至輸出層決策輸出結果。參數更新過程中,加入一個新的參數η,稱為學習率,學習率在接近最優值過程中不斷減小,則網絡可以收斂到最優點附近更小的區域。本文中采用指數減緩的措施調整學習率,初始學習率設置為0.01[10]。

選取熱力站u1與鄰近熱力站u2和u4以及熱源P為觀測點,將非正常運行工況下或者含有隨機添加粗大誤差的情況下,與正常運行工況相比的節點供、回水壓力變化率和所在管段的質量流量變化率作為神經網絡的輸入,其中熱源回水壓力作為定壓點,取0,因此輸入層節點數為4個觀測點的3組數據共12個。對于隱層節點數的確定原則是[10]:在滿足誤差精度要求的前提下采用盡可能簡單的結構,即隱層節點數盡可能地小,本文中根據模型復雜程度取經驗值。神經網絡的輸出層具有一個輸出單元,輸出的是數據異常模式編碼,輸出編碼與異常模式的對應規則見表1。故本神經網絡結構為5層神經網絡,各層節點數為:12、10、10、5、1。為了避免不必要的數值問題并加速網絡的迭代收斂過程,對神經網絡的輸入與輸出數據進行歸一化處理。本文中神經網絡輸入的數據均采用相對變化率的無量綱數,輸出則是整數數值,因此采用最大-最小標準化對數據進行歸一化處理。本文選用ReLU函數作傳遞函數,權值初始化方法采用MSRA初始化。誤差函數選擇交叉熵函數。

表1 神經網絡輸出編碼規則

神經網絡數據樣本集的構造方法同2.1節,異常模式為1、2、3、4的數據組數分別為60、528、528、200,將該數據集稱為數據集C。對200組正常工況水力計算結果,隨機添加粗大誤差并計算變化率,構造異常模式為4的數據樣本。取各類異常模式數據總量的70%構成訓練集,剩余30%做測試集。

對測試集的分類結果在200次迭代計算中誤差不斷減小,經過150次迭代后計算已經收斂,迭代誤差精度小于1×10-9,滿足計算要求。4種異常模式的分類正確率均達到90%以上,說明模型訓練成功,異常分類性能良好。

對2.2節u1熱力站測試數據經過孤立森林異常檢測輸出的440條異常數據記錄,從模擬運行數據集中調取對應的熱源、u2和u4熱力站的數據記錄,計算各參數的變化率,構成u1熱力站異常分類模型驗證集,稱為數據集D。

將驗證集輸入訓練好的神經網絡模型進行異常分類,驗證集的分類正確率結果見表2,總體分類正確率為90.3%,與測試樣本集上模型分類的效果相比有所降低,說明模型將所學應用到新的環境條件時分類結果有所偏差,但總體達到90%以上,可以滿足工程需求。

表2 神經網絡模型在驗證集上的分類正確率

2.4 異常數據均值替換

對異常模式為4的異常數據進行替換就可以完成數據校正所有步驟。因為供熱系統穩定運行在某個工況時,管網各處的水力參數觀測值在時間序列上也是穩定或者圍繞真值小幅度波動的,因此,異常值前后時刻的數據對于需要替換的異常值具有很大的參考價值。因此選取異常值所在序列前后各5個鄰近序列的數據記錄,計算各屬性的平均值替換異常數據。

3 基于實際熱網數據源的數據校正方法應用

3.1 實際熱網數據源組成

以某一實際集中供熱系統驗證該數據校正方法。該供熱系統包含1個供熱首站和54個熱力站。研究對象選用編號為15的草埠站數據進行校正,熱力站所在的局部管網拓撲結構見圖4。數據記錄以小時計,從2017-11-15至2018-02-03共取得1 944組。選取圖中東軫站和銀海熙岸站兩處熱力站為觀測對象,用于BP神經網絡。在訓練基于BP神經網絡的異常分類模型時,由于供暖期數據采集時間較短,所獲取的數據集中包含的工況變化較少,為了驗證本文中提出的數據校正方法的有效性,此處按照2.1節人工數據集的拓展方法,隨機添加管網非正常運行工況水力仿真結果至原始數據,拓展后的數據集共包含數據記錄1 994條。

圖4 供熱管網局部拓撲結構

3.2 數據校正方法應用

將1 994組數據中草埠站供回水壓力以及質量流量作為待檢測的數據輸入孤立森林異常檢測模型。異常檢測模型參數設置為:樣本污染率為10%,子采樣規模大小φ為256,iTree數目t為100。根據模型給出的異常分數排序,認為異常數據得分前40位的數據為異常數據。

按照2.1節中的方法構造該管網系統的水力仿真模型,并構造模擬運行數據集,包含熱力站局部調節工況數據200組、熱源集中調節工況數據60組、泄漏故障工況數據187組、測量異常工況數據30組,作為BP神經網絡的訓練數據集。基于BP神經網絡的異常數據分類模型中神經網絡結構設計與參數設置為:5層(含3隱層)神經網絡,各層節點數為9、10、10、5、1,學習率η變化范圍0.000 1~0.01,最高迭代次數為200。對孤立森林模型識別出的40組異常數據,補充加入對應的東軫站和銀海熙岸站對應供回水壓力和質量流量,計算各參數變化率,構成測試數據集輸入訓練好的模型。草埠站及觀測站運行數據異常分類后部分分類結果見表3。經人工核驗,模型總體分類正確率達92.8%。

表3 草埠站及觀測站運行數據異常檢測后部分分類結果

異常數據的替換基于數據在時間序列上的關聯性,剔除異常值后,采用異常檢測結果為正常的數據序列中前后各5個時刻的均值填充該時刻的數據記錄(包括供回水壓力和質量流量等所有屬性)。表4中異常分類結果為4的數據為管網原始數據,其他異常分類結果的數據均為人工添加的異常數據。因此草埠站運行數據發生了測量異常。數據記錄進行異常替換部分結果見表4。

表4 草埠站異常數據替換部分結果

續表4

將部分校正結果同原始數據對比,其中質量流量對比見圖5~圖6。數據校正方法對錯誤數據的甄別效果很好,獲得合理的流量和壓力運行曲線,說明了數據校正方法的可行性和有效性。

圖5 草埠站一次側供水質量流量原始數據

圖6 草埠站一次側供水質量流量經校正數據

4 結論

① 利用水力計算模型的多工況仿真結果拓展數據源進行數據異常校正是可行的方法。

② 供熱管網數據校正方法關鍵在于異常數據的處理,提出3步法:數據異常檢測、數據異常分類、異常數據替換,構建的異常檢測模型和分類模型是高效可行的。

③ 對實際供熱管網上傳的運行數據進行數據校正實踐,結果表明提出的數據校正方法具有實用性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 美女免费黄网站| 夜夜操狠狠操| 永久免费无码日韩视频| 婷婷综合亚洲| 欧美笫一页| 婷婷色一二三区波多野衣 | 日本一区二区三区精品视频| 国产9191精品免费观看| 成人在线观看不卡| 国产91高跟丝袜| 精品成人一区二区三区电影 | 色男人的天堂久久综合| 亚洲成人在线网| 四虎亚洲精品| 又粗又大又爽又紧免费视频| 色偷偷一区二区三区| 99热这里都是国产精品| 黄色污网站在线观看| 99久久精品国产麻豆婷婷| a级免费视频| 97视频在线精品国自产拍| 在线观看国产精美视频| 97青青青国产在线播放| 亚洲va在线∨a天堂va欧美va| 一区二区三区成人| 国产一区二区三区在线观看免费| 亚洲一区二区黄色| 91在线精品麻豆欧美在线| 国产成人免费视频精品一区二区 | 亚洲AⅤ无码日韩AV无码网站| 自慰网址在线观看| 国产精品亚洲а∨天堂免下载| 91极品美女高潮叫床在线观看| 国产午夜福利在线小视频| 久久精品人人做人人| 国产精品久久国产精麻豆99网站| 91人人妻人人做人人爽男同| 精品视频一区二区观看| 成人一区在线| 激情六月丁香婷婷四房播| 国产欧美亚洲精品第3页在线| 亚洲免费人成影院| 亚洲欧美成人影院| 激情六月丁香婷婷四房播| 国产无码精品在线播放| 久久综合丝袜长腿丝袜| 真实国产乱子伦视频| 亚洲三级成人| 国产区福利小视频在线观看尤物| 成年人国产视频| 在线永久免费观看的毛片| 日本欧美成人免费| 欧美亚洲中文精品三区| 精品夜恋影院亚洲欧洲| 不卡无码h在线观看| 中文字幕久久波多野结衣| 国产成人精品午夜视频'| 亚洲色图欧美视频| 国产在线精品美女观看| 亚洲国产成人精品一二区| 男女性色大片免费网站| 免费观看男人免费桶女人视频| 欧美精品啪啪| 国产麻豆永久视频| 午夜丁香婷婷| 天天做天天爱夜夜爽毛片毛片| 国产一级二级三级毛片| 国产精品网拍在线| 97人人做人人爽香蕉精品| 亚洲成aⅴ人片在线影院八| 亚洲色欲色欲www在线观看| av色爱 天堂网| 狂欢视频在线观看不卡| 2019国产在线| 91福利免费| 日韩专区第一页| 国产精品亚洲一区二区三区z | 精品久久777| 国产精品妖精视频| 精品人妻一区二区三区蜜桃AⅤ | 天天色综网| 久久亚洲日本不卡一区二区|