王 群
上海碳索能源服務(wù)股份有限公司
冷水機(jī)組是暖通空調(diào)系統(tǒng)主要耗能設(shè)備,最高可達(dá)60%~70%的比例,因此對(duì)冷水機(jī)組開(kāi)展節(jié)能及故障診斷的工作意義重大。
冷水機(jī)組的模型分為黑箱、灰箱模型[1]。黑箱為純數(shù)據(jù)驅(qū)動(dòng)模型,隨著人工智能發(fā)展,黑箱模型在實(shí)際工程中的應(yīng)用越來(lái)越廣,但其解釋性較差。灰箱模型建立了冷水機(jī)組的物理模型,通過(guò)數(shù)據(jù)統(tǒng)計(jì)的方式確定其中的因子,比較常見(jiàn)的灰箱模型包括SL、BQ、MP、GNU、GNS 及LS 模型,本文采用實(shí)際項(xiàng)目數(shù)據(jù)對(duì)該6種灰箱模型進(jìn)行評(píng)價(jià)。
實(shí)驗(yàn)數(shù)據(jù)采用項(xiàng)目數(shù)據(jù),數(shù)據(jù)字段為810-814,602,601,719,739,此外還采用杭州氣象數(shù)據(jù)(字段1078)。原始數(shù)據(jù)見(jiàn)表1。
建立模型需要的數(shù)據(jù)包括:冷凍水供回水溫度T_rchw、T_schw,冷凍水流量F_chw,冷凍機(jī)主機(jī)功率P,冷卻水回水溫度T_rcow。采用的項(xiàng)目數(shù)據(jù)中缺少冷卻水?dāng)?shù)據(jù),因此根據(jù)虹橋機(jī)場(chǎng)氣象數(shù)據(jù)進(jìn)行推測(cè)。在此處假設(shè)冷卻水回水溫度比濕球溫度高3 ℃。除此之外,原始數(shù)據(jù)的預(yù)先處理還包括:
1)去除冷凍水流量、冷凍水供回水溫度無(wú)數(shù)據(jù)點(diǎn),若此行有一個(gè)數(shù)據(jù)無(wú)效點(diǎn),則刪除此行;
2)判斷冷機(jī)單獨(dú)運(yùn)行的時(shí)間。判斷依據(jù)為:如果該數(shù)據(jù)點(diǎn)的有功功率小于10 kW,則判斷該時(shí)間點(diǎn)冷機(jī)沒(méi)有運(yùn)行。如果一數(shù)據(jù)點(diǎn)只有1臺(tái)有功功率大于10 kW,則認(rèn)為該時(shí)間點(diǎn)該冷機(jī)單獨(dú)工作。經(jīng)處理后,1~4 號(hào)主機(jī)單獨(dú)工作的數(shù)據(jù)點(diǎn)分別有861、1 932、714、1 862個(gè);
3) 根據(jù)時(shí)間,將不同字段的數(shù)據(jù)進(jìn)行鏈接,鏈接后再次去除無(wú)數(shù)據(jù)點(diǎn)。此項(xiàng)處理之后,1~4號(hào)冷機(jī)的數(shù)據(jù)點(diǎn)數(shù)量分別有120、741、13、162 個(gè),根據(jù)結(jié)果,選擇2號(hào)冷機(jī)進(jìn)行試驗(yàn);
4)冷機(jī)的數(shù)據(jù)包含了一些噪聲點(diǎn),利用filter.py中的zscore_filter 進(jìn)行數(shù)據(jù)清洗。在zscore_filter中,根據(jù)每一個(gè)變量的值計(jì)算其zscore,如果其大于閾值,則刪除該行數(shù)據(jù),經(jīng)處理后,2 號(hào)冷機(jī)剩余662個(gè)數(shù)據(jù)點(diǎn)。
由于經(jīng)過(guò)處理之后的數(shù)據(jù)在時(shí)間上沒(méi)有延續(xù)性,因此每一個(gè)數(shù)據(jù)點(diǎn)可以視為獨(dú)立而與前后數(shù)據(jù)點(diǎn)無(wú)關(guān)聯(lián)。處理后的數(shù)據(jù)示例見(jiàn)表2。其中溫度單位K,流量單位為m3/h,制冷量單位為kW。為進(jìn)行建模,溫度參數(shù)單位全部需要轉(zhuǎn)換為K。
數(shù)據(jù)詳情見(jiàn)表3。

表1 原始數(shù)據(jù)

表2 數(shù)據(jù)示例

表3 數(shù)據(jù)詳情
探究模型見(jiàn)表4。其中,Tci 為冷卻水回水溫度,即T_rcow,單位:℃;Two為冷凍水供水溫度,即Tschw,單位℃;Twi為冷凍水回水溫度,即T_rchw,單位℃;Qe 為制冷量,單位為kW。在6 個(gè)模型中,SL、BQ、MP Model 為數(shù)據(jù)模型(Black Box Model),GNU、GNS、LS Model 為半物理模型(Grey Box Model)。
該報(bào)告主要包含了對(duì)6 個(gè)模型的預(yù)測(cè)精度、外圍預(yù)測(cè)、數(shù)據(jù)減少、參數(shù)物理意義等方面的探究。
1) 6 個(gè)模型性能的基本探究,主要以RMSE(Root-Mean-Squre-Error)和 CV(Coefficient of Variance)為判斷依據(jù)。兩個(gè)參數(shù)的計(jì)算公式分別為:

其中,為預(yù)測(cè)值,yi為真實(shí)值,n為用來(lái)測(cè)試的數(shù)據(jù)量。
2) 6 個(gè)模型對(duì)訓(xùn)練數(shù)據(jù)點(diǎn)以外的數(shù)據(jù)預(yù)測(cè)性能。如:利用8月的數(shù)據(jù)訓(xùn)練的模型對(duì)9月COP的預(yù)測(cè)精度的研究;
3)訓(xùn)練數(shù)據(jù)減少對(duì)模型性能的影響;
4)GNS、GNU、LS Model中幾個(gè)參數(shù)的物理意義研究。
4.1.1 回歸方法
在訓(xùn)練模型時(shí),主要的方法是模型線性化之后進(jìn)行回歸。其中SL、BQ、MP、GNS、LS Models 均采用此方法進(jìn)行回歸。
BQ 中 令,GNS、LS 中 令然后線性回歸之后進(jìn)行再計(jì)算得到COP。為探究GNS、LS Model的性能,回歸時(shí)同時(shí)探究了是否有常數(shù)項(xiàng)時(shí)模型的表現(xiàn)。
在線性回歸時(shí),分別考慮有常數(shù)項(xiàng)和無(wú)常數(shù)項(xiàng)時(shí)模型的表現(xiàn)。
以下為3個(gè)灰箱模型回歸時(shí)的具體參數(shù)轉(zhuǎn)化。
(1)GNU Model
GNU Model的公式為:

回歸對(duì)應(yīng)公式為:
第一次回歸,y=β1x1+β2x2+β3x3+C1,

表4 探究模型
(2)GNS Model
GNS Model公式為:

回歸對(duì)應(yīng)公式為:

其中,為常數(shù)項(xiàng)。
(3)LS Model
LS Model 公式為:

回歸對(duì)應(yīng)公式為:

4.1.2 基本性能探究結(jié)果
在測(cè)試中,隨機(jī)選取2 號(hào)冷機(jī)中300 個(gè)數(shù)據(jù)點(diǎn)進(jìn)行訓(xùn)練(注:300個(gè)數(shù)據(jù)點(diǎn)已足夠作為6個(gè)模型的訓(xùn)練數(shù)據(jù),詳見(jiàn)訓(xùn)練數(shù)據(jù)減少部分結(jié)果),其余數(shù)據(jù)作為測(cè)試數(shù)據(jù)。為研究噪聲數(shù)據(jù)對(duì)模型性能的影響,在有噪聲影響時(shí)(利用未過(guò)濾的2號(hào)冷機(jī)數(shù)據(jù)進(jìn)行訓(xùn)練),同樣選擇300個(gè)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。
為防止在預(yù)測(cè)時(shí)單個(gè)噪聲點(diǎn)對(duì)模型造成較大影響,對(duì)于預(yù)測(cè)結(jié)果中COP 小于0,大于10 的結(jié)果進(jìn)行之前,用預(yù)測(cè)結(jié)果的平均值替代。在實(shí)際計(jì)算過(guò)程中,此項(xiàng)僅在MP Model及GNU Model中有重要作用。各個(gè)模型的性能在不同數(shù)據(jù)下的基本表現(xiàn)見(jiàn)表5。
未排除預(yù)測(cè)精度的隨機(jī)性,重復(fù)100 次試驗(yàn)得到測(cè)試的平均值見(jiàn)表6。
根據(jù)預(yù)測(cè)結(jié)果:
在沒(méi)有噪聲的情況下,除無(wú)常數(shù)項(xiàng)的GNS、LS Model外,6個(gè)模型在數(shù)據(jù)量足夠的情況下表現(xiàn)差異不大,預(yù)測(cè)的相對(duì)誤差CV均在6%~7%之間,其中MP Model 預(yù)測(cè)精度最高,其次為含常數(shù)項(xiàng)的GNS Model;
GNU Model由于訓(xùn)練過(guò)程較為復(fù)雜,需要對(duì)預(yù)測(cè)結(jié)果進(jìn)行修正,以防止單個(gè)反常點(diǎn)對(duì)模型精度產(chǎn)生較大的影響;
有噪聲數(shù)據(jù)時(shí),6個(gè)模型平均的預(yù)測(cè)精度均出現(xiàn)了一定程度的下降,但總體還是保持了較好的準(zhǔn)確率。在沒(méi)有進(jìn)行結(jié)果的修正之前,MP Model 的CV高達(dá)190%,模型本身對(duì)噪聲相當(dāng)敏感,容易出現(xiàn)單個(gè)點(diǎn)偏離值異常;

表5 模型基本表現(xiàn)

表6
在沒(méi)有常數(shù)項(xiàng) C 時(shí),GNS、LS Model 預(yù)測(cè)結(jié)果均不理想,而GNU Model 表現(xiàn)與含常數(shù)項(xiàng)相差不大。
6 個(gè)模型的預(yù)測(cè)性能(無(wú)噪聲訓(xùn)練數(shù)據(jù))詳見(jiàn)圖1。
探究訓(xùn)練模型對(duì)未來(lái)數(shù)據(jù)的預(yù)測(cè)能力是模型性能探究的重要部分。將2號(hào)機(jī)數(shù)據(jù)按月分為三部分,其中包括 175 條 8 月數(shù)據(jù)點(diǎn),294 條 9 月數(shù)據(jù),198 條 10 月數(shù)據(jù)。三組數(shù)據(jù)中 COP 均為 3~6 之間。比較的內(nèi)容包括:6 個(gè)模型利用8 月數(shù)據(jù)訓(xùn)練對(duì) 9 月 和 10 月 進(jìn) 行 預(yù) 測(cè) Aug-> Sept、Aug->Oct、Aug->Sept,Oct,利用9月數(shù)據(jù)訓(xùn)練對(duì)10月進(jìn)行預(yù)測(cè)Sept-> Oct,利用8、9 月數(shù)據(jù)訓(xùn)練對(duì)10月進(jìn)行預(yù)測(cè)Aug, Sept-> Oct;為了比較各個(gè)月的數(shù)據(jù)量不同對(duì)結(jié)果的影響,每個(gè)月的數(shù)據(jù)量根據(jù)最少數(shù)據(jù)月(8 月)進(jìn)行隨機(jī)去除,并用去除后的數(shù)據(jù)進(jìn)行試驗(yàn),重復(fù)試驗(yàn)50 次,最后將結(jié)果進(jìn)行平均。預(yù)測(cè)結(jié)果見(jiàn)表7。

圖1 6個(gè)模型的預(yù)測(cè)-真實(shí)值散點(diǎn)圖(19:含常數(shù)項(xiàng),20:不含常數(shù)項(xiàng))
表7 中綠色表示模型CV 值小,紅色表示CV值大。典型的模型預(yù)測(cè)-真實(shí)值散點(diǎn)圖見(jiàn)圖2。
對(duì)比預(yù)測(cè)結(jié)果:
各個(gè)模型對(duì)外圍數(shù)據(jù)的預(yù)測(cè)并不精確,僅8月數(shù)據(jù)對(duì)9月的預(yù)測(cè)結(jié)果較好,而其他項(xiàng)模型的CV值較大,預(yù)測(cè)結(jié)果不理想;
根據(jù)各預(yù)測(cè)結(jié)果的平均CV,排除隨機(jī)性 ,SL Model、BQ Model 和 無(wú) 常 數(shù) 項(xiàng) 的 LS Model 對(duì)未來(lái)數(shù)據(jù)的預(yù)測(cè)最差,其他5 個(gè)模型的性能差異不大,灰箱模型的表現(xiàn)稍好于數(shù)據(jù)驅(qū)動(dòng)模型;
對(duì)所有模型而言,主要誤差來(lái)源為預(yù)測(cè)得到的COP 偏小,BQ Model 還存在部分點(diǎn)預(yù)測(cè)COP偏大;
在此項(xiàng)預(yù)測(cè)中,GNS Model結(jié)果較為穩(wěn)定,但由于其基礎(chǔ)誤差較大,參考意義不高。
為得到模型在不同的訓(xùn)練數(shù)據(jù)下的預(yù)測(cè)表現(xiàn),隨機(jī)選取n條數(shù)據(jù),對(duì)模型進(jìn)行訓(xùn)練,然后用剩余數(shù)據(jù)作為測(cè)試數(shù)據(jù),計(jì)算該模型的CV。經(jīng)過(guò)30 次隨機(jī)之后,對(duì)所得的結(jié)果進(jìn)行平均即為該模型在此數(shù)據(jù)量中的表現(xiàn)。6 個(gè)模型的表現(xiàn)見(jiàn)圖3,由于GNS Model 在沒(méi)有常數(shù)項(xiàng)時(shí)表現(xiàn)過(guò)差,在后面的討論中不再提及。在測(cè)試過(guò)程中注意訓(xùn)練誤差和測(cè)試誤差的變化,以預(yù)防過(guò)度擬合。
根據(jù)模型在預(yù)測(cè)時(shí)的精度做出的三色圖(N 表示無(wú)常數(shù)項(xiàng))見(jiàn)圖4。圖中,從上往下訓(xùn)練數(shù)據(jù)條數(shù)依次增大,綠色表示CV值較小(<6.5%),紅色表示CV值較大(>9%)。

表7 模型對(duì)未來(lái)數(shù)據(jù)的預(yù)測(cè)表現(xiàn)

圖2 未來(lái)數(shù)據(jù)預(yù)測(cè)的典型預(yù)測(cè)-真實(shí)散點(diǎn)圖

圖3 模型在訓(xùn)練數(shù)據(jù)減少時(shí)的CV值(小圖為訓(xùn)練誤差和測(cè)試誤差)
結(jié)合各圖,可以看出:
在數(shù)據(jù)驅(qū)動(dòng)模型中,SL 模型收斂最快,MP次之,BQ 最慢,在數(shù)據(jù)量足夠時(shí)BQ Model 和MP Model 模型預(yù)測(cè)精度更高,BQ、MP Model 在數(shù)據(jù)量達(dá)到125 條之后數(shù)據(jù)增加對(duì)模型的表現(xiàn)影響不大;
GNS Model 在沒(méi)有常數(shù)項(xiàng)時(shí)不能很好擬合數(shù)據(jù),無(wú)論是訓(xùn)練誤差還是預(yù)測(cè)誤差都較大;
相比數(shù)據(jù)驅(qū)動(dòng)模型,灰箱模型所需要的訓(xùn)練數(shù)據(jù)更少,在數(shù)據(jù)較少的情況下,灰箱模型明顯有更好的預(yù)測(cè)精度;
LS Model 在沒(méi)有常數(shù)項(xiàng)時(shí)表現(xiàn)精度不高,而加入常數(shù)項(xiàng)后表現(xiàn)較好。
GNU N Model 和 GNS Model 在 所 有 模 型中表現(xiàn)最好,其需要的訓(xùn)練數(shù)據(jù)少,約75 條模型的訓(xùn)練誤差和測(cè)試誤差即相差不多,GNU Model 的參數(shù)更有物理意義,GNS Model 則擁有較高的預(yù)測(cè)精度,其他模型與這兩個(gè)模型的表現(xiàn)相差較大。

圖4 訓(xùn)練數(shù)據(jù)減少時(shí)模型CV三色圖(Min:6.5%,Max:9%,Medium:7.5%)
在6 個(gè)模型中,有GNS、GNU、LS 均為灰箱模型。為將模型應(yīng)用于故障診斷,此報(bào)告包含對(duì)模型參數(shù)物理意義的探究。
4.4.1 GNU Model
GNU Model的公式為:

回歸對(duì)應(yīng)公式:
第一次回歸,y=β1x1+β2x2+β3x3+C1,
其中,β1~β3均有各自的物理意義:
β1— ΔS,由于內(nèi)部不可逆性,冷水機(jī)組總內(nèi)熵產(chǎn)生率,
β2— Qleak,熱量損失/增加率來(lái)自或進(jìn)入冷水機(jī)組,
β3——R,總換熱器熱阻。
GNS Model公式為:

回歸對(duì)應(yīng)公式為:

β1~β3為該冷機(jī)的熵增特性(characterize the entropy generation of a particular chiller)。4.4.3 LS Model

LS Model 公式為:

回歸對(duì)應(yīng)公式為:

該模型的參數(shù)意義理論上與GNS Model相似,均是冷機(jī)的熵增特性。,

4.4.4 結(jié)果及討論
在現(xiàn)有的數(shù)據(jù)中隨機(jī)選擇足夠多的數(shù)據(jù)進(jìn)行反復(fù)訓(xùn)練,即得到該數(shù)據(jù)集的參數(shù)分布。此報(bào)告中選擇200~250 條數(shù)據(jù),每個(gè)數(shù)據(jù)量隨機(jī)重復(fù)50次,從而得到2 500 次訓(xùn)練的參數(shù)。由于GNU Model 無(wú)常數(shù)項(xiàng)的表現(xiàn),因此不再考慮加入常數(shù)項(xiàng)后的模型,而GNS、LS 模型,則需考慮加入常數(shù)項(xiàng)后的模型。
GNU Model
各參數(shù)分布圖(橫軸為參數(shù)值,縱軸為頻數(shù))
根據(jù)理論,β1~β3分別對(duì)應(yīng)熵增ΔS, 熱損Qleak,換熱器熱阻R。某一典型(冷機(jī)功率3~4 kW)的回歸結(jié)果見(jiàn)圖5,結(jié)合數(shù)據(jù)來(lái)源冷機(jī)的功率(Pmean=1961 kW)。統(tǒng)計(jì)結(jié)果見(jiàn)表8,回歸結(jié)果見(jiàn)表9。
初步判斷,β1、β2、β3的分布范圍不大,遵循正態(tài)分布,具有物理意義,可以作為故障診斷的依據(jù)。但在回歸時(shí)可能會(huì)有比較意外的值出現(xiàn),因此建議多次隨機(jī)取數(shù)據(jù)點(diǎn)訓(xùn)練之后得到參數(shù)的平均值。此外,對(duì)β2,由于與試驗(yàn)結(jié)果的符號(hào)不同,因此建議通過(guò)實(shí)際測(cè)量數(shù)據(jù)進(jìn)行校對(duì),以確認(rèn)其符號(hào)。

圖5

表8 統(tǒng)計(jì)結(jié)果

表9 典型的GNU Model回歸結(jié)果
含常數(shù)項(xiàng)時(shí)各參數(shù)分布見(jiàn)圖6(橫軸為參數(shù)值,縱軸為頻數(shù))。
不含常數(shù)項(xiàng)時(shí)各參數(shù)分布圖見(jiàn)圖7(橫軸為參數(shù)值,縱軸為頻數(shù))。
根據(jù)J.M.Gordon等人的試驗(yàn),典型的結(jié)果見(jiàn)表9,其中A0~A2對(duì)應(yīng)β1~β3,同時(shí)與沒(méi)有常數(shù)項(xiàng)的回歸結(jié)果對(duì)比發(fā)現(xiàn),實(shí)際得到的參數(shù)分布和實(shí)驗(yàn)數(shù)據(jù)差別較大,因此物理意義有待確認(rèn)。
LS Model
含常數(shù)項(xiàng)時(shí)各參數(shù)分布圖(橫軸為參數(shù)值,縱軸為頻數(shù))見(jiàn)圖9。
·GNS Model

圖6 含常數(shù)項(xiàng)時(shí)各參數(shù)分布

圖7 不含常數(shù)項(xiàng)時(shí)各參數(shù)分布

表10 統(tǒng)計(jì)結(jié)果(N 表示無(wú)常數(shù)項(xiàng))

表11 某試驗(yàn)結(jié)果
不含常數(shù)項(xiàng)時(shí)各參數(shù)分布圖(橫軸為參數(shù)值,縱軸為頻數(shù))見(jiàn)圖10,統(tǒng)計(jì)結(jié)果見(jiàn)表10。
根據(jù)結(jié)果,發(fā)現(xiàn)在加入常數(shù)項(xiàng)后各參數(shù)的分布發(fā)生了巨大變化,因此認(rèn)為在加入常數(shù)項(xiàng)后,LS Model參數(shù)不再具有的物理意義。
經(jīng)過(guò)華為數(shù)據(jù)的試驗(yàn),所探究的6 個(gè)模型在冷機(jī)COP 預(yù)測(cè)上均能達(dá)到較高的精度。各個(gè)模型的特點(diǎn)總結(jié)見(jiàn)表11。
從故障診斷的角度看,GNU Model 和GNS Model 兩種模型具有較好的前景。GNS Model 的參數(shù)雖然物理意義待確認(rèn),但仍可以作為換熱器工作狀況的一項(xiàng)指標(biāo),且其要求的訓(xùn)練參數(shù)較少,很快模型即可穩(wěn)定;GNU Model 的參數(shù)可以用來(lái)診斷制冷劑在循環(huán)中的流動(dòng)情況、機(jī)組換熱器的工作情況等。但是,具體的診斷過(guò)程需要有相應(yīng)的數(shù)據(jù)才能進(jìn)行更好的研究。相比之下,GNU 模型的性能更為優(yōu)秀,其各個(gè)參數(shù)物理意義較為明確,各參數(shù)基本遵循正態(tài)分布,對(duì)訓(xùn)練數(shù)據(jù)的要求較少,可以作為故障診斷的冷機(jī)模型。

圖8 含常數(shù)項(xiàng)時(shí)各參數(shù)分布圖

圖9 不含常數(shù)項(xiàng)時(shí)各參數(shù)分布圖

表12 統(tǒng)計(jì)結(jié)果(N 表示無(wú)常數(shù)項(xiàng))

表13 模型探究總結(jié)