閆棟, 楊富斌, 張紅光,3, 許永紅, 吳玉庭,3
(1.北京電子科技職業學院, 北京 100176; 2.北京工業大學 環境與生命學部, 北京 100124; 3.傳熱與能源利用北京市重點實驗室, 北京 100124)
2030年實現碳達峰、2060年實現碳中和是時代賦予能源領域的神圣使命,實現中低溫熱能高效熱功轉換是節能減排的關鍵。有機朗肯循環(organic Rankine cycle, ORC)以其結構簡單、適應性強、轉化效率高等優點成為極具潛力的中低溫熱能熱功轉換技術之一。目前在太陽能[1]、地熱能[2]、生物質[3]等可再生能源開發,以及工業過程節能[4-5]、內燃機余熱利用[6-8]等方面的應用得到了廣泛研究。
ORC系統參數對其性能有著重要影響。學者們分別就工質特征參數[9]、透平效率[10]、循環水流量[11]、工質流量[12]、工質泵效率[13]對ORC系統性能的影響進行了深入研究。ORC是一個由多部件組成的循環系統,許多系統參數都會對系統性能產生影響,這些系統參數間不可避免地就會出現冗余信息。另一方面,ORC系統性能不可能完全由1或2個關鍵系統參數決定。這就需要識別出ORC系統的關鍵參數集,準確描述ORC系統參數與系統性能的關聯規律。
由于不可逆損失的存在,常規的熱力學方法難以實時準確可靠的描述ORC系統參數與其性能之間的關聯規律。統計學方法可以從信息學角度描述系統參數與系統性能的關聯關系,為建立準確可靠的ORC系統模型提供了可能。Bademlioglu等[14-15]采用了Taguchi和ANOVA方法獲得了ORC系統參數對系統性能的貢獻率和重要性排序。Kalina等[16]建立了ORC黑箱模型識別最佳的系統運行工況。Larsen等[17]建立了ORC系統線性統計模型研究系統參數與系統性能的關聯規律。另一方面,ORC系統參數高度耦合(例如,蒸發溫度與蒸發壓力之間的強相關關系),理論研究和簡單試驗分析難以實現參數解耦。主成分分析(principal component analysis, PCA)可獲得多個參數之間的隱含數據結構,并通過構建包含參數信息的主成分從而實現參數的解耦。此外,它還可以實現參數降維,降低分析的難度。基于PCA的優勢,已經在熱力學領域的研究中得到了廣泛應用[18-20]。
ORC系統是一個多部件聯合運行的熱功轉換系統,系統運行過程中有很多參數(如:蒸發器出口壓力和溫度、冷凝器入口壓力和溫度、工質泵效率、膨脹機軸效率、工質流量、管路壓力損失和系統熱損失等)都會對系統性能產生影響。在這些參數中,蒸發器出口壓力和溫度、冷凝器入口壓力和溫度、工質泵效率和膨脹機軸效率是6個基本系統參數,其它參數對系統性能的影響也是通過改變這6個基本參數而實現的。
本文選擇蒸發器出口壓力pe和溫度Te、冷凝器入口壓力pc和溫度Tc、工質泵效率ηP、膨脹機軸效率ηSSE6個基本參數作為初始變量,并對其進行相關性分析和主成分分析。隨后,將ORC系統熱效率ηORC作為系統性能指標,建立ORC系統參數與ηORC之間的機器學習模型。最終,根據回歸模型的預測性能利用枚舉法識別出ORC系統關鍵參數集。
該ORC系統的示意如圖1所示。該系統主要包括3個子循環:導熱油循環、有機朗肯循環和冷卻水循環。

圖1 有機朗肯循環系統示意Fig.1 Schematic diagram of the ORC test system
在該試驗系統中,導熱油循環為系統提供熱源。導熱油循環主要由3個部件構成:導熱油鍋爐、油泵和蒸發器。在試驗過程中,導熱油首先在導熱油鍋爐中被電阻絲加熱,然后進入蒸發器,將熱量傳遞給ORC系統工質,最后在油泵的作用下重新進入導熱油鍋爐。
在該試驗系統中,ORC系統主要由4個部件組成:工質泵(離心泵)、蒸發器(管殼式)、膨脹機(單螺桿式)和冷凝器(管殼式)。R123[21]作為系統工質。在試驗過程中,工質首先在工質泵的作用下進入蒸發器吸收熱量成為高溫高壓蒸汽。隨后,高溫高壓蒸汽進入膨脹機做功。最終,完成做功后的工質被冷凝器冷卻為液態工質,再重新進入工質泵開始新的循環。
循環過程的T-s圖如圖2所示。ORC中所用傳感器的主要參數如表1所示。這些傳感器的位置分布如圖1所示。

表1 ORC系統所用傳感器的參數Table 1 Parameters of measurement sensors in the ORC system

注:圖中數字1~6依次表示工質高溫高壓狀態、膨脹做功后的過熱狀態、膨脹后的等壓干飽和狀態、膨脹后的等壓濕飽和狀態、工質泵加壓后狀態、工質泵加壓后工質濕飽和狀態。圖2 有機朗肯循環T-s圖Fig.2 T-s diagram of the ORC system
在該試驗系統中,冷卻水循環為試驗系統提供冷源。冷卻水循環主要由3個部件組成:水泵、冷卻塔和冷凝器。冷卻水循環從系統冷凝器中帶走熱量,并將熱量釋放到環境中。
在該ORC系統中開展了一系列試驗工作。研究ORC的pe、Te、pc、Tc、ηP和ηSSE系統參數對系統性能的影響規律。該試驗系統使用的單螺桿膨脹機對應的最佳工作效率時的轉速約為2 500 r/min, 因此,在試驗過程中膨脹機的轉速被設定在2 500±30 r/min的范圍內。當該試驗系統暖機工作完成后,通過調整導熱油循環和工質泵的運行狀態,使蒸發器出口的工質參數從初始狀態(T=80.50 ℃,p=0.424 MPa)緩慢變化到最終狀態(T=120.60 ℃,p=1.054 MPa)。在試驗過程中,所有的測量數據均被實時記錄。ORC系統的試驗數據變化范圍如表2所示。在試驗過程中共計獲得了2 043個有效數據點,受文章篇幅所限,本文僅在表3中展示了部分原始試驗數據。ORC系統ηORC的不確定度ΔY為:

表2 ORC系統試驗數據變化范圍Table 2 Variation ranges of ORC system test data

表3 部分原始試驗數據Table 3 Part of the original experimental data
(1)
式中:Y為目標變量;ΔXi為測量變量的不確定度。ORC系統熱效率的不確定度最大值、最小值及平均值分別為0.000 34、0.000 17和0.000 255。
PCA是一種常用的分析多維數據的統計學方法,以最少的信息損失為前提,將原有變量轉變為幾個線性無關的綜合指標,并將這些綜合指標稱為主成分PCs[22]。PCs按照包含變量方差信息的大小分為第1主成分PC1、第2主成分PC2、第3主成分PC3等。PC1包含了最多的變量信息,接下來依次是其他PCs。
PCA的計算步驟為:1)將原始數據矩陣X標準化為新矩陣X*;2)計算新矩陣X*的系數矩陣R;3)利用Jacobi方法求解特征方程∣λI-R∣=0獲得特征值;4)計算獲得各主成分的貢獻率和累積貢獻率以及載荷因子。
在ORC系統中,系統參數常常呈現出強關聯性。PCA可以減少系統參數的維度,識別出系統參數的基本數據結構。并且通過建立新的變量,避免了系統參數之間的強關聯性。
在ORC系統中,由于壓力損失、散熱損失、機械損失等不可逆損失的存在,傳統的ORC熱力學模型的準確度會降低[23]。機器學習模型是基于統計學原理,在試驗數據的基礎上訓練獲得,因而有較高的準確性。本文分別建立ORC系統的基于多元線性MLR、人工神經網絡BP-ANN和支持向量機SVR的回歸模型。回歸模型是以pe、Te、pc、Tc、ηP和ηSSE為變量,以ηORC為目標函數。試驗數據集按照5∶1∶1的比例分別劃分為訓練集、驗證集和測試集。在構建多元線性回歸模型時,由于沒有用到驗證集,因此將訓練集和驗證集組合在一起作為訓練集。基于這3種機器學習方法建立ORC模型過程為:
1)建立MLR模型,用多元線性方程來直接描述變量與目標函數值的關聯規律;
2)建立BP-ANN模型。BP-ANN是一種誤差反向傳播的人工神經網絡[24]。它以適應性強、非線性、高精度等優點在ORC研究領域得到了廣泛應用[24]。本文采用Matlab工具箱建立BP-ANN模型。所使用的隱含層層數為1,神經元個數為10,學習率為0.1,訓練函數為Levenberg-Marquardt;
3)建立SVR模型。SVR是支持向量機的重要分支,是支持向量機中的超平面決策邊界,是一種性能強大的機器學習方法[25]。本文采用libsvm-3.24工具箱建立SVR模型,采用網格法獲得最優參數。
特征選擇是簡化數據維數的重要手段,它從最初的特征集合中按照一定的規則刪除冗余以及不重要的特征,從而獲得一個最優特征集合的過程。在機器學習中常采用特征選擇的方法來應對高維問題[26-28]。枚舉法是利用計算機運算速度快、準確度高的優點,對有窮集合逐一進行檢查,從而確定符合要求的集合。通常,枚舉法首先確定枚舉對象、枚舉范圍和判定條件,然后枚舉可能的集合并驗證是否是最佳集合。利用枚舉法進行特征選擇是一個在相關參數中確定出最優參數集的有效方法。本文通過枚舉法在系統參數數量從1變化到6的過程中,從不同的系統參數組合中篩選出使回歸模型性能達到最優的參數組合,稱這個參數組合為關鍵參數集。
在對ORC系統參數進行主成分之前,首先對系統參數的相關性進行檢查。在本文中,將pe、Te、pc、Tc這4個系統參數定義為工質狀態參數;將ηP和ηSSE定義為設備運行效率參數。該6個系統參數的相關系數如表4所示,具有較強的相關性,其中工質狀態參數之間的相關性最強,相關系數均超過0.971;設備運行效率參數與工質狀態參數之間的相關性稍弱;設備運行效率參數之間的相關性最弱,其相關系數為0.814。由此可知,設備運行效率參數是相對獨立的2個參數。系統參數的各主成分載荷因子及特征值如表5所示。PC1、PC2、PC3、PC4、PC5和PC6依次代表了ORC系統參數的6個不同的主成分。系統參數不同的PCs對總體變量信息的貢獻率及累積貢獻率如圖3所示。PC1的貢獻率為94.33%,PC1和PC2的累積貢獻率已經超過97%,因此需要對PC1和PC2進行深入分析。對于PC1,4個工質狀態參數的載荷因子相當,且均大于設備運行效率參數,這表明PC1包含了更多的工質狀態變化信息。在PC2中設備運行效率參數的載荷因子明顯大于比在PC1中的大,這意味著PC2中包含了更多的設備效率參數。因此,PC1可以定義為工質狀態參數指標,PC2可以定義為設備運行效率參數指標。

表4 系統參數之間的相關性系數Table 4 Correlation coefficients between the system parameters

表5 系統參數各主成分的載荷因子及特征值Table 5 PCA factor loadings and eigenvalues of system parameters

圖3 各主成分對變量信息的貢獻率和累積貢獻率Fig.3 Contribution percentage and cumulative contribution percentage of the PCs
對PC1與PC2與設備性能的相關性進行分析,發現與ORC系統性能的關聯規律。PC1與PC2與ηORC的相關性分別為0.958 4和0.173 0。表明PC1對于ηORC表現出了很強的相關性,遠大于PC2和ηORC之間的相關性,由此可以看出ORC系統性能受工質狀態參數的影響超過了受設備運行效率的影響。盡管PC2與ORC系統性能的相關性較低,但PC2包含了系統運行必不可少的設備運行效率的參數信息,對建立ORC系統模型是必要的。
決定系數R2與均方誤差EMSE是評價回歸模型性能的2個重要指標。基于MLR、BP-ANN、SVR方法建立的ORC回歸模型的R2和EMSE分別如表6所示。基于3種方法建立的ORC系統ηORC模型的R2均超過0.99。且采用3種方法建立的ORC系統ηORC模型的均方誤差均低于2.8×10-7。對比3種方法建立的ORC回歸模型的性能,可以看出MLR方法雖然精度比BP-ANN和SVR方法略低,但是對ORC系統性能的預測已經達到了相當高的精度。為了提高模型的可解釋性與計算的方便性,本文選用了MLR方法在PCA分析的基礎上建立ORC系統回歸模型,簡稱PCA-MLR模型。

表6 PC1與PC2和ORC系統性能之間的相關系數Table 6 Correlation coefficients between each PC and ORC system performance
ORC系統關鍵參數集的選取是獲得準確系統性能的前提,對于實際ORC系統,測量的變量有很多,然而并非這些變量都會對系統性能產生影響,且由于變量間強關聯關系的存在,這些變量未必都是造成系統性能改變的直接原因。另一方面,ORC系統包含了多個熱力過程,系統性能并非由單一的關鍵變量完全確定的。此外,從統計學角度來看,選取過多的參數會造成模型的過擬合,過少的參數會降低模型的精度。因此要獲得準確的ORC系統性能,首先需要識別出系統關鍵參數集。
基于建立的PCA-MLR模型,采用枚舉方法依次減少系統參數的變量個數,根據PCA-MLR預測模型精度的變化,逐步確定關鍵系統參數,并最終確定關鍵參數集。在確定關鍵參數集的過程中,當所選擇的變量個數大于1時,采用的PCA-MLR模型是基于第1和第2主成分建立的;當系統參數個數為1時,所采用的PCA-MLR模型是僅基于第1主成分建立的。另外,在此過程中PCA-MLR的預測性能是基于測試集分析獲得的。
隨著系統參數數量變化,ORC系統參數的篩選結果如下:當變量個數從1增加到6的過程中,依次增加的變量為Te、ηP、ηSSE、pe、pc和Tc。系統參數數量變化過程中,最優的PCA-MLR模型的R2變化如圖4(a)所示。隨著變量個數從1變化到6,PCA-MLR的R2呈現出先增大后減小的變化規律,在變量個數為3時取得最大值,結合篩選變量結果,可以確定出此時的變量集合為(Te、ηP、ηSSE)。由此可知,提高ORC系統蒸發溫度、提高工質泵效率、提高膨脹機軸效率可以明顯提高系統熱效率。系統參數數量變化過程中,PCA-MLR模型預測ηORC的MSE變化規律如圖4(b)所示。MSE的變化呈現出與R2一致的變化規律。MSE隨著變量個數從1變化到6,先減小后增大,在變量個數為3時取得最小值。結合PCA-MLR模型R2和EMSE的變化規律及枚舉法所篩選出的關鍵參數,可以確定出ORC系統的關鍵參數集為(Te、ηP、ηSSE)。

圖4 不同數量系統參數建立PCA-MLR模型的R2與均方誤差對比Fig.4 R2 and MSE of the PCA-MLR models using different numbers of system parameters
以6個系統參數建立的PCA-MLR模型ηORC的平均誤差為1.66×10-3;而基于關鍵參數集建立的PCA-MLR模型ηORC的平均誤差為1.44×10-3,平均誤差降低了13.36%。基于關鍵參數集建立的PCA-MLR模型的絕對誤差如圖5所示。從圖中可知ηORC的絕對誤差范圍為-0.05%~0.05%,此時模型已獲得較優的預測精度。

圖5 基于關鍵參數集的PCA-MLR模型系統熱效率的絕對誤差Fig.5 Absolute error of the PCA-MLR model for thermal efficiency based on key parameter subset
1)基于關鍵參數集建立的PCA-MLR模型可以使平均誤差降低13.36%。采用關鍵參數集建立ORC系統機器學習模型,可以有效提高模型精度。
2)6個系統參數,相互之間均表現出明顯的相關性,工質狀態參數對系統性能的影響超過了設備運行效率參數的影響。調節系統運行時,優先改善工質狀態參數可以提高ORC系統熱效率。