黃 超,李 航,周 利,畢可鑫,戴一陽,李汶穎
(1.四川大學化工學院, 成都 610000;2.清華四川能源互聯網研究院, 成都 610000)
氫氣是石化工業的關鍵原料之一。近年來,由于新的燃料電池的應用,氫變得更加重要。現階段化工工業制氫主要依靠化石能源的重整,方法有水蒸氣重整、部分氧化、煤氣化和氨解等[1]。隨著我國提出2060 年達到碳中和的目標,綠氫技術開始在國內發展[2]。所謂綠氫,是指利用可再生的清潔能源產生電,再通過電解水得到氫氣。綠氫技術將間歇性、不穩定性的清潔能源轉化成為具有能量和物質雙重屬性的氫。
綠氫技術由于其在脫碳領域的優勢[3-6],也會在未來的化工領域成為氫氣生產的主要手段。一方面,隨著天然氣、煤等能源價格逐年上升,會造成化工原料制造成本的上升。而隨著可再生能源發電價格持續降低,在未來原料氫的選擇上,綠氫比其他氫更具有成本優勢。另一方面,電解水的生產規模已經逐步擴大,現有堿性(AEL)、陰離子交換膜(AEM)、質子交換膜(PEM)和固體氧化物(SOEC)這4 種電解水技術[7-8]也愈加成熟。
對于化工工藝而言,用于化工生產的氫的產量必須達到噸級甚至萬噸級以上,對應到電解氫的商業化規模要達到MW 級甚至GW 級。目前只有堿性電解水技術可以通過集群的方式達到該規模,并且該技術成本最低,設備壽命更長,無疑是化工領域制氫技術最好的選擇。然而由于氫氣的爆炸極限廣(體積分數范圍為4.0%~75.6%),堿性電解水技術操作彈性較低。在電解槽內,氣體很容易發生擴散,尤其是氫側的氫氣更容易擴散。氧中氫(HTO)為氧氣中氫氣所占體積比,其決定了設備安全操作的邊界。一般來說當HTO 值超過2%時,設備強制停機[8]。因此對于AEL 水解中HTO 值的預測是工藝生產的關鍵。
許多學者提出了用氣體純度模型去預測HTO值。Haug 等[9-10]將電解槽視為兩個連續操作釜式反應器(CSTR),考慮了操作條件,如電流密度、電解液流速、濃度、溫度以及工藝管理對于HTO的影響,提出了一個基于溶解度模型的堿水電解生產氣體純度預測模型,并通過自制的電解槽實驗對模型進行了評價。Kirati 等[11]在溫度(0~90 ℃)、壓力(0~3 MPa)、電流密度(24~600 mA/cm2)等操作條件下,提出了氣體純度的經驗公式。Sánchez 等[12]根據極化曲線、法拉第效率與電流密度的關系,在不同的溫度、壓力等操作條件下,以15 kW 堿性試驗臺的數據為基礎,采用非線性回歸的方法,用MATLAB 進行參數非線性擬合,建立了預測堿水電解系統電化學行為的半經驗數學模型。
目前存在的氣體純度預測模型是經驗或半經驗的電解槽模型,沒有考慮系統層面的影響(整個制氫工藝除了電解槽外還包括輔助設備)。對于綠氫裝置還存在電源供給端功率變化幅度大、不穩定的問題,現階段的模型不能描述在功率波動時系統的表現。在多變量耦合的電解水系統中,一個波動的影響往往伴隨著多個參數變化,且對于不同電解槽設備,設備參數一旦發生變化,原有的模型很難反映真實的氣體純度。
HYSYS 模型[13]能夠實現特定電解槽參數下的氣體純度預測,但模型的遷移能力較差,且建立HYSYS 模型步驟繁瑣。為實現不同電解系統的氣體純度預測,本文在HYSYS 工藝系統生產數據的基礎上,進一步發展了基于主成分分析-人工神經網絡(PCA-ANN)的氣體純度預測模型。該方法使用數據驅動的方式,通過電解裝置運行數據即可完成預測,可普遍適用于各種電解槽設備氣體純度預測建模。
圖1 示出了一個典型的堿性電解水裝置。堿性電解水制氫技術采用堿性電解質(KOH、NaOH)作為循環水,從電解槽陰陽兩極出來的氣液混合相通過分離器分離氣體后經堿液循環泵混合回流到電解槽中。氫氧分離器氣相出口處各有氣體檢測裝置。

圖1 堿性電解水裝置Fig.1 Alkaline water electrolysis system
在堿性水電解中,OH-負責電荷交換,當電子轉移系數為2 時,在電解槽陰陽極發生的反應如下:
根據實際堿性水電解裝置流程搭建的Aspen HYSYS 模型如圖2 所示。電解槽建模采用Aspen Custom Modeler (ACM)[14]工具搭建,其他裝置如泵(PUMP)、分離器(SEP)、換熱器(EXCHANGER)、混合器(MIXER)等均采用HYSYS 提供的內置模塊單元。

圖2 堿性電解水系統Aspen HYSYS 模型Fig.2 Aspen HYSYS model of alkaline water electrolysis system
全流程模擬中,電解液(STACK-IN)進入電解槽發生電解反應,從電解槽(STACK)出口的陰極物流(H2-STACK)和陽極物流(O2-STACK)分別進入氣液分離器SEP-H2和SEP-O2中并分離出其中的氣相產品后,將剩余液相部分經混合器(MIX-100)混合后再經循環泵(P-RCY)回流。回流液溫度通過E-100 換熱器進行控制。電解消耗的水由補水泵(PUMPH2O)提供,以保證系統質量平衡。
由于Aspen HYSYS 不包括用于堿性水電解池堆棧建模的操作單元,因此本文使用ACM 將堿性水電解池堆棧模型作為子程序集成到Aspen HYSYS中,ACM 允許創建自定義操作單元,再將單元堆棧模型合并到整個流程,如圖3 所示。本文參考Sánchez[15]建立的電解槽模型,該模型包含了堿性電解小室的電化學模型和所有與堆棧中發生的質量和能量平衡有關的方程,能夠預測堿水電解堆在不同操作條件(溫度T和壓力p)下的電化學行為。

圖3 使用ACM 搭建的電解槽操作單元模型Fig.3 Operating unit model of electrolytic cell built by ACM
電解槽模型的必要輸入參數包括電力輸入、電池數量、電極的活性面積、堆棧溫度和操作壓力等。該堿性電解槽模型是半機理模型,基于與電解原理和一部分數據擬合的質量和能量平衡方程,以運行工況參數為因變量,計算出電解過程的極化曲線、法拉第效率以及氫氣擴散量,得到最終輸出陰陽兩極氣體的產量與純度、電解過程中水的消耗量以及電解過程產熱量與熱損失量。
HYSYS 的輸入包含物流和設備的輸入。設備包括電解槽和其他輔助設備。ACM 模型電解堆棧由12 個表面積為1 000 cm2的雙極堿性電解電池組成,電解液循環流速固定為15 L/min。電解槽的基本參數見表1。其他輔助設備參數見表2。電解液參數見表3。溫度與壓力均隨設置的系統溫度、壓力變化。

表1 電解槽參數Table 1 Electrolytic cell parameters

表2 輔助設備參數Table 2 Auxiliary equipment parameters
通過HYSYS 模型運行,輸出氫氣產品和氧氣產品的流量和組成(氧氣產品組成中,HTO 為后續模型訓練的關鍵指標值)。
設計裝置工作壓力為0.7 MPa,在模擬變工況生產時,為保證操作區間盡可能大,本文將操作范圍適當擴大。電解水系統操作范圍如表4 所示。

表4 電解水系統操作范圍Table 4 Operating range of electrolytic water system
為保證模型產生的數據均勻覆蓋工作點,本文通過Python Interface 操作HYSYS 模型,在恒定的工作功率下,調整系統的工作壓力和溫度產生數據,再變功率采集不同工作點位數據。
本文使用Sánchez[15]電解水裝置生產的實驗數據對模型進行評價,圖4 所示為HYSHS 模型驗證。如圖所示,在55~75 ℃和0.5~0.9 MPa 下,HTO 隨電流密度的變化符合實驗測量數據點的變化趨勢,可以得出該HYSYS 模型數據具有一定的準確性。

圖4 HYSYS 模型驗證Fig.4 HYSYS model validation
PCA 是一種數據線性降維算法[16],最開始應用于人臉識別領域[17]。目前已經廣泛應用于化學計量學和化學信息學[18-19]。它可以將高維的數據映射到低維空間中,以方差最大為信息量保留的標準,在降維的同時能夠比較好地保證原始數據的信息量。
堿性電解水工藝是電-熱-化學多變量耦合的系統,從HYSYS 模擬中提取的數據維度較高,許多變量之間存在耦合關系。因此使用PCA 先處理數據集,保證信息量的同時可以減輕模型的負擔。
ANN 是對人腦或自然神經網絡若干基本特性的抽象和模擬[20],通過神經元的簡單連接計算,模擬人類大腦中神經系統的信息交互方式。目前ANN及其各種改進網絡已經廣泛用于工業、社科、分子研究等各種領域,可以用于策略優化、裝置模擬、值預測等[21-26]。ANN 有強大的數據學習能力,本文將其應用于堿性電解水裝置中HTO 值的預測,建立了氣體純度預測模型。
ANN 的結構如圖5 所示。人工神經網絡擁有輸入層、隱藏層和輸出層。輸入的M個變量構成向量后輸入隱藏層神經元進行計算并輸出。對于輸入的變量x∈R1×M,經過人工神經網絡計算后輸出變量Y∈R1×1。

圖5 人工神經網絡結構Fig.5 Artificial neural network structure
本文輸入變量為各種變化操作參數,如壓力、溫度、功率等。隱藏層含有N個神經元。對于一個輸入向量x,在經過隱藏層時乘以矩陣w,w∈RN×M,再加上偏置單元b0,b0∈R1×N。
權重矩陣W(W=wT)連接輸入層與隱藏層。在隱藏層的神經元接收到了向量z后,神經元進行激活函數的計算。
激活函數將非線性特性引入到ANN 網絡中,讓ANN 能夠學習到非線性的數據特征。神經元激活后的向量z',同樣需要乘以系數矩陣θ,再加上一個偏置單元b1,得到輸出層y。本文中輸出為電解水的HTO 值。
最終通過ANN 建立輸入和輸出的關系。
對于W、b0、b1、θ等參數則通過神經網絡的訓練得到。神經網絡的訓練方式為BP(Back Propagation)反向傳播[27]。BP 反向傳播首先通過ANN 的正向計算得到損失函數L,對損失函數反向求導,用梯度下降來調整參數。對于k組訓練數據(xi,yi)i=1,2···k,以常用的平方和作為損失函數L來介紹反向傳播過程。
其中:f代表ANN 正向計算函數。首先,需要對模型參數進行初始化,通過正向計算得到損失函數值。然后,求出誤差函數關于神經網絡自身變量(w,b0,b1,θ)的偏導數,反向更新模型參數,即梯度下降法[28]。
以上公式中的點表示矩陣點乘。當偏導數求出后通過式(11)更新模型參數。
其中:r為模型訓練設置的參數學習率,其決定了ANN 的訓練速度和質量。
如圖6 所示,本文模型主體部分是PCA-ANN 網絡,它圍繞PCA-ANN 模型迭代過程,涉及了數據傳輸、數據預處理、模型訓練、模型評價這4 個步驟。模型的原始數據來源于堿性電解水工藝模擬裝置,通過Python與HYSYS 服務器建立連接,將數據傳輸到Python。由HYSYS 模型模擬產生的原始數據經預處理后,將數據集劃分為80%訓練集和20%測試集,用于后續模型訓練。訓練后的PCA-ANN 模型使用模型評價指標對比分析,通過不斷地更新數據評估模型性能,以此更新線上預測模型。

圖6 PCA-ANN 模型框架Fig.6 Framework of PCA-ANN model
(1)評價指標。PCA-ANN 模型為數值類預測模型,屬于回歸模型,用于對連續的實數值進行預測,并且使用平均絕對誤差(MAE)、均方差(MSE)、平方根誤差(RMSE)、決定系數(R2)作為評價標準。
(2)模型訓練。人工神經網絡結構多樣,增加隱藏層和神經元數量會影響網絡估計數據的精度。本文通過PCA 前后訓練效果和不同結構的ANN 對比分析,依據R2和MAE 值判斷模型預測效果,同時結合學習曲線分析模型是否出現過擬合現象,最終篩選出用于建模預測HTO 人工神經網絡的最優結構。
由于實際裝置在運行的過程中HTO 不會超過4%,某些工作點位產生的數據會與實際數據存在差異,同時考慮到電解槽設計運行工況區間較小,而操作范圍設置較廣,在操作邊界處可能會出現異常點和噪聲數據,且當工業數據作為輸入時預處理更加重要,因此需對HYSYS 生成的數據進行數據清洗處理。
(1)對于真實的輸入數據,采用箱線圖分析離群點數據,篩除整體HTO 分布中的異常數據(離群點數據在HTO 分布箱線圖(圖7)中以綠色方塊表示)。

圖7 HTO 分布箱線圖Fig.7 Box plot of HTO distribution
(2)針對邊界處的數據趨勢進行分析并篩除邊界異常點數據。選取邊界條件p=0.1 MPa 時HTO 隨溫度的變化趨勢進行異常點位分析,如圖8 所示(圖中TSTACK為裝置運行溫度),可以看到,當裝置運行溫度(TSTACK)為40 ℃時出現了HTO 異常值。采用邊界條件趨勢分析方法可以對邊界條件數據進行數據清理。通過預處理后的數據再進入模型進行訓練,能使模型具有更好的魯棒性。

圖8 HTO 隨溫度變化趨勢Fig.8 HTO changing trend with temperature
從HYSYS 流程中選取了12 個參數作為待輸入的預選參數,主要包括:電解槽功率(PSTACK)、電解槽產熱(QGEN)、電池電壓(VCELL)、電解過程可逆電壓(VREV)、電流密度(I)、裝置運行溫度(TSTACK)、循環泵功率(PRCY)、加水泵功率(PH2O)、裝置運行壓力(pSTACK)、氫氣產量(FH2)、氧氣產量(FO2)、換熱器能耗(E100)。
用選取的12 個參數對HTO 進行皮爾遜相關性分析[29],分析結果如圖9 所示。結果表明:(1)VREV、PH2O、QGEN對于HTO 的相關度為0,因此都可以忽略。(2)有兩組變量(FH2和FO2,PRCY和TSTACK)相關性較高,存在多重共線性,為避免模型過擬合,每組中剔除一個變量。

圖9 變量相關度分析熱力圖Fig.9 Variable correlation analysis of heat map
根據相關性分析結果,最終選取裝置運行溫度、裝置運行壓力、電解槽功率、電池電壓、電流密度、氫氣產量、換熱器能耗作為PCA-ANN 模型的輸入參數。
選取HYSYS 運行過程的12 870 條數據訓練模型。將篩選出的變量作為輸入,HTO 值作為輸出。由于HTO值為連續的數值,采用Python 機器學習庫Sklearn 提供的ANN 神經網絡MLPRegression 進行回歸訓練。學習率選擇為0.000 6,優化器選擇SGD(隨機梯度下降),正則化參數為0.001,損失函數為平方誤差損失函數。
首先對數據進行PCA 降維處理。原始數據為7 維的數據,采用PCA 算法進行特征累積貢獻度計算,結果如圖10 所示。當原始數據通過PCA將維度降低到4 維時,累積特征貢獻度已經達到了99%。這表明通過PCA 將維度降到4 維已經能夠最大程度保留數據特征,并減少訓練參數量。

圖10 PCA 特征累積貢獻度曲線Fig.10 PCA feature cumulative contribution curve
對比分析了增加PCA 頭部處理對神經網絡性能的影響,結果如圖11 所示。隨機選擇5 組訓練數據進行對比,可以看到,增加PCA 頭部后,R2有明顯提升,說明PCA頭部提取了有效特征,提升了模型的性能。

圖11 PCA-ANN 與ANN 效果對比圖Fig.11 Comparison of PCA-ANN and ANN effect
首先對比分析了不同隱藏層下,不同結構PCAANN 模型的表現,其評價指標如表5 所示。

表5 不同隱藏層PCA-ANN 性能對比Table 5 PCA-ANN performance comparison of different hidden layers
對比模型深度對預測結果的影響,分別從隱藏層數為1、2、3、4 的PCA-ANN 網絡中選出3 個不同網絡進行實驗,為防止隨機性造成的影響,每個模型訓練10 次取最優值。PCA-ANN 模型在只有1 層隱藏層時,R2僅為0.500 0 左右。當ANN 為2 層隱藏層時,R2明顯提升,范圍大約為0.600 0~0.660 0,MAE、MSE 值也有所降低。當模型深度加深為3 層時,模型的預測效果進一步提升,[6,6,6]網絡的R2更接近于1.000 0。模型深度為4 層時模型整體表現依然穩定,但是與3 層模型相比,R2提升不夠明顯。綜合以上的數據,選擇參數較少且表現最好的[6,6,6]為預測模型。
模型的損失曲線與交叉驗證如圖12 所示。模型的損失曲線表明在樣本量達到7 000,訓練批次epoch 為70 輪左右時,模型已經收斂,MSE 值穩定在0.1 左右。交叉驗證曲線中,訓練集和交叉驗證集Loss 值穩步下降,表明模型沒有出現欠擬合和過擬合的情況。

圖12 模型的損失曲線與交叉驗證Fig.12 Loss curve and cross validation of the model
當不進行數據清洗而直接預測時,隨機選取了模型預測的2 574 個點與HYSYS 工藝數據進行對比,結果見圖13。圖中越靠近黃色直線的點表明模型的預測結果越準確。模型的預測結果表明,基于PCA-ANN 的氣體純度預測模型在大多數情況下可能會高估HTO 值,但誤差不超過0.2%。這樣的高估有助于避免安全問題的發生,因此使用PCA-ANN 進行預測的值是可以被采納的。

圖13 HYSYS HTO 與PCA-ANN HTO 對比圖Fig.13 Comparison of HYSYS HTO and PCA-ANN HTO
對邊界處進行分析,在HTO 為2.2%~2.8%時,會有少數點位的HTO 值被PCA-ANN 低估,選擇其中10 個預測較差點位進行分析,結果見表6。從表中可以看出,PCA-ANN 與HYSYS 模型產值誤差較大時的點位均為壓力等于 0.1 MPa 的邊界工作點,而沒有發現非邊界壓力條件下的異常預測點。分析結果表明,若不對HYSYS 模型在邊界處產生的數據進行數據清洗,會導致PCA-ANN 在邊界條件處預測效果差。篩除壓力邊界工作點的異常數據再次進行訓練,預測結果如圖14 所示,可以看出,模型的R2為0.950 7,較之前有明顯提升。

表6 預測較差點位的運行工況Table 6 Operation conditions with poor prediction effect

圖14 數據清洗后HTO 對比圖Fig.14 Comparison of HTO after data cleaning
通過建立基于PCA-ANN 的氣體純度預測模型,預測了堿性電解水制氫過程中的關鍵指標HTO,模型實驗結果表明,機器學習算法對于堿性電解水系統氣體純度的預測結果比較準確,MAE、MSE 值小,因此,以機器學習模型去預測制氫過程中氣體純度是可行的。用PCA-ANN 對電解水制氫過程中HTO進行預測,若不進行數據清洗,則模型最佳決定系數R2大概介于0.490 0~0.720 0 之間,經過數據集數據預處理后能夠達到0.950 7,模型表現良好。原始數據集質量決定了模型的上限。綜上,對邊界操作條件處的數據清洗極為重要。
原始訓練數據的7 個變量與HTO 值為強相關關系,但HTO 值還受堿液循環量、分離器分離效率、操作策略等因素的影響,在本模型中沒有對其他參數進行參數調整和研究。