羅祉婧,韋振宇,鄭荻凡,曾澤楷,鐘漢斌
(西安石油大學,化學化工學院,低碳能源化工工程研究中心,陜西 西安 710065)
隨著大數據和深度學習的發展,人工智能迎來了第三次發展熱潮,并開始在化工[1-2]、醫療[3]、交通[4]、金融[5]、農業[6]等領域上獲得廣泛應用。其中,卷積神經網絡(Conventional Neural Network,CNN)作為典型的深度學習網絡之一,在圖像和視頻處理中發揮著重要的作用。較之于傳統的機器學習,CNN圖像識別技術大大提高了圖像識別的精度,同時也避免了因進行人工特征提取所消耗的大量時間。將CNN圖像識別技術應用在化工領域上,解決了圖像收集、重建等諸多問題,為推動人工智能在化工領域上的應用,助力化工企業數字化轉型和高效率、高質量發展奠定了重要基礎。
卷積神經網絡是由多層感知機(Multi Layer Perceptron,MLP)演變而來,主要由卷積層、池化層、激活函數以及全連接層構成。由于卷積神經網絡具有局部連接、權值共享、降采樣的特性,使得其在處理圖像時表現尤為出色。
卷積層通過對圖片進行卷積運算來提取特征。低層卷積提取低級特征,如邊緣、線條等,高層卷積則用來提取更為深層的特征。卷積操作如圖1所示,其中,k1~k9為卷積核的數值。卷積核在原圖上滾動來遍歷圖片,并且通過計算圖片與卷積核上的數值來提取特征。同一個卷積層將會得到若干個特征圖,每個特征圖都會提取出一類特征,并且同一個特征圖的神經元會使用同一個卷積核(權值共享)。

圖1 卷積操作
卷積計算公式如下:
(1)
式中,f(x)代表輸出特征;θij代表第i行j列的卷積核元素大小;xij代表第i行j列元素;b為偏差。
常用激活函數有sigmod函數、tanh函數,以及ReLU函數,三者函數曲線如圖2所示。激活函數一般具有非線性、連續可微、單調性等特性。在網絡中加入若干激活函數,用于提高網絡的非線性擬合能力。

圖2 三種激活函數
在卷積層后通常會添加池化層來對實現對特征的降維。不僅如此,池化操作還能有效避免模型的過擬合,同時可以提高所提取特征的魯棒性。
常用的池化方法包括最大池化和平均池化,具體操作如圖3所示。其中,平均池化以卷積核中所有值的平均值為特征值,從而減小因鄰域大小受限造成的估計值方差增大,平均池化對微小變形具有魯棒性;而最大池化可以減小因卷積層參數誤差造成的估計均值偏移,它對圖像紋理信息保留更好。

圖3 池化操作
經過一系列的卷積和池化操作后,輸入數據被移交給分類層,由分類層對提取的所有特征進行非線性組合,最終輸出,該過程可由公式(2)表示。
f(x)=W×x+b
(2)
式中,x為全連接層的輸入;W為權重系數;b為偏置。
黃正梁等人[7]基于CNN網絡、全卷積神經網絡(Fully Convolutional Network,FCN)網絡和條件隨機場,建立了一種氣-液-固三相反應器的圖像分析方法。該流程如圖4所示。

圖4 基于CNN的氣-液-固三相反應器圖像分析流程[7]
主要包括圖像采集、訓練集制作、模型建立以及參數提取四部分。在模型訓練過程中,當識別得到的圖像與原始二值化圖像偏差小于設定值時,模型訓練完成。經過學習率、訓練次數、訓練集大小等參數優化后,模型在學習率為0.005、學習率大于2000、訓練集超過400張圖像下,誤差控制在5%以內。該方法可用于涓流床流動參數的檢測,其中所提取得到的平均液相分數能較為準確地預測涓流區的壓降,其平均相對偏差控制在15%以內,為氣-液-固三相反應器的研究提供了新的工具。
Wang等[8]利用卷積神經網絡來識別方形涓流床反應器中的流場圖像,并且定量提取了床層中的氣液相含率,結果表明,利用平均液相含率可清晰辨識涓流、脈沖流、鼓泡流等流型間邊界。仝衛國等人[9]提出一種基于Landweber算法和卷積神經網絡VGG16的流型識別方法,首先通過Landweber算法對流型圖像進行重建,并且利用采集得到的10000張泡狀流、彈狀流流形圖片對模型進行訓練、測試;當凍結卷積層為10,輸入100×100尺寸、326×218分辨率的圖片時,該流形識別網絡達到了95%的準確率;同時,在如圖5所示的4組數據集容量下,對模型進行魯棒性考察,結果表明,4種數據集的測試準確率最終穩定在96%左右,驗證了該模型具有很好的魯棒性。

圖5 不同數據集容量下的準確率曲線[9]
孫先亮等[10]建立了一種基于數據驅動的卷積神經網絡的顆粒濃度分布重建方法,并且通過數值模擬方法隨機抽取了6萬組具有氣-固兩相流流型特點的顆粒濃度分布圖像,進而基于有限元法建立了顆粒分布與電容向量對應的數據集。依據所建立的數據集對模型進行訓練,并且考察了CNN網絡結構對重建效果的影響,同時根據相對圖像誤差、相關系數和相含量三個指標對模型重建效果進行了分析。結果表明(圖6所示),所建立的CNN圖像重建模型抗干擾能力較強,在20 dB、30 dB及40 dB噪聲環境下的重建效果依然與不加噪聲的傳統LBP、Landweber算法重構的顆粒介質濃度分布較為吻合。
在化學流程工業故障診斷中,卷積神經網絡發揮著不可小覷的作用[11]。例如,Wu等[12]基于深度卷積神經網絡(Deep Convolutional Neural Network,DCNN)提出了故障診斷分類模型,訓練數據通過MATLAB工具箱進行收集,并且在訓練階段使用了Dropout手段有效防止了模型過擬合;模型最終在233720張訓練集樣本下精度達到了98.6%,在測試集樣本(30680張)下達到了88.2%的故障分類準確度。吳春磊[13]提出了具有非對稱卷積核(Asymmetric Convolutions)的CNN工業過程故障識別模型(AC-CNN),原始的簡單CNN故障分類模型由于結構簡單,對工況故障數據分類效果并不理想(如圖7(b));在此基礎上,通過對模型卷積核尺寸、濾波器數量等進行優化,改進后的AC-CNN模型在21種故障下隨機測試集的分類性能和效率顯著提高。

圖6 CNN、Landweber與LBP算法在不同噪聲環境下的重建效果[10]

(a)工況原始數據 (b)CNN模型故障分類 (c)AC-CNN模型故障分類
根據生物神經網絡拓撲獲得的人工神經網絡在現階段應用越來越廣泛,因為它具有很強的并行處理、聯想記憶、非線性、自學自適應等能力。其中,卷積神經網絡作為深度學習的代表算法之一,在反應器內參數測定、流場識別、流場重構和故障診斷等方面取得了一定的應用進展。但在將人工智能與化工融合應用過程中,仍需要進一步提高應用的深度和廣度。建議從算法本身的優化出發,與化工領域的知識特點進行深度整合,為化工行業的高質量發展添加新動力。