柯 晗,付曉薇,2+,李 曦
(1.武漢科技大學 計算機科學與技術學院 智能信息處理與實時工業系統湖北省重點 實驗室,湖北 武漢 430065;2.華中科技大學 材料成形與模具技術國家重點實驗室, 湖北 武漢 430074;3.華中科技大學 人工智能與自動化學院,湖北 武漢 430074)
固體氧化物燃料電池(solid oxide fuel cell,SOFC)是一種具有高效率和低污染排放的經濟型能源轉換系統[1]。SOFC主要通過陽極中燃料氣體的氧化反應來產生電能。Ni-YSZ陽極、YSZ電解質、LSM-YSZ陰極是制備單片電池首選材料體系。通常,SOFC的陽極中,基于Ni的陽極是在首次啟動時以NiO還原生成,陽極的氧化還原反應也會造成微觀結構的變化,因此了解相關的氧化還原過程非常重要。在SOFC陽極還原過程中,NiO未完全還原的情況下會出現由較大晶粒包裹未還原NiO的球殼結構,會限制還原氣體進入或離開Ni/NiO球殼表面,影響電池性能和穩定性[2]。
非神經網絡的機器學習方法試圖通過待檢測目標的局部或全局特征進行統計和分析。例如HOG[3]或者SIFT[4]進行特征提取,通常與AdaBoost[5]或SVM[6]等分類器結合,然后采用滑動窗口所示的策略,實現有效定位。深度學習方法實現了真正的端到端的計算,也大幅提升了目標識別的速度和精度。使用了深度學習方法自動檢測SOFC陽極球殼結構,分析陽極還原程度,能協助電池優化和研究。使用具有較好目標檢測性能的全連接卷積網絡(R-FCN),結合圖像預處理、數據擴增以及網絡結構優化,提出一種適用于球殼結構數據集的SOFC陽極中球殼結構檢測方法。為避免其它相似結構造成的誤檢和漏檢,使用了更適合光學顯微鏡下球殼結構的閾值算法,并針對SOFC圖像中球殼大小對預選框尺度進行優化,提出了殘差網絡101層(Res101)搭配R-FCN球殼檢測的優化方法。
SOFC陽極中球殼結構的影響有:導致樣品電池微結構退化;陶瓷骨架結構不完全;阻擋催化活性表面并降低了整體復合材料的孔隙率;持續影響SOFC氧化還原反應和電化學性能[7];降低其使用壽命。SOFC陽極的微觀結構和還原程度分析有利于優化SOFC的最佳性能和制造條件[8,9]。顯微分析法是現在應用較普遍的微觀測試技術,可無損研究微結構單元體的大小、形狀、表面特征以及各單元體之間在空間上的排列及其相互作用形式。通過掃描電子顯微鏡或光學顯微鏡拍攝得到多孔電極陽極的微觀結構,具有簡單,直接,無損,易于實現等優點[10]。其它方法比如:X射線斷層掃描[11]和聚焦離子束掃描電子顯微鏡(FIB-SEM)技術[12],但這些技術過程復雜,且掃描的圖像中球殼結構與其它結構很相似,特征不明顯,不利于檢測球殼結構。由于光學顯微鏡圖像(OM)中易分辨 Ni-YSZ 復合材料中的Ni、NiO相和球殼結構,且光學顯微鏡圖像獲取簡單,所以通過光學顯微鏡觀察和研究球殼微觀結構信息。Utigard等[13]使用光學顯微鏡觀察未完全還原Ni/NiO的球殼結構,研究不同制備條件下球殼結構與還原動力的關系,優化陽極的微觀結構和制備條件,提高電池性能。利用光學顯微鏡來檢測和分析SOFC中球殼結構,能根據球殼數量、大小和形狀快速分析出陽極的還原程度,有利于對整體微觀結構的優化分析和尋找最佳制備條件。
光學顯微鏡圖像中,基于Ni/YSZ陽極未完全還原的SOFC微觀結構圖像如圖1所示,由于Ni/YSZ金屬陶瓷材料的物理特性,SOFC陽極在光學顯微鏡下呈現特有的三相灰度分布規律:較亮部分為催化劑Ni相,較暗部分為孔隙相,中間灰度值的部分為致密陶瓷YSZ相。圖2中白色Ni顆粒包圍灰色NiO形成了球殼結構[13],可以觀察到有大量Ni晶粒中心存在NiO,表明盡管加工過程中采用了嚴格的還原條件,但還沒有實現NiO完全還原。灰色顆粒被亮粒子包圍的球殼微觀結構具有以下特征:①數量大;②形狀復雜,多為不規則的圓環和半圓環形狀;③由于圖像噪聲和模糊邊界,有一些尖銳的球殼。

圖1 Ni/YSZ陽極微觀結構光學顯微鏡圖像

圖2 SOFC球殼結構圖像
使用的數據集包含未完全還原的SOFC陽極圖片1000張,并將這些圖像剪切為不同的尺寸,圖像大小包括120×120、256×256和500×375。在圖3中,顯示了使用的不同尺寸具有球殼結構的光學顯微鏡圖像。圖像包含球殼結構和背景類,背景類一般為Ni、YSZ和孔隙。在SOFC光學顯微鏡圖像中,根據專家經驗,手動標注包含球殼的位置框和類,標記輸出是相應類別和不同大小的邊框坐標。圖3中可見不同尺寸圖像的球殼標記邊框,其中標記邊框包含SOFC的球殼結構。在光學顯微鏡圖像中,由于一些球殼結構與其它結構易混淆,從而使得球殼識別問題更具挑戰。在制作訓練圖像時,為了得到更好的球殼結構檢測結果,制作包含特征圖上的框(ROI)作為圖像主要部分的樣本,如圖3(a)和圖3(b)所示,圖像中矩形框標注的球殼結構占圖像的主要部分,這能使訓練更有效,更快捷。

圖3 不同尺寸的球殼結構圖像
盡管深度神經網絡系統相對于傳統的機器學習視覺算法具有明顯的優異,但其仍存在訓練過程中,易產生過度擬合問題。使用數據集擴充可有效解決過擬合問題。當數據集中的圖像數量不足時,需要進行數據增加。使用的數據集擴充方法有:幾何變換和強度變換。前者包括:調整大小、裁剪、旋轉和水平翻轉;后者包括:對比度和亮度增強。
使用了R-FCN框架[14]對SOFC陽極球殼結構進行檢測和識別,算法流程如圖4所示,主要包括候選分類和邊框分類。R-FCN提出了基于區域的全卷積網絡對象檢測方法,在分類問題中需要特征具有平移不變性,檢測則要求對目標的平移做出準確響應。現在的大部分卷積神經網絡(CNN)在分類上可以做的很好,但用在檢測上可能效果不佳。Faster R-CNN[15]類的方法在候選區域池化(ROI pooling)前都是卷積,是具備平移不變性的,一旦插入候選區域池化,后面的網絡結構就不再具備平移不變性了,因此,R-FCN提出來的目標位置敏感得分這個概念是能把目標的位置信息融合進區域池化。R-FCN把R-CNN換成了先用卷積做預測,再進行候選區域池化。由于候選區域池化會丟失位置信息,故在池化前加入位置信息,為了指定不同得分圖(score map)負責檢測目標的不同位置。在池化后,對不同位置得到的score map進行分析,得到原來的位置信息[14]。并且R-FCN模型在搭配ResNet 101[16]時,可以在更短的檢測時間內,獲得比Faster-RCNN更高的檢測精度。

圖4 R-FCN結構
方法中使用的損失函數(loss fuction)由兩部分組成:分類部分和邊界回歸,前者為交叉熵損失(cross-entropy loss),或者為回歸損失(box regression loss)[14],其損失函數定義為
L(s,tx,y,w,h)=Lcls(sc*)+λ[c*>0]Lreg(t,t*)
(1)
其中,c是RoI的真實標簽(c=0表示的是背景)。Lcls(sc*)=-log(sc*), 是用于分類的交叉熵損失函數(cross-entropy loss),Lreg是邊界回歸損失函數(bounding box regression loss),t*表示真實邊框,λ初始化設置為1。
由于NMS算法中,將相鄰檢測框的分數均強制歸零,即將重疊部分大于重疊閾值的檢測框移除。在這種情況下,如果一個真實物體在重疊區域出現,則將導致對該物體的檢測失敗并降低了算法的平均檢測率,且NMS的閾值不太容易確定,設置過小會出現誤刪,設置過高又容易增大誤檢。優化方法在球殼結構檢測中使用Soft-NMS檢測框去重[17],交并比(IoU)計算如式(2)
(2)
其中,A表示數據集中原標記框,B表示網絡的候選框。在算法執行過程中不是簡單對IoU大于閾值的檢測框刪除,而是降低得分。算法流程同NMS,但對原置信度得分使用函數運算,目標是降低置信度得分。置信度重置函數如式(3),bi為待處理候選框,si是bi框更新得分,N是NMS的閾值,bi和M的IoU越大,si就下降越多
(3)
由于殘差網絡(residual network,Res)可以使用很深的網絡層,其訓練集準確率不會因為數據集誤差下降,所以網絡更容易訓練,且可以從顯著增加的深度中獲得更加準確的特征信息。因此對比VGG網絡,殘差網絡的網絡層數可以更多,且局部感受野信息更多[18]。vgg16有228×228像素的感受野,殘差網絡50(Res50)有335×335像素的感受野, 殘差網絡101(Res101)有879×879像素感受野,而且感受野信息越大,檢測任務的準確性可能越高。R-FCN搭配Res101網絡的準確率相比搭配VGG、殘差網絡50和殘差網絡152準確率最高[14]。因此優化方法的特征提取網絡采用101層的殘差網絡,其基本結構如圖5所示。

圖5 殘差網絡基本結構
殘差網絡由兩層構成,第一層是F(x), 如式(4)所示,其中wi(i∈(1,2)) 是卷積層的權重,激活函數是ReLu。第二層是Y(x), 如式(5)所示
F(x)=w2×Relu(w1×x)
(4)
Y(x)=Relu(F(x)+x)
(5)
殘差網絡采用卷積層與恒等映射(identity)之和結構作為網絡的基本結構,如果失去恒等映射結構,學習目標是H(x)=F(x)+x, 而添加恒等映射結構后學習目標為H(x)-x。 該網絡,使得神經網絡的訓練錯誤不會隨著網絡層數增加而增加,從而解決網絡深度變深之后性能退化的問題。x與F(x) 維度不同時,就需要采用式(6)增加Ws變量對x升維
Y(x)=Relu(F(x)+Wsx)
(6)
優化方法在R-FCN中使用Res101特征提取網絡,其網絡結構見表1,Res101去除原始網絡最后的平均池化層和全連接層,保留100層的卷積層用于特征提取。為了降維,100層卷積層后添加了一層1×1×1024的卷積層,使輸出維度變成1024(原始的是2048),再接一層卷積層用于產生得分圖。ROI特征處理是對RPN網絡輸出的可疑區域做進一步處理,使用“Conv4_x”最后一層的特征映射,步幅大小為8像素或16像素,加上5個卷積層,其深度分別為512,512,256,256,128。當從“Conv5_x”的最后一層進行特征映射時,和“Conv4”的準確率基本一樣,但計算參數更多。因此,優化方法選擇使用“Conv4”的最后一層進行特征映射。

表1 殘差網絡101結構
實驗對比使用原始R-FCN、Faster-RCNN和SSD[19]檢測方法,使用反向傳播(BP)和梯度下降算法(SGD)優化網絡權重,學習率為0.001,RPN訓練的小批量大小為256。在Ubuntu16.04系統Python3.5版本的tensorflow1.4環境下進行訓練,硬件配置: 內存:16 G RAM, CPU: Inter Xeon(R) E3-1240 v5 2.2 GHz,GPU: NVIDIA GTX 1060 @6 G。
圖6是訓練迭代次數與訓練集總損失值之間的關系,橫坐標是迭代次數,縱坐標是總損失值。當迭代次數大于9000次后,訓練損失值不再下降,因此選取迭代次數為 10 000 的訓練結果進行測試。

圖6 訓練損失率
預選框尺寸的優化:R-FCN框架的原始預選框尺寸為128×128,256×256以及512×512,由于圖像中球殼結構尺寸較小,且差異較大,通過統計訓練集中球殼結構尺寸來對預選框尺寸的優化。邊長長度在30-130之間的球殼占所有球殼的97%,因此預選框尺度選擇32×32、64×64、128×128和192×192這4種尺度的預選框,更切合球殼結構的大小,從而避免漏檢。
提出的系統實現了R-FCN和Res101特征提取器來檢測SOFC球殼結構圖像。首先根據交并比(IOU)和平均準確率(AP)評估我們系統的性能,當預測的球殼位置與實際球殼位置的IOU值大于設置的閾值,則認為預測結果是真陽性,否則為假陽性。TP是真陽性的數量,FP對應于誤報的數量,理想情況下,FP的數量會很小。AP計算方式如式(7)。不同的IoU閾值會對判別結果有影響,在SOFC球殼結構數據集中測試不同的IOU閾值對判別結果的影響如圖7所示,基礎模型包括R-FCN和僅優化NMS后的優化方法
(7)

圖7 不同IOU閾值的結果對比
當IOU<0.5,曲線較穩定上升,當IOU在0.5左右時,平均精度較高,當IOU>0.5時,平均精度有所下降,因此在測試時選擇IOU閾值為0.5。在SOFC球殼數據集上IOU= 0.5的平均準確率見表2。從表2中可以看出,基于Res101的R-FCN檢測結果優于其它兩種方法,且使用了R-FCN改進方法相比原R-FCN方法準確率也有提升,在球殼數量較多的500×375的大圖上,提升更加明顯。

表2 不同方法的AP值/%
基于Res101的R-FCN、Faster-RCNN和SSD在球殼測試集上的檢測結果示例如圖8所示,矩形框為檢測框,且在方框上方顯示出球殼結構的置信度。圖8(a)為SSD檢測結果,置信度較低,大概在50%到90%之間,存在漏檢現象,在較大圖中右下角的球殼結構未被檢測出。對較小的球殼結構不敏感。圖8(b)和圖8(c)分別為Faster-RCNN各R-FCN方法的檢測結構,置信度高,大概在90%到98%之間,從結果中可以看出,Faster-RCNN和R-FCN方法的檢測準確率相當,在測試圖像中,都將右圖中右下角球殼結構漏檢。圖8(d)為優化方法,可以看出優化方法正確檢測出測試圖片中所有球殼結構,并且對于不同大小以及形狀的球殼均具有較好的檢測結果,能夠有效地檢測球殼的類和位置。相比前3種方法,優化方法有更高置信度,有效減少了漏檢現象,更適合用來對SOFC光學顯微鏡圖像進行檢測識別工作。

圖8 球殼檢測示例
通過檢測SOFC陽極中是否含有球殼結構,來判斷SOFC陽極是否完全還原,還能通過檢測的球殼數量評估出陽極的還原程度,以此來輔助研究陽極NiO的還原動力。優化方法在球殼結構檢測上相比其它方法存在一定的優勢,但仍存在少數誤檢以及漏檢現象。在大量的測試中發現漏檢情況包括:尺寸較小的低灰度值球殼結構;容易和其它結構混淆的球殼結構;尺寸較小且邊緣不清晰的球殼。若測試圖片中如果球殼結構清晰明顯,3種檢測方法都能很好的檢測出球殼結構,但優化方法在較小或易混淆的球殼結構上也有突出表現。表3是不同方法在不同尺寸球殼測試圖像的平均檢測時間和平均準確率。

表3 檢測時間和平均AP
搭配Res101特征提取網絡的Faster R-CNN模型可以實現球殼圖像的高精度,但檢測速度比R-FCN慢很多,準確率比R-FCN低。SSD的準確率低于前兩者,但檢測速度最快。基于Res101優化的R-FCN模型降低了計算參數,在球殼數據集上相比R-FCN原始方法減少了檢測時間,同時通過優化NMS和檢測窗口等方法來提升準確率,實現了檢測速度和準確度之間的平衡。
結合了圖像數據增強、訓練參數以及網絡結構優化,提出一種適用于SOFC光學顯微鏡圖像中球殼結構檢測的優化方法。在測試集上對提出的方法進行驗證,結果表明相比其它流行檢測方法,優化方法具有更好的球殼結構檢測性能和檢測速度,驗證了此檢測架構的可行性和魯棒性。主要改進的方向是:訓練參數更加適合球殼結構訓練集;NMS計算方式更加合理;通過網絡結構優化,保證準確率的同時,降低了計算的參數。優化方法實現了對SOFC陽極球殼結構的準確檢測識別,可用于SOFC陽極還原程度的檢測與研究。該方法為優化電池前期制備工藝和提高SOFC電池的性能,提供了一種思路與方法。