馬天順,魯 昊,李頂根,張翰林,錢 祥
(華中科技大學 能源與動力工程學院,湖北武漢 430074)
在工業生產和科學研究中,火焰檢測(flame detection)是一個重要的課題,常用于火災預警等。火焰檢測技術的深入發展,產生了對于燃燒場中反應區域的識別,尤其是火焰識別(flame recognition),有助于捕捉火焰形態特征,并進一步研究火焰的變化規律。
在湍流燃燒的研究中,準確捕捉火焰面對于進一步研究其中能量傳輸、物質輸運,以及湍流與反應之間相互作用等問題非常關鍵,但在三維動態的湍流燃燒場中進行火焰識別十分困難。在火焰面判斷上,一些學者提出了一些方法。Mohammadnejad 等在對不同條件下CH4/H2-空氣湍流預混火焰的內部結構進行的實驗研究中,使用平面激光誘導熒光(PLIF)技術得到CH2O 和OH 的信號,以[CH2O]ɑx[OH]β來表征熱釋放率作為火焰面,其中系數α和β需要進行擬合。在數值模擬中,Kerkemeier[2]在對湍流非預混火焰進行直接數值模擬(Direct numerical simulation,DNS)時,使用YOH>10-4作為標準,以確定非預混燃燒中的火焰面。另外,Turkeri 等[3]在大渦模擬(Large-eddy simulation,LES)數據中,用溫度擾動的極大值來判斷火焰面位置。
上面這些方法的主要問題是所選取的變量較少,而且比較主觀,例如按照Kerkemeier 中提及的以YOH為依據的識別方法,從圖1可以看出,不同YOH的閾值定義的火焰面在形態、厚度上存在明顯差異。有些還無法實現對火焰的動態跟蹤(如Turkeri 等)。而引入人工智能的手段可以同時處理多個物理場(比如溫度、組分、速度場等);在湍流燃燒中,尤其是DNS和LES 中,可以得到瞬態、三維的流場,提供大量的多個物理場的數據,能夠對開展湍流燃燒中火焰面的識別與檢測提供數據支持。Zhou 等結合三維計算流體數據和K-means 方法對加熱通風和空調(HVAC)系統開展分析,以優化該系統的效率。從這次嘗試可以看出,人工智能算法是能夠用于三維流場的區域劃分。

圖1 不同YOH大小定義的MILD燃燒HM1工況火焰面的溫度分布
本研究將探索采用無監督學習方法中的聚類算法來識別湍流燃燒場中的火焰,方法具有兩個明顯的優勢:
1)能夠更加客觀地,而不是基于經驗標注湍流燃燒場中的區域類別;
2)能夠處理包括速度場,溫度和各個組分在內的多維數據樣本,解決人工類別標注成本巨大的問題。本研究將會采用 Dally 等開展的在熱伴流射流(jet-in-hot-coflow,JHC)設置下的一個典型的湍流MILD 燃燒工況——HM1為研究對象,在對其進行數值模擬的基礎上,使用基于聚類算法(K-means、均值漂移等)對其中的火焰區域進行識別。
本研究采用的MILD 燃燒模擬工況是Dally 等[5]在JHC條件下的HM1實驗工況。其實驗裝置是一個內徑為4.25mm,外徑為82mm 的環形柱狀裝置。內徑的中心孔噴入燃料射流(質量分數:80%CH4和20%H2),入口溫度為305K,平均速度為73.5m/s,雷諾數為9 482;孔外的環形區域噴入熱伴流(質量分數:3% O2、85% N2、6.5% H2O 和5.5% CO2),平均溫度為1 300K;而最外層為冷空氣(300K),熱伴流與外層的冷空氣的平均速度3.2m/s。魯昊等已經對該工況實現了高精度的非線性大渦模擬,具體方法和結果不再贅述。
聚類算法是機器學習的一個分支,屬于無監督學習算法。其中,K-means 算法是最早提出的聚類算法,已經有50多年的歷史[7]。在K-means 算法的基礎上,又發展出很多改進的聚類算法,在不同的科學領域被廣泛地研究和應用。但K-means算法憑借其容易實施、簡單、高效,目前仍然是應用最廣泛的劃分聚類算法之一。其主要步驟為:
(1)隨機選擇K個類的中心點。
(2)計算中心點與每個數據點之間的距離。
(3)將數據點劃分到離它最近的中心點的類中。
(4)重新計算中心點。
(5)計算新的中心點和每個數據點之間的距離。
(6)重復2~5步驟,直到每一類中心在每次迭代后變化不大為止。
除了K-means 算法,本研究還使用了自組織映射神經網絡(Self-Organizing Maps,簡稱SOM 神經網絡)和均值漂移(meanshift)兩種聚類算法。SOM 神經網絡輸入層是燃燒相關的變量信息,輸出層是一個多維空間模型。輸入一個n維向量X=(x1,x2,…,xn),建立一個有m個輸出節點的二維網格。對輸入變量與輸出變量的神經元節點進行訓練,產生最小距離的神經元,直至得出聚類結果。均值漂移算法的主要思路是在樣本空間中搜索密度最高的區域,即通過不斷迭代,將特征空間中的樣本數據向更密集的區域“漂移”,其原理簡單、迭代計算的效率很高,但是迭代計算過程中搜索區域的大小對算法的準確性和性能有較大的影響。
這三種算法中,K-means 和SOM 神經網絡都需要指定分類的數目(SOM 神經網絡為神經元數目);而均值漂移算法不需要設定數目,會根據設定的收斂距離進行劃分。
為了使聚類后不同的類能較好地反映燃燒的狀態,選擇變量就十分關鍵。通過圖2給出的變量(a)溫度、(b)OH、(c)CH4、(d)CO 的分布云圖可以看出,不同變量的云圖區別較大,高溫區主要與羥基(OH)存在的區域重合,這部分也是CH2等燃燒中間產物濃度的主要聚集區;CH2O、CO 等燃燒初期的生成物主要分布在OH 分布面內側,溫度為1 000K 左右的區域;更內側區域的溫度會更低,甚至和外側常溫空氣相當,這里的主要成分是燃料甲烷;而在OH 分布面的外側,溫度在1 300K 左右的區域主要是熱伴流;在熱伴流外側是常溫空氣區。研究將反應區域大致分為五部分,分別代表:
1)燃料區(甲烷為主)。
2)火焰面(主要為OH 等)。
3)火焰內部高溫區(主要為CO 等)。
4)熱伴流區。5)空氣。

圖2 溫度(T/K)和一些物質質量分數云圖

表1 權重設置方案
圖3顯示了三種算法在改變權重后的聚類劃分結果。可以看出,K-means 和SOM 神經網絡顯示出了很好的一致性,兩種算法對分類的劃分十分接近。結合圖1、圖4,反應區域被分成五類,分別代表:Cluster1:燃料區;Cluster2:OH 較濃的區域作為火焰區域;Cluster3:內部高溫區;Cluster4:熱伴流區;Cluster5:空氣區。均值漂移的聚類結果和前兩種算法相比,最大的差別在于K-means 和SOM 神經網絡劃分的燃料區更大。

圖3 三種算法的聚類結果
下面將比較三種算法之間的相關性,即比較每兩種算法產生的類別數組的相關系數,比較三種算法計算的一致性。從表2能夠看出,K-means 和SOM 神經網絡兩種算法結果的相關系數都超過了0.99,可以看作幾乎是一樣的;均值漂移算法和另外兩種算法的相關性在0.85左右。

表2 三種算法兩兩間的相關系數
文獻[2]中的YOH>10-4判據,應用到本研究的模擬工況中,改變YOH的大小,得到的火焰面就會不同(圖1)。以上一節中劃分出來的Cluster2:OH 較濃的區域作為火焰區域,如圖4,三種算法識別出來的火焰面在形態上非常接近。

圖4 三種算法識別的火焰面的溫度分布
從表3中可以看出,三種算法火焰面的相關系數都在0.9以上,顯示出了很強的相關性,尤其是K-means 和SOM 神經網絡算法,相關系數達到了0.999 7,可以說識別出來的火焰面幾乎是一樣的。

表3 不同算法火焰面的相關系數
由于三種算法良好的一致性,為了更好地了解數值模擬火焰區域以及聚類分析的結果,以K-means 算法的結果作為對象,考察聚類結果在混合分數空間上的分布情況。使用Bilger 公式[10]計算出各數據點的混合分數(mixturefraction),計算公式為:



圖5 溫度和OH濃度在混合分數空間的散點圖
通過上面的分析可以看出,選用合適的變量,并設置適當的權重,應用聚類算法可以較為準確地識別出火焰面;并且不同的算法在識別火焰面上表現出來很好的一致性;與選擇變量少、比較主觀的傳統方法相比,這種運用機器學習的方法更加客觀,為湍流燃燒的模擬研究提供了一種新的思路。
本研究對采用大渦模擬的MILD 燃燒數據進行了不同方法的聚類劃分,得到了以下的結論:
1)選取OH、CO、CH4三種物質的濃度和溫度作為變量,在權重選擇合適的情況下,使用三種不同的聚類算法進行聚類劃分的結果有很好的一致性,K-means 與SOM 神經網絡的相關性達到了0.99以上,均值漂移算法與這兩種算法的相關性也在0.85;
2)三種算法識別出來的火焰面區域有著更高的一致性,它們之間的相關性都在0.9以上,K-means 與SOM 神經網絡的火焰面相關性達到了0.99以上,均值漂移算法與這兩種算法的相關性也到達了0.94;
3)相較于傳統地人為通過單一或少數幾個變量的閾值定義火焰面,采用多個變量,應用聚類算法定義的火焰面更加準確。
本研究中只采用了一種燃燒工況作為研究對象,且所選用的網格較為稀疏,在未來的工作中會對網格數更多的數據進行分析;不同變量的選擇和前處理還需要更加合理、客觀的方法(比如無量綱化、降維算法等方法來避免設定權重),使其能夠擴展至其他的湍流燃燒模擬工況中。