







摘 要 原子層沉積(ALD)設備被廣泛應用于半導體、新材料、光伏產業中制備高質量納米膜。針對制膜過程中關閉真空計,導致壓強數據缺失,無法判斷反應源是否通入及設備是否正常運行的問題,采用軟測量方法預測制膜過程中的壓強。為提高軟測量對不同工藝條件及配方的預測泛化能力,提出采用基于滑動窗口的集成即時學習法(BaggingMwLWPLS)對壓強進行實時建模及預測,使用滑動窗口劃分數據集,采用Bagging集成算法將局部加權偏最小二乘法(LWPLS)的預測值平均融合作為預測壓強。結果表明:該方法能自適應預測不同工藝配方的實時壓強,且預測快速、準確、不易受噪聲干擾,實現設備壓強狀態和性能的實時監控。
關鍵詞 工藝壓強 滑動窗口 局部加權偏最小二乘 集成學習 自適應預測
中圖分類號 TP274"" 文獻標志碼 A"" 文章編號 1000-3932(2024)05-0879-08
原子層沉積(ALD)設備能夠制備均勻性好、純度高、保形性強的納米級薄膜,且設備操作簡單、可重復性強、沉積溫度低、污染小,在對材料純度及均勻性要求較高的微電子、顯示器件、光電儲能器件等領域應用廣泛[1]。ALD設備通過向真空度為10-1 Torr(1 Torr=133.3224 Pa)左右的腔體內交替通入不同的反應源,進行化學吸附及配體交換制備薄膜,由于腔體密封加熱和檢測技術的局限,制膜過程中反應源的運動情況無法得知,不能檢測到反應源的沉積情況及反應殘余物是否吹掃干凈。但是反應源流進ALD腔體會引起壓強變化,所以壓強的準確、快速檢測對反應過程至關重要[2]。原子沉積設備可以利用真空計測量壓強,但是制膜過程中為了防止真空計被沉積腐蝕,導致測量值失真、響應速度變慢,通常關閉真空計,導致壓強數據缺失,無法判斷制膜過程是否正常進行、泵是否正常工作等。
對于無法直接測量或實時檢測到的變量,軟測量能利用待測量的相關量,基于工藝機理或數據驅動建立數學模型預估待測量[3]。工藝機理法通過變量之間的理化特性進行建模,由于反應源通入腔體引起的壓強變化具有非線性和時變性,且受反應源通入量、泵抽速、化學反應、腔室溫度等多因素影響,無法進行機理建模,所以采用數據驅動法對沉積過程的壓強進行預測[4,5]。
采用數據驅動法進行預測,當實際應用中出現傳感器老化和工藝配方、條件調整時,會出現模型不匹配的情況,針對這種情況,金懷平等提出了即時學習(Jitl)、時間差分(Td)及滑動窗
口(Mw)等自適應特性軟測量算法[6]。即時學習是軟測量中常用的方法,能有效預測非線性和時變信號,其在歷史數據庫內選擇與當前待測樣本相似的數據作為訓練集,再利用偏最小二乘(PLS)回歸、支持向量機(SVR)或高斯過程回歸(GPR)等算法建立局部模型進行預測[7]。
采用軟測量進行實際預測時,不同階段數據具有多相似度,且在其他因素的干擾下,單一模型預測性能下降。為提升預測性能,改進的“多模型、多尺度、多階段”軟測量模型開始廣泛應用[8]。周鋼和郭福亮提出采用集成學習將多相似度的基模型以投票、平均、堆疊等方式組合,提高模型的適用范圍、魯棒性和準確性[9]。潘貝等提出采用偏最小二乘回歸系數對不同相似度進行加權,采用Stacking算法對多相似度高斯回歸模型進行集成預測[10]。蔡成煒和蔡可采用Bagging集成學習算法形成多個訓練子集,進行基礎預測模型訓練,對各子模型的輸出值進行加權求解預測值[11]。
針對原子層沉積過程的壓強數據缺失,壓強為非線性、時變信號,原子層沉積工藝和條件調整導致常規軟測量模型不匹配的問題,提出以下方法[12]:
a. 采集壓強及其相關量,采用即時學習-局部加權偏最小二乘算法進行實時建模預測。
b. 通過滑動窗口劃分時序數據,縮小即時學習選擇相似數據的范圍,增加窗口時序權重;采用相似度界定值判斷當前觀測值是否需要重新建模,以減小計算量、縮短預測時間。
c. 對有調整的工藝配方,采集沉積開始階段的壓強及相關量構建數據庫,通過Bagging集成學習算法基于有限數據隨機形成多個子數據集,采用局部加權偏最小二乘(LWPLS)算法對子數據集進行訓練構建預測器,將觀測值的不同預測結果的平均值作為預測壓強。
1 原子層沉積設備及真空檢測方法
1.1 原子層沉積設備介紹
ALD是一種特殊的化學氣相沉積方法,以“氣體脈沖”方式交替通入兩種或以上的反應源,微量反應源在載氣和泵的作用下,流至真空腔體內的基片上發生化學吸附和配體交換[13],生長上一層單原子薄膜,依據反應源的自限制性和飽和性,通過控制反應物通入次數改變膜厚。圖1所示的ALD設備由反應腔室、反應源、真空泵、尾氣處理系統和設備控制系統組成。ALD設備自動操作界面如圖2所示,該界面由控制界面、設備構成及檢測數據、實時壓強和運行監控4個板塊組成。
1.2 壓強檢測方法介紹
ALD為防止氣路中的水氧雜質污染反應源,降低制備溫度,在制膜前需要將反應腔體及氣路管道抽為高真空狀態。在制膜過程中,微量反應源在載氣和壓差作用下流入腔體,反應源是否沉積在基片表面,化學吸附反應是否結束,可通過四級桿質譜儀間接分析,但是該方法過于復雜且不具備實時性[14]。由于技術局限,實際設備利用反應源流入腔體引起的微弱壓強脈沖變化來判斷反應源是否流入腔體且反應完畢。同時設備的壓強也可用于檢測設備腔體、氣路管道的密封性,觀測真空泵的抽速及性能,所以ALD設備的壓強監控至關重要。
ALD的壓強檢測傳感器要求不能對反應源的流動特性及反應造成影響,且檢測精度高、響應速度快、量程寬、耐腐蝕、耐高溫、體積小、易于安裝[15]。早期ALD采用薄膜規進行壓強檢測,但是隨著反應源在傳感器表面逐漸沉積,出現檢測結果漂移、腔體壓強達不到工藝所需壓強值及檢測速度變慢等問題[16]。目前采用美國公司的MKS910和INFOCON公司的CDG025D兩款真空計進行不同量程的壓強檢測,MKS910為微皮拉尼-壓電傳感器,檢測大氣壓到超高真空;CDG025D為電容式陶瓷隔膜真空計,檢測高真空壓強。真空計測得的沉積過程的壓強如圖3所示,反應源通入階段的壓強為非線性脈沖,吹掃階段(PURGE)的壓強較為穩定,不同反應源(DOSE1、DOSE2)通入并吹掃,完成一個沉積周期,循環多個周期實現納米膜層狀沉積。
2 算法介紹
2.1 偏最小二乘回歸介紹
PLS利用輸入輸出相關量進行降維預測,具有計算簡單快速、預測精度高的特點。局部偏最小二乘(LWPLS)結合局部線性加權和PLS進行預測,LWPLS能克服傳統PLS不適用于非線性、時變模型的缺點[17],是一種常用的即時軟測量算法。該算法突出局部特征,計算簡單,能有效避免過擬合,減小噪聲信號干擾,適用于實時性要求高且計算內存較小的情況[18]。
2.2 基于滑動窗口的集成即時學習(BaggingMwLWPLS)算法流程
ALD設備工藝配方調整導致壓強變化,為實現壓強快速、自適應預測,筆者采用BaggingMwLWPLS算法對壓強進行實時建模及預測[21]。
滑動窗口是軟測量中一種常用的自適應建模方法,常規LWPLS模型依據數據的空間相似度構建子集進行建模預測。原子層沉積過程的壓強呈現時序性、階段性、周期性,為同時考慮壓強數據的時間和空間相似度,使用滑動窗口劃分時序數據,增加數據周期時序權重。在窗口內尋找相似數據,縮小搜索范圍,減小噪聲數據干擾,提高預測效率和準確性。同時使用滑動窗口也可實時更新數據庫,減小數據內存,提高設備響應速度[22]。
Bagging算法是集成學習中的經典算法,通過隨機有放回地重復采集數據,產生多個獨立的數據集,構建多個并行學習器,學習器通過投票或加權法輸出一個預測值。初始沉積過程的壓強數據有限,采用Bagging隨機采樣形成多個獨立數據集能有效避免欠擬合,提高模型精度[23]。
針對壓強在線檢測數據量較少,不同訓練集預測結果不同的問題,BaggingMwLWPLS算法依據初始沉積階段的壓強及其相關量,采用Bagging產生多個訓練集,以LWPLS算法為基預測模型形成多個學習器,將各學習器的預測值平均加權作為預測結果,算法流程如圖4所示。
具體步驟如下:
a. 采集壓強及相關數據,進行數據去噪、歸一化處理;
b. 依據工藝配方和數據特征選擇滑動窗口長度;
c. 使用滑動窗口劃分數據集,并計算時序權重;
d. 預測過程中,計算當前觀測數據與前一觀測數據的累計相似度界定值,判斷是否需要重新尋找相似數據并建模;
e. 當累計相似度界定值εq?埸(1-δ,1+δ)時,采用Bagging算法隨機生成多組子訓練集,以LWPLS算法作為基訓練器對子訓練集構建子預測器;
f. 將子預測器的預測結果進行加權平均,得到最終預測結果。
觀測數據具有時序性,在吹掃階段相鄰數據較為穩定,且占較長周期時間,為減小相似數據的搜索、計算時間,提高預測效率,引入相鄰數據的累計相似度界定值判斷當前觀測點是否需要重新建立模型,累計相似度界定值公式為:
3 實驗及分析
3.1 建模數據來源
采用嘉興科民電子的TALD-150D設備制備TiN和LiO薄膜材料,兩者的制備工藝配方見表1。沉積腔體溫度為387 ℃,反應源加熱溫度為35 ℃,本底真空度為0.16 Torr,載氣流量為10 sccm(1 sccm=6×10-5 m3/h),泵抽速約1.8 L/s。PLC采集傳感器數據,并與上位機軟件Intouch通信,將測量數據導出至Mysql數據庫,數據導出頻率為每個0.12 s,測量數據為采集的時間、腔體的本底真空度、載氣流量、反應源溫度及腔體溫度等18個特征變量。為構建軟測量模型,通過特征選擇排除冗余特征,得到與腔體壓強最相關的5個輔助變量(時間、載氣流量、反應源通入時間、溫度、周期權重系數),將其作為預測模型的輸入,腔體壓強作為輸出,共導出5 471組數據。采用統計假設檢驗進行數據處理,將噪聲信號替換為相鄰數據值。模型訓練集占70%,測試集占30%。實驗仿真所用的計算機配置為處理器Intel(R) Core(TM) i7-12700K,RAM 64 GB,建模軟件PyCharm2021。
3.2 模型參數選擇
滑動窗口的長度選擇影響模型的預測準確性及計算時間,為跟蹤沉積過程的壓強狀態變化,考慮數據的時間、空間相似度,減小建模計算量,提高預測精度。筆者采用不同長度的滑動窗口劃分連續數據,采用基礎LWPLS算法進行預測,對比預測結果,確定最合適的窗口長度。為保證模型精度,突出局部數據特征,窗口應該盡量小,但至少包含一個工藝周期T的完整數據,筆者設滑動窗口長度為周期T的n倍(n取0、0.5、1、2),采用LWPLS算法對TiN材料的工藝壓強進行預測,用RSS方差、r2相關系數對模型的預測性能進行評價,評價結果見表2。
當不使用滑動窗口(n=0)時,常規LWPLS算法也能預測非線性壓強;窗口大小nlt;1個周期時,預測誤差較大,模型預測性能最差,存在部分觀測數據搜索到的訓練數據相似度不高的情況;ngt;1個周期時,預測誤差逐漸變大,預測性能變差;n=1個周期長度時,預測誤差最小,預測模型性能最好,n=1既能減小相似數據的搜索范圍,縮短運行時間,又能保證模型的預測精度。同時也驗證了LWPLS算法增加滑動窗口后對非線性壓強預測精度更高。
3.3 BaggingMwLWPLS預測效果對比
為驗證LWPLS算法增加滑動窗口和集成Bagging算法能更準確地預測沉積過程的壓強,分別采用PLS、MwPLS、LWPLS、MwLWPLS、Bagging MwLWPLS5種算法對表1中TiN材料的工藝壓強進行預測,設滑動窗口長度為一個工藝周期,集成Bagging算法為3個基訓練器,設εq=[0.95,1.05],5種算法的預測效果對比如圖5所示,算法預測效果的局部放大圖如圖6所示,用方差RSS、相關系數r2、均方根誤差RMSE和CPU運行時長4個參數對模型性能進行評價,模型預測性能分析見表3。
由圖5、6的預測結果可以看出,在反應源通入階段,5種模型的預測結果存在明顯差異,其中BaggingMwLWPLS模型的預測結果誤差最小,且對吹掃階段的預測結果不存在靜態誤差,對壓強的預測整體跟隨效果較好。其他模型在脈沖下降階段的預測效果較差,預測值明顯低于實際壓強,且預測值先下降后上升,其中PLS模型的預測效果最差,在脈沖下降階段預測值存在過沖,吹掃階段的預測值存在靜態誤差,脈沖峰值的預測值誤差較大。
由表3可知LWPLS模型由于在PLS基礎上增加了局部加權,突出了局部特征,有效避免了模型過擬合,減小了噪聲的干擾,提高了非線性壓強的預測準確性,預測方差減小了42.67%,相關系數提高了27.2%。
LWPLS模型增加滑動窗口和周期時序系數后性能又有提升,預測方差減小了14.28%,運行時長縮短了68.7%。滑動窗口能減小噪聲數據干擾,縮短相似數據搜索時間。
在LWPLS模型基礎上使用滑動窗口和Bagging集成算法,BaggingMwLWPLS模型預測方差減小了40.7%,相關系數提高了4.6%。Bagging集成算法對于數據集有限的對象,能依據數據庫隨機生成子訓練集,在一定程度上緩解樣本不足的問題,防止欠擬合情況出現,并減小異常數據對預測結果的影響,提高模型的準確性和可靠性。且BaggingMwLWPLS模型通過選擇相似數據進行實時建模預測,無需建立預測對象的模型,具有較好的自適應特性。
3.4 算法適應性驗證
為驗證BaggingMwLWPLS模型對配方經常調整的壓強數據仍具有較好的預測效果,對表1中Li2O材料的沉積壓強進行預測,Li2O材料的壓強脈沖峰值波動較大,真實壓強值與預測值的對比如圖7所示,TiN和Li2O材料的模型預測效果對比見表4。
由圖7和表4可知,在制備不同材料時,調整工藝配方、壓強及相關變量,BaggingMwLWPLS模型具有一定的泛化能力,預測兩種材料的模型預測相關性平均為0.941,對壓強值的預測誤差最大為±2.76×10-4 Torr,平均預測時間為69.134 5 s,兩種材料的平均預測方差為0.295 1,平均RMSE為0.024 9,滿足壓強的測量精度及設備的準確性和實時性要求。BaggingMwLWPLS模型能夠實時建模,快速、準確地跟隨工藝過程中的脈沖壓強,且對不同材料的壓強預測具有自適應性。
4 結束語
針對原子層沉積設備制膜過程中真空計關閉,壓強數據缺失,工藝配方和條件經常調整,采用常規軟測量方法預測壓強不具備泛化能力的問題,采用基于滑動窗口的集成即時學習算法BaggingMwLWPLS采集初始工藝過程中的壓強及相關數據進行實時建模,預測后續階段的工藝壓強。實驗結果表明該方法能對不同配方及材料的壓強信號進行穩定跟隨預測,預測結果滿足設備精度和實時性要求,具有較好的泛化能力。
該方法能準確高效地預測原子層沉積設備的壓強,計算簡單,適用于設備工控機內存及運算性能有限的情況;能提供缺失壓強數據,使工藝人員能依據壓強數據判斷反應源通入狀態、當前反應過程和設備密封性能;對提高真空計壽命,為原子層沉積設備的關鍵參數智能檢測提供了理論上的可行性方案。為進一步提升模型預測性能,可采用貝葉斯概率、粒子群等算法優化模型相似度、相關變量個數等參數。
參 考 文 獻
[1] LAFFAIRE J,STEFANO A L D,CHINOT O,et al.An ANOCEF Genomic and Transcriptomic Microarray Study of the Response to Irinotecan and Bevacizumab in Recurrent Glioblastomas[J].Biomed Res Int,2016,2014 (4,article e15):282815.DOI:10.1155/2014/282815.
[2] 王濤.MOCVD系統的自動控制研究——溫度、流量、壓力自動控制研究[D].西安:西安工業大學,2007.
[3] 黃成,金懷平,王彬,等.基于時空局部學習的集成自適應軟測量方法[J].儀器儀表學報,2023,44(1):231-241.
[4] 袁小鋒.基于即時學習的復雜非線性過程軟測量建模及應用[D].杭州:浙江大學,2016.
[5] 潘立登,李大字,馬俊英.軟測量技術原理與應用[M].北京:中國電力出版社,2009.
[6] 金懷平,李建剛,錢斌,等.基于多模態擾動的集成即時學習軟測量建模[J].信息與控制,2020,49(3):257-266.
[7] 羅月陽,張新民,MANABU K,等.高爐煉鐵過程數據驅動軟測量技術研究綜述[J].Frontiers of Information Technology amp; Electronic Engineering,2023,24(3):327-355.
[8] 石立賢,金懷平,楊彪,等.基于局部學習和多目標優化的選擇性異質集成超短期風電功率預測方法[J].電網技術,2022,46(2):568-577.
[9] 周鋼,郭福亮.集成學習方法研究[J].計算技術與自動化,2018,37(4):148-153.
[10] 潘貝,金懷平,楊彪,等.基于多樣性加權相似度的集成局部加權偏最小二乘軟測量建模[J].信息與控制,2019,48(2):217-223;231.
[11] 蔡成煒,蔡可.動態軟測量技術在食品發酵過程中的應用[J].食品安全質量檢測學報,2022,13(11):3668-3675.
[12] 薛明晨,熊偉麗,徐保國.基于局部加權偏最小二乘的在線多模型建模[J].計算機應用研究,2015,32(10):2981-2984;2995.
[13] 趙恒利.HfO2薄膜制備工藝及其性能研究[D].昆明:云南師范大學,2021.
[14] 鄧章.基于流體動力學的原子層沉積工藝優化與實驗驗證[D].武漢:華中科技大學,2016.
[15] 段晨龍.基于原子層沉積的微納米顆粒表面改性方法研究及其應用[D].武漢:華中科技大學,2017.
[16] 周濤.單晶片原子層沉積反應系統的設計[D].武漢:華中科技大學,2014.
[17] 楊鑫,周成宇.即時學習法在過程工業中的應用研究進展[J].計算機與應用化學,2018,35(9):746-758.
[18] ZHU X L,CAI K,WANG B,et al.A dynamic soft senor modeling method based on MW-ELWPLS in marine alkaline protease fermentation process[J].Preparative Biochemistry amp; Biotechnology,2020,51(5):430-439.
[19] 任佳,馬仕強.時序局部加權自適應核PLS軟測量建模及其應用[J].儀器儀表學報,2018,39(1):1-7.
[20] 何召.基于集成學習的復雜工業過程自適應軟測量方法研究[D].西安:西安理工大學,2022.
[21] 游文霞,申坤,楊楠,等.基于Bagging異質集成學習的竊電檢測[J].電力系統自動化,2021,45(2):105-113.
[22] 王維杰.基于即時學習策略的畢赤酵母發酵過程軟測量[D].鎮江:江蘇大學,2022.
[23] 任濤,林夢楠,陳宏峰,等.基于Bagging集成學習算法的地震事件性質識別分類[J].地球物理學報,2019,62(1):383-392.
(收稿日期:2023-10-28,修回日期:2024-08-03)
Study on ALD Process Pressure Prediction Based on Sliding
Window Integrated Just-In-Time Learning Algorithm
SUN Shi-na1,2, CHEN Yan1, WU Zu-ming1," LIU Zhen-qiang1,2,
MING Shuai-qiang2,3, XIA Yang2,3
(1. Faculty of Information Engineering and Automation, Kunming University of Science and Technology;
2. Jiaxing Microelectronics Instrumentation and Equipment Engineering Center, Chinese Academy of Sciences;
3. Jiaxing Kemin Electronic Equipment Technology Co.,Ltd.)
Abstract" Atomic layer deposition(ALD)device enjoys wide application in" semiconductors, new materials and photovoltaic industries to prepare high-quality nanofilms. Aiming at the vacuum gauge to be closed in the membrane-making process and the loss of pressure data and the difficulty in judge whether the reaction source is connected and whether the equipment is running normally, the soft sensor method was adopted to predict the pressure in preparing the membranes. For purpose of improving the prediction generalization ability of soft sensor for different process conditions and formulas, a sliding window-based ensemble just-in-time learning (BaggingMwLWPLS) algorithm was proposed to model and predict the pressure in real time, including having the sliding window employed to divide the data set and the Bagging ensemble algorithm adopted to average the predicted values of local weighted partial least squares(LWPLS) as the predicted pressure. The results show that, the method can adaptively predict the real-time pressure of different process formulations, and the prediction is fast, accurate, and not susceptible to noise interference so as to realize real-time monitoring of both equipment pressure status and performance.
Key words"" process pressure, sliding window, LWPLS, integrated learning, adaptive prediction
基金項目:中科院關鍵技術團隊項目(批準號:GJJSTD20200003)資助的課題。
作者簡介:孫世娜(2001-),碩士研究生,從事智能控制、軟測量技術的研究。
通訊作者:陳焰(1965-),高級工程師,從事DCS監控系統的教學與研究工作,chen_y_1@qq.com。
引用本文:孫世娜,陳焰,伍祖銘,等.基于滑動窗口集成即時學習算法的ALD工藝壓強預測[J].化工自動化及儀表,2024,51(5):879-886.