范 偉 李世光 武志鵬 段 晨 宗明成
(1.中國(guó)科學(xué)院微電子研究所 北京 100029)
(2.中國(guó)科學(xué)院大學(xué) 北京 100049)
光刻機(jī)是大規(guī)模集成電路芯片制造的核心設(shè)備,對(duì)焦控制[1]是保障光刻機(jī)成像質(zhì)量、光刻工藝窗口和產(chǎn)品良率的重要技術(shù)保障,調(diào)焦調(diào)平測(cè)量系統(tǒng)是光刻機(jī)對(duì)焦控制的核心部件。調(diào)焦調(diào)平測(cè)量系統(tǒng)的數(shù)據(jù)處理精度影響光刻機(jī)的對(duì)焦控制性能[2],計(jì)算速度影響光刻機(jī)的產(chǎn)能[3],因此需要綜合考慮這兩個(gè)因素。本文對(duì)比分析多項(xiàng)式擬合算法(polynomial fitting)[4]、RF(random forest)算法[5~6]和XGBoost(extreme gradient boosting)算法[7]在調(diào)焦調(diào)平測(cè)量系統(tǒng)中的測(cè)量精度與計(jì)算耗時(shí),提出適用于光刻調(diào)焦調(diào)平測(cè)量系統(tǒng)的擬合算法。
本實(shí)驗(yàn)室搭建的調(diào)焦調(diào)平測(cè)量系統(tǒng)[8]基于光學(xué)三角法測(cè)量硅片高度,探測(cè)器接收到的O光與E光信號(hào)[9]為

式中,N為光柵狹縫個(gè)數(shù),P是矩形光柵周期,Δx是硅片高度變化為h時(shí)從投影光柵出射的光束中心位置在探測(cè)光柵處產(chǎn)生的偏移,c是(偏振片+分光晶體)組件的透射率。
對(duì)O光和E光信號(hào)進(jìn)行歸一化差分處理[9]后得到hraw,即當(dāng)硅片在調(diào)焦調(diào)平測(cè)量系統(tǒng)零位附近± 1.25μm范圍內(nèi)變化時(shí),hraw隨h近似線性變化。光柵狹縫個(gè)數(shù)為29,周期為30,采樣點(diǎn)數(shù)為7520個(gè),仿真生成該范圍內(nèi)連續(xù)掃描35次的hraw與h數(shù)據(jù),如圖1所示。通過(guò)擬合算法得到硅片表面高度h隨hraw的變化關(guān)系模型后,即可通過(guò)hraw計(jì)算得到硅片表面擬合高度hfit。不同的擬合算法得到的這種變化關(guān)系模型具有不同的計(jì)算精度和速度。
使用基于Python的Scikit-learn工具包對(duì)數(shù)據(jù)進(jìn)行處理。將hraw與h輸入到模型中可得擬合算法模型,將hraw代入擬合算法模型中即可得到硅片表面高度擬合值hfit,記錄獲得hfit的耗時(shí),計(jì)算硅片表面真實(shí)高度h與擬合高度hfit的差herror及其3σ值,即,式中μ為herror的均值,N為數(shù)據(jù)個(gè)數(shù)。

圖1 實(shí)驗(yàn)數(shù)據(jù)
本研究采用3種擬合算法:多項(xiàng)式擬合、RF算法和XGBoost。多項(xiàng)式擬合算法是曲線擬合的基本方法,其形式簡(jiǎn)單且易于工程實(shí)現(xiàn)。RF算法是Bagging集成算法[10]的典型代表,通過(guò)并聯(lián)多個(gè)基學(xué)習(xí)器的結(jié)果提高精度。XGBoost算法是Boosting集成算法的典型代表,通過(guò)串聯(lián)多個(gè)基學(xué)習(xí)器的結(jié)果提高精度。
多項(xiàng)式擬合函數(shù)為多次方程,其形式為

式中αi為擬合系數(shù),由最小二乘法確定,即最小化
RF由多個(gè)決策樹(decision tree)并聯(lián)組合而成,對(duì)單個(gè)決策樹的結(jié)果進(jìn)行結(jié)合后作為RF集成方法的結(jié)果,算法主要參數(shù)為決策樹的總個(gè)數(shù)n與單個(gè)決策樹的最大深度(max depth),其框架示意如圖2所示。
決策樹在構(gòu)建過(guò)程中采用平方誤差準(zhǔn)則(square error criterion)進(jìn)行特征選擇構(gòu)建二叉樹。對(duì)于輸入樣本(xi,yi),單個(gè)決策樹的模型[11]如下:

式中,R1,R2,…,RM為輸入空間可劃分成的M個(gè)區(qū)域,Cm為每個(gè)區(qū)域Rm上的輸出值。
XGBoost由多個(gè)決策樹串聯(lián)組合而成,前一個(gè)決策樹的輸出結(jié)果作為輸入傳送到下一個(gè)決策樹中,經(jīng)過(guò)多個(gè)決策樹得的輸出作為RF集成方法的結(jié)果,主要參數(shù)為決策樹的總個(gè)數(shù)n與單個(gè)決策樹的最大深度(max depth),其框架示意如圖3所示。

圖3 XGBoost算法框架示意圖
對(duì)于給定N個(gè)樣本、m個(gè)特征的數(shù)據(jù)集D={(xi,yi)}(|D|=N,xi∈Rm,yi∈R),集成樹模型使用K棵CART決策樹結(jié)果的累加值作為預(yù)測(cè)值[6]:

式中,fk(xi)是樣本(xi,yi)在第k棵樹的葉子結(jié)點(diǎn)上的權(quán)重。F={f(x)=wq(x)}(q:Rm→T,w∈RT),q表示將樣本映射到相應(yīng)葉子結(jié)點(diǎn)的樹結(jié)構(gòu),T表示樹中葉子結(jié)點(diǎn)的個(gè)數(shù)。wi表示第i個(gè)葉子結(jié)點(diǎn)的評(píng)分(score)。
將圖1原始數(shù)據(jù)轉(zhuǎn)化成hraw-h曲線,如圖4(a)曲線所示。使用多項(xiàng)式、RF和XGBoost算法對(duì)該曲線進(jìn)行擬合,擬合高度hfit分別如圖4(a)曲線所示。3種算法計(jì)算得到的hfit與h相減后得到擬合誤差,如圖4(b)~(d)所示。誤差圖中的水平線縱坐標(biāo)值對(duì)應(yīng)誤差的±3σ值,多項(xiàng)式擬合誤差為0.001nm,RF擬合誤差為0,XGBoost擬合誤差為10.789nm。其中,RF算法擬合誤差為0的原因?qū)⒃?.2節(jié)分析。
圖4展示的是某特定參數(shù)下不同算法的擬合高度、誤差和3σ值。實(shí)際上,算法的擬合精度3σ與計(jì)算耗時(shí)會(huì)隨擬合參數(shù)變化而變化,下文對(duì)此變化關(guān)系進(jìn)行仿真與實(shí)驗(yàn)分析,并說(shuō)明圖4(b)~(d)的擬合參數(shù)設(shè)置過(guò)程。


圖4 擬合高度與誤差圖
改變多項(xiàng)式擬合階數(shù),對(duì)圖4(a)中hraw-h曲線進(jìn)行擬合,擬合誤差的3σ值如圖5所示,小圖為局部放大圖。隨著擬合階數(shù)的增加,擬合誤差的3σ值不斷減小。多次統(tǒng)計(jì)發(fā)現(xiàn)多項(xiàng)式擬合算法計(jì)算耗時(shí)總小于1ms,這是因?yàn)槎囗?xiàng)式擬合算法簡(jiǎn)單,時(shí)間復(fù)雜度小。

圖5 多項(xiàng)式擬合算法3σ 值隨階數(shù)變化圖
RF算法中影響精度與計(jì)算耗時(shí)的主要因素是決策樹的最大深度與決策樹的個(gè)數(shù)n,使用網(wǎng)格搜索[12]方法改變這兩個(gè)參數(shù),擬合誤差的3σ值與計(jì)算耗時(shí)如圖6所示。
由圖6(a)可知,RF算法中,決策樹的最大深度對(duì)擬合誤差有較大影響,決策樹個(gè)數(shù)的變化對(duì)擬合誤差影響小。這是因?yàn)镽F算法采用的并行計(jì)算策略在決策樹增多時(shí)可以降低擬合方差,擬合誤差的減少主要依靠單個(gè)決策樹的最大深度,決策樹的最大深度越深,擬合誤差越小。由圖6(b)可知,計(jì)算耗時(shí)隨決策樹個(gè)數(shù)與決策樹的最大深度的增加呈增加趨勢(shì),模型復(fù)雜度的提升會(huì)造成計(jì)算時(shí)長(zhǎng)的增加。
在RF算法中,單個(gè)決策樹的輸入為hraw,輸出為該決策樹得到的擬合高度hfit,由于仿真數(shù)據(jù)是沒(méi)有噪聲影響的采樣點(diǎn)序列,當(dāng)決策樹最大深度增加時(shí),算法對(duì)數(shù)據(jù)的擬合能力不斷增強(qiáng),算法能獲得hraw序列和h序列間的一一對(duì)應(yīng)關(guān)系,如同構(gòu)建了鍵為hraw,值為h的映射表,通過(guò)查詢hraw,可直接得到對(duì)應(yīng)的h,因此圖4(c)中誤差為0。

圖6 RF算法3σ 值與計(jì)算耗時(shí)圖
改變決策樹的個(gè)數(shù)和最大深度,XGBoost算法擬合誤差的3σ值與計(jì)算耗時(shí)如圖7所示。

圖7 XGBoost算法3σ 值與計(jì)算耗時(shí)圖
由圖7(a)可知XGBoost算法中測(cè)量精度隨決策樹的最大深度與決策樹的個(gè)數(shù)增加而增加。由圖7(b)可知計(jì)算耗時(shí)隨決策樹個(gè)數(shù)n與決策樹最大深度的增加而增加。RF算法中各決策樹相互獨(dú)立,而XGBoost算法中,前一個(gè)決策樹的輸出作為下一個(gè)決策樹的輸入,hfit為各個(gè)決策樹的輸出加權(quán)和。XGBoost與RF算法計(jì)算機(jī)制的不同,使得盡管RF和XGBoost均采用決策樹個(gè)數(shù)和最大深度作為擬合參數(shù),兩者的擬合精度有較大差異。
分別改變多項(xiàng)式擬合算法的階數(shù)、RF和XG?Boost算法中的最大深度與決策樹個(gè)數(shù),對(duì)圖1所示的數(shù)據(jù)重新進(jìn)行擬合。當(dāng)多項(xiàng)式擬合階數(shù)在2~8范圍內(nèi)變化,決策樹個(gè)數(shù)在1~100范圍內(nèi)變化,最大深度在2~15范圍內(nèi)變化時(shí),得到不同參數(shù)下的3σ值。在光刻機(jī)中,為了兼顧對(duì)焦精度和產(chǎn)能,必須兼顧算法的擬合精度與擬合時(shí)間,最終得到一個(gè)優(yōu)化方案。因此在參數(shù)選取時(shí),設(shè)定兩個(gè)約束條件:1)計(jì)算當(dāng)前參數(shù)與前一次參數(shù)下的3σ差值Δ3σ,只選取保證Δ3σ<0.3nm的參數(shù)。其中,0.3nm是個(gè)擬合實(shí)踐值,當(dāng)Δ3σ<0.3nm時(shí),可以認(rèn)為擬合精度基本維持在最高精度,不隨參數(shù)遞增而提高;2)設(shè)定計(jì)算耗時(shí)小于某給定計(jì)算時(shí)間。這是因?yàn)橛?jì)算耗時(shí)越長(zhǎng),擬合精度通常更好,而工程實(shí)踐一般不允許擬合時(shí)間過(guò)長(zhǎng)。對(duì)于多項(xiàng)式擬合算法,在8階擬合范圍內(nèi),計(jì)算時(shí)間均小于1ms,滿足Δ3σ<0.3nm的階數(shù)有4,6,7,8。擬合殘差3σ最小時(shí)(0.001nm)對(duì)應(yīng)的階數(shù)為7和8,由于7階對(duì)應(yīng)的計(jì)算時(shí)間短,因此選擇7階作為多項(xiàng)式擬合的階數(shù)。對(duì)于RF算法和XGBoost算法,約束條件1)具體為:當(dāng)前參數(shù)對(duì)(i,j)得到的3σ值(i為決策樹個(gè)數(shù)n,j為最大深度max depth),與參數(shù)對(duì)(i-1,j)和(i,j-1)得到的3σ值的差異都滿足Δ3σ<0.3nm 。由圖6和圖7可知,同時(shí)滿足上述兩個(gè)約束條件的(i,j)通常不唯一,為了得到最佳擬合效果,選取擬合殘差3σ最小時(shí)所對(duì)應(yīng)的那組(i,j)作為該曲線的擬合參數(shù)。繪制不同計(jì)算時(shí)間下的3σ曲線如圖8所示,小圖為局部放大圖。圖4表示的是當(dāng)計(jì)算時(shí)間為3ms時(shí)(圖8矩形框區(qū)域所示),3類算法的擬合高度與誤差曲線,此時(shí)多項(xiàng)式擬合為7階;RF決策樹個(gè)數(shù)為3,最大深度為8;XGBoost決策樹個(gè)數(shù)為8,最大深度為10。
由圖8可知,多項(xiàng)式擬合算法精度隨時(shí)間變化不敏感,7階多項(xiàng)式擬合的3σ值為0.001nm,RF算法和XGBoost算法精度隨計(jì)算時(shí)間的增加迅速提升,RF算法在2ms時(shí),對(duì)仿真數(shù)據(jù)完全擬合,誤差為0,XFBoost算法在5ms時(shí),擬合精度基本趨于穩(wěn)定,為0.6nm。在計(jì)算時(shí)間比較關(guān)鍵的情況下,例如計(jì)算時(shí)間為1ms,多項(xiàng)式擬合算法精度最高,其次為RF算法。

圖8 不同算法3σ 值隨給定計(jì)算時(shí)間的變化圖
為了驗(yàn)證上述3種算法在實(shí)際數(shù)據(jù)中的有效性,采集3組實(shí)驗(yàn)數(shù)據(jù),按4.4節(jié)中所示流程獲得不同算法的3σ值隨給定計(jì)算時(shí)間的變化,如圖9所示。3種算法隨計(jì)算時(shí)間變化的趨勢(shì)與圖8相同,多項(xiàng)式擬合精度隨時(shí)間變化不敏感,RF算法和XGBoost算法精度隨計(jì)算時(shí)間的增加而迅速提升,相對(duì)于XGBoost算法,RF算法可以更快地穩(wěn)定到比較高的精度。但總體上,3σ值均有所增加,RF和XGBoost算法趨于穩(wěn)定的時(shí)間有所延長(zhǎng),RF算法精度在3ms時(shí)超越多項(xiàng)式擬合算法,而XGBoost在5ms時(shí)擬合精度超越多項(xiàng)式擬合算法,且RF算法在處理實(shí)際數(shù)據(jù)上,擬合精度略優(yōu)于XGBoost算法。
從圖9中可知,3次實(shí)驗(yàn)在給定計(jì)算時(shí)間為10ms時(shí),多項(xiàng)式擬合算法的3σ值分別為14.1nm、25.6nm和17.4nm;RF算法的3σ值分別為7.8nm、24.8nm和13.9nm;XGBoost算法的3σ值分別為9.2nm、24.7nm和14.4nm。在給定1ms的計(jì)算時(shí)間下,多項(xiàng)式擬合算法精度最高。圖9中的3σ值大于仿真結(jié)果中對(duì)應(yīng)的數(shù)值,這是因?yàn)閷?shí)驗(yàn)環(huán)境不理想,存在環(huán)境噪聲,實(shí)驗(yàn)系統(tǒng)自身存在10nm的重復(fù)性誤差等。隨給定計(jì)算時(shí)間增加,RF算法與XG?Boost算法擬合精度不斷提升并超越多項(xiàng)式擬合算法,這是因?yàn)槎囗?xiàng)式擬合基于最小二乘法,因此對(duì)噪聲比較敏感,而基于決策樹的RF算法與XG?Boost算法對(duì)噪聲有較好的魯棒性。

圖9 不同算法3σ 值隨給定計(jì)算時(shí)間的變化圖
本文通過(guò)仿真與實(shí)驗(yàn)對(duì)比分析了多項(xiàng)式擬合、RF算法和XGBoost算法在光刻調(diào)焦調(diào)平測(cè)量系統(tǒng)中數(shù)據(jù)處理的精度與速度。仿真與實(shí)驗(yàn)結(jié)果表明,多項(xiàng)式擬合精度隨時(shí)間變化不敏感,RF算法和XGBoost算法精度隨計(jì)算時(shí)間的增加而迅速提升。對(duì)于不存在噪聲的仿真數(shù)據(jù),7階多項(xiàng)式擬合的3σ值固定在0.001nm;RF算法在2ms時(shí),算法對(duì)仿真數(shù)據(jù)完全擬合,誤差為0;XGBoost算法在5ms時(shí),擬合精度基本趨于穩(wěn)定,為0.6nm。對(duì)于存在噪聲的實(shí)驗(yàn)數(shù)據(jù),RF算法相對(duì)于XGBoost算法可以更快地穩(wěn)定到比較高的精度,且擬合精度略優(yōu)于XGBoost算法。隨計(jì)算時(shí)間的增加,RF算法與XG?Boost算法擬合精度不斷提升并分別于3ms和5ms超越多項(xiàng)式擬合算法,這是因?yàn)槎囗?xiàng)式擬合基于最小二乘法,因此對(duì)噪聲比較敏感,而基于決策樹的RF算法與XGBoost算法對(duì)噪聲有較好的魯棒性。在計(jì)算時(shí)間比較關(guān)鍵的情況下,例如計(jì)算時(shí)間為1ms,多項(xiàng)式擬合算法精度最高,其次為RF算法。在光刻機(jī)中,為了兼顧對(duì)焦精度和產(chǎn)能,必須兼顧算法的擬合精度與擬合時(shí)間。在處理實(shí)際數(shù)據(jù)時(shí),RF和XGBoost擬合精度盡管在3ms~5ms以后比多項(xiàng)式擬合精度略有提高,但提高有限,而3ms~5ms處理一組數(shù)據(jù)對(duì)光刻機(jī)產(chǎn)能而言難以容忍。綜合考慮擬合精度與計(jì)算時(shí)間,調(diào)焦調(diào)平測(cè)量系統(tǒng)選用多項(xiàng)式擬合算法較為合適。