姚曉童,李 林
(上海理工大學 管理學院,上海 200093)
成品率是半導體制造過程中一項重要的工藝性能指標,精準預測晶圓成品率對于改進生產工藝、減少晶圓制造損失具有重要意義。
目前成品率建模大多基于影響成品率的關鍵參數,如缺陷數量、大小、電性參數等。文獻[1]考慮缺陷概率密度分布建立了經典的泊松成品率預測模型,由于模型結構簡單,應用最為廣泛,但預測準確度較低。文獻[2]考慮缺陷分布存在過度分散性,對文獻[1]進行了改進,建立了廣義泊松分布模型預測晶圓成品率,提高了成品率的預測精度。文獻[3]基于缺陷類型、大小、位置等基本信息建立因果統計模型,進行成品率的預測,并提出了成品率優化策略,但由于缺陷數據量龐大,模型求解困難。文獻[4 -5]考慮晶圓電性測試的關鍵參數,以最小化測試參數和預測誤差為目標,選取顯著特征向量,進而預測晶圓成品率,但電氣參數數據對象多,對象間關聯性強,導致模型預測準確度較低。文獻[6]基于成品率歷史數據提出一種混合聚合–熵–共識的模糊協同智能算法,首先得到成品率預測區間,然后用反向傳播網絡去模糊化得到成品率的預測值,具有較好的預測精度。影響晶圓成品率因素眾多,數據量大且關系復雜,但缺陷數據仍然是成品率建模最具影響力的因素[7]。
為提高預測精度以及確定晶圓缺陷來源,部分學者考慮晶圓缺陷的聚集性建立成品率預測模型。文獻[8]考慮晶圓缺陷的鄰近效應,利用缺陷模式建立成品率模型,具有較高的預測精度。文獻[9 -10]通過分析晶圓圖,識別缺陷模式,幫助管理者確定減少缺陷任務的優先級以提高晶圓成品率。以上研究表明,考慮晶圓缺陷聚集特性,不僅可以快速查找缺陷來源,且模型預測精度高。但以上成品率模型均是在晶圓水平進行建模,僅考慮晶圓缺陷的一種模式。晶圓生產過程復雜,一片晶圓通常會存在多種缺陷模式,在晶圓水平進行建模在一定程度上降低了模型的預測準確度,難以獲得全面的缺陷損失來源。實際生產過程中,缺陷數據存在嵌套結構[11],即同組晶片缺陷模式具有相似性,現有文獻大多都沒有考慮缺陷數據嵌套結構特性。
本文考慮缺陷聚集性和數據的嵌套結構,首先用基于噪聲的密度聚類(density-based spatial clustering of applications with noise,DBSCAN)算法識別缺陷模式,將缺陷計量數據按缺陷模式在晶片水平匯總,基于缺陷模式和缺陷數量建立多水平邏輯回歸(Hierarchical Logit,HL)晶片失效概率模型,研究引起晶片失效的主要缺陷模式、關鍵工序,進而完成成品率的預測。
在半導體行業中,計算機輔助制造會產生海量數據集,通常每個數據集不能直接用來預測成品率,需要對不同數據集進行有效整合,如何獲得可行數據是成品率建模復雜的原因之一。本文所用數據集為產線缺陷監控系統數據和電氣參數測量數據。缺陷監控系統有兩種:一種是以缺陷為單位的缺陷記錄數據庫,該系統主要記錄了缺陷的大小、缺陷的類型以及缺陷的位置等基本信息;另一種為缺陷分析工程師使用光學顯微鏡掃描晶圓得到晶圓圖(wafermap),分析晶圓圖可以識別不同的缺陷模式,例如線性缺陷、團狀缺陷等,幫助工程師定位缺陷來源。電氣參數測量數據指在晶圓加工完成后,對晶圓上每個晶片進行針測,以檢查晶片的性能,根據針測結果將晶片劃分為不同的bin值。考慮晶圓缺陷聚集特性,本文用DBSCAN算法對晶圓缺陷進行聚類獲取晶片缺陷模式;將在線缺陷檢測系統中的缺陷在晶片水平進行匯總,即獲得每個晶片缺陷數量;根據晶圓針測數據集獲取每個晶片bin值,最后將晶片缺陷模式、晶片缺陷數量以及晶片bin值3個數據集進行整合,得到適用于成品率建模的數據集。
基于缺陷計量數據成品率建模通常會假設缺陷數據是獨立的,但在晶圓實際生產過程中,缺陷數據是呈嵌套結構存在的,例如晶片嵌套在晶圓上,晶圓組合在批次中。因此,不同批次或者不同晶圓上的晶片并不是相互獨立的,晶圓嵌套結構數據如圖1所示。圖中:ynijkt表示第t個產品、第k個批次、第j個晶圓、第i個組別的失效晶片;nj表示第j個晶圓失效晶片的數量;N表示失效晶片總數。在該結構中,不同組的缺陷數據呈差異性,同組缺陷數據呈聚集性,HL模型可以解決嵌套結構數據組間非獨立性與組內聚集性[12]。為此,本文建立了HL成品率預測模型,該模型還可幫助企業識別顯著性批次、組別,以快速定位關鍵工序。

圖1 多層次晶圓結構Fig.1 Multi-level wafer structure
晶圓缺陷聚集性表現為具有明顯的簇、缺陷點集中和簇中點密度大。晶圓缺陷模式主要分為隨機缺陷、局部團狀缺陷、線性缺陷、邊緣環狀缺陷以及粒子缺陷。5種缺陷模式劃分[13]的主要依據如表1所示。

表1 5種缺陷模式主要特點及劃分依據Tab.1 Main characteristics and classification basis of 5 defect modes
基于噪聲的密度聚類算法可由密度可達關系找出最大密度相連的集合,不需要指定聚類個數,在有噪聲的情況下可識別出任意形狀的簇。
假設鄰域為ε,聚類密度閾值為 minPts,缺陷點集為T={oi},i=1,2,···,6,對缺陷點進行相關定義。
a.鄰域:缺陷點o1,o2∈T,如果點o2與o1的距離不大于ε,則o1的 領域可表示為Nε(o1)={o2∈T|d(o1,o2)≤ε},d為缺陷點之間的距離。
b.核心對象:如果缺陷點o1的鄰域內至少存在minPts個缺陷點,則o1是一個核心對象。
c.密度直達:如果缺陷點o2在 缺陷點o1的鄰域內,且o1點 為核心對象,則稱o2由o1的密度直達。
d.密度可達:存在缺陷點序列o1,o2,o3,o4,o5,o6。在這個序列中,每一個缺陷點都與它前一個缺陷點密度直達,則稱o1與o6密度可達。
e.密度相連:如果缺陷點o1與缺陷點o6密度可達,缺陷點o2與缺陷點o6密度可達,則o1與o2密度相連。
f.簇:由所有密度可達的缺陷點導出的最大密度相連的點集合為一個簇。對于不屬于任何一個核心對象鄰域的缺陷點標示為噪音點。
通過實驗法調整鄰域 ε與密度閾值 minPts完成晶圓圖所有缺陷點聚類,形成分類簇。將分類簇根據表1劃分缺陷模式(將小于密度閾值的缺陷點劃分為粒子缺陷),獲得各個缺陷點分類。
邏輯回歸模型常用于晶圓成品率建模,但它的基本假設為數據是相互獨立的。考慮晶圓缺陷數據嵌套結構和聚集性,本文使用多水平邏輯回歸構建晶圓成品率模型。多水平邏輯回歸是廣義混合線性模型的一種。
廣義混合線性模型主要由抽樣模型、結構模型和連接函數3部分組成。抽樣模型是指反應變量服從某一指數族分布,本文晶圓成品率為二分類問題(晶片pass/fail),定義 φnijkt為第t個產品、第k個批次、第j個晶圓、第i個組別、第n個晶片的失效概率,yj代 表第j個晶圓上有mj個缺陷晶片的失效晶片數量,則yj服 從有mj次實驗、每次實驗成功概率為 φn的二項分布

采用Logit連接函數,即

式中,ηnijkt為晶片失效概率的對數發生比,ηnijkt=。 φnijkt取值范圍為(0,1),當φnijkt>0.5時,晶片失效。
結構模型是解釋變量與自然參數的線性表達式,與廣義線性模型不同的是,廣義混合線性模型的結構模型包括隨機效應與固定效應兩部分。當不定義隨機效應時,廣義混合線性模型變為廣義線性模型。通過晶片組合在晶圓上,晶圓嵌套在批次上,批次嵌套在產品層建立嵌套變量,假設不同層次不同組別的晶片是相互獨立的,同組內晶片具有相似性。在批次層、晶圓層和組別層建立嵌套變量的隨機截距模型,在產品層引入晶片大小變量,構建非隨機變化斜率與截距模型。
多層次晶圓晶片失效概率的對數發生比綜合線性模型為[12]

式中:wt表示晶圓特征尺寸;xnijkt表示晶片缺陷數 量;π00000為 截 距 項,πl0000(l=1,2,3,4,5)表 示 第l個缺陷模式的自然參數;π00001表示產品大小的自然參數; πl0001(l=1,2,3,4,5)表示產品層與個體層交互效應的自然參數;r0ijkt,e00jkt,u000kt分別表示失效概率對數發生比在批次層、晶圓層、組別層的隨機效應參數。
第j個晶圓成品率Yj可表示為

式中, E(φj)表示在第j個晶圓上晶片失效概率的期望值。
使用SAS 9.1軟件NLMIXED過程構建模型。選用極大似然估計算法與對偶擬牛頓優化算法進行模型求解,使用比值比(odds ratio)解釋特征向量對晶片失效概率的影響,如式(5)所示。比值比代表當晶片為第l個缺陷模式時,缺陷數量增加一個單位會影響晶片失效概率的增加值。選用Pearson卡方統計量與AIC信息準則指標評價模型擬合優度[13]。

式中:QOR表示被檢驗的解釋變量的比值比;odds表示晶片失效發生概率與不失效概率之比。
本文缺陷數據樣本選自某晶圓廠實際生產線監測系統,包含 3種不同工藝尺寸產品,15個批次,30個晶圓。3種不同工藝尺寸產品分別可劃分出2480,848,533個晶片。首先對30個晶圓圖進行密度聚類,共識別出4578個缺陷晶片。將產品1與產品2作為訓練集,產品3作為測試集。訓練集數據共包括3599個缺陷晶片,測試集數據共包含979個缺陷晶片。
基于DBSCAN對每個晶圓圖進行聚類,根據實驗法確定鄰域ε,聚類密度閾值 minPts,部分晶圓缺陷晶片聚類結果如坐標圖圖2所示。

圖2 晶圓聚類結果Fig.2 Wafer clustering results
每張晶圓圖具有多種缺陷模式,結合表1可知:圖2(a)屬于環狀缺陷與隨機缺陷;圖2(b)屬于線性缺陷;圖2(c)屬于隨機缺陷和局部團狀缺陷。根據晶圓圖獲取每個缺陷晶片的坐標、缺陷模式、到中心的徑向距離,并根據徑向距離對晶片分組,分組界限為半徑的一半。
本文將在線缺陷測量數據與晶片針測數據基于晶片缺陷模式進行整合,以獲取適用于缺陷建模的數據。部分缺陷原始數據如表2所示,加粗部分為位于同一晶片上的不同缺陷的數據。利用Excel數據透視表功能對其進行聚合,缺陷測試數據與晶片針測數據整合后的數據如表3所示。根據晶片聚類結果,對表3數據進行整合,整合后的數據為HL模型的輸入數據,如表4所示。
為了提高預測精度,對數據進行分析與預處理,將異常值在數據中剔除。對訓練數據集進行統計分析,每個晶片中存在缺陷均值為2.8,中位數為1,分位數為1,分位數為2,最小值為1,最大值為144。可見,在訓練數據集中存在大量異常值。為消除異常值對模型的影響,采用one-side trimmed均值異常值檢測方法剔除異常值。該方法統一了數據集中的均值與中值,其效率優于中值法異常值檢測[14]。本文設置p值為5%,根據統計分析結果,95%的晶片缺陷數在5以內,所以將晶片缺陷數大于5的晶片樣本在訓練集中刪除。為驗證模型方法的有效性對測試集數據不作處理。

表2 缺陷原始數據Tab.2 Defect raw data
4.3.1 Logit回歸

表3 聚合后數據Tab.3 Aggregated data
為了探討該數據集是否需要使用多水平Logit回歸,首先對訓練集數據作一般Logit回歸分析。模型輸入參數為產品編號、批次編號、晶圓編號、組別、晶圓特征尺寸以及缺陷模式,其中晶圓特征尺寸為標準化后的數值。實驗結果表明,模型擬合優度檢驗Pearson卡方p值為0.009,但預測準確率達90.83%,表明模型沒有充分利用樣本數據,模型擬合優度表現不優,AIC指標值為2423.61。Logit模型顯示晶圓1、晶圓2、組別3、組別7、組別9、組別15、組別19、組別23、隨機缺陷模式、團狀缺陷模式、線性缺陷模式、環狀缺陷模式以及粒子缺陷模式因子具有顯著性(p<0.1)。

表4 模型分析數據Tab.4 Model analysis data
4.3.2 Nested Logit回歸
考慮缺陷數據嵌套結構,在Logit回歸模型中加入嵌套變量,Nested Logit模型輸入參數為產品編號(批次編號)、批次編號(晶圓編號)、晶圓編號(組別)、晶圓特征尺寸以及缺陷模式,輸入數據集為剔除異常值后的訓練集。與Logit模型相比,Nested Logit模型給出了更加精確的信息,不僅識別出重要的批次、晶圓信息,同時給出產品1的批次1與其他批次有顯著差異,批次1中的晶圓1、晶圓2有顯著差異。對于同一片晶圓,不同組別晶片失效概率差異較大,這些信息可以幫助企業工程師找出潛在的質量偏差,進而在制造過程中進行故障排除。在顯著性水平 α=0.1下,Nested Logit回歸模型識別出產品1(批次1)、批次1(晶圓1)、批次1(晶圓2)、晶圓1(組別2)、隨機缺陷、團狀缺陷、線性缺陷、環狀缺陷以及粒子缺陷解釋變量具有顯著性。Nested Logit回歸模型的Pearson卡方p值為0.128,表明Nested Logit 模型對數據擬合較優,AIC指標值為1902.191。該模型AIC指標值小于Logit 回歸模型的AIC指標值,p值更加顯著,表明Nested Logit回歸模型優于一般Logit回歸模型。
根據Nested Logit回歸模型顯著性因子構建晶片失效概率模型,由于產品編號、批次編號、晶圓編號、組別等變量對于每個數據樣本都是不同的,因此利用隨機缺陷、團狀缺陷、線性缺陷、環狀缺陷以及粒子缺陷因子構造晶片失效概率模型為

式中,ηn=?4.4321+1.4199xn+1.4203xn+1.377xn+1.1566xn+0.8149xn。
4.3.3 Hierarchical Logit回歸
Nested Logit回歸模型的基本假設為同組內的晶片是相互獨立的,但在晶圓生產過程中所產生的系統缺陷通常是集群存在的,且Nested Logit回歸模型沒有考慮產品層與個體層的交互效應,在實現多產品的混合預測方面有待進一步考察。
本文所構建的HL回歸模型的固定效應參數包括晶圓特征尺寸、缺陷模式、晶圓特征尺寸與缺陷模式交互變量,隨機截距模型參數為產品編號(批次編號)、批次編號(晶圓編號)、晶圓編號(組別)。結果顯示:隨機效應參數中晶圓編號(組別)和產品編號(批次編號)具有顯著性,協方差估計分別為(0.2584,0.1053),表明缺陷模式斜率受產品層和組別層(晶片失效概率組均數)影響較大;但批次編號(晶圓編號)不具有顯著性,表明在批次層和晶圓層晶片失效概率組間差異不大。在顯著性水平 α=0.1下,HL模型識別出產品1(批次1)、晶圓1(組別2)、晶圓2(組別2)、隨機缺陷、團狀缺陷、線性缺陷、環狀缺陷以及粒子缺陷、晶圓特征尺寸、晶圓特征尺寸以及隨機缺陷、晶圓特征尺寸以及團狀缺陷、晶圓特征尺寸以及線性缺陷、晶圓特征尺寸以及環狀缺陷解釋變量具有顯著性(p<0.1)。 Pearson卡方p值為0.79,模型的擬合優度提高,在顯著性0.05下,該模型基于缺陷數據擬合晶片失效概率是合適的。AIC指標值為1692.5,小于Logit 回歸模型AIC指標值與Nested Logit回歸模型AIC指標值,因此,HL回歸模型擬合更優。
在顯著性水平 α =0.1下,使用固定效應參數因子構建晶片失效概率,模型為

式中,ηnt=?4.4155+0.553wt+1.5424xn?0.2498wt·xn+1.3376xn?0.2159wtxn+1.3267xn?0.2433wtxn+1.138xn?0.1694wtxn+0.6889xn。
根據模型(6)與模型(7)預測測試集晶片失效概率,通過式(4)計算每個晶圓成品率。HL回歸模型、Nested Logit回歸模型與Seed’s模型對測試集中每一個晶圓的缺陷晶片pass數預測值,如圖3所示。圖4展示了HL回歸模型、Nested Logit回歸模型與傳統成品率預測模型Seed’s模型[1]對測試集中每個晶圓成品率的預測情況。

圖3 晶圓預測通過數Fig.3 Number of wafers predicted to pass

圖4 測試集晶圓成品率預測值Fig. 4 Predicted yield of the test set
由圖3和圖4可以看出Seed’s模型成品率預測值低于成品率實際值,而低估成品率會增加廠商缺陷分析成本。Nested Logit回歸模型的成品率預測值比真實值高,預測偏差比Seed’s模型低,預測準確率較高。因此,考慮晶圓生產過程的嵌
套結構可以提高成品率預測精度,同時可輔助工程師決策,但未考慮產品層與個體層的交互效應和缺陷數據的組內聚集性,可適用于單一產品的預測。本文提出的HL模型成品率預測值與實際值最為接近,預測偏差遠小于Seed’s模型,比Nested Logit回歸模型預測更加精確,可適用于不同產品成品率預測,具有更高的預測能力與可行性。
根據HL模型實驗結果得出,缺陷分析工程師應重點關注產品1的批次1。分析產品1批次1,晶圓缺陷模式多為團狀缺陷且晶片缺陷數量多,團狀缺陷主要發生在刻蝕工藝和光刻工藝,可檢查各工藝步驟,通過實驗排除法確定缺陷來源。根據缺陷模式比值比,團狀缺陷模式對晶圓受缺陷限制的成品率影響最大,晶片缺陷數量每增加一單位,缺陷失效概率增加4.27,其次為線性缺陷模式、環狀缺陷模式與粒子缺陷模式。晶圓特征尺寸與受缺陷限制的成品率呈負相關,即晶圓特征尺寸越小,對缺陷控制要求越高。
基于缺陷計量數據構建晶片失效概率模型,進而預測成品率。首先采用基于噪聲的密度聚類算法對缺陷點聚類,獲得缺陷模式;考慮缺陷聚集性與缺陷數據的嵌套結構,構建HL模型預測晶片失效概率。該模型考慮了晶片水平更加具體的信息,違背了更少的Logit回歸模型的假設,具有更高的預測精度。同時考慮了產品層與個體層的交互效應,可適用于不同產品的混合預測。
下一階段研究可以考慮更多的影響因素提高模型的預測能力,如缺陷大小、缺陷類型等,并針對各缺陷模式對成品率影響進行更深入的研究,提出指導半導體生產線加工與調度決策的可行性策略,提高芯片質量,降低芯片成本。