999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

三維芯片多層與多核并行測試調(diào)度優(yōu)化方法

2018-08-28 08:53:04汪加偉任福繼
計(jì)算機(jī)應(yīng)用 2018年6期
關(guān)鍵詞:分配優(yōu)化

陳 田 ,汪加偉,安 鑫,任福繼,3

(1.合肥工業(yè)大學(xué)計(jì)算機(jī)與信息學(xué)院,合肥230601;2.情感計(jì)算與先進(jìn)智能機(jī)器安徽省重點(diǎn)實(shí)驗(yàn)室(合肥工業(yè)大學(xué)),合肥230601;3.德島大學(xué)工學(xué)部,日本 德島770-8506))

(*通信作者電子郵箱ct@hfut.edu.cn)

0 引言

目前,傳統(tǒng)的二維(Two-Dimensional,2D)芯片在集成度和功耗等方面面臨許多困難和挑戰(zhàn)。與2D芯片相比,三維(Three-Dimensional,3D)芯片結(jié)構(gòu)具有更高的傳輸帶寬、更低的延遲和更低的功耗[1],目前已經(jīng)成為學(xué)術(shù)界和產(chǎn)業(yè)界的研究熱點(diǎn)。3D芯片在其堆疊過程中,隨著電路的復(fù)雜性逐層增加,會(huì)導(dǎo)致測試難度不斷增大,而整個(gè)芯片的可測試性問題也是3D芯片獲得應(yīng)用的主要難點(diǎn)之一[2]。在3D芯片多核測試中,如何將測試數(shù)據(jù)移入位于不同層各個(gè)芯核的掃描鏈中以及如何縮短測試時(shí)間一直是3D片上系統(tǒng)(System on Chip,SoC)中測試訪問機(jī)制(Test Access Mechanism,TAM)設(shè)計(jì)的重要問題。如果測試激勵(lì)移入一個(gè)芯核中掃描鏈的頻率很高,測試時(shí)可能會(huì)產(chǎn)生過高的測試功耗。另一方面,如果采用多核并行測試,會(huì)在并行測試的局部區(qū)域產(chǎn)生大量的電路開關(guān)活動(dòng),有可能使這一部分電路在測試時(shí)產(chǎn)生噪聲,導(dǎo)致芯片良品率的損失;同時(shí),也可能導(dǎo)致芯片局部溫度升高,在芯片上產(chǎn)生熱斑,這對(duì)沒有散熱裝置的裸片而言,很容易造成芯片因過熱而失效[3]。因此,如何在功耗限制下,縮短3D多核測試時(shí)間、提高測試并行度是一個(gè)很重要的問題。然而,在測試過程中,由于測試引腳和芯核之間傳輸測試數(shù)據(jù)的TAM資源有限,利用有限的資源最小化測試時(shí)間被認(rèn)為是一個(gè)NPHard問題[4]。文獻(xiàn)[5]將該問題轉(zhuǎn)化為二維裝箱問題,并使用傳遞閉合圖與動(dòng)態(tài)分區(qū)相結(jié)合的方法來進(jìn)行求解,取得了良好的效果,但仍有可以提升并行度的空間。另外,一些最優(yōu)化方法也被引入用于解決該問題,如:文獻(xiàn)[6]使用整數(shù)線性規(guī)劃的方法并定義了一種退出搜索循環(huán)的約束策略求解TAM寬度限制下的最優(yōu)資源分配,但是該方法在SoC規(guī)模較大時(shí)計(jì)算量極高;文獻(xiàn)[7]基于遺傳算法提出了一種測試調(diào)度優(yōu)化方法,擁有較強(qiáng)的隨機(jī)搜索能力,但是該方法在遺傳基因確定和基因突變的規(guī)劃等方面存在非常大的多變性;文獻(xiàn)[8]將量子尋優(yōu)算法作為解決裝箱問題的策略。這些調(diào)度優(yōu)化方法雖然減少了測試所需的時(shí)間,但是仍然受限于TAM架構(gòu)設(shè)計(jì)。一些學(xué)者將研究方向放在TAM的優(yōu)化設(shè)計(jì)上,設(shè)計(jì)了基于時(shí)間段分割方式的測試訪問方法[9]和將位于不同層的芯核先進(jìn)行偽平面設(shè)計(jì)再進(jìn)行掃描鏈均衡的方法[10]等。然而,這些設(shè)計(jì)與調(diào)度方法在同一時(shí)間段內(nèi)只有部分芯核能夠并行測試,測試過程中仍然存在大量空閑的TAM資源;另外,為了保證測試時(shí)間較短,這部分芯核在測試時(shí)的頻率也相對(duì)較高,使得整個(gè)堆疊在測試過程中的發(fā)熱不均、芯片失效的風(fēng)險(xiǎn)仍然存在,而時(shí)分復(fù)用的TAM設(shè)計(jì)方法在這些問題上有著明顯優(yōu)勢。

時(shí)分復(fù)用作為一種典型的多路復(fù)用技術(shù),最初被廣泛應(yīng)用于電話公司的數(shù)字語音傳輸,文獻(xiàn)[11]中將時(shí)分復(fù)用方法用于解決2D芯片的測試問題,文獻(xiàn)[12]在此基礎(chǔ)之上將其應(yīng)用到3D芯片的TAM設(shè)計(jì)中。這一方法能夠讓堆疊中的所有芯核并行測試,并且每個(gè)芯核在測試時(shí)都被限制在較低的頻率下。本文在文獻(xiàn)[12]的基礎(chǔ)上,提出了一種基于分時(shí)復(fù)用的協(xié)同優(yōu)化各層之間、層與核之間測試資源的調(diào)度方法。

在整個(gè)3D芯片的堆疊過程中,多個(gè)芯核被分配到不同層。因?yàn)檫B接三維芯片不同層的TSV長度很短,所以TSV可以在GHz范圍內(nèi)傳輸測試數(shù)據(jù)[13],并且TSV在3D堆疊的不同層之間建立了高速的垂直通信接口[14],但是芯核的測試頻率受到功耗的約束,因此整個(gè)3D堆疊只能在較低的頻率下進(jìn)行測試[12]。時(shí)分復(fù)用的方法將自動(dòng)測試設(shè)備(Automatic Test Equipment,ATE)的全局測試時(shí)鐘(Global Test Clock,GTC)從堆疊芯片的底部輸入,經(jīng)過TSV傳輸,并通過各層間移位寄存器對(duì)時(shí)鐘頻率進(jìn)行分解,然后進(jìn)入3D堆疊中的不同層,進(jìn)入每一層的層間測試時(shí)鐘(Layer Test Clock,LTC)與全局測試時(shí)鐘相比相對(duì)較低。同樣,再將LTC經(jīng)過核間移位寄存器進(jìn)一步分解,這樣,到達(dá)不同芯核的測試時(shí)鐘頻率會(huì)被再次降低。所有芯核共享數(shù)據(jù)通道,并根據(jù)分配到的時(shí)鐘接收測試數(shù)據(jù),從而保證了多個(gè)芯核可以在較低頻率下并行測試。

但是,在時(shí)分復(fù)用數(shù)據(jù)通道進(jìn)行芯核測試的過程中,由于各個(gè)芯核的測試數(shù)據(jù)量不成比例,這使得用于分頻的寄存器的設(shè)計(jì)問題變得十分復(fù)雜,并且會(huì)產(chǎn)生部分的空閑測試時(shí)鐘周期,造成測試資源的浪費(fèi)。為了解決這一問題,本文設(shè)計(jì)了一種基于貪心算法的寄存器分配方案,并提出了一種使用離散二進(jìn)制粒子群優(yōu)化(Discrete Binary Particle Swarm Optimization,DBPSO)算法優(yōu)化芯核在三維堆疊中布圖的方法,協(xié)同優(yōu)化層間與核間的測試并行度,該方法充分利用測試傳輸通道的數(shù)據(jù)傳輸潛力,以減少綁定前、綁定中和綁定后的測試時(shí)間。

1 測試優(yōu)化方法

1.1 面向3D SoC的整體測試流程

3D SoC與傳統(tǒng)的2D SoC相比結(jié)構(gòu)更為復(fù)雜,因此測試流程也相對(duì)繁瑣。為了更好地解決可測試性設(shè)計(jì)問題,本文在3D SoC設(shè)計(jì)之初就將測試問題納入設(shè)計(jì)范圍并使用時(shí)分的方法設(shè)計(jì)測試結(jié)構(gòu),通過合理分配整個(gè)SoC上的芯核分布,盡可能平衡層內(nèi)芯核的測試時(shí)間,保證層間測試并行度,進(jìn)一步減少測試時(shí)間。本文設(shè)計(jì)流程可以分為以下幾個(gè)步驟:

1)將不同芯核所需的測試數(shù)據(jù)按照全局測試通道寬度進(jìn)行等長分段;

2)按貪心策略確定寄存器分配方案;

3)對(duì)整個(gè)三維芯片按照不同芯核所在的層號(hào)進(jìn)行二進(jìn)制編碼,將整個(gè)三維堆疊表示為二進(jìn)制形式;

4)使用基于BPSO的方法求得最優(yōu)的芯核布圖。

本文方案可以有效解決層內(nèi)和層間測試的并行問題,因此可以應(yīng)用于綁定前、綁定中和綁定后的測試過程中。對(duì)于一個(gè)m層的3D SoC,一般的測試過程如下:

1)對(duì)每一層芯片都進(jìn)行綁定前測試,保證每一片芯片在綁定前都是有效的;

2)對(duì)每一次部分堆疊的綁定都進(jìn)行一次測試,保證部分堆疊的有效性,共需要進(jìn)行m-2次綁定中測試;

3)對(duì)綁定后的完整堆疊進(jìn)行綁定后的完整測試;

4)對(duì)封裝后的整個(gè)3D SoC進(jìn)行1次最終測試。

根據(jù)文獻(xiàn)[14],在測試過程中,一個(gè)由m層芯片堆疊而成的3D芯片,需要經(jīng)過2m次測試步驟。本文在一般測試流程之前對(duì)芯核進(jìn)行了優(yōu)化設(shè)計(jì),整體流程如圖1所示。

圖1 尋找最優(yōu)測試堆疊方案Fig.1 Scheme of searching optimal test stacking

1.2 層與核間移位寄存器設(shè)計(jì)

在共享測試數(shù)據(jù)通道的環(huán)境中如何使得測試數(shù)據(jù)從ATE輸出后按照既定邏輯到達(dá)指定的芯核是數(shù)據(jù)調(diào)度的主要問題。數(shù)據(jù)先經(jīng)過全局測試通道調(diào)度到不同層,再在各層間經(jīng)過調(diào)度到達(dá)指定的芯核,而層核間測試數(shù)據(jù)調(diào)度的關(guān)鍵在于層與核間移位寄存器的設(shè)計(jì)。

在整個(gè)堆疊的每一層都分配一個(gè)相同結(jié)構(gòu)的移位寄存器,目的是將GTC信號(hào)進(jìn)行劃分,轉(zhuǎn)換為每一層的LTC。在圖2中,堆疊的每層上都有一個(gè)四位的循環(huán)移位寄存器,寄存器的初始值分別為“1010”“0100”“0001”。當(dāng) GTC信號(hào)的一次脈沖來臨時(shí),每層的循環(huán)移位寄存器進(jìn)行一次移位,GTC信號(hào)被分解為原頻率的1/2、1/4和 1/4分別進(jìn)入 Layer 1、Layer 2和Layer 3,且不同層內(nèi)的脈沖并無沖突。

圖2 層間移位寄存器設(shè)計(jì)Fig.2 Design of interlayer shift register

層內(nèi)移位寄存器設(shè)計(jì)如圖3所示,與層間數(shù)據(jù)傳輸頻率劃分類似,在每一層內(nèi),通過循環(huán)移位寄存器將LTC分解為不同芯核的測試頻率。與層間頻率劃分不同的是在層內(nèi)多個(gè)芯核共用一個(gè)寄存器。從不同的寄存器中引出輸出信號(hào)作為不同芯核的數(shù)據(jù)傳輸時(shí)鐘,當(dāng)某一寄存器數(shù)據(jù)由0跳變成1時(shí),芯核從共享的全局測試數(shù)據(jù)通道中接收一次測試數(shù)據(jù)段,從而減少多個(gè)移位寄存器帶來的額外面積開銷。

圖3 核間移位寄存器設(shè)計(jì)Fig.3 Design of inter-core shift register

在圖4中,每個(gè)芯核用于測試的掃描鏈有多個(gè),當(dāng)一個(gè)接收數(shù)據(jù)的脈沖到來時(shí),多段掃描鏈從全局測試時(shí)鐘上接收一個(gè)測試數(shù)據(jù)段,直到整個(gè)掃描鏈被填滿,然后進(jìn)行芯核的測試。

圖4 全局?jǐn)?shù)據(jù)通道共享方式Fig.4 Sharing method of global data channel

1.3 測試數(shù)據(jù)集的寄存器分配方案

在層間和核間的移位寄存器設(shè)計(jì)中,如果層或者芯核分配到的用于產(chǎn)生局部時(shí)鐘的觸發(fā)器數(shù)比例越高,那么,通過對(duì)GTC分頻得到的測試數(shù)據(jù)段的時(shí)鐘頻率也越高。由于不同層之間或者同一層的不同芯核之間所需時(shí)鐘周期數(shù)不一致,需要有效的寄存器分配方案。

假設(shè)在測試中,傳送測試數(shù)據(jù)的全局測試通道寬度是確定的,芯核A、B和C接收測試數(shù)據(jù)各需要100、200和300個(gè)時(shí)鐘周期。如果每個(gè)芯核都只分配一個(gè)觸發(fā)器,那么,當(dāng)芯核A完成測試時(shí),芯核B、C仍然沒有測試完成,繼續(xù)進(jìn)行測試時(shí)為A分配的測試資源會(huì)出現(xiàn)空閑狀況。為了保證所有芯核能夠被完整測試,芯核A會(huì)產(chǎn)生200個(gè)空閑時(shí)鐘周期,芯核B會(huì)產(chǎn)生100個(gè)空閑時(shí)鐘周期,共產(chǎn)生300個(gè)空閑的時(shí)鐘周期。如何分配移位寄存器以保證每個(gè)芯核能獲得合適的測試時(shí)間是多核并行測試中的一個(gè)重要問題。

為了降低成本減少面積開銷,需要對(duì)移位寄存器的規(guī)模作一定的約束,為此,可以在設(shè)計(jì)時(shí)將移位寄存器中觸發(fā)器的數(shù)量限制在給定值以內(nèi)。本文提出了一種基于貪心算法的寄存器設(shè)計(jì)方案。假設(shè)給n個(gè)芯核最多分配r個(gè)觸發(fā)器,具體設(shè)計(jì)步驟如下:

1)初始,為每一個(gè)芯核分配一個(gè)觸發(fā)器,計(jì)算空閑周期并將該次分配記為最優(yōu)分配;

2)為每一個(gè)芯核嘗試分配下一個(gè)觸發(fā)器時(shí),計(jì)算該次分配所產(chǎn)生的空閑時(shí)鐘周期,將該觸發(fā)器分配給空閑時(shí)鐘周期最少的芯核;

3)將步驟2)分配與最優(yōu)分配進(jìn)行對(duì)比,如果空閑時(shí)鐘周期小于最優(yōu)分配的空閑周期,則更新最優(yōu)分配;

4)判斷r個(gè)觸發(fā)器是否分配完成,如果沒有完成,重新進(jìn)行步驟2);

5)輸出最優(yōu)分配。

以前文提到的芯核A、B和C為例,假設(shè)最大觸發(fā)器數(shù)量為7,圖5中的方塊標(biāo)記了當(dāng)次分配觸發(fā)器后所產(chǎn)生的空閑時(shí)鐘周期,并且每次選擇分配的芯核都用深色標(biāo)出。首先為三個(gè)芯核各分配一個(gè)觸發(fā)器,將第4個(gè)觸發(fā)器分配給芯核C時(shí),空閑時(shí)鐘周期最小;將第5個(gè)觸發(fā)器分配給芯核B時(shí),空閑時(shí)鐘周期最小;當(dāng)7個(gè)觸發(fā)器分配完成后,最優(yōu)分配是為芯核A、B和C分別分配1、2、3個(gè)觸發(fā)器的方案,此時(shí)的空閑時(shí)鐘周期為0。

圖5 移位寄存器分配過程Fig.5 Allocation process of shift register

層間移位寄存器的分配也采用該方法,只需要將芯核的測試數(shù)據(jù)量替換為完成該層測試所需的時(shí)鐘周期。

1.4 多芯核排列的編碼方式

為保證測試時(shí)間最短,不同層的測試完成時(shí)間應(yīng)保持一致,可以通過優(yōu)化芯核在不同層上的分布來解決這樣的問題。同時(shí)為了保證功耗安全,針對(duì)某一個(gè)指定的芯核,它的測試時(shí)鐘頻率應(yīng)該被限制在某一個(gè)頻率之下,以保障芯核在測試過程中不會(huì)因?yàn)轭l率過高而產(chǎn)生熱故障,即在功耗約束下,求得一個(gè)最優(yōu)三維堆疊,使得整體的測試時(shí)間最小。

對(duì)于一個(gè)擁有m層并有n個(gè)芯核的三維芯片,問題在于如何將n個(gè)芯核分配不同層中,對(duì)于一個(gè)特定的芯核k,它所在的層號(hào):qk(0<qk≤m,qk∈Z)表示這一個(gè)芯核處于整個(gè)三維芯片堆疊的層號(hào),其中Z表示整數(shù)集,針對(duì)一個(gè)給定的三維芯片堆疊,其芯核1到n的層號(hào)排列可以表示為一個(gè)n維的向量:(q1,q2,…,qk,…,qn),0 < qk≤m,qk∈Z,1≤k≤n。對(duì)向量中芯核k,其層號(hào)用qk二進(jìn)制編碼表示,層編碼長度為「lb(m)?,對(duì)某一個(gè)確定的三維芯片堆疊,其二進(jìn)制編碼長度l為:

圖6表示的是一個(gè)三維堆疊分配方案的編碼,它有4層并包含8個(gè)芯核。標(biāo)志4層要2個(gè)二進(jìn)制位,共有8個(gè)芯核,所以碼字長度為16比特。按照每兩位為一個(gè)芯核層號(hào)的規(guī)律,可以將圖6的二進(jìn)制編碼還原為一個(gè)原始的三維芯片中芯核分配方案,即底層分配Core4和Core8,第二層分配Core2和Core7,第三層分配 Core3和 Core5,第四層分配 Core1和Core6。如果某一次分配使得整個(gè)三維芯片堆疊需要的測試時(shí)鐘周期最少,則該編碼所表示的三維芯片堆疊為最優(yōu)的三維芯片芯核分配方案。對(duì)于一個(gè)規(guī)模較大的三維芯片,如何尋找三維芯片的最優(yōu)測試堆疊是一個(gè)復(fù)雜的問題,本文使用離散二進(jìn)制粒子群優(yōu)化算法來解決這一問題。

圖6 分配方案二進(jìn)制編碼Fig.6 Binary coding of allocation scheme

1.5 離散二進(jìn)制粒子群優(yōu)化算法

粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法由魚群、鳥群的群體智能規(guī)律設(shè)計(jì)出來的,DBPSO算法是PSO基礎(chǔ)上的改進(jìn)版本,用以解決PSO算法在離散空間尋優(yōu)問題中存在的局限性,本文引入該方法用以尋找三維芯片的最優(yōu)堆疊。

在一維的空間中存在多個(gè)粒子,每一個(gè)粒子表示的空間點(diǎn)都是一個(gè)三維芯片堆疊方案的二進(jìn)制編碼,粒子的每一個(gè)維度只能取值0或者1,粒子的位置和速度根據(jù)自身和同伴的經(jīng)驗(yàn)進(jìn)行動(dòng)態(tài)的調(diào)整,經(jīng)過多次迭代之后找到一個(gè)最優(yōu)的空間點(diǎn)作為三維芯片的最優(yōu)分配方案。

整個(gè)種群(種群中粒子的總數(shù)為p)第i個(gè)粒子的位置表示為Xi=(bi1,bi2,…,bil),Xi即為一次三維堆疊分配方案,將測試所需的時(shí)鐘周期數(shù)的倒數(shù)作為種群的適應(yīng)度,粒子的適應(yīng)度越高,則該粒子的位置更優(yōu)。將特定粒子在歷史上獲得的最優(yōu)位置記為Pbesti,最優(yōu)位置Gbest看成是種群到目前的最優(yōu)解,那么粒子的速度 Vi=(vi1,vi2,…,vil)。

當(dāng)前的粒子速度Vi中某一維的速度vid由當(dāng)前的種群的狀態(tài)決定:

其中:pbestid為當(dāng)前粒子歷史最優(yōu)Pbesti的第d維;gbestd為全局最優(yōu)位置Gbest的第d維;ω、c1和c2分別為上一代粒子速度vid、pbestid和gbestd對(duì)當(dāng)前粒子速度影響的權(quán)重,當(dāng)前粒子某一維的速度表示在下一次迭代中該二進(jìn)制位取1的概率,為了將速度值映射到區(qū)間[0,1]中,使用sigmoid函數(shù):

sigmoid函數(shù)是將變量映射到[0,1]區(qū)間的S型函數(shù),其中的Sig(vid)作為位置xid取1的概率,使用rand()函數(shù)落入[0,1]區(qū)間的位置來模擬隨機(jī)性:

所有粒子位置更新后,Pbesti和Gbest也將得到更新,重新計(jì)算粒子的飛行速度vid。初始種群和初始粒子速度隨機(jī)生成,種群經(jīng)過多次迭代后收斂,最終獲得種群最優(yōu)解作為分配方案。

2 基于時(shí)分的測試結(jié)構(gòu)

本文整體測試結(jié)構(gòu)如圖7所示。在設(shè)計(jì)階段,本文方案需要根據(jù)測試數(shù)據(jù)量對(duì)3D SoC進(jìn)行可測性設(shè)計(jì)優(yōu)化,保證位于不同層的芯核完成測試的時(shí)間相差不大。在圖7中,用于測試的數(shù)據(jù)被預(yù)先存儲(chǔ)在ATE中,ATE發(fā)出的測試數(shù)據(jù)進(jìn)入全局測試通道,經(jīng)過層間的通信接口共享到不同層的不同核中。全局測試時(shí)鐘經(jīng)過層間移位寄存器和核間移位寄存器的分解,到達(dá)芯核后變成芯核接收數(shù)據(jù)段的頻率。每次脈沖來臨時(shí),芯核就從全局測試通道接收一次數(shù)據(jù)段,當(dāng)某一芯核接收到完整的測試向量,進(jìn)行一次測試。

圖7 并行測試結(jié)構(gòu)Fig.7 Parallel test structure

對(duì)單個(gè)芯核k來說,在測試數(shù)據(jù)量和測試頻率一定的情況下,測試時(shí)間tk與芯核k數(shù)據(jù)傳輸帶寬wk成反比。將tk和wi當(dāng)作矩形的長和寬,則矩形面積為:

面積 sk恒定。假定有5 個(gè)芯核 C1、C2、C3、C4和 C5,在無有效的TAM設(shè)計(jì)下,每個(gè)芯核只能串行測試,圖8(a)中表示了使用串行測試方法所需要的時(shí)間,整個(gè)堆疊的測試時(shí)間較長。在進(jìn)行合理的TAM資源分配后,部分芯核可以進(jìn)行并行測試,相較于串行測試方法測試時(shí)間有所減少;但在圖8(b)中,某些時(shí)間段仍然有大量空閑的TAM資源,存在測試資源的浪費(fèi)。

圖8 串行測試與并行測試方法對(duì)比Fig.8 Comparison of serial test and parallel test methods

在本文中的測試架構(gòu)設(shè)計(jì)中,所有芯核共享測試資源,理論上通過頻率上的分配可以使得所有芯核在相同的時(shí)間完成測試。在圖9(a)中,測試資源得到了合理的分配,使得測試時(shí)間進(jìn)一步減少。然而,考慮到控制上的復(fù)雜性,在圖9(b)的實(shí)際分配情況中,每個(gè)芯核的測試完成時(shí)間會(huì)略有偏差,但仍能保證芯核在比較接近的時(shí)間點(diǎn)完成測試;雖然造成了少量的資源浪費(fèi),但是測試效率保持了較大的提升。

圖9 本文測試調(diào)度方法與理論測試方法對(duì)比Fig.9 Comparison of proposed test scheduling method and ideal test method

3 實(shí)驗(yàn)與結(jié)果分析

為了驗(yàn)證本文分配方法的有效性,采用ISCAS-89標(biāo)準(zhǔn)測試電路中4個(gè)測試電路(C2670,C7552,S420,S641)模擬芯核進(jìn)行測試,算法在Windows平臺(tái)PC上采用C++程序設(shè)計(jì)語言模擬實(shí)現(xiàn)芯核測試過程。層間移位寄存器進(jìn)行分配時(shí)的各個(gè)芯核傳輸測試數(shù)據(jù)需要的時(shí)鐘周期數(shù)如表1所示。

表1 芯核測試數(shù)據(jù)分配結(jié)果Tab.1 Allocation results of core test data

實(shí)驗(yàn)數(shù)據(jù)表明移位寄存器內(nèi)寄存器的數(shù)量對(duì)測試所需時(shí)鐘周期量有較大的影響。隨著移位寄存器的數(shù)量增加,測試所需時(shí)鐘周期急劇減少,最后趨于穩(wěn)定。測試數(shù)據(jù)量的下降趨勢如圖10所示。

為了驗(yàn)證多芯核優(yōu)化方案的有效性,實(shí)驗(yàn)選取了12個(gè)芯核、4層堆疊的三維芯片作為實(shí)驗(yàn)對(duì)象,層間和核間最大的寄存器數(shù)量取12個(gè)。由于芯核在測試過程中并行工作,實(shí)驗(yàn)通過控制ATE傳輸數(shù)據(jù)的頻率保證整個(gè)芯片的測試功耗始終在安全閾值以下。

圖11是測試通道寬度為48時(shí),原始三維堆疊和優(yōu)化后的三維堆疊TAM利用率的對(duì)比。為了更加直觀地對(duì)比利用率,將每一個(gè)時(shí)鐘周期作為圖像的一個(gè)像素點(diǎn)。當(dāng)該時(shí)鐘周期內(nèi)TAM正在使用時(shí),像素點(diǎn)標(biāo)為黑色;TAM空閑時(shí),像素點(diǎn)標(biāo)為白色。由于圖中黑白像素點(diǎn)較為密集,部分區(qū)域黑白交替呈現(xiàn)出灰色,顏色越深,表示黑色像素點(diǎn)的占比越高。圖11中,優(yōu)化后的堆疊生成的圖像黑色像素點(diǎn)較優(yōu)化前占比更高,即優(yōu)化后的TAM利用率更高。在測試過程中,測試資源的利用率得到提高后,相應(yīng)的測試時(shí)間得到縮短。

圖10 最大寄存器數(shù)量與測試數(shù)據(jù)量的關(guān)系Fig.10 Relationship between maximum number of registers and amount of test data

圖11 優(yōu)化前后TAM利用率對(duì)比Fig.11 Comparison of TAM utilization ratio before and after optimization

本文方案優(yōu)化前后的對(duì)比如表2所示。由表2可知,優(yōu)化后的三維堆疊測試時(shí)間有所下降:測試通道寬度為16、32、48、64 時(shí),測試時(shí)間分別下降 14.44%、12.71%、14.35%、14.45%,平均測試時(shí)間下降13.98%,并在整個(gè)TAM利用率上有較大的提升;測試通道寬度為16、32、48、64時(shí),TAM利用率分別上升 16.88%、14.60%、16.75%、16.88%,平均 TAM利用率上升16.28%。

表2 優(yōu)化前后測試時(shí)間和TAM利用率對(duì)比Tab.2 Comparison of test time and TAM utilization ratio before and after optimization

為了驗(yàn)證本文方案在測試時(shí)間上的效果,本文在ITC'02基準(zhǔn)電路中的3D SoC(p22810、p34392和p93791)上進(jìn)行實(shí)驗(yàn),并與近些年來的一些方案在相同的測試頻率和TAM寬度下進(jìn)行了測試時(shí)間上的對(duì)比,實(shí)驗(yàn)結(jié)果如表3所示。其中:文獻(xiàn)[6]方案使用整數(shù)線性規(guī)劃方法尋找最優(yōu)裝箱策略,來提高測試并行度;文獻(xiàn)[8]方案使用量子尋優(yōu)算法優(yōu)化測試調(diào)度;文獻(xiàn)[9]方案是將測試過程按時(shí)間分段的測試架構(gòu)設(shè)計(jì);文獻(xiàn)[10]方案采用了一種先偽平面化的結(jié)構(gòu)設(shè)計(jì)再進(jìn)行掃描鏈均衡的優(yōu)化設(shè)計(jì)方法;文獻(xiàn)[12]方案是一種時(shí)分復(fù)用的架構(gòu)設(shè)計(jì),該方案也是本文方案的研究基礎(chǔ);文獻(xiàn)[16]方案是一種標(biāo)準(zhǔn)可配置的測試架構(gòu)設(shè)計(jì)。總體來看,由于基準(zhǔn)電路中部分芯核之間存在依賴關(guān)系,所以絕大多數(shù)方案不能對(duì)這類芯核并行測試;而本文方案采用時(shí)分復(fù)用的策略,宏觀上看各個(gè)芯核雖然并行測試,但在測試中某一時(shí)刻,只有不多于一個(gè)芯核在進(jìn)行測試,所以不存在沖突的問題。由表3可知,在相同測試頻率和TAM寬度的情況下,除了文獻(xiàn)[8]方案未提供p34392的實(shí)驗(yàn)數(shù)據(jù)外,本文方案均使用了較短的測試時(shí)間,有效地降低了芯片的測試成本。此外,本文方案因?yàn)樗行竞硕伎梢圆⑿袦y試且測試頻率較低,相較于其他方案只有部分芯核可以并行測試,整個(gè)堆疊的發(fā)熱更為均勻,也相對(duì)更安全。

表3 不同方案的測試時(shí)間(時(shí)鐘周期數(shù))對(duì)比Tab.3 Comparison of test time(clock cycle number)of different schemes

4 結(jié)語

針對(duì)測試時(shí)間對(duì)測試成本的重要影響,本文提出了一種基于時(shí)分復(fù)用的層核間測試數(shù)據(jù)調(diào)度的多芯核優(yōu)化方法。通過合理分配層核上的移位寄存器數(shù)量,提高不同芯核的測試并行度,同時(shí)使用DBPSO算法優(yōu)化芯核在三維堆疊中的位置,求出最優(yōu)測試芯核布圖。實(shí)驗(yàn)結(jié)果表明,該方法不僅可以協(xié)同優(yōu)化測試數(shù)據(jù)在層與核間的測試調(diào)度,并且適用于綁定前、綁定中和綁定后測試。由于方法考慮了芯核間的測試并行度問題,在減少測試時(shí)間的同時(shí),也降低了各個(gè)芯核的測試頻率,從而保證了芯核的安全測試。

本文方法目前每個(gè)時(shí)鐘周期只能對(duì)一個(gè)芯核進(jìn)行測試數(shù)據(jù)的傳輸,進(jìn)一步的研究方向在于如何使相容的測試數(shù)據(jù)可以同時(shí)送入不同的芯核中,進(jìn)一步提高芯核的測試并行度,減少3D SoC的測試時(shí)間。參考文獻(xiàn)(References)

[1] 王喆垚.三維集成技術(shù)[M].北京:清華大學(xué)出版社,2014:6-18.(WANG Z Y.Three-Dimensional Integration Technology [M].Beijing:Tsinghua University Press, 2014:6 -18.)

[2] LEE H H S,CHAKRABARTY K.Test challenges for 3D integrated circuits [J].IEEE Design and Test of Computers, 2009, 26(5):26-35.

[3] NICOLICI N, AL-HASHIMI B M.Power-Constrained Testing of VLSI Circuits [M].Boston, MA:Springer, 2003:113 -115.

[4] IYENGAR V,Chakrabarty K,MARINISSEN E J.Test wrapper and test access mechanism co-optimization for system-on-chip [J].Journal of Electronic Testing,2002,18(2):213-230.

[5] ZHAO D,UPADHYAYA S.Dynamically partitioned test scheduling with adaptive TAM configuration for power-constrained SoC testing[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2005,24(6):956-965.

[6] CHAKRABARTY K,IYENGAR V,CHANDRA A.Test wrapper and TAM co-optimization[M]//CHAKRABARTY K,IYENGAR V,CHANDRA A.Test Resource Partitioning for System-on-Chip.New York:Springer US,2002:65-93.

[7] 梁旭,李行善,于勁松.基于遺傳算法的并行測試調(diào)度算法研究[J].電子測量與儀器學(xué)報(bào),2009,23(2):19 -24.(LIANG X, LI X S, YU J S.Research on the task schedule algorithm based on the GA [J].Journal of Electronic Measurement and Instrument, 2009,23(2):19 -24.)

[8] XU C P, ZHANG J, ZHANG M.Test scheme of SOC test with multi-constrained to reduce test time[C]//Proceedings of the 2009 International Conference on Electronic Packaging Technology&High Density Packaging.Piscataway, NJ:IEEE, 2009:970 -973.

[9] ROY S, GHOSH P, RAHAMAN H, et al.Session based core test scheduling for minimizing the testing time of 3D SOC [C]//Proceedings of the 2014 International Conference on Electronics and Communication Systems.Piscataway, NJ:IEEE, 2014:1 -5.

[10] 李嬌.層次化SOC可測性架構(gòu)及測試調(diào)度優(yōu)化策略研究[D].上海:上海大學(xué),2014:63 -83.(LI J.The research on DFT structure and test scheduling optimization for hierarchical SOC [D].Shanghai:Shanghai University,2014:63 -83.)

[11] VARTZIOTIS F, KAVOUSIANOS X, CHAKRABARTY K, et al.Time-division multiplexing for testing DVFS-based SoCs [J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 2015,34(4):668 -681.

[12] GEOFGIOU P,VARTZIOTIS F, KAVOUSIANOS X, et al.Twodimensional time-division multiplexing for 3D-SoCs [C]//Proceedings of the 2016 IEEE European Test Symposium.Piscataway,NJ:IEEE,2016:1-6.

[13] NDIP I, CURRAN B, LOBBICKE K, et al.High-frequency modeling of TSVs for 3-D chip integration and silicon interposers considering skin-effect,dielectric quasi-TEM and slow-wave modes[J].IEEE Transactions on Components, Packaging and Manufacturing Technology,2011,1(10):1627-1641.

[14] SHEIBANYRAD A, PETROT F.Asynchronous 3D-NoCs making use of serialized vertical links [M]//SHEIBANYRAD A,PETROT F,JANTSCH A.3D Integration for NoC-based SoC Architectures.New York:Springer, 2011:149 -165.

[15] MARINISSEN E J, ZORIAN Y.Testing 3D chips containing throughsilicon vias [C]//Proceedings of the 2009 IEEE International Test Conference.Piscataway, NJ:IEEE,2009:1-11.

[16] 李廣進(jìn),陳圣儉,牛金濤,等.數(shù)字IP核的IEEE Std1500外殼架構(gòu)設(shè)計(jì)研究[J].微電子學(xué)與計(jì)算機(jī),2012,29(10):42 -46.(LI G J, CHEN S J, NIU J T, et al.Research on IEEE Std1500 wrapper design for digit IP core [J].Microelectronic & Computer,2012, 29(10):42 -46.)

猜你喜歡
分配優(yōu)化
基于可行方向法的水下機(jī)器人推力分配
超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
由“形”啟“數(shù)”優(yōu)化運(yùn)算——以2021年解析幾何高考題為例
應(yīng)答器THR和TFFR分配及SIL等級(jí)探討
遺產(chǎn)的分配
一種分配十分不均的財(cái)富
績效考核分配的實(shí)踐與思考
主站蜘蛛池模板: 亚洲欧美日韩视频一区| 色婷婷成人网| 日韩视频精品在线| 毛片大全免费观看| 亚洲欧洲日韩久久狠狠爱 | 欧美在线伊人| 欧美日韩国产精品va| 日本三级欧美三级| 午夜日b视频| 午夜无码一区二区三区| 欧美日韩另类国产| 亚洲黄色激情网站| 亚洲专区一区二区在线观看| 天天综合天天综合| 久久久久免费看成人影片| 国产美女视频黄a视频全免费网站| 欧美成人一区午夜福利在线| 精品视频一区在线观看| 国产男人天堂| 国产网站免费观看| 999国产精品| 久久久久久国产精品mv| 国产午夜精品一区二区三区软件| 国产女人18水真多毛片18精品| 国产办公室秘书无码精品| 热这里只有精品国产热门精品| 中文字幕免费播放| 国产欧美在线观看精品一区污| 久久精品国产精品青草app| 婷婷亚洲视频| 国产手机在线观看| 欧美成人h精品网站| 波多野结衣久久高清免费| 国产精品久久久久久影院| 亚洲天堂高清| 91久久国产热精品免费| 9丨情侣偷在线精品国产| 五月天在线网站| 波多野结衣AV无码久久一区| 午夜福利亚洲精品| 日韩高清在线观看不卡一区二区| 亚洲天堂免费| 久久亚洲美女精品国产精品| 日韩欧美视频第一区在线观看| 国产剧情国内精品原创| 婷婷激情亚洲| 综合亚洲色图| 精品黑人一区二区三区| 99re在线观看视频| 成人精品午夜福利在线播放| 一本综合久久| 色综合中文综合网| 成人蜜桃网| 亚洲国产精品日韩av专区| 国产主播在线观看| 亚洲一级毛片在线观播放| 国产在线91在线电影| 天堂网亚洲系列亚洲系列| 精品伊人久久久香线蕉| 激情六月丁香婷婷| 伊人久久大香线蕉影院| 伊人色综合久久天天| 全部无卡免费的毛片在线看| 国产精女同一区二区三区久| 国产69囗曝护士吞精在线视频 | 91久久夜色精品国产网站| 亚洲中文字幕国产av| 毛片网站观看| 亚洲国产无码有码| 激情综合激情| 国产精品人成在线播放| 亚洲国产精品无码久久一线| 国产亚洲精品97AA片在线播放| 91亚洲精品第一| 国产天天色| 在线观看国产精美视频| 欧洲日本亚洲中文字幕| 伊人无码视屏| 亚洲成人网在线播放| 国产亚洲高清视频| 一区二区无码在线视频| 日本国产精品|