999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于門控時鐘的低功耗電路實現方案

2010-12-21 06:27:42謝曉娟蔣見花
電子器件 2010年2期
關鍵詞:優化設計

謝曉娟,蔣見花

(中國科學院微電子研究所, 北京100029)

集成電路工藝節點的提升帶來了芯片集成度的極大提高,同時也導致了功耗的急速增加[1]。另外,市場對電子設備的大量需求使得系統功耗成為系統性能的一個重要指標,功耗的高低成了芯片廠商競爭力的焦點之一,功耗控制與管理已成為絕大多數芯片廠商首要考慮的問題。 SoC設計的功耗包含兩部分:靜態功耗和動態功耗。靜態功耗主要由泄漏電流引起,在130 nm工藝下,靜態功耗相對較小,可以忽略不計。動態功耗主要包括短路功耗和翻轉功耗,是本設計中功耗的主要組成部分。短路功耗即內部功耗,指由器件內部由于P管和N管在某一瞬間同時導通引起的瞬時短路引起。翻轉功耗由CMOS器件的輸出端負載電容充放電引起。芯片工作時,很大一部分功耗是由于時鐘網絡的翻轉消耗的,如果時鐘網絡較大,這部分引起的功耗損失會很大。在眾多低功耗技術中,門控時鐘對翻轉功耗和內部功耗的抑制作用最強。本文主要講述門控時鐘技術的具體實現。另外,基于高閾值單元具有較低的功耗,設計采用高閾值單元庫。

1 門控時鐘技術的基本原理

圖1 帶有多路開關的同步使能寄存器

對于一個設計中的寄存器組,經DC編譯后一般會生成如圖1 所示的電路。由圖1可以看出,當EN為1時, DATA_IN的值由多路開關傳至寄存器組的數據輸入端,當CLK上升沿來臨時,傳至DATA_OUT。當EN為0時, OUTPUT保持不變。但由于時鐘信號CLK的翻轉,寄存器組會持續在CLK的上升沿來臨時讀取數據輸入端的數據,而這時讀取的數據是不變的,這就消耗了額外的功耗[2]。

為保證此時寄存器組不受時鐘翻轉的影響,可在EN信號為0時關斷寄存器組的時鐘輸入端,使其不受CLK端的變化而變化,這一操作可通過門控時鐘技術來實現,如圖2所示。圖中的門控單元由一個Latch和一個與門組成。門控單元也可以采用非Latch結構,直接由與門或或門組成。但由于這種電路會引發毛刺[2],故此處采用基于Latch的門控單元電路。插入門控時鐘后,當EN為1時, Latch單元在時鐘低電平時將EN鎖存至ENL,時鐘上升沿來臨時, ENCLK隨CLK變化,寄存器組執行正常的讀入讀出操作。當EN為0 時,寄存器時鐘輸入端ENCL保持為0,不隨源時鐘CLK的翻轉而變化,故此時寄存器組不消耗額外功率。

由此可見,插入門控時鐘能消除寄存器組冗余翻轉引發的內部功耗,同時由于多路選擇器組被一個基于latch的門控單元代替,所以也減小了電路的面積[3]。

另外,為了進一步減小設計的功耗,可采用一些特定的門控技術。目前應用比較廣泛的有多級門控時鐘,層次化門控時鐘等。在多級門控時鐘技術中,一個門控單元還可用來驅動其他一個或一組門控單元。這樣就通過分級控制減少了門控單元的數目,而且這種方法可組合盡可能多的寄存器組使得門控單元向頂層靠近,節省更多功耗。

圖2 基于latch的門控單元電路

2 門控時鐘的物理實現

電路在功能仿真通過后,開始進行寄存器級綜合。采用高閾值標準單元庫和多級門控時鐘技術相結合,在RTL階段插入門控時鐘單元,并在布局布線時在IC Compiler中進行了基于門控時鐘的布局布線優化,布局布線正確完成仿真通過后,在PT中做靜態時序分析并進行最終的功耗分析。以下分三個部分講述。

2.1 時鐘門控的RTL級實現

在RTL級,門控時鐘的實現不需要對設計本身進行修改,而只需在綜合腳本中加入一些控制項。本文采用多級門控時鐘,相關的腳本如圖3所示。圖中,傳統的綜合流程用實線標出。虛線部分為門控時鐘的操作。

控制項set_clock_gating_style是門控時鐘的核心。它的參數大小決定門控時鐘的質量,對功耗的優化效果和對CTS的影響。目前尚無完備的體系介紹如何設置控制項以使門控效果達到最優。本設計中有以下各個參數的設置方法。

首先確定時序單元的類型。為了避免非Latch單元易產生毛刺的缺點,此處選定時序單元的類型為Latch。由于庫中提供基于鎖存器的門控單元,固正邊沿邏輯positive_edge_logic采用工藝庫提供的專用單元。采用集成單元的優勢在于不僅不需要設置門控單元輸入端建立時間和保持時間,因為集成單元的時序信息在單元庫中已有說明,而且有效緩解了插入門控單元對延時帶來的不利影響。以下重點闡述實驗中bitwidth, fanout和stage的確立方法。

fanout的大小對功耗和時序都有影響。數值越大則表示一個門控單元可承受較多的負載,即代表越節省功耗,需要的門控單元也越少,但對門控單元輸入端建立時間的要求也就更加嚴格。位寬決定一組寄存器能被門控的最小寬度。級數則確定多級門控時鐘的最大級數。本設計在這三個參數的選取上,主要是依據設計本身對功耗的要求,結合綜合時的時序約束和單元庫中門控單元的時延信息加以估計,確定一個粗略的數值范圍。 fanout的值在滿足時序的前提下,不經編譯就可確定,方法如下:首先按約束文件中的扇出值約束此處fanout,然后insert_clock_tree,加入時序約束并傳遞至門控時鐘,用report_clock_gating– multi_stage查看報告,重點關注第1項。發現fanout按約束文件取值為15時,門控單元的數目達到61個, fanout取值為20 或更高時,門控單元數目為41,見表1,而被門控的寄存器數目卻保持不變,多級門控單元的數目也由fanout取值為15時的7級減小到當前的6級。由于門控單元也會消耗相當大功耗,因此在被門控的寄存器數目相同的情況下門控單元數越少就越節省功耗。因此確定fanout為20。

圖3 門控時鐘的基本描述

num_stages最初取值為2,插入門控時鐘后的報告顯示平均級數為1.4,其值增至3時,平均級數為2.3, 如表1 所示。從對時鐘網絡的平衡性來講,stage值為2時要優于取值為3時的情況,但結合其后的編譯,綜合考慮時序面積功耗因素,折衷考慮選定stage為3。

bitwidth初值為3,經過編譯,得出了功耗和延時信息。以此為基準,根據設計改變bitwidth數值,然后再編譯,對比功耗延時。發現當bitwidth取值為5時,設計的各個性能指標達到最優。

通過以上試驗,得出下列結論:對門控時鐘而言,若不考慮設計的平衡性,插入的門控單元越少且被門控的寄存器越多, 門控的效果就越好, 反之亦然。

經編譯,查看時序功耗報告,在滿足電路性能指標情況下, RTL級代碼經綜合生成層次化門級網表和門級時序約束文件。

為查看門控單元在不同設置下的插入情況,用report_clock_gating– multi_stage得到表1所示報告。

從中可知,有23.68%的寄存器沒有被門控,原因在于位寬,使能等不滿足門控要求,對設計無影響。

表1 門控時鐘總結

2.2 時鐘門控的版圖級實現

在布局布線階段,基于門控時鐘的功耗優化流程主要如下:在布局之前,設置set_power_options–clock_gating true,之后在布局、時鐘樹綜合和布線階段的主要命令中添加選項-power即可。上述設置可實現最基本的門控時鐘布局布線,但在本設計中生成的時鐘網絡分布不均勻,而且skew很大。需要采取額外的優化措施來消除其帶來的不利影響。

門控單元的加入給CTS帶來的影響主要有兩個方面,一方面會造成整個時鐘網絡分布不平衡,另一方面導致時鐘偏移增大。單采用上述措施,時鐘偏移最大可達到1.11,見圖4中的第二項,嚴重偏離了不采用門控時鐘時的偏移量0.12。在優化時鐘偏移上,目標有三個方面:構造一個相對平衡的時鐘網絡,使得在各個層上,層的各個分支上的單元數目相近;減小時鐘偏移至可承受范圍;盡量保持功耗同只采用門控時鐘而不優化時鐘偏移狀況下的功耗相近或更小。

分析引起skew偏大的原因,通過在ICC中跟蹤路徑,查看時鐘網絡電路圖,發現時鐘層分布極不均勻,分支節點最大相差6層。在具體時序路徑中,兩條路徑延時過大, 插入了許多不必要的buffer,為構造一個平衡的時鐘樹,減小skew并減少對功耗的影響,在CTS階段采取了三個措施。第一,設置set_clock_tree_options– logic_level_balance為true。 CTS的操作模式有三種:模塊模式,頂層模式,邏輯級平衡模式。默認為模塊模式。此處選取邏輯級平衡模式可得到最佳的skew, 但對功耗有一定影響[4]。第二,復制門控單元。主要是通過修正ICG輸出端的DRC來平衡扇出,并添加緩沖單元來驅動沒有被門控的寄存器使得整個時鐘樹的結構更加平衡。首先設置cts_push_down_buffer為true。然后sp lit_clock_gate– objects{*./latch}– gate_sizing– gate_relocation。并且在時鐘樹綜合時結合使用-inter_clock_balance選項。最后,為了彌補功耗優化方面的不足,在CTS完畢之后用psynopt– power。不采用門控時鐘、采用門控時鐘但不做skew優化、采用門控時鐘且進行skew優化三種情況下的skew見圖4。由此可見,優化后的skew較原來相比雖有所增大,但要遠小于優化前的設計。

圖4 各種操作方式下的時鐘偏移

2.3 功耗測量過程及實驗結果分析

布局布線完成后, 導出網表到VCS中進行后仿,并得到分析功耗所需的saif文件。將此saif文件和布局布線后帶有實際延時信息的網表讀入PT中,加以適當的時序約束進行功耗分析,得到如圖5所示的分析結果。

圖5 布局布線完成后的功耗分析結果

由圖5可知, 采用門控時鐘技術后的設計總體功耗下降了 22.6 %。其中, 開關功耗下降了63.2 %,內部功耗下降了21.9 %,體現了引入門控時鐘技術的優勢,因為門控時鐘主要用于降低動態功耗,泄露功耗略有下降。總功耗由原來的1 mW降低至778 uW, 功耗降低效果非常明顯。除此之外,芯片核的面積也略有減小。

3 結語

越來越多低功耗設計方法的出現為低功耗設計提供了無限的空間。門控時鐘技術作為當前比較成熟的一種低功耗方法,已經得到普遍應用。本設計全面講述了門控時鐘的后端實現方法,并提出了一種門控控制項的設置方法,解決了由其引起的時鐘偏移問題,對VLSI深亞微米低功耗電路物理層的實現有一定的實用價值。

[ 1] Michael Keating, David Flynn, Robert Aitken, etc.Low Power Methodology Manual For System-on-chip Design[ M] .Synopsys Inc, 2008, 13-15.

[ 2]Power Compiler User guide, Version C-2009.06 [ Z].Synopsys Inc.

[ 3] 張永新,陸生禮,茆邦琴.門控時鐘的低功耗設計技術[ J] .微電子學與計算機, 2004, 21(1):23-26.

[ 4]IC Compiler Implementation User guide, Version C-2009.06[ Z].Synopsys Inc.

猜你喜歡
優化設計
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
何為設計的守護之道?
現代裝飾(2020年7期)2020-07-27 01:27:42
《豐收的喜悅展示設計》
流行色(2020年1期)2020-04-28 11:16:38
瞞天過海——仿生設計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
主站蜘蛛池模板: 少妇极品熟妇人妻专区视频| 欧美激情网址| 亚洲天堂成人| 亚洲日本韩在线观看| 国产超碰在线观看| 国内熟女少妇一线天| …亚洲 欧洲 另类 春色| 激情亚洲天堂| 日本福利视频网站| 日韩精品一区二区三区大桥未久| h网站在线播放| 草草线在成年免费视频2| 国产精品极品美女自在线看免费一区二区| 国内99精品激情视频精品| 亚洲欧美自拍中文| 精品久久蜜桃| 日韩在线第三页| 网友自拍视频精品区| 国产精品吹潮在线观看中文| 国产精品香蕉在线| 国产一区二区精品福利| 欧美国产综合色视频| 九九精品在线观看| 久久久久免费看成人影片 | 精品人妻一区无码视频| 999国内精品久久免费视频| 九九热在线视频| 日本在线欧美在线| 97视频精品全国免费观看| 亚洲国产日韩欧美在线| 性色生活片在线观看| 亚洲啪啪网| 中文字幕欧美日韩高清| 婷婷激情五月网| 四虎在线高清无码| 久久精品人人做人人| 91成人在线免费观看| 国产成人亚洲精品蜜芽影院| 97国内精品久久久久不卡| 欧美另类精品一区二区三区| 久久99国产乱子伦精品免| 亚洲一级毛片免费观看| 99热这里只有精品久久免费| 操美女免费网站| 99爱视频精品免视看| 69精品在线观看| 2020国产免费久久精品99| 欧美影院久久| 日韩精品无码免费一区二区三区| 国产激情国语对白普通话| 在线日韩日本国产亚洲| 日本www色视频| 激情网址在线观看| 国产欧美又粗又猛又爽老| 日本五区在线不卡精品| 日韩国产高清无码| 久久一色本道亚洲| 成人午夜天| 欧美日本中文| 亚洲无码精品在线播放| 国产网站免费看| 啊嗯不日本网站| 免费看美女毛片| 97超级碰碰碰碰精品| 99999久久久久久亚洲| 亚洲美女一级毛片| 国产欧美日韩91| 国产原创自拍不卡第一页| 97在线公开视频| 欧美精品亚洲二区| 国产成人高精品免费视频| 国产伦片中文免费观看| 免费人成视网站在线不卡| 欧美一区二区三区欧美日韩亚洲| 青青操视频在线| 白丝美女办公室高潮喷水视频| 99re免费视频| 亚洲日本中文字幕乱码中文| www精品久久| 国产极品美女在线播放| 在线欧美a| 在线欧美日韩国产|