多核與其說是一場CPU革命,倒不如說是一種過渡性的改良,而且這種改良的瓶頸已見
風(fēng)向變了:人們再不用主頻這個指標來談CPU了,現(xiàn)在要談的是——幾個核心?
4月9日,英特爾發(fā)布旗下第四款四核心處理器Core 2 Extreme QX6800。
要80個核心的也有。在此前舉行的一次論壇上,英特爾甚至還向外界展示了運算性能可以達到每秒萬億(Teraflop)級的80核心處理器原型,這種運算能力已經(jīng)達到了大型機的水平。要知道,直到1996年,人類才首次在超級計算機上突破萬億次大關(guān)。
英特爾在全球市場最大的競爭對手AMD公司,也準備在今年年中正式發(fā)布四核X86處理器“Barcelona”。
在中國國內(nèi),3月28日,中國科學(xué)院計算所也宣布,“龍芯”(中國首個有自主知識產(chǎn)權(quán)的通用CPU)計劃在三年內(nèi),即先于英特爾,推出業(yè)內(nèi)首個采用65納米工藝、具有16個核心的“龍芯三號”處理器。
然而,多核之路,至少到現(xiàn)在為止,在很多人看來,仍然是一場相當(dāng)勉強的革命。它能真正經(jīng)受得住時間的考驗嗎?
速度為王
1971年,英特爾推出的全球第一顆通用型微處理器4004,由2300個晶體管構(gòu)成。當(dāng)時,公司的聯(lián)合創(chuàng)始人之一戈登摩爾(Gordon Moore),就提出后來被業(yè)界奉為信條的“摩爾定律”——每過18個月,芯片上可以集成的晶體管數(shù)目將增加一倍。
在一塊芯片上集成的晶體管數(shù)目越多,意味著運算速度即主頻就更快。今天英特爾的奔騰(Pentium)四至尊版840處理器,晶體管數(shù)量已經(jīng)增加至2.5億個,相比當(dāng)年的4004增加了10萬倍。其主頻也從最初的740kHz(每秒鐘可進行74萬次運算),增長到現(xiàn)在的3GHz(每秒鐘運算30億次)以上。
當(dāng)然,CPU主頻的提高,或許在一定程度上也要歸功于1975年進入這個領(lǐng)域的AMD公司的挑戰(zhàn)。正是這樣的“雙雄會”,使得眾多計算機用戶有機會享受不斷上演的“速度與激情”。一些仍不滿足的發(fā)燒友甚至選擇了自己超頻,因為在玩很多游戲時,更快的速度可以帶來額外的饕餮享受。
但到了2005年,當(dāng)主頻接近4GHz時,英特爾和AMD發(fā)現(xiàn),速度也會遇到自己的極限:那就是單純的主頻提升,已經(jīng)無法明顯提升系統(tǒng)整體性能。
以英特爾發(fā)布的采用NetBurst架構(gòu)的奔騰四CPU為例,它包括Willamette、Northwood和Prescott等三種采用不同核心的產(chǎn)品。利用冗長的運算流水線,即增加每個時鐘周期同時執(zhí)行的運算個數(shù),就達到較高的主頻。
這三種處理器的最高頻率,分別達到了2.0G、3.4G和3.8G。
按照當(dāng)時的預(yù)測,奔騰四在該架構(gòu)下,最終可以把主頻提高到10GHz。但由于流水線過長,使得單位頻率效能低下,加上由于緩存的增加和漏電流控制不利造成功耗大幅度增加,3.6GHz奔騰四芯片在性能上反而還不如早些時推出的3.4GHz產(chǎn)品。所以,Prescott產(chǎn)品系列只達到3.8G,就戛然而止。
英特爾上海公司一位工程師在接受記者采訪時表示,Netburst微架構(gòu)的好處在于方便提升頻率,可以讓產(chǎn)品的主頻非常高。但性能提升并不明顯,頻率提高50%,性能提升可能微不足道。因為Netburst微架構(gòu)的效率較低,CPU計算資源未被充分利用,就像開車時“邊踩剎車邊踩油門”。
此外,隨著功率增大,散熱問題也越來越成為一個無法逾越的障礙。據(jù)測算,主頻每增加1G,功耗將上升25瓦,而在芯片功耗超過150瓦后,現(xiàn)有的風(fēng)冷散熱系統(tǒng)將無法滿足散熱的需要。3.4GHz的奔騰四至尊版,晶體管達1.78億個,最高功耗已達135瓦。
實際上,在奔騰四推出后不久,就在批評家那里獲得了“電爐”的美稱。更有好事者用它來玩煎蛋的游戲。
很顯然,當(dāng)晶體管數(shù)量增加導(dǎo)致功耗增長超過性能增長速度后,處理器的可靠性就會受到致命性的影響。就連戈登摩爾本人似乎也依稀看到了“主頻為王”這條路的盡頭——2005年4月,他曾公開表示,引領(lǐng)半導(dǎo)體市場接近40年的“摩爾定律”,在未來10年至20年內(nèi)可能失效。
一些人比摩爾更加悲觀一些。早在三年前,處理器市場分析公司Insight 64的分析師納森布魯克伍德(Nathan Brookwood)就表示“主頻已死”,在他看來,所有的好東西都是有始有終的,這次也不能例外。
2006年10月,英特爾正式宣布取消4GHz奔騰四處理器的開發(fā)計劃;AMD也表示,其2.8GHz的Athlon FX57,將在很長一段時間內(nèi),是主頻最高的產(chǎn)品。
另辟蹊徑
多核心CPU解決方案(多核)的出現(xiàn),似乎給人帶來了新的希望。
所謂核心,就是指CPU中心隆起的芯片,這也是所有的計算、接受/存儲命令、處理數(shù)據(jù)的執(zhí)行中心。
多核CPU技術(shù),是在同一個硅晶片上集成了多個獨立物理核心,在實際工作中,多顆核心協(xié)同工作,以達到性能倍增的目的。每個核心都具有獨立的邏輯結(jié)構(gòu),包括一二級緩存、執(zhí)行單元、指令級單元和總線接口等邏輯單元。
“多核是在目前功耗限制下,能找到的最好的提升芯片性能的方法。這種方法允許每個核心可以在相對節(jié)能的方式下運行,并通過犧牲單個核心的運算速度,提高芯片整體上的性能表現(xiàn)。”布魯克伍德告訴《財經(jīng)》記者。
早在上世紀90年代末,就有眾多業(yè)界人士呼吁用CMP(單芯片多處理器)技術(shù)來替代復(fù)雜性較高的單線程CPU。IBM、惠普、Sun等高端服務(wù)器廠商,更是相繼推出了多核服務(wù)器CPU。不過,由于服務(wù)器價格高、應(yīng)用面窄,并未引起大眾廣泛的注意。
直到AMD搶先手推出64位處理器后,英特爾才想起利用“多核”這一武器進行“帝國反擊戰(zhàn)”。2005年4月,英特爾倉促推出簡單封裝雙核的奔騰D和奔騰四至尊版840。AMD在之后也發(fā)布了雙核皓龍(Opteron)和速龍(Athlon) 64 X2和處理器。
但真正的“雙核元年”,則被認為是2006年。
這一年的7月23日,英特爾基于酷睿(Core)架構(gòu)的處理器正式發(fā)布。2006年11月,又推出面向服務(wù)器、工作站和高端個人電腦的至強(Xeon)5300和酷睿二四核至尊版系列處理器。
與上一代臺式機處理器相比,酷睿二雙核處理器在性能方面提高40%,功耗反而降低40%。
作為回應(yīng),7月24日,AMD也宣布對旗下的雙核Athlon64 X2處理器進行大降價。
由于功耗已成為用戶在性能之外所考慮的首要因素,兩大處理器巨頭都在宣傳多核處理器時,強調(diào)其“節(jié)能”效果。英特爾已發(fā)布了功耗僅為50瓦的低電壓版四核至強處理器。而據(jù)AMD高層透露,即將發(fā)布的“Barcelona”四核處理器,功耗將不會超過95瓦。
在英特爾高級副總裁帕特基辛格(Pat Gelsinger)看來,從單核到雙核,再到多核的發(fā)展,證明了摩爾定律還是非常正確的,因為“從單核到雙核,再到多核的發(fā)展,可能是摩爾定律問世以來,在芯片發(fā)展歷史上速度最快的性能提升過程”。
但也許并不是所有人都準備給“多核”這么高的評價。
美國國家科學(xué)院院士大衛(wèi)科克(David Kirk)就曾公開表示,CPU制造商所使用的多線程和多核心技術(shù),看起來好像是使CPU的性能加倍,但從本質(zhì)上說,并不能解決CPU主頻提升以及制造工藝的瓶頸。而對于游戲開發(fā)人員來說,也形如雞肋,“多核CPU乃黔驢技窮之作”。
“多核毫無疑問是一個趨勢,但也是個不得已的選擇。”中國科學(xué)院計算所研究員、國家智能計算機中心主任孫凝輝也對《財經(jīng)》記者表示,多核從技術(shù)上沒有革命性的進步,它實質(zhì)上只是在模擬大型機在過去30年走過的并行道路而已,只不過這次做到了芯片內(nèi)部。
目前,多核心技術(shù)在應(yīng)用上的優(yōu)勢有兩個方面:為用戶帶來更強大的計算性能;更重要的,則是可滿足用戶同時進行多任務(wù)處理和多任務(wù)計算環(huán)境的要求。兩大巨頭都給消費者描繪出了使用多核處理器在執(zhí)行多項任務(wù)時的美妙前景:同時可以檢查郵件、刻錄CD、修改照片、剪輯視頻,并且同時可以運行殺毒軟件。或者利用同一臺電腦,父親在查看財務(wù)報表,女兒在打游戲,母親在給遠方的朋友打網(wǎng)絡(luò)電話。
但并不是所有家庭只有一臺電腦,也不是所有用戶都要用電腦一下子做那么多事,更何況目前的大部分應(yīng)用程序還并不能自動分割成多任務(wù),分別交給多個核心去執(zhí)行。
所以,對于大多數(shù)用戶來說,多核所帶來的實際益處,很可能并不明顯。
而多核所帶來的挑戰(zhàn),或者說麻煩,卻是實實在在的。美國卡內(nèi)基梅隆大學(xué)計算機系教授朗道布賴恩特(Randal E Bryant)在接受《財經(jīng)》記者采訪時就坦稱,“這給軟件業(yè)制造了巨大的問題”。
軟硬失衡
布賴恩特直言不諱地指出,要想讓多核完全發(fā)揮效力,需要硬件業(yè)和軟件業(yè)更多革命性的更新。其中,可編程性是多核處理器面臨的最大問題。一旦核心多過八個,就需要執(zhí)行程序能夠并行處理。盡管在并行計算上,人類已經(jīng)探索了超過40年,但編寫、調(diào)試、優(yōu)化并行處理程序的能力還非常弱。
易觀國際分析師李也認為,“出于技術(shù)的挑戰(zhàn),雙核甚至多核處理器被強加給了產(chǎn)業(yè),而產(chǎn)業(yè)卻并沒有事先做好準備”。
或許正是出于對這種失衡的擔(dān)心,中國國家智能計算機中心主任孫凝輝告訴《財經(jīng)》記者,“十年以后,多核這條道路可能就到頭了”。在他看來,一味增加并行的處理單元是行不通的。并行計算機的發(fā)展歷史表明,并行粒度超過100以后,程序就很難寫,能做到128個以上的應(yīng)用程序很少。CPU到了100個核以上后,現(xiàn)在并行計算機系統(tǒng)遇到的問題,在CPU一樣會存在。
“如果解決不了主流應(yīng)用并行化的問題,主流CPU發(fā)展到100個核就到頭了。現(xiàn)在還不知道什么樣的革命性的進展能解決這些問題。”孫補充說。
實際上,市場研究公司In-Stat分析師吉姆克雷格(Jim McGregor)就承認,雖然英特爾已向外界展示了80核處理器原型,但尷尬的是,目前還沒有能夠利用這一處理器的操作系統(tǒng)。
中科院軟件所并行計算實驗室副主任張云泉也持類似的觀點。他對《財經(jīng)》記者表示,這個問題實際一直就存在,但原來在超級計算機上才會遇到,所以,討論也多局限在學(xué)術(shù)界。而現(xiàn)在,所有用戶都要面對這樣的問題。
新的契機?
3月29日,英特爾向外界透露,其全球第一個45納米工藝“Penryn”處理器生產(chǎn)線已經(jīng)投產(chǎn),包括低電壓版的雙內(nèi)核筆記本處理器,還有雙內(nèi)核和四內(nèi)核版的臺式機和服務(wù)器處理器。
按照計劃,這些產(chǎn)品將從今年下半年開始上市銷售。有評論認為,其跨越程度可以與1996年從486到奔騰處理器類比。業(yè)內(nèi)人士分析,“Penryn”實際上是65納米工藝的“酷睿”系列處理器的45納米版本。
從現(xiàn)在的產(chǎn)品路線看,一個全新的概念正在被英特爾反復(fù)強調(diào)——性能功耗比(Performance/Watt)。這或許意味著,目前英特爾發(fā)展CPU的戰(zhàn)略正在從只重視生產(chǎn)工藝的提升,不斷加入晶體管的“粗獷型”向“集約型”轉(zhuǎn)變,就是以“好的架構(gòu)設(shè)計,先進的生產(chǎn)工藝”,來逐步提升性能、降低功耗。
在布賴恩特教授看來,除繼續(xù)增加核數(shù),應(yīng)該可以有很多其他方法來提升芯片的性能,比如用高速網(wǎng)絡(luò)鏈接加快核之間的通訊,用更好的方法實現(xiàn)緩存和處理器間的通信。否則,就算是核心跑得再快,數(shù)據(jù)從處理器的高速進出或在處理器間傳送不夠快的話,再多的計算能力也無濟于事。
對于中國的芯片制造者來說,目前兩大處理器巨頭所遭遇的瓶頸,也許不失為一個機會。
“現(xiàn)在英特爾和AMD再也不能重復(fù)以前的老路了,用戶對他們的新產(chǎn)品也跟得不那么緊了。這個時候,也許中國企業(yè)就有機會了。”
孫凝輝對《財經(jīng)》記者解釋說,把努力方向轉(zhuǎn)到降低功耗、價格上,也是“摩爾定律的另一條線。”而在降低價格從而爭奪市場方面,中國企業(yè)一向不乏成功的先例。
但CPU在技術(shù)上是已經(jīng)到達了頂點,還是遭遇到了暫時的瓶頸?這仍然是一個有爭議的話題。這方面,Insight 64的分析師納森布魯克伍德顯然是位樂觀主義者。
的確,今天有很多人確信,從原子的尺度或者量子效應(yīng)的制約來看,目前的芯片業(yè)在十年內(nèi)就將到達物理上的頂點。但他提醒說,不要忘記在10年甚至20年前,我們很多人也是這么認為的(在十年內(nèi)將達到頂點)。
雖然量子計算機走向?qū)嵱每赡苓€需要幾十年的時間,但此外可能的探索,還包括分子計算機、化學(xué)計算機以及DNA計算機,“每當(dāng)業(yè)界感覺到極限時,總是會有聰明的科學(xué)家想到其他的辦法。”納森布魯克伍德對《財經(jīng)》記者說。