重啟信息技術革命行動倡議(二)

編者按
2015年,華盛頓特區(qū)舉辦了一場關于重啟信息技術革命的研討會,對實現(xiàn)信息技術的跨越式發(fā)展問題進行了探討。美國半導體行業(yè)協(xié)會(SIA)、美國半導體研究公司(SRC)以及他們的成員公司和半導體技術專家共同發(fā)布了一份倡議報告——《重啟信息技術革命行動倡議》,在上期文章中主要對技術革命相關發(fā)展情況進行闡述,本期將對大數(shù)據(jù)的基礎設施技術、智能基礎設施組成要素進行分析。
未來的信息通信技術(ICT)將產(chǎn)生大量的數(shù)據(jù),遠遠超過今天的數(shù)據(jù)流。過去,存儲和計算能力的擴大基于積極的功能擴展,表現(xiàn)在摩爾定律中。然而,這種擴展將無法解決即將到來的、在信息通信技術性能和能源利用方面的需求。因此,在面對越來越多的數(shù)據(jù)時,需要全新的能效分析技術和海量數(shù)據(jù)存儲技術。需要新的數(shù)據(jù)處理器和基礎技術來提供可行的洞察力,并從數(shù)據(jù)中推斷出新的結論,而傳統(tǒng)的存儲和計算方法是無法完成這些功能的。
技術將帶來大數(shù)據(jù)的一個例子是將在2018~2030年間建造的平方公里陣列射電望遠鏡(SKA),它用于研究星系演變、暗能量和引力波等。SKA將包含成千上萬個接收天線,它們分布于數(shù)千千米的范圍內(nèi),每天將生成1020比特的數(shù)據(jù)。
國防應用是大數(shù)據(jù)技術的另一個重要驅動力,包括與情報、監(jiān)視和偵察(ISR)相關的數(shù)據(jù)。例如,目前“全球鷹”ISR無人機系統(tǒng)可生成500 Mbps,它5倍于整個美軍在海灣戰(zhàn)爭中使用的帶寬。另一個例子是ARGUS(自動實時地面普遍監(jiān)視)航空成像ISR系統(tǒng),其輸出為1854 Gbps,使用一個274 Gbps的通用數(shù)據(jù)鏈,需求與能力比為103,甚至還將采用10:1的壓縮。最后,大數(shù)據(jù)的“典范”是物聯(lián)網(wǎng),其中數(shù)十億的在線傳感器將生成和傳輸前所未有的大量數(shù)據(jù),從中將獲得情報,常常是實時的情報。
1.數(shù)據(jù)中心
為了管理數(shù)據(jù)流和存儲,數(shù)據(jù)中心繼續(xù)增長。每個包含50000個或更多個服務器的數(shù)據(jù)中心建造成本在5000萬美元到10億美元,耗電在20~50 MW級上。云數(shù)據(jù)中心通常以標準的、自定義的或商品的配置形式實現(xiàn)。輸入數(shù)據(jù)速度在100 Tb/s左右,通過專有纖維傳輸,還提供其它的網(wǎng)絡和設施來緩存和管理該數(shù)據(jù)的延遲。在擴展上,云數(shù)據(jù)中心還必須提供彈性,這通過故障檢測和中心級管理過程來實現(xiàn)。
2.大數(shù)據(jù)對高性能計算
大數(shù)據(jù)和高性能計算(HPC)有許多技術共性,并可能變得更加相似,但也還存在差異。HPC已經(jīng)發(fā)展了幾十年,主要關注的是計算密集型任務。大數(shù)據(jù)處理各種不同類型的海量數(shù)據(jù),是當前在許多領域和應用領域正在新興的一個主題,如遺傳學和天文學。大數(shù)據(jù)使用大規(guī)模存儲網(wǎng)絡,而HPC使用本地存儲;此外,它們各自使用不同的軟件開發(fā)工具,受不同的文化和期望引導。HPC還包括科學和工程計算,主要基于模型和離線(盡管網(wǎng)絡-網(wǎng)絡計算是一個顯著的例外),而大數(shù)據(jù)云服務器基于交易,它近實時地運作。在軟件世界中,抽象是取得成功的關鍵,還有像操作/焦耳這樣的指標驅動軟件實現(xiàn)專業(yè)化而非普遍化。需要通過進一步的深入研究,來解決有關HPC的基于模型的、專業(yè)化的軟件與有關大數(shù)據(jù)的實時計算的、普遍化的軟件之間存在的沖突壓力。
3.技術驅動因素和需求
對新興的信息處理器,需要一個新的概念抽象,但最常見的計算模型是圖靈模型,它在計算機科學和工程文化中根深蒂固。若想背離當前的處理硬件是困難的。可能的替代計算模型包括模擬“近似計算”和量子計算。不同計算模型的并列或混合可能推動類腦計算的發(fā)展,這可能是未來混合系統(tǒng)的一個重要組成部分。
近期,可以預期的是微服務器和云設備將興起并得到廣泛應用。微處理器使用非常小的芯片來制造規(guī)模較小、成本較低、功率較低的服務器,它能夠以可再生的能源來工作。云設備在移至和移自云時對數(shù)據(jù)進行緩存,以提高性能。應該注意的是,使用這些系統(tǒng)需要明確跨管轄邊界的數(shù)據(jù)流動問題,這會引發(fā)許多法律或隱私問題,需要解決好。
在許多情況下,數(shù)據(jù)采集相對容易,而“冷數(shù)據(jù)”的維護更困難。越來越多的數(shù)據(jù)存儲在磁盤這樣的介質中,其成本效益高,但訪問速度慢。未來的大數(shù)據(jù)系統(tǒng)將受益于對以下領域進行的研究和開發(fā),如用于通信的納米光子學以及用于解決數(shù)據(jù)移動能量成本和訪問延遲問題的、新的存儲設備(ReRAM、PCM、FeRAM等)。
考慮到競爭性技術和商業(yè)因素驅動下的生態(tài)系統(tǒng)沖突,對數(shù)據(jù)存儲解決方案,需要在概念上有進一步的突破,例如,通用的計算——加速器、專用的計算——全新替代方案、面向銷量的系統(tǒng)——面向高利潤和增值的系統(tǒng)。最大的機會在兩極:一端是云數(shù)據(jù)中心和百億億次級的HPC;另一端是移動和物聯(lián)網(wǎng)的未來前景。進步可能源自數(shù)據(jù)中心中的量子計算或超導設備以及神經(jīng)形態(tài)/模擬移動設備。

圖1 今天的計算機為什么不能像大腦那樣處理數(shù)據(jù)?
4.新的體系結構
必須開發(fā)全新的處理器——存儲器架構來解決當前處理器速度與存儲器訪問時間之間存在的不匹配問題。對未來HPC而言,當前傳輸數(shù)據(jù)所需的高昂能源成本和存儲器是最困難的障礙之一。作為一個目標,新的存儲器管理技術可以提高程序員的工作效率,其方法是通過使用編程方法來推動實現(xiàn)數(shù)據(jù)的局部性、通過自動調(diào)整以消除低層次優(yōu)化方面的需求以及通過管理軟件層來確保可靠性。
當前計算面臨的帶寬——功率的困境源于不同存儲層的傳輸時間之間存在的不匹配問題,如從CPU傳至RAM、從RAM傳至磁盤、從磁盤傳至磁帶。管理傳輸時間之間差距的一個方法是在RAM和磁盤存儲系統(tǒng)之間添加固態(tài)設備,從而增加存儲層次深度。未來,存儲類存儲器(如STTRAM、PCRAM和RRAM等)也將插入到RAM與磁盤存儲系統(tǒng)之間的存儲器層次結構中。最后,存儲器結構方面的創(chuàng)新(如混合存儲體)可以增強RAM系統(tǒng)的性能。
存儲器上的處理(PIM)可能為存儲帶寬問題提供最佳的解決方案。該想法將大大減少或消除數(shù)據(jù)移動,以便以一定的而非可用的功率來釋放存儲器的原始帶寬。中央概念是定位每一條比特線上的每一個比特元素,以承受大規(guī)模并行且可伸縮的計算技術。PIM體系結構與自動機理論相關,將可擴展到其它新興的存儲器技術。其成功的一個關鍵要素在硬件和軟件。
最后,在系統(tǒng)層面上,用于數(shù)據(jù)存儲、管理和分析的分層網(wǎng)絡可以大大提高整體能源效率以及速度和性能。通過分散數(shù)據(jù),一個更加分布的體系結構可具備更高的安全性。
5.腦啟發(fā)計算
大數(shù)據(jù)的崛起正在創(chuàng)造巨大的機遇,但數(shù)據(jù)容量、速度、種類和真實性等方面對當前系統(tǒng)和架構提出了更加嚴峻的挑戰(zhàn)。需要全新的計算機體系結構,也許在某種程度上需要像大腦那樣運作,以便處理大量的數(shù)據(jù),特別是處理非結構化的數(shù)據(jù)。大腦皮層——大自然的認知處理器,是一個工程奇跡,包括一張折疊的2D平面六層結構。如果展開,大腦擁有一個約0.7 m2的面積,厚度為3~4 mm。它有約1010個神經(jīng)元,每個神經(jīng)元約有104個連接。它需要約25W的持續(xù)電力供應,并以相當于25 PetaOp/秒的速度開展“計算”。圖1對大腦與傳統(tǒng)無機串行架構的電腦進行了比較。我們需要的是一個類腦計算模型,可以為之開發(fā)相應的技術。
新的應用需要新的方法。在許多情況下,價值并不在于整個數(shù)據(jù)集的、高精度的、對還是錯這樣的答案,而是在尋找有趣的模式和連接,這種模式和連接將帶來新的解決方案和見解。差異在于多快可以找到一個“更好的”主意,而不在于一個非常精確的結論。
大腦提供有用的指導:它以低得多的功率、快速決策和驚人的洞察力,對原始速度、計算能力和精度進行權衡。雖然模仿大腦結構完全可能是不必要的(甚至自然界需要用9個月的時間來建造人類的大腦以及需要用約18年的時間來充分打造它,以使之可用),嘗試速度較慢、功率較低、密集互連以及與存儲器更緊密集成的計算架構是一種方法,已顯現(xiàn)美好的前景。
隨著更高能效需求的提出,以及更強大計算能力的增長,新的方法(如腦啟發(fā)計算)有可能改變系統(tǒng)的設計和制造方式。一個集成了存儲和邏輯的裝置,或者能夠以較低的功率實現(xiàn)更高級功能(可能犧牲精度)的裝置,可能是一個卓有成效的選擇。需要對設備技術和電路開展研究,以達成良好的權衡,從而獲得最佳的系統(tǒng)解決方案。最后,我們不應試圖取代現(xiàn)有系統(tǒng)的精度和計算性能,而是應利用新的能力來為這些系統(tǒng)提供新的動力,以便在一個電量日益有限、充斥著數(shù)據(jù)的移動世界中,找到新的見解和解決方案。

在許多情況下,價值并不在于整個數(shù)據(jù)集的、高精度的、對還是錯這樣的答案,而是在尋找有趣的模式和連接,這種模式和連接將帶來新的解決方案和見解。
最終的智能基礎設施將由普遍接入的和智能的傳感器組成,它們彼此相連、連接至本地網(wǎng)絡以及連接至基于云的系統(tǒng)。這種復雜的、分層互連的系統(tǒng)體系(SoS)應具備分析能力,從而提供洞察力和可操作的建議或控制。雖然在某些方面正在取得進展,但仍存在必須應對的巨大挑戰(zhàn)。許多現(xiàn)有的技術不能充分得到擴展,例如,為分析和存儲而向云傳送每一片段數(shù)據(jù)既不可行也不實用。
1.洞察計算系統(tǒng)
新的計算時代正在到來,正從可編程系統(tǒng)時代邁入“洞察計算”系統(tǒng)時代。洞察計算屬性包括情境和學習、視覺分析和交互、軟件定義的環(huán)境、以數(shù)據(jù)為中心的系統(tǒng)、納米尺度和原子尺度的組件。在這類系統(tǒng)中,傳感器至關重要,負責收集數(shù)據(jù)以生成見解。對某些實時應用,感知數(shù)據(jù)的價值可能是短暫的,也許只有幾毫秒,但數(shù)據(jù)必須在該時間框架內(nèi)加以應用。
行業(yè)在對話、推理、圖像識別先進技術研究方面不斷取得進展,在知識表示和機器學習方面實現(xiàn)突破。通過全面深入的研究,這些技術進步將在未來十年內(nèi)帶來神經(jīng)合成計算、量子計算和腦啟發(fā)系統(tǒng)設計等方面的進一步突破。
2.網(wǎng)絡-物理系統(tǒng)
網(wǎng)絡-物理系統(tǒng)將成為即將到來的信息技術革命的一個重要組成部分。根據(jù)美國國家科學基金會(NSF)的定義,“網(wǎng)絡-物理系統(tǒng)(CPS)指的是工程化的系統(tǒng),構建于并依賴于計算算法和物理組件的無縫集成……CPS技術將改變?nèi)藗兣c工程化系統(tǒng)的交流方式”。一個CPS包含協(xié)作計算元素(用于控制物理實體)的網(wǎng)絡。它們完全不同于計算系統(tǒng)和物理系統(tǒng),需要新的工程模型(包括時間動力學和算法計算);的確,面對高動態(tài)的、常常隨機行動的物理系統(tǒng),一個CPS必須具有強勁的控制力。此外,它們必須滿足安全性方面的約束條件。
3.芯片級安全
對信息系統(tǒng)的依賴將繼續(xù)擴大,安全成為一個日益嚴峻的問題。與此同時,一系列趨勢增加了系統(tǒng)在面對攻擊時的脆弱性,不論是受經(jīng)濟方面動機的驅動,還是受政治方面動機的驅動。集成電路和系統(tǒng)的設計、制造涉及許多企業(yè)的全球供應鏈以及成百上千的工程師,在整個路徑的許多點上為惡意篡改提供了機會。高端處理器的復雜性繼續(xù)增長,設計人員正在使用越來越多的第三方設計或IP,對其安全性可能并未做審查,并且不如其所聲稱的那樣,假冒部分正在進入供應鏈。現(xiàn)有產(chǎn)品的逆向工程利用了半導體制造商的知識產(chǎn)權,結果是帶來了假冒產(chǎn)品,但這些假冒產(chǎn)品可能并不能按預期執(zhí)行功能。或許最大的風險來自設計,并因此造成對數(shù)據(jù)的非預期訪問。目前的驗證過程的主要目標只是確保設計按預期執(zhí)行功能。
隨著互連設備數(shù)量的增加,安全問題預計將成為未來的一個更大挑戰(zhàn)。傳感器智能芯片將嵌入和集成到所有事物中,從基礎設施到人體,以保證數(shù)據(jù)和信息的安全,保證關鍵數(shù)據(jù)和信息可信。事實上,物聯(lián)網(wǎng)可以被看作是“人類構建的最大的和最脆弱的網(wǎng)絡攻擊面”。除了對物聯(lián)網(wǎng)提出的低成本、簡單和低功率等標準需求,還必須解決多種安全需求,比如防篡改、安全的通信和存儲等。
(翻譯:盛開)