董宇
[摘要]隨著科學技術的發展,計算機技術更是突飛猛進,嵌入式系統的應用也越來越廣泛。截至目前,各種處理器不斷的出現,為計算機技術提供了高效、科學、安全、穩定的運行基礎上,也形成了一套綜合、系統的管理流程和管理模式,這也是當前業內人士研究的重點目前,以向量處理器為主的微型處理結構應用日益廣泛,其向量數據存儲結構的設計也成為相關人員研究的要點本文就多現場向量處理器中向量數據存儲結構的設計與實現提出了探討,以供相關工作人員參考。
[關鍵詞]多線程;處理器;計算機技術;訪存款帶
[中圖分類號]F224.39 [文獻標識碼]A [文章編號]1672-5158(2013)06-0053-01
多線程和向量技術是當前計算機技術發展的一個重要的趨勢,也是現代化社會發展中研究最多的處理器設計要點。這種設計工作中,是通過提出一個多現場向量處理其設計要點為基礎,利用多線程切換數據的方式來隱藏訪存延遲現象的出現,并使得向量數據在運行中能夠直接訪問到二級cache從而提高寬帶運行效率的一種結構。基于這些優勢,因此在目前的向量處理器工作中,這些技術的應用較為常見,也是實現現代化計算機技術發展的核心內容。
一、向量處理器與多線程技術分析
在目前的社會發展中,多線程技術和向量技術一直深受著業內人士的關注,是處理器結構體系中結構和編程模式的技術要點,其在整個處理器發展中扮演著重要的角色。
1、向量處理器分析
向量處理器也被人們廣泛的稱之為陣列式處理器,是在工作中能夠同步進行多種數據綜合處理和運算操作的一種復雜的計算機結構。然而截至目前的社會發展中,多數計算機組裝中都仍然是采用純良處理器為主,這種處理器在應用中只能夠一次處理一個要素,而無法對多套數據進行處理和歸納。向量處理器的出現使得計算機領域發生了翻天覆地的變化,它的出現使得整個計算機結構、構成和功能發生了重大變化,尤其是在上個世紀八十年代至九十年代著一段時期內,其更是成為各種超級計算機運行和主要基礎。當今社會中,大多數的商業處理器仍然是以向量處理器為主的,已成為整個社會領域中最為常見的一項。
2、多線程技術分析
所謂的多線程技術主要指的是多個線程能夠同時、并發運行的一項綜合性技術體系,具有多線程能力的計算機因為有重組的硬件和軟件系統的支撐能夠在同一時間運行多個不同的軟件和線程,進而提高了計算機的處理效率和處理質量,同時從整體上提升了計算機技術的應用優勢。截至目前,我們在工作中可以將多線程技術分為以下三個方面:主要指的是細粒度多線程體系結構、粗粒度多線程體系結構和同時多線程體系結構。這三種結構體系的相互促進、相互協調運行使得整個計算機體系呈現出巨大的發展態勢,也為計算機技術的全面、綜合、統一邁進提供了扎實的基礎平臺。
3、向量技術
向量技術從誕生以來一直應用在高性能計算機當中,是計算機技術發展的指導依據和基礎平臺。隨著科學技術的發展和計算機技術的進步,向量技術也得到了極大的邁進,其已經廣泛的應用在各類處理器結構當中,成為處理工作中的指導依據和應用基礎。經過多年的實踐證明,向量技術的能夠更好的適應計算機技術、處理技術和自動化技術的發展要求,從阿爾達到更高的實際應用性能的優勢。
二、多線程向量存儲結構設計
1、多線程向量體系結構
多線程處理器中設計有多套獨立的線場,包括PC、通用寄存器、浮點寄存器、向量寄存器、狀態寄存器等。每個線程從軟件的角度看都是一個獨立的處理器,線程的數量可以很多。多線程處理器設計有專門的向量部件,執行擴展的寬向量指令。多線程向量處理器通過將來自多個線程的指令交叉執行來隱藏長延遲操作帶來的流水線阻塞,當來自某個線程的指令由長延遲操作而阻塞的時候,其他線程的指令仍可以繼續執行,從而保持流水線的滿負荷工作。
2、多線程向量存儲結構
將多線程與向量技術結合,可以隱藏向量數據訪問的存儲器延遲,但需要處理好向量數據與標量數據的存儲結構和數據相關性。我們設計了一種向量與標量混合訪問的存儲層次,一級數據緩存只緩存標量數據,不緩存向量數據。向量訪存操作將不進入一級數據緩存,直接通過二級緩存訪問。這樣做是基于兩點考慮:首先,L1D容量小而向量數據規模大,這樣避免了向量數據與標量數據爭奪有限的LID資源,避免LID的數據抖動,利于充分發揮標量處理部件的計算性能;其次,由于有多線程的延遲隱藏機制,二級緩存高速緩存的訪問延遲可以得到很好的隱藏,不會對向量處理部件的性能造成過大的影響。高速緩存數據塊的大小與向量寄存器的位數一致。這樣,每個向量訪存操作都能夠消耗或生成一個完整高速緩存塊,便于高速緩存的控制及向量訪存部件的設計。
三、多線程向量處理器中向量數據存儲結構實現
向量處理器是通過向量操作來支持數據并行性的處理器。為了有效地利用向量計算中的數據并行性,向量處理器的結構通常包括向量寄存器文件、深度流水的ALU和一維的SIMD組織形式的多種組合。向量寄存器文件存儲的是數據向量,而不是單個的數據字,它們是在對向量進行操作時,順序地進行傳送的。不僅圖像處理采用向量處理器技術,當前世界上處理速度最陜的超級計算機——日本NEc的《地球仿真測試系統》,也是以0.15mm工藝實現的向量處理器為基礎,由5120個向量處理器(共有640個節點,每個節點有8個向量處理器)組成的。
1、多線程向量處理器中向量數據存儲結構的回顧
整個計算機界似乎總是在不停的重復著“前進-回退-再前進”的步調。很多基礎性的創新結構在很早之前都被提出了,但由于市場、技術和現實條件的限制最終只有很少的技術在一段時間內成為主流。一種主流技術在走到生命盡頭之后,以前一種被遺忘技術可能被人們從故紙堆中翻出來,以嶄新的面目引導新的技術革新。
在處理器體系結構設計中的上一次回歸是RISC。當VAX開啟了變長指令,多尋址模式等CISC技術之后,處理器設計變得越來越復雜,純粹的CISC很難設計,也難以實現;這時提倡精簡的RISC替代了VAX處理器體系結構稱主流技術。在80 90年代,RISC思想JL5e遍布所有廠商的處理器。
2、桌面優化
在開始詳細分析向量處理器的結構之前,不妨先看一下近30年的發展過程中桌面系統體系結構的變遷。除了CPU而外,桌面系統的其他部件的功能也不斷增強。在向量處理器中以內部互連EIB總線為核心,8個完全相同的SPE(synergistic Processor Element)向量處理核心和一個PowerPC兼容的PPE(Power Processor Element)核心圍繞在環狀數據總線四周。XIO接口提供與Rambus XDR內存的高速互連,FlexIO提供了高速I/O通道,同時在應用中也為整個計算機工作的持續進行提供了方便。
四、結束語
本文提出一種多線程向量的存儲結構,該結構支持標量數據和向量數據的混合存儲,利用多線程切換來隱藏訪存延遲,并讓向量數據直接訪問cache來提高帶寬。模擬實驗表明多線程能提高實用帶寬,所提出的存儲結構能支持高帶寬的向量數據訪問。
參考文獻
[1]孫彩霞同時多線程處理器中的資源分配策略研究[學位論文]2006
[2]Intel Pentium4 processor homepage 2011