價格不是最高也不是最低,規格不前衛但也不落伍,這就是G41,我們今天的主角,英特爾嵌入式產品線中在網絡通信市場上拼殺的絕對主力。而它的載體,是中國臺灣伯科技股份有限公司推出的一款網絡通信硬件平臺,代號NSP-1096。這款產品采用1U規格設計,前面板提供了6個千兆電口、兩個USB 2.0接口和一個9針串口。接口左側設有附帶按鈕的液晶屏,右側空間則留給了擴展槽位。伯科技為NSP-1096準備了多種規格的擴展卡,用戶可以用來為硬件平臺添加多達4個千兆接口。
合理的配置與設計
打開NSP-1096的機箱上蓋,可以看到處理器所在位置做了有針對性的設計。NSP-1096沒有使用處理器散熱風扇,而是采用了一個較大型的銅質散熱器,通過特別制作的導流罩,配合機箱風扇形成一個專門風道,為CPU、內存條以及北橋芯片散熱。風道兩側是磁盤懸掛位和電源,該產品配備了全漢的80Plus電源,讓NSP-1096在所有的工作負載時間內都能維持較高的電能轉換效率,降低了發熱量以及其散熱需求。
NSP-1096采用專門為嵌入式平臺設計的英特爾G41芯片組,和ICH7/ICH7R南橋芯片搭配使用。作為系統的核心,G41連接著處理器、內存和PCIe總線。它支持1333MT/s的FSB,可以兼容嵌入式產品列表內LGA775接口的各種賽揚、酷睿處理器;內存規格則支持到DDR2-800和DDR3-1333,最大容量分別達到8GB/4GB,且擁有兩個內存通道。I/O方面,G41提供了16個PCIe v1.1信道,可以配置為1×16或者2×8;此外,通過DMI 1.0總線和G41連接的ICH7R南橋,還能提供6個PCIe v1.0a信道。在NSP-1096上,這6個信道連接了6顆英特爾82754L網絡芯片(對應前置接口,其中兩組支持硬件ByPass);G41提供的PCIe v1.1×16則連接到擴展槽位,用以連接使用了82576、82580等中高端網絡控制器的擴展模塊。
NSP-1096內置的6顆82574芯片是沿用已久的嵌入式/服務器千兆以太網控制器,支持兩個TX/RX隊列和兩個RSS隊列,是一個成熟穩定、性能尚佳的產品。該芯片使用PCIe v1.1×1接口,能支持MSI-X等技術。不過由于連接在支持PCIe v1.0a的ICH7R上,它僅能使用傳統的MSI模式。擴展模塊上應用較多的82580則是英特爾最新推出的單芯片四網口千兆以太網控制器,采用了支持5GT/s速率的PCIe v2.1×4接口,支持包括LTR、TPH、DCA等在內的諸多特性。面向網絡通信、主流服務器和高密度刀片的82580是十分強大的芯片,其規格甚至比上一代的王者82576還要強一些。
測試使用的這臺NSP-1096還配備了一顆主頻為2.66GHz的英特爾Q9400處理器,該處理器使用45nm工藝設計制造,具有4個核心和6MB二級緩存。內存使用了兩根DDR3-1333規格、1GB容量的產品,工作在雙通道模式。網絡接口方面,除了板載的6個千兆銅口,我們還在擴展槽位安裝了一塊編號為BEM-580-F4的擴展卡。該卡使用了一顆英特爾82580網絡控制器,提供4個額外的SFP接口。不過,理論上該芯片在連接到G41的PCIe v1.1后速率將降為2.5GT/s,功能特性也只有包括MSI-X模式在內的v1.1部分可以使用。
整體性能超越預期
在CF卡中安裝了NCPBench 0.8后,我們將每兩個相鄰接口配置為橋模式,進行純轉發性能與帶簡單業務情況時的測試(NCPBench的功能介紹和使用方法見上一期連載內容)。對于NSP-1096來說,BEM-580-F4擴展模塊在很大程度上左右著整機的處理能力,我們也對其進行了重點考察。考慮到是第一次在這樣的配置場景中進行測試,每個項目在使用測試儀表進行測試后,都再使用NCPBench進行一次自測試。我們可以對比兩組數據的差異,用以評估NCPBench測試結果的準確性。
從測試結果中可以看出,當NCPBench運行在純轉發模式時,BEM-580-F4擴展模塊上的4個接口轉發64Byte幀的速率超過4Mpps,其他幀長時均接近或達到線速。這個結果雖然出色,卻使人略感遺憾。我們曾經在一臺采用5520芯片組的硬件平臺上,測得過82580的4個接口間所有幀長均線速轉發的結果,也就是說瓶頸不在網絡控制器。而對NSP-1096全部10個千兆接口的測試結果表明,該產品對64Byte幀的整機轉發能力接近9Mpps,這又意味著,之前測試中的性能瓶頸也不應該在處理器。經過排除分析,我們推測問題很可能來自I/O方面,理論上G41與82580協商后只能使用PCIe v1.1規格進行連接,在傳輸速率和效率上都大打折扣。此外,硬件平臺在緩存和內存等方面的差異,也可能會對數據包轉發能力造成一定影響。不過總體來說,NSP-1096的設計已經最大地發揮了G41芯片組的潛能,表現出來的整體性能也超越預期,足以滿足其目標市場的需求。
本次測試中,測試儀與NCPBench得到的兩組結果保持高度一致,我們只在高負載情況下觀察到pps統計數值略有不同,沒有出現往常幾個百分點級別的差異;加載簡單業務后,性能數據也沒有發生很大變化,只在使用128Byte幀長測試時有所降低。我們認為,造成這兩種情況的主要原因是處理器本身有性能余量,接口帶寬也限制了極限數據的出現。單就NCPBench來說,其自測試結果還是比較準確的,可以滿足用戶的常規測試需求。(產品信息:http://www.bestek.tw/prdouct-view/NSP-1096/product-nsp-1096.html)
NSP-1096吞吐量測試結果(針對BEM-580-F4擴展模塊)