馬宇川



一定要考慮投資回報
與普通電腦不同,我們認為在為高性能工作站選擇硬件時,除了能滿足目前所需的用途,還應具備一定的投資價值。簡單地說,可能您現在需要一臺高性能工作站用于渲染,但當這行的客戶減少、行業不景氣時,你也可以將它用于挖礦、轉碼等其他工作。總之你準備購買的工作站應在各個應用場景下,都能有優秀的表現,能實現不間斷地生產、創作,這樣才能保護您的投資。目前高性能工作站主要用于挖礦、內容創作、模擬仿真、設計制造等幾方面,接下來我們將以跟經濟產出密切相關的挖礦、渲染、轉碼三方面舉例,并通過AM D銳龍Threadripper 3990X、Intel酷睿i9-10980XE兩款規格差異較大的處理器在這些應用中的實際表現來說明哪類處理器更適合高性能工作站。
AMD銳龍Threadripper 3990X是目前A M D頂級的消費級處理器,擁有64核心、128線程配置。借助Zen 2核心的采用,銳龍Threadripper 3990X也擁有很多新特性—從IPC提升了15%到PCIe 4.0技術的使用,再到對高頻內存的支持。酷睿i9-10980XE則是目前英特爾方面定位最高的產品,它是第十代酷睿i9 X系列處理器中的旗艦。相對于銳龍Threadripper 3990X處理器,它的核心、線程數要少很多,只有18核心、36線程,但這款處理器的工作頻率要高一些,最高加速頻率可以達到4.8GHz,不過酷睿i9-10980XE 仍只支持PCIe 3.0技術。
新一代挖礦依賴加密性能
說到挖礦大家可能首先想到的是顯卡,的確像之前的比特幣、ETH,ETC和ZEC這些虛擬貨幣的挖掘非常依賴顯卡的整數并發運算性能,不過隨著全網挖礦難度的不斷增加,挖礦收益的急速下跌,目前從事上述幣種的礦工越來越少,一些新的虛擬貨幣開始流行了起來,典型代表就是Filecoin。
所謂Filecoin就是一個基于IPFS分布式存儲協議,將云存儲轉變為點對點、去中心化、自由交易的存儲市場。礦工通過提供數據存儲和檢索服務來獲得數字貨幣報酬。對于Filecoin中的礦工來說,要想盡可能多地獲得報酬就需要提供盡可能大的存儲空間,并更快地存儲客戶分發的數據,以及為有檢索需求的客戶上傳數據。要想盡可能多地存儲數據很簡單,礦工需要準備更多的大容量存儲設備。而要想盡快地存儲數據或為有檢索需求的客戶上傳數據,首先需要礦工擁有性能強大的存儲設備,如傳輸帶寬高達8GB/s的PCIe 4.0 SSD。而目前只有以銳龍Threadripper 3990X為代表的第三代銳龍Threadripper,以及第三代銳龍處理器在搭配相關主板時可以支持這類SSD。同時礦工最好還需要為礦機采用萬兆網卡,以能快速地傳輸數據。
不過對于Filecoin挖礦來說最為重要的還是處理器的加密解密性能,簡單地說,Filecoin使用哈希加密算法來識別和分發存儲在網絡上的數據。存儲在礦機上的數據需要加密進行數據密封,用戶在檢索時也需要唯一的哈希密鑰來進行數據尋找。如果處理器的加密、解密速度慢自然會影響數據的存儲速度和客戶的檢索效率。
目前在Filecoin的哈希加密算法中,SHA256是使用得最多的一種,特別是在最為耗費時間的扇區封裝第一階段,其每一層的n o d e計算全部采用SHA256,這也就意味著在硬件上支持SHA加密計算的處理器將更有優勢。所謂SHA是安全散列算法(Secure HashAlgorithm)的英文縮寫,目前在硬件上支持SHA加密計算指令集,擁有硬件計算電路的只有A M D的全系銳龍處理器。那么它們在SHA加密計算上會有多大的差別呢?
從下一頁的測試結果可以看到,硬件上支持SHA計算的AMD銳龍Threadripper 3990X在各類SHA標準計算上的測試結果都遠遠超過酷睿i9-10980XE,尤其是在關鍵的SHA2-256計算中,銳龍Threadripper 3990X領先酷睿i9-10980XE達53.2%,而在AIDA64更先進的S H A3加密解密計算中,銳龍Threadripper 3990X的領先優勢擴大到81%。事實上在實際的Filecoin挖礦中,A M D相對英特爾處理器的優勢更大。在Filecoin算力測試排行榜上(Filecoin Benchmarks),位居前列的幾乎全部都是AMD 銳龍Threadripper或E PYC(霄龍)處理器,目前各類專門為Filecoin開發的礦機也幾乎全都使用AMD處理器。
現在Filecoin虛擬貨幣的單枚價值已經達到20美元以上,專家樂觀地預測其主網上線之后,還會有很大的上漲空間。毫無疑問,要想玩轉這類新型虛擬貨幣,做一名優秀的礦工,像銳龍Threadripper 3990X這類在硬件上支持SHA加密算法、擁有超多核心的處理器就是更好的選擇。
多線程就是渲染利器
高性能工作站的另一大用途就是在各類創作設計中,為用戶高效地渲染出成品效果圖。我們通過Blender渲染一幅產品級單幀動畫進行了測試,結果讓人非常意外。銳龍Threadripper 3990X只需要4分32秒就能完成渲染,而酷睿i9-10980X E的渲染耗時達到了12分09秒,所用時間是A M D處理器的2.68倍。同時從業內常用的V-R AY渲染器效率測試來看,酷睿i9-10980X E在一分鐘內只能渲染26776ksamples,而銳龍Threadripper 3990X在一分鐘內可以渲染73388ksamples,渲染性能也達到了酷睿i9-10980XE的2.74倍,兩款處理器在渲染上的生產力有天壤之別。
顯然渲染這個工作除了需要高性能的處理器架構外,還非常依賴處理器的線程數量,即便是128條線程的處理器,也可做到100%占用。
轉碼也需要多線程
對于影視公司來說,視頻的編輯、轉碼是其中最為消耗時間的工作。在本次測試中,我們將把一段8K、60f p s,時長5分37秒的We b M影音文件轉碼為常用的MP4文件。測試軟件使用了HandBrake 1.33,為模擬專業人士應用,轉碼品質則采用了“Production Max”(最高產品級)。
而結果也讓人非常吃驚,銳龍Threadripper 3990X在轉碼這段視頻時,只需要16分45秒,而酷睿i9-10980XE則需要多達38分14秒,其轉碼消耗時間達到了前者的2.28倍。這是為何?我們在測試時也偵測了處理器的使用率情況,可以看到視頻軟件在轉碼時對多核心處理器的利用效率不如渲染軟件,其實在Premiere Pro、會聲會影等軟件中都很難100%地使用到64條計算線程,而最新的HandBrake 1.33則改變了這種情況—它雖然無法完全使用銳龍Threadripper 3990X的128條線程,但能在工作中使64條線程全部以100%的狀態滿負荷投入工作,并能調用64線程以外的其他幾條計算線程,這也使得處理器的總體占用率達到63%。而酷睿i9-10980XE在這項工作中的36條線程則保持100%的工作,但由于計算線程比銳龍Threadripper3990X少太多,因此它的轉碼時間要長很多。
面面俱到就對了
我們認為搭建高性能工作站其實就像買房、買股票一樣,是一種價值高昂的投資,因此在組建時,就應保證它能勝任各類專業應用。就像前面所說—如果您是買來挖礦的,那么在挖礦時,需要它能高效地給您帶來回報,在挖礦效益降低后,您又能將它用于視頻處理、圖形渲染或轉賣給相關公司。對于內容創作類公司也是如此,在業務繁忙時,將工作站用于自身生產,在行業淡季時,也可將工作站用于挖礦這樣的經濟產出上。因此高性能工作站處理器的選擇其實只需遵循兩個原則:
1.處理器具有先進的技術架構、生產工藝,在同類產品中擁有更多的核心、更多的計算線程,在轉碼、渲染、內容創作設計等應用上有更高的運算效率。
2.在虛擬貨幣的挖掘上,處理器具有相應的“必殺技”,可以提供更高的挖礦效率,在同級處理器中,能給用戶帶來更高的經濟回報。
所以,從以上兩個原則來看,我們認為以AMD銳龍Threadripper 3990X為代表的這類處理器就是搭建高性能工作站的更好選擇。