張平
2021年是英特爾的產品大年。年初,英特爾發布了全新的第十一代酷睿臺式機處理器和第十一代酷睿H35系列處理器,將英特爾桌面和移動處理器的性能帶到了一個新的高度。三四月份,英特爾又發布了第三代至強可擴展處理器IceLake全系列產品,在將處理器核心數量大幅度提升至40核的基礎上,又加入了大量的全新技術特性。5月份,英特爾憑借第十一代酷睿H45系列處理器實現了對移動產品的全覆蓋。在如此多、如此密集的產品發布背后,人們看到了一個在產品上銳意進取、在技術上不懈努力的英特爾。
對英特爾來說,產品的發布往往是萬里長征才走完了一半,產品發布后對產品特性和應用的持續推廣尤其是和實際市場、具體應用的結合也非常重要。這一點在英特爾第三代至強可擴展處理器上表現得特別明顯。第三代至強可擴展處理器相比上代產品整體變化非常大,其核心微架構升級、工藝進化,因此帶來了非常顯著的性能、功能提升。
近期,英特爾公司市場營銷集團副總裁兼中國區數據中心銷售總經理陳葆立及三位英特爾數據中心資深技術專家針對第三代至強可擴展處理器的特性、優勢以及應用案例進行了深度分享。根據英特爾的數據,第三代至強可擴展處理器相比上代產品在性能方面提升了46%,這里的提升是指平均數據,在諸如人工智能和網絡計算等領域,由于新指令集的引入,其提升幅度更高。此外,新產品在安全特性、機密計算、整體帶寬、平臺功能方面都有顯著改善。由于產品在功能和相關特性上變化巨大,因此在產品發布前后,英特爾還持續跟蹤和接收用戶反饋,并且和客戶一起,根據新產品特性,在安全、人工智能和機密計算方面進行了結合實際應用場景的持續研發和不斷更新。下面,本文和大家一起來分享這些新的信息。
安全第一:英特爾在軟件防護和密碼操作硬件加速方面的進展
在第三代至強可擴展處理器上,英特爾引入了兩個新的特性,一個是英特爾軟件防護擴展SGX,另一個則是英特爾密碼操作硬件加速。先來看SGX技術,從歷史來看,英特爾對產品的安全特性一直很重視,從第六代酷睿處理器開始,英特爾就引入了相關安全特性,當時稱之為IntelSoftwareGuardExtension,也就是現在我們看到的在第三代至強可擴展處理器上加入的英特爾軟件防護擴展SGX的“始祖”。值得一提的是,所謂“擴展”,并不是一個功能或者一個特性,而是指通過新擴展指令集的方式,方便軟件開發者通過直接調用CPU指令來實現平臺安全隔離技術,整體設計更為底層、高效和獨特。SGX的作用也非常明白,那就是針對敏感數據提供獨立于操作系統和硬件配置的增強安全防護。這個功能的應用場景是什么呢?舉例來說,目前企業上云的趨勢非常明顯。企業在使用云計算時,數據傳輸到云是加密的、在云端的數據也是加密存儲的,但是在云端計算的過程中,由于云端服務器要實現對數據的操作和處理,那么這個過程的數據可能就沒有辦法很好加密了。而SGX就是提供了可以把數據中心、云計算服務器中的指定內存區域的數據和當前的操作系統、硬件隔離開來的功能,實現敏感數據的安全處理。
由于數據隔離,云端數據的安全性就有了保障,服務器的操作系統和硬件在沒有許可的情況下是不可能得到這些敏感數據的。從這個角度來看,英特爾SGX是一種基于硬件的可信執行環境,內存中的數據看起來依舊在內存中,但是隔離的特性使其成為當前系統的“飛地”,安全性就有了保證。英特爾宣稱他們可以讓CPU在內存中為單獨的應用程序劃分出單獨的區域,由CPU專門對這塊區域進行加密解密操作。在這種情況下,即使是操作系統、虛擬機管理程序這些高權限的軟件或者攻擊者、惡意訪問者,都無法得到內存中加密后的數據。不僅如此,SGX保護的空間是可大可小的,最小4KB,最大1TB,基本上可以滿足目前絕大部分軟件的需求了。
在具體的客戶方面,英特爾提到阿里云和騰訊云目前已經開始部署相關的技術并實現了可信計算。國外的用戶比如德國的電子醫保數據也采用這個功能,符合歐盟嚴格的GDPR安全規范,讓用戶的數據隱私得到了很好的保護。
接下來則是英特爾密碼操作硬件加速。這個是一個比較好理解的概念,目前對很多敏感數據都采用密碼加密處理,對密碼的操作一般采用對稱密碼操作或者非對稱密碼操作,其中前者可以采用電子簽名這種標準的算法來實現,但是無論如何,類似這樣的密碼操作都需要耗費CPU的算力,如果將這種標準算法實現硬件加速以后,就可以降低CPU的算力損耗,這是非常有意義的。
在具體實現方面,英特爾提到了三個方式。一是通過CPU指令集來實現AES加密的高速度、高效率,這個指令集在2010年的時候首次應用,被稱為AES-NI,目前也在不斷地加強中。二是英特爾在每一代CPU上都針對加密解密計算做一些微架構上的調整,使得整體性能不斷提升。三則是軟件優化,通過軟件結合硬件的優化,能夠帶來密碼硬件操作的提速。
英特爾還帶來了一些有關密碼硬件加速的案例。比如新的第三代至強可擴展處理器在計算OpenSSLRSA2048位的簽名上,相比上一代CPU,單線程情況下有5.6倍的提升,在進行AES-GCM對稱加密方式的情況下,相對上一代產品,單線程情況下有3.3倍的提升,這個提升幅度是相當可觀的。在非對稱加密解密方面,英特爾也提到了一些功能優化,比如借助AVX-512指令集實現相關計算加速,英特爾舉例稱第三代至強可擴展處理器通過VPMADD52指令,再通過多緩存并行操作的機制,在RSA2048這樣一個電子簽名的操作上實現比上一代CPU高達5.6倍的提升。在密碼學的伽羅華域方面,英特爾采用VAES和VCLMultiply提升了性能。軟件優化方面,英特爾實現了多緩存并行執行和函數級別的縫合技術,后者可以實現不同格式的加密計算的一次性處理,大大提高了計算效率。
AI無處不在:智算領先
在之前的介紹文章中,我們曾提到第三代至強可擴展處理器在AI計算方面做出了很大加強,其中一個重要的改進就是AVX-512,英特爾是目前業內唯一支持AVX-512指令集的廠商,另一個是AI加速有關的指令集。借助于這兩個方面的加速和軟件的優化,英特爾宣稱新的第三代至強可擴展處理器相比上代產品提升了74%的AI計算性能,比競爭對手快了大約25倍,不過這樣的數據應該是在比較極端的狀態下實現的。此外,英特爾在軟件上持續投入,比如英特爾在TensorFlow上優化了ResNet的性能,相較于默認發行版可以提升10倍。在Scikit-Learn上經過優化,相比非優化版本獲得了100倍的性能提升。
由于英特爾在AI計算上很好的優化,因此帶來了非常領先的計算優勢和具體應用場景的優勢。在這一部分,英特爾給出了兩個例子,一個是在數字娛樂方面的優化,比如目前人們在游戲中常見的捏臉技術,可以使玩家在游戲中獲得非常出色的角色融入感。有關“捏臉”和相關應用,英特爾在這里做了一個非常好的嘗試,那就是利用AI,通過用戶上傳人臉照片,自動和游戲內的3D模型耦合,這里利用到了第三代至強可擴展處理器的VNNI指令集,僅僅使用int8整數計算,就完成了2D人臉模型到3D游戲模型的轉換,相比傳統需要使用FP32的計算,第三代至強可擴展處理器和新的指令集帶來了4.23倍的性能提升,同時技術和應用也非常簡單。第二個例子是英特爾和阿里云一起針對自然語言進行優化,利用的也是第三代至強可擴展處理器的VNNIint8相關特性,實現了3倍的性能提升。
除了上述AI加速的內容外,英特爾在AI數據的安全方面也有很多獨特的創新。比如借助第三代至強可擴展處理器的SGX技術配合AI計算,可以實現數據不用離開當前的機房就能夠完成AI模型訓練,這種技術被稱為“聯邦學習技術”。由于數據不用離開機房,因此在安全防護、數據控制方面更方便,因此受到了很多敏感數據用戶的歡迎,比如金融企業。英特爾和銀聯就推出了名為AnalyticsZoo的新技術,此外英特爾還和平安科技進行合作,實現了基于英特爾SGX技術加持的云邊協同的隱私計算實踐方案,其特點也是在SGX的控制下,數據模型中包含的敏感信息不會被威脅或者竊取,即完成了工作、提高了效率,還加強了數據安全性,整體效果很不錯。
機器學習和隱私保護:安全效率兩不誤
在上文,我們介紹了一些安全和AI計算的相關內容。在這一部分,主要談及個人隱私和機器學習有關的內容。目前全球各國對隱私保護都越來越嚴格,比如我國有《中華人民共和國個人信息保護法(草案)》,歐盟有GDPR,美國加州有CCPA等法律。這些隱私保護法律對個人隱私的獲取、存儲和使用都規定得越來越嚴格。具體到現在的AI計算來看的話,很多AI計算都離不開個人信息的收集和處理,比如人臉信息、醫療信息、位置信息和操作記錄等。目前主要有三類數據需要被保護,一個是AI模型的訓練數據,比如從千百萬用戶采集來的信息進行模型訓練,這些信息是非常敏感的。二是AI模型數據,這些模型數據是通過機器學習、機器訓練而來,其數據本質是千百萬用戶的行為,因此也需要保護,并且很多數據模型還涉及敏感信息,這就更加重要了。三是預測結果,比如AI模型根據數據給出的預測結果,具體到個人或者某個具體的群體的話,那也必須保護起來,不能被非法、無序使用。
在這種情況下,英特爾提出的解決方案是結合前文提到的SGX,聯邦學習等功能來實現數據的管控和安全處理。與其他的隱私保護或者安全技術相比,不管是在安全性、性能和可用性方面,SGX都有明顯的優勢。SGX是一個硬件級的安全技術,安全性很好,同時計算性能也非常出色。易用性方面,SGX不會打破現有應用方式,也不會重新構建底層,更不會破壞數據和模型,整體遷移性、易用性都很出色。此外,SGX還提供遠程認證等功能,可以實現參與方之間的遠程互認證,這可以解決多方合作中的可信問題,助力聯邦學習打破數據孤島。
英特爾給出了一些具體案例,包括通過SGX技術、LibOS技術,以及AnalyticsZoo現有的API和實例給用戶構建一個可信的大數據AI平臺。其中最典型的就是和螞蟻集團的隱私保護機器學習合作案例。螞蟻集團的Occlum項目,是一個開源的LibOS項目,通過OcclumLibOS,應用程序可以不做任何更改,運行在SGX中。目前,Occlum支持的應用越來越多了,除了之前講到的深度學習應用,一些大數據比如說Spark、Flink、Hadoop都可以無縫通過OcclumLibOS運行在SGX當中,從而帶來了極高的易用性和安全性。
從英特爾本次會議給出的信息來看,未來計算的發展方向一定是和效率、安全高度相關。在效率方面,英特爾通過第三代至強可擴展處理器已經實現了計算能力的飛躍,在安全方面,通過SGX技術配合相關的AI計算、隱私保護等功能,英特爾也帶來了目前業內最領先的安全管理技術之一,并且已經和多家企業合作落地,實現了技術和應用的結合。總的來說,第三代至強可擴展處理器在發布后僅僅數個月就帶來了如此多改變業內應用模式的方案和應用案例,確實體現了英特爾在企業級市場上的統治力。