王贊波,賓立
(益陽橡膠塑料機械集團有限公司,湖南 益陽 413000)
益陽橡膠塑料機械集團有限公司(以下簡稱“益陽橡機”)現隸屬于中國化工集團有限公司旗下的中國化工裝備有限公司。企業集研發、生產、銷售、服務于一體,是國內橡膠機械行業骨干企業。
為了破解企業自身發展所存在的瓶頸制約,打造承接德國克勞斯瑪菲轉移平臺,益陽橡機啟動了整體搬遷技改——智能型橡膠機械數字化制造基地項目。
在整體搬遷這個戰略轉型背景下,企業對信息化建設和運營提出了更高的要求,IT部門越來越成為企業實現創新發展的本源,真正實現客戶和市場驅動的運營模式。面對新的挑戰,一方面需要IT服務能力能夠實現快速交付;同時,益陽橡機企業內部的IT系統規模不斷增大,各類業務系統和數據業務數量日益龐雜,如果繼續采用傳統從硬件到應用相互獨立的煙囪式運營發展模式,IT設備采購和部署將面臨越來越大的壓力,各類IT設備(網絡、服務器、存儲等)的資源將無法得到充分利用,從而在一定程度上制約了企業的快速發展。以此契機,益陽橡機實施虛擬化服務器及虛擬化桌面項目(以下簡稱“研發云平臺項目”)。
根據信息化整體規劃,益陽橡機研發云平臺第一期項目,主要是為了滿足公司快速發展的研發業務需求,將現有的研發設計數據、應用、管理整合到一個統一的云平臺。不僅解決研發設計過程的數據安全管理、基于權限的應用使用,同時也為公司運維管理提供了一套業界領先的云管理平臺,幫助益陽橡機實現自動化IT運維。這個目標主要是分為兩個部分。
業務管理系統上云:建立虛擬化服務器,所有的應用系統都遷移至虛擬服務器上。通過服務器整合,建立資源池,實現計算資源、存儲資源、圖形資源動態按需分配,充分發揮硬件資源的使用效率。
研發設計上云:搭建企業研發虛擬化桌面平臺,涵蓋技術中心、工藝部等部門所有應用軟件和應用系統,實現設計、工藝工作模式切換到虛擬化桌面平臺,并支持設計、工藝集中統一管理模式。
經過半年多時間的技術交流和測試,我們最終選擇了Citrix桌面云和VMware的虛擬化服務器,前期經過我們大量測試,這次項目采用多臺高性能圖形服務器與基礎架構服務器通過萬兆光纖互聯互通(見圖1),其中圖形服務器采用了Nvidia專用圖形顯示卡P6000,每塊顯卡承載用戶數20~25個,目前我們有60位研發設計人員,實際并發量為66.7%,因此使用2臺圖形服務器即可滿足第一期業務需要,同時配置4臺高性能2U服務器,通過服務器虛擬化方式構建業務虛擬化資源池。

圖1 研發云平臺系統拓撲圖
項目于2019年10月啟動項目實施,到2020年1月份正式上線(見圖2)。通過項目的實施,解決傳統IT架構中以分散設備為中心的管理難題,最終實現通過網絡,動態按需使用資源及數據,集中管控硬件、軟件以及數據資源,構建支撐企業智能制造和管理目標的信息化體系。

圖2 研發云平臺桌面
項目上線之后,在2020年疫情發生后,實施效果馬上體現了出來。疫情期間,特別是互聯網企業,都引入了遠程辦公工具,一度造成系統崩潰,比如百度、網易,在員工大面積登陸企業內網時,導致VPN癱瘓。但是對制造業而言,遠程辦公是最簡單的場景,更重要的是,如何實現異地研發、生產協同等的在線業務協作平臺,從而保證企業在線不停產,最大限度的減少現場人員聚集[2]。
相對于我們公司來說,2020年要實現整體搬遷,項目各條線正在有條不紊的進行,其中技術中心三維模型設計和工藝部門的三維工藝規劃壓力巨大,加之疫情的突然到來,導致工作暫時中斷。為了加大項目的整體進度,保證技術工藝人員的工作不受影響,益陽橡機利用研發云平臺,開通了VPN賬號,技術和工藝人員可以在家通過VPN登錄到設計云平臺上面,進行正常的工作,所設計的內容都集中存儲在企業的云平臺服務器上面,前端只有終端連接顯示,數據不能下載到前端,同時網絡不傳輸實際數據,多重數據保護措施,實現了數據可以用,但是拿不走,通過訪問控制、數據管控和外設管控等一系列策略,確保滿足安全、合規要求,保障業務數據的信息安全。
由于出差或者疫情等情況導致地域跨度大,工程師之間的協同工作就變得很困難,最多只能是基于數據共享方式的協同。如果模型數據巨大的話,有異地協同的需求時,數據傳輸也會受到網絡鏈路帶寬和穩定性的影響。而且這種協同方式只能是結果數據的共享,在數據產生過程中的協同難以實現。這種數據共享的協同工作方式效率不高,且存在著數據安全隱患。因此我們這次重點運用了在線實時協同:通過內存數據與屏幕信息共享,多人同時觀看同一模型數據與其操作過程。對客戶端設備沒有要求,只要登陸到云端即可進行;任何數據并不發生傳輸,因此協同參與人員無需準備任何環境與數據,隨時隨地可以開始協同工作。協同發起人還能夠隨時授權其他用戶的鍵盤/鼠標輸入來操作模型。
此次項目采購4臺服務器,通過以太網絡組建分布式存儲,在4臺服務器裸機上分別安裝VMware vSphere虛擬機軟件,利用服務器強大的處理能力,生成多個虛擬服務器,而每一個虛擬服務器,從功能、性能和操作方式上,等同于傳統的單臺物理服務器。然后采用一臺虛擬機部署vCenter虛擬機,安裝虛擬化管理軟件,對所有虛擬機服務器及虛擬機進行管理。4臺服務器之間通過兩個萬兆光纖網卡與萬兆光纖以太網交換機進行互聯,通過分布式交換機實現分布式存儲數據以及業務數據的傳輸,兩個千兆網絡互備,通過標準交換機,滿足超融合系統管理以及遷移的需求。所有網絡采用雙鏈路冗余,避免單點故障。目前公司所有的應用系統都已經遷移到云平臺上面,并且為以后的MES、SAP等系統的實施提供了服務器平臺。虛擬化服務器管理平臺如圖3所示。
通過項目實施,建立了益陽橡機云管理平臺,實現資源的動態調配,以及應用軟件集中更新、統一發布,只需維護管理服務器端的軟件和數據,個人電腦無需安裝應用程序和擁有數據,實現個人電腦免維護,在降低IT運維管理工作強度的同時,向用戶提供統一版本的應用軟件,規范數據格式標準。

圖3 虛擬化服務器管理平臺
益陽橡機此次是產業轉型升級,所以全部采購了高端的數控設備,對研發設計要求提高,需要全部三維設計,傳統的桌面云主要用于辦公,對于資源消耗比較大的三維設計、動畫仿真、結構力學等應用,桌面云就無法滿足要求,出現卡頓、延時的效果,所以我們這次選擇研發云,重點是解決研發設計過程中對于資源消耗的情況。
研發云與普通辦公桌面云的最大的差異在于GPU的使用,GPU是圖形處理器的簡稱,這個概念是由NVIDIA公司在發布GeForce256繪圖處理芯片時首先提出。GPU使顯卡減少了對CPU的依賴,并分擔了部分原本是由CPU所擔當的工作,尤其是在進行3D圖形處理時,功效更加明顯[3]。
經過長期市場調研以及與多家供應商進行多次技術交流,對于CPU、內存、存儲等基礎架構的虛擬化技術已經非常成熟,主流技術有:VMware、Citrix、微軟、開源軟件,如OpenStack、基于開源軟件進行二次開發,如zStack。
研發虛擬化對于GPU的使用主流方式分別為:GPU虛擬化、GPU共享。
GPU虛擬化,也就通常據說的切片方式,將一塊高性能圖形卡按預先設定好的配置分成若干小圖形卡,每塊虛擬出來的圖形卡分配到用戶的虛擬桌面中,每個用戶只能使用所分配到的GPU和顯存資源。如果資源不足,重新調整時,必須要重新啟動虛擬機。
GPU共享是利用多用戶、多進程操作系統進行資源調度。但在圖形卡驅動與操作系統之間進行了優化,當多位用戶并發操作時,所有用戶的資源調用都是串型的,GPU在同一個時鐘周期中只處理1個任務,對于每位用戶而言,他們的資源調度始終都在使用GPU最大處理能力進行工作,資源利用率非常高,圖形效果最佳。目前主流的VMware和Citrix就是采用的這個方法。
桌面虛擬化的一個重要的技術就是協議,因為協議效率決定了虛擬桌面使用的用戶體驗[4]。目前提供虛擬化解決方案的主要國外廠商都有自己的協議,目前主流的有PCoIP、ICA、RDP和SPICE這四類桌面云傳輸協議,Microsoft使用RDP協議,Citrix用的是ICA協議,Vmware的是PCoIP協議,Redhat發布了SPICE協議。
研發云應用場景,在確保數據安全的前提下,客戶端通過網絡將后臺應用鏡像通過專屬協議傳輸至前端用戶界面,研發人員在獲得良好三維操作體驗性上需要以下重點指標:低帶寬占用、高圖像顯示效果、低延時。而這三個特點是ICA協議所具備的,這是我們此次選型的重點參考依據。
研發云平臺助力益陽橡機解決傳統IT架構的沉疴,集中資源創新,建立新的生態環境,真正實現企業IT建設的集約化可持續發展的模式。預計在三至五年內,益陽橡機工業互聯云平臺的建設能夠幫助公司初步構建完成企業智能制造系統架構體系,承載智能設計、智能制造、智能服務、工業軟件和大數據工業互聯網等方面的應用;構建支撐企業智能制造和管理目標的信息化體系,助推企業設計、制造、服務、管理達到國內先進水平,成為機械裝備行業數字化、智能化示范企業,樹立機械裝備行業數字化、智能化標桿。