趙艷秋


牙膏、香皂、洗發水和紙尿褲與那些高速運轉、需要大量空調降溫的超級計算機有關系嗎?Tom Lange是寶潔公司模擬與仿真研發部經理,34年間一直穿梭在二者之間。“消費者會發現,寶潔的產品相對來說都比較便宜,但是他們很難了解到,為了使這些產品保持較低價格,寶潔要采用很復雜的技術來進行開發和生產。如果你看到這些復雜的機器和每臺機器上正在跳動的代碼行數,你還以為我們在做飛機制造。”Tom Lange說。
洗發水和汽車模具
消費者在貨架前徘徊,決定購買哪種洗發水時,價格往往起到很重要的作用。如果產品定價不當,或者不能給消費者帶來預期的價值,他們通常都不會動心。所以,Tom Lange領導的模擬與仿真團隊要做的第一個關鍵工作,就是挑選產品原材料并設計生產工藝。“最終敲定的原材料和制造工藝要使公司生產的產品,消費者能夠承擔得起。”他說。
選定原材料或者制造工藝,是一件極為復雜的事。一種洗發水,Tom Lange要從上百種材料中挑選七八種來搭配,用計算機模擬搭配后的產品長得什么樣,在遇冷或遇熱后是否還能從瓶中很容易地倒出來……這些計算已經超出了普通計算機的處理能力,通常需要128個甚至更多的CPU協同完成,被稱為“超級計算”,簡稱“超算”。
十多年間,超級計算在美國企業的設計生產中已成為關鍵環節。福特汽車利用它來模擬汽車碰撞試驗,摩托羅拉用它來設計不同形狀的手機,這些手機掉到地上不易損壞。
如今,中國企業也開始將超算用到實際生產中,汽車行業的相關企業是其中最早的應用者之一。
陳惠濱,國內最大的汽車模具企業——天津汽車模具股份有限公司CAE部長,是這家企業的核心技術骨干,他的工作是利用計算機來設計仿真汽車模具。現在,汽車需要越來越精細的模具,一個兩三米長的車身模具,每個關鍵面的公差都要控制在0.5毫米以下,這相當于幾根頭發絲的直徑。這給模具設計制造帶來相當的難度,沖壓零件的精度合格率要求每提高幾個百分點,設計的計算量就會成倍增長。陳惠濱10年前進入這個行業以來,汽車模具設計中的CAE模擬工作量已經至少增長了幾十倍。
計算量的井噴,讓陳惠濱順理成章地成為國家超級計算天津中心的首批客戶。利用超算中心為廠子分配了256個CPU,原來在廠內計算機上要計算一兩天的模具模型,現在幾小時就完成了;原來一次只能設計一種方案,現在可以同時設計多種方案,然后挑出最優化的結果。
除了效率提升,超算對于廠里的成本優化相當明顯。不同汽車制造廠對模具的合格率要求從90%到100%不等。在沒用超算之前,利用普通CAE(計算機輔助工程)設計結果做出的模具,合格率一般在60%~70%之間,這些模具要經過反復修改、再加工,才能達到客戶要求。使用超算后,模具設計可以模擬得特別精細,合格率都在90%左右,修改、重復加工和調試工作大幅降低,成本也隨之降低一半以上。
當然,讓陳惠濱感到超算便利性的地方還有資料存儲問題。因為大型制件如整體側圍每次精確CAE成型模擬的結構數據量都在10GB以上,以前公司內部沒有足夠大的存儲空間,設計過程數據基本兩三天就要清除一次。現在,公司內大量的模擬文件都可以保存在超算中心的存儲平臺上,要做進一步研發時就很方便。
使用者的“資格”
國內外企業都用超算,但國內找不到消費品企業的超算案例。在國外,生產紙尿褲的企業會利用超算計算液體如何流動,產品怎樣設計才不淹孩子的屁股;生產薯片的企業會計算薯片從什么方向切,在運輸中更不容易碎……但在國內,超算項目更多的是氣象、石油、航天等這類大型工程。
國內企業很多時候發現國外同行的產品突然有了一個小拐角,但不知道為什么——是為了更結實,還是節省成本?這些細微之處的背后很可能有超算。正因為如此,大多數“普普通通的國內企業”在研發和成本控制方面并沒有用超算的打算。
但在陳惠濱看來,超算并不只是大企業、大項目的權利。他在意大利拜訪菲亞特的一個合作伙伴,發現在這個只有十幾個人的小公司里,每位員工都在用強大的計算平臺做工程仿真。陳惠濱感到,只要有計算需求,企業就完全可以用。
不過,現實中,中小企業用超算需要一定的“資格”。
第一個資格是數字化制造的普及。天津汽車模具在十年間積累了兩樣東西——如何根據不同的模具設計方案設定輸入模型的參數;如何評判仿真結果,解決問題——這兩樣東西都是人和機器融合得到的經驗,不是靠搭建軟硬件平臺和招收幾個員工就能得到的。
第二是資金。從經濟角度衡量,大多數中小企業還用不起超算。陳惠濱算了一本賬,如果企業自己投資,每隔三四年,軟硬件的升級費用就要上百萬元,多數企業目前經受不起這樣的頻繁升級;按照超算中心目前對外的收費模式——每個CPU按小時計費,超算一般要用到上百個CPU,這也是“接受不了的”。
云來統籌
在順利過渡到超算之后,現在陳惠濱會在晚上把作業和數據“丟”到超算中心,早上一上班就能看到各種設計結果。
這很像云計算,不管你在哪里,通過終端提交需求,再在終端上獲得結果。那么,超算和云計算有什么關聯?
胡松年,中科院北京基因組研究所研究員,他進行的水稻、微生物和人類基因組等研究項目需要的計算量極為龐大,2008年,他就使用了10萬億次/秒的超算平臺,今年,他已開始用40萬億次/秒的超算平臺了,存儲容量也提升到1P以上。這樣的計算量是普通機器計算上百年可能都完不成的任務。
云雖然是一種商業概念,但支撐它的底層技術,很多來自超算。同時,超算成為云調度統籌的一部分,就需要摘下神秘面紗,更為親民。“即使是現在,企業要用超算,技術人員一般要在電腦上敲一堆字符命令,遠程登陸,這跟消費者天天接觸的云很不同。”浪潮集團高性能服務器產品部總經理劉軍說,“不過,我們正讓超算的專業化軟件更易于使用,包括改變作業的提交方式、監控方式和數據輸入輸出方式。”
脆弱的應用軟件環節
看上去,超算和人的互動將越來越美妙。不過,在很多時候,龐大的超算系統還很不給力。
電影《阿凡達2》要推遲上映了。大導演詹姆斯.卡梅隆承認,這個本來計劃2014年底上映的大片,觀眾最早也要等到2016年才能看到。這是因為在續集中那些我們從未見過的神奇世界——潘多拉星球海洋——將完全在超算平臺上用虛擬化的方式創造出來。可是相應的電影制作軟件還在開發中,這次制作過程將是一個“非常艱苦的探索”。
即便是在超算已經發展了30多年的美國,為了把這些計算峰值達到幾百萬億次/秒、幾千萬億次/秒的龐大機器真正調動起來,應用軟件的開發也不是件輕松的事。而沒有好的軟件,那些硬件設備將只是一堆既占地又耗能的“大型沉寂物”。
在中國,超算的應用環節更為脆弱,能夠數得出的超算軟件鳳毛麟角。
賴能和,中國石油東方地球物理公司研究院處理中心的總工程師,國內最早一批涉足石油超算應用的行業人士。上世紀80年代,當中石油開始競標國際石油勘探項目后,全球最大的石油勘探公司——西方地球物理公司就再也不把石油勘探軟件賣給中國人了。為此,中國石油東方地球物理公司投入了巨大的人力和財力,開發出自主全國產的石油勘探處理解釋一體化軟件GeoEast。
不過,業內有個有意思的現象,僅僅是行業人士開發的應用軟件,通常做不大——他們雖然了解自身需求,但對性能擴展優化并不在行。2011年,中石油東方地球物理公司和浪潮在委內瑞拉的合作顯示出聯手的力量。當時,中石油在號稱“石油天堂”的委內瑞拉勘探石油,不過,他們只能在租用的幾個賓館房間內搭建一套原本龐大的超算系統。受限于環境,中石油只能在提高平臺效率上打主意,把原先的“大超算”變成“小超算”。
中石油東方地球物理公司提供軟件算法,浪潮將GPU加速技術引入,完成算法移植和優化。最終,機器規模縮減到原來的1/5,而中石油也在委內瑞拉規定的20天內完成了2000平方公里的全部石油勘探工作。
這個項目也給劉軍很深的感觸。在超算行業打拼15年來,劉軍一直把美國ANSYS公司作為超算應用軟件發展的目標和夢想。在過去42年間,這家位于賓夕法尼亞的企業一直沒有停止積累的腳步,自主開發也好,兼并也罷,目前它在全球工程設計模擬仿真軟件領域獨霸一方。“中國要出現ANSYS,也要把時間尺度放長到二三十年。這不是大躍進方式做的事,需要我們沉下心在算法研究、并行優化、人才培育上做功課。”
目前浪潮有個幾十個人的團隊與行業人士合作開發石油勘探、數值氣象預報、基因測序、金融風險分析、工程設計等應用軟件。最近,浪潮還主辦了中國首屆大學生超級計算機競賽。劉軍說,通過大賽期間的鍛煉,他希望學生們在學校期間就能建立一種思維方式——超算不能只比拼硬件,要強調應用,從應用的角度來配置系統。這樣,當這批年輕學生走入各個行業,那個消費者看不見的超算,才能讓我們的日常消費體驗更加美好。