

北京“的哥”王師傅開了8年出租,最近兩個月來油價連續降價讓他緊繃了許久的眉頭略略松了松。“我住在房山,每天出車、收車都要放空幾十公里,油價下跌當然能幫我省下不少油錢。”
燃油價格的波動,不但關系到王師傅這樣一個普通出租車司機的收入,更是關系到整個社會生活的方方面面。同時出于降低碳排放、實現低碳發展的目標,國家近年來不斷進行著能源結構的調整,石油、天然氣等非煤炭的能源使用比例正在不斷增加。
但是眾所周知,長期以來中國一直是處于“富煤、少氣、缺油”的資源環境下。找到更多的油氣田資源,不光是廣大物探工作人員的目標,也是眾多相關IT工作人員的心愿。正如在中國石化石油物探技術研究院內有這樣一塊石雕,上面書著“物有象,探無疆”。
計算無止境
“我相信現在中國還有很多石油沒找出來。”說這句話的人不是別人,正是中國石化物探技術研究院副院長兼工程師趙改善。
趙改善能說出這樣的話,一方面源于他多年在石油物探方面的實際工作經驗;一方面也源于其工作背后的高性能計算力量。
中國石化石油物探技術研究院(下稱物探院)以原中國石化石油勘探開發研究院南京石油物探研究所為基礎組建成立。在三維地震、高精度地震、井中地震、多波多分量地震等勘探方法上,以及基礎理論研究、勘探工程規劃、數據處理分析、復雜構造成像、復雜儲層預測等物探關鍵技術領域,形成了一系列特色技術和專有軟件產品;高質量處理了一萬多平方千米三維地震資料,提供了數百口探井和開發井建議井位,為塔河、川東北、鄂爾多斯、東海、江蘇、松遼等一大批油氣田的勘探發現和增儲上產做出了積極貢獻。
據了解,為了配合日常工作,物探院在南京江寧新基地建設了可容納380個機柜的高性能計算中心。“整個高性能計算中心CPU數量達到了11708個核,GPU數量達到了112640個核。總計算能力達到了單精度443TFlops,雙精度248TFlops。”趙改善說,“整個中心主要在進行常規地震數據處理、地震成像處理,以及地震波場模擬計算。”
同樣作為石油物探高性能計算方面的專家,中國石油東方地球物理公司研究院(下稱BGP)副總工程師兼處理中心總工程師賴能和也認為,石油物探行業和高性能計算機技術的發展是密不可分的。“高性能計算機的發展促進了我們很多地球物理方面技術的進步,舉一個簡單的例子,例如石油物探研究中會涉及到疊前時間偏移或者是逆時偏移這些算法,這些算法上個世紀70年代就已經出現了。但是那時候計算機的計算能力非常有限,所以這些算法當時很難實現,或者說處于試驗階段。到上世紀90年代末的時候,還是處在實驗階段。真正到2000年以后,隨著高性能計算技術的不斷普及,這些密集型的算法才得以實現。”
挑戰無極限
正如賴能和所言,在石油物探領域,業務計算量與高性能計算能力之間相互促進、螺旋上升的情形非常明顯。
趙改善表示,隨著勘探工作區域的不斷擴大,以及地震數據采集技術與裝備的發展,石油物探高性能計算所需要處理的數據量都是在成倍地增長。“2002年,我們處理的一個典型三維地震勘探項目,實際的面積只有800平方公里,每平方公里的數據大約230MB。2011年,我們進行的一個典型的三維地震勘探項目所涉及的區域面積就達到3000平方公里左右,每平方公里的數據量甚至可以達到10GB。”
勘探中地震波數據量的增加,直接帶來的就是地震解釋數據的激增,最終給相應的高性能計算系統帶來了挑戰。賴能和結合東方地球物理公司近年來在海內外多個處理項目的實際情況為例,向《計算機世界》報記者表示:“高密度地震采集帶來了海量數據,例如我們現在進行的一些項目中,由于采用了可控震源高效采集技術,每日產生的數據可達到5TB-7TB。面對這些海量數據,系統架構、網絡、內存、存儲等方面都存在著不小的挑戰,需要從整體考慮系統的搭建。”
對此,英特爾相關人士表示,要推動高性能計算在石油物探等領域的持續發展,除要提供專為高度并行化應用優化的產品外,還需要讓整個數據中心的IT設備(包含服務器、存儲設備、網絡設備),在性能和功能上盡量實現平衡。
“目前英特爾平衡計算理念的最佳實踐載體,就是于2012年3月上市的英特爾至強E5處理器。針對財務分析、媒體內容制作和高性能計算等計算密集型應用,該產品家族不但通過創新的微架構設計,例如對英特爾高級矢量擴展指令集 (Intel AVX)實現了比上一代至強處理器提升高達兩倍的性能,而且由于在業內率先在處理器中集成支持PCI Express 3.0標準的I/O控制器,以及在處理器中內置了英特爾集成I/O和英特爾數據直接I/O技術,以及在平臺層面以英特爾萬兆位以太網控制器X540來提供低成本、低功耗的板載局域網(LOM)功能。在最近一期高性能計算Top500排行榜中,就有45套系統采用了英特爾至強E5處理器。”英特爾(中國)有限公司服務器平臺的產品經理張振宇說。
物探云計算
云計算與高性能計算之間存在著千絲萬縷的關系,前者的興起,讓很多相關人士覺得通過云計算的服務模式來解決高性能計算人才匱乏、缺乏建設和運維費用、應用復雜等問題成為可能。
國內也有不少高性能計算用戶已經開始了基于云計算理念構建HPC服務,例如華大基因、上海交通大學等單位。具體到石油物探領域,之前一些民營的、從事地震資料處理與解釋的企業,已經在進行相關的試驗。目前,包括物探院這樣的具有國有企業背景的機構,也開始了相應的摸索。
趙改善告訴《計算機世界》報記者:“云計算強調資源集中部署、實現遠程共享的特點,在某些程度上是適合石油物探領域的。以物探院為例,我們的最終用戶實際上就是各個油田,我們本身就是一個技術服務商的角色。以前更多的時候,我們是拿別人的資料來做一些數據處理的分析,我們現在也在思考,能不能通過軟硬件整合,通過平臺架構的建設,對油田提供一些面向成像技術的云計算服務。”
在趙改善看來,各個油田自建系統進行相應的地震數據處理,往往會存在性能瓶頸,“對于某些應用不是一個小的集群就能處理的,必須集中部署大系統才能解決問題。”另外一個方面,趙改善認為軟件也是個制約因素。“地質成像技術發展中有一個很大的問題就是軟件成本的問題,軟件成本往往是硬件成本的1.5倍到2倍,有的甚至高達6倍。買得起硬件,不一定買得起軟件。如果我們通過自主軟件的研發,實現大規模的部署,這樣在軟件上會就節省很大一筆成本。無論從投資回報或者從管理來講,我相信會得到用戶的認可。”
不過,當前高性能計算采用云計算的方式,也面臨著一個非常突出的障礙,就是網絡傳輸帶寬的問題。這個問題,記者也曾經在華大基因等之前推行云計算的高性能計算用戶那里聽到過。趙改善也指出,網絡帶寬的確制約著物探院對于云計算的嘗試。
“相對于我們要處理的TB級的數據,目前的網絡帶寬確實是遠遠不夠的,要真正實現云計算的思路,首先要解決帶寬。”趙改善笑著說,“原始數據通過網絡傳輸不大現實,解決帶寬最有效的方法還是‘坐高鐵’,相比網絡,提著幾個硬盤坐高鐵的速度是最快的。”
期待融核
石油物探行業高性能計算應用是GPGPU(通用計算圖形處理器)異構計算最早的試水者,隨著近年來對于應用的深入,用戶逐漸也對GPGPU這樣的異構應用模式有了更深一步、更清晰的認識。一方面,GPGPU所涉及的異構編程模式一直在困擾著不少用戶。現有的科學計算程序很多都是通過OpenMP 程序來實現的,如何繼承原先已有的程序,讓其方便地在GPGPU架構上運行,是相應軟件編譯過程中必須跨越的一個難關。
趙改善向《計算機世界》報記者表示,異構系統并行計算軟件的開發也是目前高性能計算應用中的難點。
另一方面,包括東方物探、物探院這樣的用戶,逐漸開始關注到GPGPU架構的效率問題。賴能和就表示,GPGPU的架構并不是能夠運行所有的應用,所以有些情況下,GPU計算單元是處于一種“休眠”的狀況下。和常規的CPU相比,GPU的利用率并不令人滿意。
針對GPGPU架構下的可編程性、可靠性和低功耗等問題,英特爾開發了集成眾核架構產品。對于該產品英特爾傾注了大量的人力和物力,其前身甚至可以追溯到Larrabee顯卡。以至于在真正產品面世前,英特爾就迫不及待地公開了“至強融核”的名稱(相應具體產品將在2012年年底發布)。
英特爾相關人士表示,除了能夠為高度并行的應用程序帶來更高性能外,至強融核產品最大的一個亮點就是易用性。它能夠利用英特爾CPU架構上使用的編程模式、技術和開發者工具,這就使得軟件公司和 IT 部門無需重新為其開發人員提供與加速器有關的專用編程模型的培訓。
據悉,目前包括BGP、物探院在內的用戶都已經開始測試“至強融核產品”。趙改善透露,物探院正在與英特爾、浪潮一起在開展將相應軟件移植到至強融核平臺上的工作。賴能和也表示,BGP已經在至強融核平臺上測試自主研發的地震數據處理與解釋協同工作一體化軟件系統Geo East。
鏈接
曙光第四代刀片瞄準高性能計算行業應用
7月10日,曙光信息產業股份有限公司正式發布曙光第四代刀片服務器曙光TC4600。
TC4600目前支持英特爾至強E5-2600處理器,標準42U機柜可容納112片計算節點。據悉,這樣的密集設計可以大大降低單臺服務器的用電量和發熱量,將電源模塊的能效提升至90%以上。TC4600配有冗余金牌電源,轉換效率可以達到93%,能夠有效減省數據中心的用電成本,降低IT設備運營成本。另外,通過模塊化設計,TC4600為計算刀片提供多種網絡接口,既包括Infiniband QDR網絡,也包括1Gb以太網絡和10Gb以太網絡。
曙光刀片服務器產品經理付雪華表示,作為一款高密度、高性能的刀片服務器,TC4600適用于科學計算、動漫渲染、石油物探、電力調度、氣象預報和安全等多行業的應用。另據付雪華透露,針對一些對安全性有特殊要求的行業,曙光還會推出采用龍芯處理器的TC4600。同時,付雪華透露,TC4600支持GPGPU的異構計算模式,針對英特爾即將推出“至強融核”產品,曙光已經開始在TC4600平臺上展開相應的測試工作。
針對這些以高性能計算應用為主的行業,曙光X86服務器產品總監房玉震表示,曙光TC4600強調的是技術差異,對于石油、超算等高性能計算用戶,曙光絕不是單單地將產品交付給他們,而是從整體解決方案到真實應用的優化,曙光都有相關的專業團隊來和用戶一起進行合作。“我們會強調TC4600所具有的增值功能,也就是強調圍繞產品的各種不同解決方案。同樣,在銷售渠道上,除了圍繞大客戶外,我們也會選擇那些具有增值能力的合作伙伴,例如面向這些行業的獨立軟件開發商。”