本刊記者 何紅匣
從“數聯”到“物聯”
——記曹軍威與他的基礎架構學研究團隊
本刊記者 何紅匣

基礎架構(Infrastructure)一詞從上世紀20年代開始被用作公路、電網、電話、橋梁以及鐵路等類似的公共設施的總稱,為工業經濟的發展起到了支撐作用。雖然好的基礎架構經常被人忽視,其重要性也只有在出現故障時才能體現出來,但基礎架構的確是人類創造出的復雜而昂貴的系統,任何技術只有通過基礎架構化的過程才能夠最終為人類提供方便、經濟、安全和可靠的服務。進入21世紀,人類社會要想在科學技術和經濟文化等方面進一步取得飛躍式發展,就必須解決社會發展對新一代基礎架構的需求。在信息技術日新月異的今天,要想洞悉其中的一般規律和共性技術,基礎架構更是提供了最為獨特和本質的視角,這正是清華大學信息技術研究院曹軍威研究員和他的基礎架構學研究團隊所致力的研究方向。
計算機集成制造系統通過分布式的計算和通信技術把制造信息、資源、軟件和應用聯接在一起;網格計算把跨組織、跨地域的超級計算資源聯接起來實現整合與共享;PB量級的海量科學數據需要支持分布在全世界幾十個研究單位的研究人員的分析處理;廣域電網阻尼閉環智能監控系統在廣域立體環境中實現實時在線的信息感知、通信、存儲、分析、決策、控制和操作執行。這些看似不同的研究領域,不同的技術背景,不同的行業和應用場景背后,卻體現出驚人一致的基礎架構思想、理論、方法和技術,這也是這么多年來激勵著曹軍威和他的基礎架構學研究團隊不斷探索和進取的原動力。
1991年,曹軍威以全面的素質和優異的成績被保送到清華大學自動化系,1996年又以清華大學優秀畢業生直讀本系研究生并加入系統集成研究所,也就是國家計算機集成制造系統(CIMS)工程技術研究中心。在這里,他親身參與了國家863/CIMS主題重大關鍵技術攻關項目“制造業CIMS應用集成平臺總體設計與原型系統開發”,并由此形成了基礎架構思想。
CIMS應用集成平臺項目的設立與開發是為了解決當時我國企業在實施CIMS過程中遇到的實施周期長、可靠性低、軟件維護性和可重用性差等問題,希望為企業提供一個實現信息集成和應用集成的軟件框架環境,實現了全企業范圍內信息的透明共享與管理,通過提供應用的開發工具、原型系統和集成接口等給實施CIMS的企業提供全方位的支持。
在項目支持下,曹軍威參與完成集成平臺運行管理與控制系統原型的設計和開發,利用多代理機制完成CIMS應用集成平臺的動態、靜態配置與裁剪,對平臺中各節點運行的應用進行控制和管理,對系統中重要資源進行共享管理……雖然當時曹軍威對基礎架構的認識還不是很深刻,但通過軟件與應用集成環境的開發,其中“集成則得、分散則失”、透明共享、優化調度、動態監控等方面的思想卻一直影響了他的研究方法和學術道路的選擇。
1998年底,曹軍威偶然爭取到清華大學公派赴英國留學的機會,獲得全額獎學金進入英國華威(Warwick)大學攻讀計算機博士學位。在全新的學習、生活和工作環境中,曹軍威卻意外地發現在高性能計算領域,英國導師給他指引的研究方向與他在清華大學所研究的問題如出一轍!
網格(GRID)計算試圖將跨組織、跨地域的超級計算機聯接起來,實現資源的整合和共享。1998年底網格的概念剛剛悄然從美國興起,便引起了曹軍威極大的興趣。在清華大學曹軍威就是從事制造資源、軟件和應用的分布式管理、優化與調度,應用到網格計算資源的管理應該是同樣的道理呀!其后,曹軍威迅速將多代理系統、工作流管理、性能評測等一系列技術率先應用到網格計算環境中并進行了原型系統的實現,在CCGrid和IPDPS等國際著名學術會議上連續發表多篇文章,立刻引起了國際學術界的關注,引發了無數后續相關研究。至今,這些論文被國際同行引用上千次,所開發的原型系統被改進和提高。隨后,曹軍威在德國NEC歐洲實驗室找到工作,在網格計算應用方面繼續研究,并開始應邀在英國、美國、波蘭、日本等地做學術報告和交流。
其實,網格計算最具啟發性的就是它從基礎架構的角度對其理念和初衷進行了清晰和透徹的闡述。為什么計算資源不能像電網一樣做到按需使用?簡單的問題實際上直指技術基礎架構化的核心。對照現實世界中基礎架構的重要性,網格是從基礎架構的角度,重新審視數字空間資源利用和共享的結果。在數字世界中,已經有一些類似現實世界中基礎架構的成功例子,比如通過簡短的Email地址,就可以實現通信;通過簡單的域名就可以登陸相應的Web主頁。它們實現了數字世界中的信息共享,而對于網格的研究則是為了更深層次的資源(如計算、數據、網絡和軟件等)共享。
雖然現在看起來網格計算在實際應用中遇到種種困難,但其計算資源基礎架構化的初衷仍然是符合技術發展趨勢的,仍然是目前包括云計算等在內的計算技術發展的終極目標。曹軍威對于基礎架構的思考和認識是在這個階段逐漸清晰和明確起來。既然在諸多領域同時面臨基礎架構化的技術問題,為什么不能通過一般意義下的基礎架構學的研究盡快得到一般規律和實現共性技術,以便在各個領域中最大可能的加速技術基礎架構化的進程?曹軍威致力于將研究推向不斷深入和系統。
所謂“數聯”就是在數字世界中實現網絡化聯接,取得基礎架構化的效果。海量數據的“數聯”在這方面有極致的體現。曹軍威2004年加入美國麻省理工學院空間研究中心并參加了激光干涉引力波天文臺(LIGO)的項目。
關于萬有引力的本質是什么,牛頓認為是一種即時超距作用,不需要傳遞的“信使”。愛因斯坦則認為是一種跟電磁波一樣的波動,稱為引力波,而引力波是時空曲率的擾動以行進波的形式向外傳遞的。直接探測到引力波的存在將可以為愛因斯坦廣義相對論的正確性提供又一有力證據,將是人類認知史上具有里程碑意義的科學發現。LIGO是美國國家科學基金(NSF)資助的迄今為止最大的科研項目,歷時10年多,建成了世界上靈敏度最高的激光干涉引力波天文臺。曹軍威參與研發的軟件用于管理數據,這些數據分布在美國和歐洲的10多個節點的2萬多個CPU并達PB數量級,為世界各地的60多個研究單位的700多位LIGO科學合作組織中的研究人員使用。
2006年曹軍威選擇回清華大學工作,任信息技術研究院研究員,立刻組織創建了清華大學LIGO工作組。在他的帶領下,工作組在引力波科學研究和LIGO實時數據分析方面的工作不斷取得進展,得到國際同行的認可。2009年9月,清華大學成為首個也是唯一一個來自中國的LIGO科學合作組織成員,填補了中國在引力波探測數據分析領域的研究空白,在世界一流科學合作組織中爭取到了一席之地,相關消息為科學網、教育網等主流媒體大量轉載。2010年,曹軍威成為LIGO科學合作組織理事會唯一來自中國的理事,提升了中國在這一領域的國際地位和影響。作為LIGO科學合作組織成員,實驗結果發表在Nature等國際著名期刊,短短幾年被引用700次以上。
技術的最新挑戰往往最先出現在重大科學前沿問題的探索過程中,比如Web的發明源于歐洲核子研究中心CERN;又如像LIGO科學合作組織中的很多天體物理專家,他們有時候不能集中精力解決科學問題的原因是沒有一個方便的模式可以使他們很快找到想要的數據,需要的計算能力,或者花費大量的時間和精力安裝配置需要的軟件和工具包,或者這些條件都具備的時間和地點很有限,如只能在上班時間,登陸到特定的機器完成。那么,為什么只能在特定的時間和地點完成特定的工作,而不能在任意時間、任意地點、執行任意應用完成工作呢?在計算機、網絡、通信等信息技術如此發達的今天,應付這些看似簡單的需求依然捉襟見肘。要將應用延伸到任意時間和空間,需要徹底解決支持應用和計算完成的所有因素的跨域共享問題,徹底實現信息技術的基礎架構化。曹軍威在LIGO項目中的嘗試從另外的角度證實了這一點。

在歐洲留學和工作
2006年回國后曹軍威更加堅定地開始從基礎架構的角度進行深入研究。當時,美國提出進入21世紀,新一輪的基礎架構化以信息技術為引擎,主要指基于分布計算機、信息和通信技術的基礎架構,稱為信息基礎架構(Cyberinfrastructure),其對于知識經濟的重要性可以與傳統基礎架構對工業經濟的支撐作用相比擬。
但曹軍威對基礎架構的研究卻有另外一方面的理解。既然數字空間需要基礎架構化實現資源的深度共享,為什么這一理念不能延伸到物理世界呢?“數聯”到“物聯”不是同樣的道理嗎?剛剛回國的曹軍威甚至參與了一個大型科學儀器共享方面的研究,將這一理念運用到大型儀器設備的管理、共享、優化與調度之中,很快就在CCGrid國際會議再次發表文章。而這一想法馬上也被緊接著的物聯網技術的興起所證實。
物聯網是集傳感、通信、網絡、計算、控制技術為一體的數物復合型系統。物聯網應用將遍及國民經濟和社會服務的各個領域,如智能電網、智能交通、現代物流、數字醫療、節能環保、精準農業等。物聯網被認為是繼計算機、互聯網之后,世界信息產業的第三次浪潮,是下一個萬億級的產業。物聯網已成為國際科技競爭的新高地,同新能源、綠色制造等并列為國家戰略新興產業。
物聯網系統運行中涉及一組關鍵過程,包括物理狀態感知,信息表示,信息傳輸,分析決策和控制執行。物理狀態感知主要是傳感器網,通過有線和無線的網絡傳感數據。操作執行主要由數字控制系統負責完成。物聯網中,傳感器和控制器的分布很廣而且數據量巨大。在過去的10年,對物聯網的研究大部分都集中于對感知層的無線網絡技術,包括RFID(radio-frequency identification)和WSN(wireless sensor networks)無線傳感網技術。但是,如何把各層網絡通信與應用軟件緊密地融合在一起,從而開發出高性能的物聯網應用,仍然是一個巨大的挑戰。曹軍威敏銳地觀察到,就像十幾年前的網格一樣,新一輪的基礎架構化進程又將啟動!
經過4年的發展,曹軍威從只身一人回國創業,迅速建立并發展起一支由20余人組成的高水平科研團隊,基礎架構學研究的“探索號”已經揚帆遠航!近年來,研究團隊獲得國家科技部863、973計劃,教育部質量工程和國家自然科學基金委員會等10余項國家級科研項目,以及重大產業化合作項目的資助,特別是2010年作為子課題負責人獲得國家973計劃“物聯網基礎理論和設計方法研究”項目的資助,并負責實現電力物聯網仿真驗證平臺,為物聯網理論和方法研究提供支撐環境。作為團隊負責人,曹軍威短短幾年間所承擔項目的科研經費達到上千萬,獲得專利1項,軟件著作權2項和科研成果登記1項,同時入選2008年教育部新世紀優秀人才支持計劃。
在物聯網技術興起的今天,曹軍威根據10多年的科研和實踐的一線經驗,指出要想加速物聯網相關技術的基礎架構化進程,基礎理論與方法的研究迫在眉睫。基礎架構如此重要,但迄今為止,對于基礎架構的論述還主要停留在定性描述的層面或者局限于特定領域,還沒有對基礎架構通用共有的特性進行定量、科學和系統的深入研究。因此,2006年回國后曹軍威即著手開展基礎架構學的研究。

曹軍威和他的團隊
基礎架構學(Infrastructurology)是對不同基礎架構的通用共有規律進行深入研究的科學,目的是為當前以信息技術為引擎的新一輪基礎架構化進程提供堅實的理論依據、切實的方法指導和具體的技術實現。這方面的系統研究在國際上還不多見。例如MIT的基礎架構科學和技術(Infrastructure Science and Technology)研究組主要還是針對特定領域(如土木工程)的特定問題(如材料腐化)開展定量深入研究。雖然也偶爾可見不同領域基礎架構之間相互借鑒的研究,基本也都停留在定性層面。
基礎架構學的研究直接來源于物聯網等方面的國家重大戰略需求。看似是不同行業產業的前沿問題,實際上從基礎架構化的角度進行詮釋時都是相通的。定量、科學、系統地研究基礎架構主要要從時間和空間兩個維度上研究基礎架構共通的演進規律。這是之前任何單一學科或研究領域所未曾涉及的。從這一點出發,曹軍威認識到,一方面基礎架構的形成是需要時間的,需要不斷成熟的技術作為支撐,同時還受到經濟、政治、文化等非技術因素的影響。但是從整體上看還是有一定的趨勢和規律可以探索的。一旦掌握了這些規律,可以更好的指導和加速新的基礎架構化進程。另一方面,基礎架構的空間分布也是有規律可循的。最為直觀的比如大多數成熟的基礎架構都采用分層樹狀結構,比如電網分為輸電、供電、配電等幾個層次;互聯網上的Domain Name Service也是采用樹狀結構等等。當然,基礎架構學本身還是一門應用基礎科學,比如系統論或復雜性理論研究都是以一般意義上的系統為研究對象。基礎架構雖然也是復雜系統,但還是具有許多自身的特點,需要結合和運用基礎理論,采用不同的研究方法進行深入探索,如理論分析、統計歸納和計算仿真。為了避免在開始階段基礎架構學的研究流于空泛,從特定領域,或以特定理論為基礎作為切入點和著手點是必經之路。為此,曹軍威帶領著他的團隊開發了無極(elop)軟件包,在教育、制造、電力、石化等行業應用解決方案中獲得廣泛應用。
積極沉淀學術成果和引領國際學術交流也是曹軍威的重要工作內容之一。近年來,他策劃并主編的英文學術專著Cyberinfrastructure Technologies and Applications已于2009年1月由美國Nova Science Publishers出版。同時,他本人受邀擔任國際著名學術出版商Elsevier學術期刊Journal of Computational Science編委、ICNDC 2011國際學術會議聯合主席。圍繞基礎架構方面的創新研究,他還大力開展國際合作,并獲得美國著名發明創新公司Intellectual Ventures的資助,組建了清華信息科學與技術國家實驗室(籌)分布式計算與應用講席教授組,與國際著名專家學者緊密聯系、交流與合作;與美國普渡大學ROSEN先進計算中心開展開放科研網格方面的交流;在國家自然科學基金委員會國際學術會議項目和美國NSF的支持下,在清華大學主持召開了中美Cyberinfrastructure研討會;與佛羅里達國際大學合作參與美國NSF支持的國際合作項目“Partnerships for International Research and Education-A Global Living Laboratory for Cyberinfrastructure Application Enablement”的研究,均取得了階段性成果……
科研攻堅是艱苦的,千淘萬漉之后才能收獲成果。科研攻堅又是快樂的,那種收獲之后的滿足是別人無法體會的。未來,曹軍威將和他的團隊一起不斷深入分析和解決產業與應用中的實際問題,勇于思考,大膽創新,大力開拓基礎架構科學、技術與應用基礎研究,為中國云計算和物聯網等方面的產業發展做出應有的貢獻!