王懷民
分布計算的研究對象,簡單說是多個獨立的計算實體組成的系統,它們是通過網絡連接,通過通訊協議有效協同。
分布計算2.0是新型應用的支撐技術
應從兩個視角來理解這個問題。一個我們稱為分布計算1.0,實際上分布計算這個概念,在20世紀60年代末就提出了,1.0是以計算機為中心的,它關注的問題是如何將確定數量計算實體組合成為具有明確性能或可靠性需求的計算系統。其中需要注意兩個關鍵詞,一個是確定的數量計算實體,一個是明確可靠性需求的計算系統。這是1.0關注的問題。而新型應用的支撐技術,指的是分布計算2.0,關注的是如何將持續成長的網絡資源聯接成為更大規模,更高效的網絡信息系統,是以網絡為中心的。它是今天信息社會,賴以發展的重要的支撐技術。建設這樣一個網絡信息系統,是人類近幾十年做的一件大事。面向互聯網的連接技術能連接百億臺的設備,聯接超過45億在線網頁,聯接35億網民,以及未來的成百億成千億甚至更大規模設備。實際上這樣一個連接技術,已經在支撐社會前進了,我們從發展角度看,支持這樣一個,包括像慕課在線教育網絡信息系統,持續成長和發展的核心技術是什么?這樣的系統,不是一蹴而就的,是在一個持續成長發展過程當中,走到今天的。從發展角度看,是什么樣的技術支撐人類走到今天。就是面向互聯網的聯接計算。這個聯接計算包括聯接軟件資源技術,聯接計算資源技術,以及聯接智力資源技術。
關于聯接軟件資源技術,今天我們已經體會到了。各種各樣不同的實體要聯接起來通常通過一個軟件標準,聯接到一個所謂的抽象的軟件總線上,這需要哪些標準呢?比如過去網絡連接的TC包括軟件技術領域里面的對象的遠程對象連接的標準,以及后來我們聯接網頁的Http標準,等等這樣一些重要的技術。正因為有這樣的技術,我們今天講聯接,包括做網上教育的實踐才有了好的基礎。
聯接的三個方面
第一,聯接要關注如何支持技術的發展與演化。網絡體系已經存在,我們需要重組,它既是一個變革的過程,又是連續的過程。聯接的這些組成部分,是可以升級的,是可以有效的聯接。這是我們今天需要的,所謂軟件聯接技術所要支持的,因此我們將互操作,將每個聯接實體的自主性,是我們要支持的。
第二,重要的聯接技術,是計算資源的聯接,其中重要的概念就是抽象與綁定。在計算機時代,計算機的資源為什么能夠支持分布式應用,而且越來越便捷和高效,正是因為有了抽象的綁定系統。今天我們要抽象和綁定什么資源?不斷成長的網絡資源,如何有效地支持能開發各種應用的平臺,我們需要支持綁定和應用。我們講的云操作系統,云的設計和運行管理環境。在這個過程當中,我們最需要的資源是以一種聚合和協同的工作方式,實現彈性的綁定。眾所周知,即便在云中心,資源使用的頻率和要求也是不一樣的。比如“雙十一”搶購的峰值和平時差十倍的差別,在這個情況下,資源利用率要提高,就需要彈性的綁定,也就是適時感知需求,正確決策,進行動態綁定,在適當的資源粒度上,調整時機,實現任務和計算資源的綁定。
第三,智力資源的聯接,我所關注的領域是開源計算。我們知道過去的軟件的開發平臺是一個企業級平臺,是按照工業化生產來研發軟件。它關注的是產品要滿足用戶需求,因此它的支撐環境,是以質量控制為核心的協同生產環境。怎么把用戶控制住,這是過去我們講的。開源的環境是什么?是開發者、自由職業者和學生企業,都可以參與的環境,在這里研發出很多重要的作品,這是每個參與者靈感得以表現的環境,在這樣的環境本質是支持分享和協同創作的。在大學教育當中,傳統的教室和今天網絡教育也是這樣一種對比,這兩種方式,不是徹底的替代。因此,如何把一個有效的作品變成產品需要思考,比如說維基百科做好以后,怎么把它變成有效的服務,這兩種機制是需要聯接的。智力資源聯接強調激發與匯聚,今天的開源世界已經提供了很好的激發模式,讓大家都可以參與,這個激發模式,如何匯聚成有價值的成果,需要研究。今天的學習者,利用在線教育平臺,已經擁有豐富的計算資源了,大家最關心的是,怎么才能匯聚更多資源?大家明顯感覺到,一個搜索引擎已經不夠了,因此在這個過程當中,我們要解決的問題是,一個核心團隊和互聯網大眾的自主參與是如何有效協同的?在整個過程當中,創作活動和生產活動如何有效協同?這里面涉及到大眾協同機制,開放工作機制和持續評估機制。
分布計算的方位
信息化時代有兩次浪潮,一次重要的浪潮是數字化,這個浪潮仍然在推進中,分布計算是邊緣化的,在數字化浪潮后,又興起浪潮網絡化浪潮,網絡化時代分布式計算處于中心的位置。在這個過程中,我們的支撐技術處于什么位置?在1.0的時候,我們計算技術是跟蹤為主,面臨的是自主可控的挑戰;到了網絡時代,我們已經從跟蹤到并跑,網絡可控的問題已經解決得比較好了。我們最近看了一個材料,講基礎設施和我們的應用,說1986年,互聯網在美國學術界廣泛發展的時期,中國互聯網帶寬是0,到這個世紀之初,中國互聯網帶寬達到世界第二了,到2014年中國互聯網帶寬的累計已經是世界第一而且兩倍于美國,同時我們注意到,中國在互聯網上的應用,也取得了一定的成就。在支撐技術模式上,中國從跟蹤到并跑,已經有了突破。
關于這件事情,我們要歷史地看,關于信息技術發展的Gartner曲線,大家都很熟悉。信息技術的早期發展,會有泡沫期,之后會有一個所謂的幻滅期,然后才會慢慢走向成熟。用中國的講法,就是生長期,青春期,而立期,不惑期和穩定期,這是Gartner曲線基本的流程。大家經常把而立期,說成是幻滅期,把青春期說成泡沫期,這是消極的講法,我的理解是,有兩個時期是勢能的積聚期和動能的釋放期。我們首先要有一個能量積蓄的過程,之后的過程,不是破滅,而是一個勢能得以釋放的過程,我們必須有一個很高的勢能的積累。所以重要的是要把握好勢能的快速積累和動能的有節奏釋放這樣一種節奏。
舉一個例子,我們做了一個軟件平臺叫StarBus,這個平臺根據多元及的技術,在勢能積累過程當中,研制我們中國的具有自主知識產權的中間件平臺,應用達到頂端的時候,我們就開始用這個平臺來推動中國在中間件領域產業的發展,因此我們就有了對技術標準、繼續發展的認識和體會。我們還要繼續努力,讓這樣一個勢能得以持續的釋放。過去我們做了兩件有意義的事情,第一件,是在2001年,我們用這個平臺,開發出當時在國際上失誤處理能力最強的計費軟件,這在今天看很平常,但在沒有云計算的時候,支撐三千萬用戶計費的系統,是世界最高水平。第二件,在過去十年當中,我們把這些技術,用于國防信息化建設,用我們的技術實現了國防信息系統的對象化、構建化、服務化。這個軟件技術的實現過程,就是我們從勢能的積累到動能的釋放過程。我們已經推進了20年。把它應用于軍隊的信息化,我們也實踐了15年,其意義不僅在于我們是在勢能積累過程當中,還在于我們有動能釋放的韌性。
軟件強調的是聯接,最重要的是把資源高效匯聚起來。我們提出了原創核心概念:在互聯網計算當中,要按需聚合、自主協同。我們用這個概念來推進國家互聯網的治理。互聯網需要治理,我們要解決的是面對千倍速增值,怎樣還能管住網?只有利用互聯網資源管理互聯網,才能真正管得住網。