本刊記者 王銀鳳
近幾年,云計算在世界范圍內都非常熱門。云計算(cloud computing)是基于互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。云是網絡、互聯網的一種比喻說法。狹義云計算指IT基礎設施的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需資源;廣義云計算指服務的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需服務。這種服務可以是IT和軟件、互聯網相關,也可以是其他服務。
目前全世界所有的國家都采用分享帶寬的共享信息的機制。帶寬是一種物質性能資源,享用的人多了就會出現有你沒有我的沖突,共享信息的速度就要慢下來。
與此同時,目前幾乎每個人都擁有數據庫,比如手機、PC機,或者IPAD機都有存儲功能,這意味著個人擁有數據庫的年代已經來到。www已經給人類提供了一個各獻所知的大數據環境,能不能把www全世界范圍的網變成個人的私有財產,即能不能使得全民能得到普遍的普惠的各取所需?
記者從此次創新論壇中了解到,這種不限共享分數的信息分發機制其實是存在的,那就是播存結構,在科學上擺脫物質分配或者帶寬分配的思維。
從2006年開始,李幼平、陳思剛、倪光南和張耀群四位院士對這個問題做了認真的研究,并得出了以下結論:
第一,文化服務占用互聯網大半帶寬。
第二,文化服務聚焦前一千種的網站。
第三,衛星廣播有能力推送前一千種網站當天內容。衛星廣播有能力通過輻射,地面又有儲存器,只要發明一個選擇的漏斗,這樣互聯網得到一個巨大的突破,有可能未來互聯網就形成一個以計算機通訊為主的IP結構,還會加上以廣播和儲存為主的BS結構。
第四,一旦個人成為現實,播存結構將幫助電信網分擔流量,并成為IP結構的次級結構。
從哪入手呢?李幼平院士介紹到:互聯網從內容的緯度來看,互聯網或者是萬圍網有三層結構,一個是網站,每個網站底下都有很多欄目,欄目下面才是網頁,欄目是重要的結構。現在每個網站都有自己的欄目,比如百度網大的欄目有財經、軍事,小的比如女人也是一個欄目,一個話題,大家根據話題分類學的辦法來選擇自己的需求。
只要經常統計個人最喜歡到哪個網站去看哪個欄目,就可以對個人的欄目進行排序,獲取個人最有興趣的欄目。故研究人員可以做一個內容漏斗——UCL(Uniform Content Label),統一的內容標簽。可以從一個無限的網頁中根據個人的需求,根據昨天、前天的行為判斷明天、后天的需求,定制滿足個人的需求內容。
李幼平院士還表示,要達到這樣的目標,需要發明一個工具,雖然已經研究很多年,還沒有最后成熟。李院士把它叫做UCL,統一的內容標簽。它是一個簡短的數據包,即一種貫穿網站、欄目和網頁三層結構的一種代碼,人類智慧的一種代表。
這個可以用中國的國家標準GB/T20092代碼的基礎上形成一個國家監管機構統一注冊頒發的代碼,這個代碼要是能夠被證實和發明出來,將會在無限的網絡中選擇每一個自己有限的需要去做工作,跟現在所有的搜索引擎概念完全是兩回事。

怎么做呢?目前Internet都有一個邊緣網或者服務器客戶機結構,工作流程如圖所示,C客戶機如果需要一個網頁就把它的URL告訴S, S就到Internet經過K跳路由拿到這個網頁給S,然后S再還給客戶機,完成一個從遠處取來網頁的過程。
如果添加多層結構,就是廣播一些熱門的內容,一方面把它的全文告訴服務器,一方面把它的標簽告訴客戶機,客戶機得到標簽,標簽規定的UCR里面有它的標簽和摘記,人們就可以產生新的要求,C就會告訴我要這個網頁,這個時候由廣播同時要把全文交給接受服務器,因此這個接受服務器S就直接給終端服務器回答,用不著通過K跳路由。就把Internet跳過,直接用邊緣的存儲把內容給個人的網庫。這就是說分擔流量的機制。
非常遺憾的是,萬維網發明了20年,Web服務一直采用點對點的,你需要什么,請你把URL給我,我用URL到遠處把這個網頁拿來。另外的人如果需要同樣的網頁,他又來一次,他不知道聚類學的生產。
1998年,Watts在頂級雜志上發表一篇文章,發現Collective Dynamics 是小世界的成因,感悟網絡也是“可聚類”的。因此如果用這種可聚類的思想,就是用廣播和存儲來代替這種完全個案的Internet訪問,有可能使個案生產的web服務大踏步進入工業化的全新年代,現在web服務還是個案生產,你要你的,他要他的,可能上海市一天有一萬人同時要向新浪網要同樣一個網頁,它是一個一個來服務,其實完全相同內容的網頁在完全相同的上海和北京這兩個路徑中間一天要冗余的、毫無疑義的走一千次甚至一萬次。
總之,這個聚類概念和聚類計算是祖先留給我們的財富。畢升的聰明過人之處在于,他把單個的漢字當成可聚可分的最小單元,而現在,UCL聚類計算是把網頁當成一個可聚可分的單元,讓13億同胞可以自由的拆卸和裝備,個案生產的電信網絡可以變成一個工業生產時代。大家都說信息化帶動工業化,李院士卻表達了相反的觀點,在十年里看信息化本身要進行工業化。如果工業化聚類概念把網頁服務一個一個去拿的概念改革掉,巨大的生產力就會迸發出來。
www是一個人類的偉大發明,它幾乎是給人類提供了一個各獻所知的大環境。從信息意義上的各盡所能、各獻所知,我們中國科學技術工作者有沒有可能發明普惠全民的各取所需呢?
因此創造不限人數的播存結構也許是個起點。播存結構是一個只有中國做得最有深度的研究領域,現在還在基礎研究階段,總有一天它會用這個域名聚類的計算概念把有限的域名聚類不斷出現的大數據網頁。中國有兩句話,一個叫博大精深,李院士認為互聯網IP網就是博大精深;他希望年輕人做另外一句話——大道至簡。網上東西非常多,但每個人需要的就那么一點,因此發明漏斗,直接向個人提供有興趣的內容,將來完成各獻所知,各取所需是一個偉大的前景。