金曉紅 整理
科學與藝術之間的一座小橋
——李幼平院士在“網絡科學”論壇的講話
金曉紅 整理
由中國傳媒大學主辦的“2012年中國網絡科學論壇”4月27日于北京順利召開。論壇圍繞“探討科學與藝術的和諧統(tǒng)一之路”的全新主題,以促進我國網絡科學與社會科學、藝術、傳媒、人文之間的交叉與和諧統(tǒng)一發(fā)展為目的而展開。本次論壇也榮幸邀請到重量級演講嘉賓,網絡科學領域專家:其中包括著名通信技術專家,中國工程院院士李幼平先生。UCL即“統(tǒng)一內容定位”,是數(shù)據(jù)廣播網絡平臺及IP交互網絡平臺上實現(xiàn)信息資源組織管理的創(chuàng)新技術理念,其目標是實現(xiàn)網絡信息資源的“個性化按內容主動服務”。4月27日,論壇開幕的首日,UCL概念的提出者中國工程院李幼平院士在重感冒的情況下為我們帶來了他的精彩演講。以下是李院士的演講內容整理:
有一個著名的理論叫六度分離,指地球上任意兩個人之間的平均距離為6。而實測數(shù)據(jù)表明,TCP/IP從工程上實現(xiàn) D 因為受到同胞的影響,令李院士產生了很多的啟示。復雜網絡有三個概念,一個叫連接度值,一個叫平均路程,還有一個叫聚類系數(shù),這是該領域三個十分重要的概念。但是他們之間沒有聯(lián)系的。我的同胞中國專家用聚類的概念,把聚類突出來了,用聚類的概念把度值和路徑聯(lián)系了起來,讓連接度大的公共內容緩存于網絡邊緣,這樣就形成了路由跳數(shù)少于3-4跳的小跳環(huán)境。為響應建設“國家公共文化服務體系”,近年國家已經投了幾十億的人民幣做小跳數(shù)。已付諸實施具體工程的有鄔江興院士的ACR,A就是一個大規(guī)模匯集路由器,它既是路由器,又是匯聚服務器。還有中國科學院唐輝教授帶領做的在P2P技術上發(fā)現(xiàn)的PPCache,以及有線電視雙向互動的TVCache等。 可以說小跳數(shù)的環(huán)境在中國已經初見端倪,鄔江興從互聯(lián)網的橋頭堡,做一個橋向廣播網靠攏,它的概念就是NGB的概念。那么廣播網,也想做一個橋往互聯(lián)網靠攏,就是TV Cache。比如說一個信息,二三四個電視臺都可以連起來,然后你就可以就近地去訪問他。那么唐輝所研究的內容就可以在廣播網和互聯(lián)網之間,搭建一個交集小跳數(shù)環(huán)境。 我們希望用小跳數(shù)環(huán)境來幫助未來的互聯(lián)網。公共內容的度值服從冪律,而且它的∑都在2.2到2.4之間。然而,傳統(tǒng)TCP/IP不過問內容,路由跳數(shù)與連接度無關,造成核心層流量隨網絡規(guī)模和視頻應用呈爆炸性增長,大有“十年千倍”之勢。也就是說2010年到2020年這十年里面流量會增加一千倍。如果用小跳數(shù)這個創(chuàng)意就順應冪律了,遷移高度值的常用內容,賦以邊緣層攔截常用訪問的強大能力。 這樣就可以希望實現(xiàn)核心層流量明顯回落,QoS和耗能問題均獲轉機。QA是有保證的,因為跳數(shù)少,安全比較好做,能耗問題都可以獲得轉機。更重要的是,在大聚類、大遷移過程中,借助于內容指紋,獲得科學治理互聯(lián)網的機會。因此就希望國家利用衛(wèi)星廣播的泛在(ubiquitous)分發(fā),發(fā)明“更小跳數(shù)” 的另類技術,形成一個技術上的突破,在物理上形成一個跟節(jié)點數(shù)無關的輻射,營造無標度(scalefree)無扭斗(no tussle)的未來網絡環(huán)境。 另外一個很重要的概念就是現(xiàn)在用的URL,URL是定值定位,它的前綴在什么網站,后綴就是在這個網站的服務器的庫里面怎么拿到這篇文章,基本是定位,要改成內容定位,要向著UCL來映射,國家制定統(tǒng)一內容標簽UCL,使各種小跳數(shù)環(huán)境得以科學整合。 2006-2009年,李幼平、倪光南、陳式剛、張堯學四位院士,工程院信息學部兩個咨詢項目《播存網格工程構思》、《信息化推動先進文化》,總結國人實證研究,有三個發(fā)現(xiàn): 1、公共文化服務占用互聯(lián)網的大半帶寬,這是清華大學在2006年做的流量表,是用數(shù)據(jù)包的數(shù)目來代表流量,不是用點擊數(shù),就發(fā)現(xiàn)大部分業(yè)務的帶寬都是給公共文化服務用的,而真正個人使用的像MSN,通話服務相對只用很少的帶寬; 2、第二個發(fā)現(xiàn)和第三個發(fā)現(xiàn)是連在一起的:文化服務聚焦在前一千種網站,而且廣播有能力推送前一千種網絡。因此就產生了所謂小跳數(shù)的創(chuàng)意,這個創(chuàng)意應該歸功于北京的李曉明教授,他很大貢獻,他有一個說法是“small can act big”,中文意思是四兩可以撥千斤。阿基米德有一個名言,給我一個支點,我可以橇動地球。就是說存儲,實際上就是一個技術杠桿,而廣播就是一個支點。李教授統(tǒng)計下來,非視頻類的網頁一篇大概只有15K左右,每天全國產生200萬到300萬種網頁,一共也就是30~50GB,那么一年加起來就是12TB。 對于一個衛(wèi)星頻道而言,24小時推送數(shù)據(jù)就有410GB,遠遠大于網頁每天所產生的30~50GB的數(shù)據(jù)量。因此可以拓展李曉明教授所想,用廣播來分發(fā)web博物館。 在以上提到的四位院士里面有兩位是從事核武器研究的,他們就覺得這種想法類似于核武器的次級創(chuàng)新。科學家發(fā)現(xiàn),單幾何中心的原子彈難以獲得當量可持續(xù)擴展,于是,發(fā)明了在第二幾何中心工作的氫彈次級。氫彈次級依靠初級產生的x射線驅動,實現(xiàn)當量的極大拓展。 今天的互聯(lián)網遇到的也是“可拓展性”問題,有必要發(fā)明輻射驅動的某種次級結構。我們把IP當成原創(chuàng)主結構(primary),把廣播存儲當成是極大拓網民數(shù)量的次結構(secondary),主次結構之間依靠輻射驅動。所以通信和廣播、對流和輻射、主和次結構其實是一個很美的相異相成的結構。不同的兩個東西組成一個穩(wěn)定的架構就像一男和一女組成家庭,帶正電的原子核和帶負電子層組成一個穩(wěn)定的原子。以后的網絡應該是通信網和廣播網,對流和輻射共同來組成相異相成的一個美好網絡。 此外,李院士還指出,他們發(fā)現(xiàn)了一個用衛(wèi)星來分化安全指紋的問題。公共內容同公共藥品、食品一樣,實施注冊管理,如果能對每一項已注冊內容附加哈希指紋,并通過“點對面”衛(wèi)星輻射手段在全國發(fā)放內容指紋。根據(jù)國家注冊機構發(fā)放的指紋,任何地點上的任何終端,都有可能在域名和路由均不可信的情況下,直接判斷公共內容的真?zhèn)危Wo公共內容的安全,防止惡意攻擊,代碼可以造假,但空間、時間關聯(lián)的“唯一性”指紋難以造假。 這也是最近美國人提出的廣播信道從物理上增強NDN的內容指紋安全概念。 而這個創(chuàng)意的內核是統(tǒng)一內容標簽,映射并拓展web服務的URL標簽。URL只提供地址信息,缺失標題、摘要等語義元數(shù)據(jù)。 我們建議國家制定統(tǒng)一內容標簽(Uniform Content Label),它是一種感知內容屬性的簡短數(shù)據(jù)包。那么UCL是做什么的,主要是感知內容的度值,可以把高度值的內容自動的鏡像在網絡的邊緣。針對個人,統(tǒng)計個人過往的UCL歷史數(shù)據(jù),感知個人優(yōu)先連接性(經常到何網站何話題獲取內容),按話題排序從廣播中過濾內容,維持庫存最高服務度值;針對邊緣存儲,統(tǒng)計用戶群過往的UCL歷史數(shù)據(jù),感知每一項標題的受訪頻度排序,按排序優(yōu)先淘汰訪頻度低的網頁,維持庫存最高服務度值;針對廣播發(fā)送端:統(tǒng)計全國過往的UCL/ URL歷史數(shù)據(jù),感知各網站長期的“人分鐘總數(shù)”排序,決定應當廣播那些網站的內容。 其實科學家和鞋匠的感悟存在相似,鞋匠按手工方式做鞋,因各人尺寸各異,覺得鞋子采用個案生產,天經地義,但做到第1000雙時,感悟復雜中存在簡單,幾十種鞋碼足以滿足大眾個性,他不再做鞋,開鞋廠去了。“鞋碼”,是一種“可類聚”的感悟。 我們新聞傳播界也有這種感悟,就是全中國如果有1千類,1千個話題,或者1萬個話題,大概是千到萬之間的話題,就能滿足老百姓的個性化需求了。Web服務20年歷史,一直采用點對點個案生產。十幾年前,Watts發(fā)現(xiàn)Collective Dynamics 是小世界的成因,感悟網絡也是“可類聚”的。而今天,我們終于感悟:引入輻射復制與聚類計算,有可能使個案生產的web類服務,大踏步進入工業(yè)化生產的全新年代。因此,可聚類,科學家與鞋匠所見略同。 B(C/S)小跳數(shù)平臺代表廣播/客戶機/服務器三點架構。通過BC、BS兩種單向下載,幫助IP的C/ S架構。BC下載:針對全民的公益、免費、自選下載, 向全國所有終端(含手機電視機)送去統(tǒng)一內容標簽UCL,讓所有公民都獲知最新網頁的標題、摘要,并告知如何通過電信商獲取全文。BS下載:針對電信服務器的收費、自選下載,向全國電信行業(yè)邊緣服務器送去最新網頁全文,讓用戶只用最少路由跳數(shù)獲取全文,廣播可用CA碼收費,電信商也可按流量向用戶收費。 B( C/S )小跳數(shù)平臺,既幫助傳統(tǒng)TCP/IP,也幫助不久前提出的NDN、SOFIA、CoreNet等新體系結構。 網絡建立播存結構就是兩個因素,網絡周邊都是CS結構,C就是終端客戶機,S就是接收服務器。那么現(xiàn)在多了一個東西,客戶既需要的東西,告訴接入服務器,接入服務器從internet拿了網頁回來,現(xiàn)在我們多了一個廣播,廣播可以把全文廣播給接入服務器,可以把標題和摘要廣播給C,就是這個終端客戶機,這樣的話很多用處,就在S和C之間一跳就解決了。可能用不到10幾跳,這樣整個網絡的運作就會出現(xiàn)很大的變化。那么很重要就要遷移這個大度值的內容,你要識別什么是大度值的內容,這就要靠USR的工具來識別,如果講的是一個接入服務器,如果許多接入服務器都接受廣播的幫助,那實際上就是讓它在intelnet的邊緣就建筑一個銅墻鐵壁,穿一個外套,你常用的媒體都在一跳兩跳里面都可以拿到的話,internet的負擔就可以大大減輕。這樣其實可以組成很有趣的,相異相成的小跳數(shù)環(huán)境: 以地址為中心-小跳環(huán)境-以內容為中心 地址命名數(shù)據(jù)包-小跳環(huán)境-內容命名數(shù)據(jù)包 名稱地址合一-小跳環(huán)境-名稱地址分離 網絡內核-小跳環(huán)境-網絡外延 網絡外延-小跳環(huán)境-網絡內核 信源指定信宿-小跳環(huán)境-信宿指定信源 未聚類無限內容-小跳環(huán)境-已聚類有限內容 全民各獻所知-小跳環(huán)境-全民各取所需 盡力而為傳輸-小跳環(huán)境-盡力而為存儲 民主思想-小跳環(huán)境-科學手段 大眾民主權-小跳環(huán)境-大眾知情權 文化產業(yè)-小跳環(huán)境-文化事業(yè) 單網絡多服務-小跳環(huán)境-單服務多網絡 share式分享-小跳環(huán)境-copy式共享 收費經營 -小跳環(huán)境-公益免費 由上我們可以看出,互聯(lián)網廣播網兩園相交,小跳數(shù)是交集。小跳數(shù)理念就是相異相成和諧至美。 剛才講到社區(qū)網絡,或者叫社交網絡,它有一個特點就是短,短是它很重要的自然科學的特征,短就可以快。一個因短而快的文化載體就誕生了。UCL,1kB,是短的數(shù)椐分組,也是一篇短文。短文含25字的標題300字摘要,幾秒至幾十秒內讀完 ,是熱門網站中連接度值最大的網頁,以每1Mb/ s的廣播帶寬,每天推送千萬種短文,任何人總可以從中找到滿足好奇心的最新短文。我們可以隨時打開隨身攜帶個人數(shù)據(jù)庫,立即得知你有興趣天下事,第一時間滿足好奇心。同時,一秒內把地震、海嘯、戰(zhàn)爭信息告知全國同胞,比“navigated in ultrashort time”更快。 有這樣一個科學道理,凡是緊要的事一般都是短的,還有因短而泛的概念,就是時時處處人人的概念。但這種文化有問題要解決,就是防偏止假的概念,“快與泛” ,難免產生“假與偏”,假和偏是兩個概念,安全不等于可信,應該分兩手治理假和偏。廣播UCL指紋,從內容上防止造假與惡意攻擊;物理學的“測不準”,人文科學的“說不準”,都與獨立樣品數(shù)目不足有關。淀積多元內容( 正面反面、贊成反對、過去當前),就是用聚類計算儲存內容來解決的問題。例如,我們如何認知非典,如何認知九級地震?我們經過非典的知道是怎么回事,9級地震也是有一個過程,所以它這是一個過程,這個問題我們以后可以再來討論。什么叫民主,民主就是對多元世界的科學表達,或者叫統(tǒng)計表達,相關表達。 演講最后,李院士為我們留下了兩個深刻而值得思考的問題:“五四”運動已經快100周年了,我想提個問題,科學和民主是不是正在出現(xiàn)由于網絡科學的進展,正在呈現(xiàn)出某種交集,就像是兩頭,中間一個交,左邊是德先生,右邊是賽先生,未來網是不是應該承擔起這么一個交集的作用?第二問題,未來網應該成為溝通科學和民主的某種渠道,就所謂社會網絡,社區(qū)網絡,或者社交網絡,應該起到這個渠道的作用,而我們現(xiàn)在做的UCL,內容定位好像是科學和人文之間的一座小橋,能不能這樣理解這個問題呢?
