邢黎聞
當(dāng)今世界,數(shù)字化信息資源急速膨脹,以大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算為標(biāo)志的信息技術(shù)逐漸成熟,特別是大數(shù)據(jù)技術(shù)與經(jīng)濟(jì)社會(huì)各個(gè)領(lǐng)域的高度融合,正在帶動(dòng)眾多產(chǎn)業(yè)的變革與創(chuàng)新。用中國(guó)工程院院士潘云鶴的話來(lái)講,是“移動(dòng)互聯(lián)網(wǎng)的發(fā)展,信息的增長(zhǎng)讓世界發(fā)生了新的變化,信息世界已經(jīng)產(chǎn)生,我們正步入大數(shù)據(jù)時(shí)代。在大數(shù)據(jù)時(shí)代,一些新的信息服務(wù)形式將會(huì)誕生,這讓預(yù)測(cè)未來(lái)成為諸多可能之一”。
大數(shù)據(jù)為什么會(huì)出現(xiàn)?
在其《大數(shù)據(jù)和知識(shí)服務(wù)》的專題發(fā)言中,潘云鶴院士以問(wèn)題開場(chǎng):大數(shù)據(jù)為什么會(huì)出現(xiàn)?
近幾年,世界各國(guó)都在談?wù)摯髷?shù)據(jù),最早對(duì)大數(shù)據(jù)感興趣的是美國(guó)政府,奧巴馬宣布了“大數(shù)據(jù)研究與發(fā)展行動(dòng)計(jì)劃”,并對(duì)該計(jì)劃投入了兩億美元(美國(guó)各部門的投入要遠(yuǎn)遠(yuǎn)大于該數(shù)目的十倍);歐洲各國(guó)緊跟其后,如英國(guó)政府于2013年宣布向大數(shù)據(jù)技術(shù)投資1.89億英鎊,遠(yuǎn)高于對(duì)機(jī)器人、合成生物學(xué)的投資。在這一大背景下,很多智庫(kù)都在做有關(guān)于大數(shù)據(jù)應(yīng)用的研究,其中以美國(guó)信息技術(shù)與創(chuàng)新基金會(huì)提出的一句話最為有名:“如果說(shuō)石油是20世紀(jì)經(jīng)濟(jì)發(fā)展的助推劑,那么數(shù)據(jù)將成為21世紀(jì)經(jīng)濟(jì)發(fā)展的助推劑。”
在美國(guó)理論界,除了為人熟知的“由互聯(lián)網(wǎng)技術(shù)和可再生能源技術(shù)結(jié)合帶來(lái)第三次產(chǎn)業(yè)革命”的論斷之外,又有經(jīng)濟(jì)學(xué)家提出了“第二經(jīng)濟(jì)”的概念:第二經(jīng)濟(jì)是第一經(jīng)濟(jì)(包括實(shí)體經(jīng)濟(jì)和虛擬經(jīng)濟(jì))之外的一個(gè)神經(jīng)層,這個(gè)神經(jīng)層能夠使得國(guó)民經(jīng)濟(jì)的活動(dòng)智能化,而且這位經(jīng)濟(jì)學(xué)家還提出了引人注意的預(yù)測(cè):到2030年,第二經(jīng)濟(jì)的規(guī)模將逼近第一經(jīng)濟(jì)。
但在潘院士看來(lái),所有這些政府重視、學(xué)者熱議背后的本質(zhì)是世界進(jìn)入了一個(gè)新的空間。他認(rèn)為,世界原來(lái)是一個(gè)二元空間,由人類社會(huì)(H)和物理世界(P)來(lái)組成,但是現(xiàn)在的人類社會(huì)出現(xiàn)了一個(gè)新的空間,即迅速發(fā)展的信息世界(C)。隨著互聯(lián)網(wǎng)、移動(dòng)通信和物聯(lián)網(wǎng)的發(fā)展,信息由原本來(lái)自并依附于人類社會(huì),發(fā)展到開始離開人類社會(huì),最后到直接從物理世界產(chǎn)生。衛(wèi)星每天24(h)×3600(s)傳回的信息,我們大概只能處理10%,甚至有的只能處理5%,剩余的90%只能放在那里無(wú)法處理。數(shù)據(jù)的快速膨脹,以至于人類社會(huì)已經(jīng)無(wú)法處理和管理這些信息。由此,人類進(jìn)入了大數(shù)據(jù)時(shí)代。同時(shí),C、P、H三極中任意兩極的互動(dòng),都可以對(duì)第三極的發(fā)展產(chǎn)生巨大影響。如無(wú)人飛機(jī)、智能電網(wǎng),就是由物理世界和信息世界互動(dòng)給人類社會(huì)帶來(lái)巨大影響的典型代表。可以想象,C、P、H三極互動(dòng)所帶來(lái)的影響將覆蓋整個(gè)城市、整個(gè)國(guó)家、乃至整個(gè)世界。
正因?yàn)槿绱耍?xí)近平主席在今年的國(guó)際工程科技大會(huì)上講道:信息技術(shù)成為率先滲透到經(jīng)濟(jì)社會(huì)生活各領(lǐng)域的先導(dǎo)技術(shù),將促進(jìn)以物質(zhì)生產(chǎn)、物質(zhì)服務(wù)為主的經(jīng)濟(jì)發(fā)展模式向以信息生產(chǎn)、信息服務(wù)為主的經(jīng)濟(jì)發(fā)展的模式轉(zhuǎn)變,世界正進(jìn)入以信息產(chǎn)業(yè)為主導(dǎo)的新經(jīng)濟(jì)發(fā)展時(shí)期。
大數(shù)據(jù)會(huì)帶來(lái)哪些新服務(wù)?
潘院士說(shuō),Google、騰訊提供了不同的新的信息服務(wù)。但在大數(shù)據(jù)時(shí)代,未來(lái)還可能出現(xiàn)更多新的信息服務(wù)。
首先是知識(shí)的新編。“我們?cè)瓉?lái)是一定要在圖書館把書一本一本地借出來(lái)。圖書館進(jìn)行數(shù)字化后成為數(shù)字圖書館,可以在家里就把書一本一本地調(diào)出來(lái)查閱。”潘院士介紹說(shuō),浙江大學(xué)醫(yī)學(xué)圖書館可以讓用戶點(diǎn)擊人體模擬骨架的不同器官,來(lái)調(diào)閱與器官相關(guān)的書和文章。這就是一種知識(shí)的新編,可以從新的角度去發(fā)現(xiàn)新的知識(shí)。
其次是進(jìn)行事件的預(yù)測(cè)。以前在這方面,比較容易做的是平緩發(fā)生的事件和周期性變化事件的預(yù)測(cè),主要的預(yù)測(cè)手段是靠曲線的擬合,但這并不能預(yù)測(cè)突發(fā)事件。而大數(shù)據(jù)使得突發(fā)事件的預(yù)測(cè)變得可能。潘院士舉例說(shuō),國(guó)家工商總局搜集動(dòng)態(tài)數(shù)據(jù)得出的企業(yè)發(fā)展指數(shù)與GDP發(fā)展變化非常相關(guān),這對(duì)調(diào)整政策和發(fā)展規(guī)劃十分有用。
再次是眾包。眾包是大數(shù)據(jù)出現(xiàn)以后一種新的組織大家聯(lián)合進(jìn)行技術(shù)發(fā)展的方式。潘院士指出,兩年前北京爆發(fā)了霧霾,而不同機(jī)構(gòu)統(tǒng)計(jì)出的PM2.5數(shù)據(jù)并不一致,主要是受制于監(jiān)測(cè)點(diǎn)太少。這種情況最好的解決方案就是利用大數(shù)據(jù)眾包的方式,讓民眾用傳感器來(lái)一起搜集PM2.5數(shù)據(jù),達(dá)到更全面的覆蓋,得出更準(zhǔn)確的數(shù)據(jù)。
第四是優(yōu)化規(guī)劃。中國(guó)工程院的建筑材料大數(shù)據(jù)知識(shí)中心曾經(jīng)把中國(guó)的鋼筋產(chǎn)量和建筑面積的數(shù)據(jù)進(jìn)行關(guān)聯(lián),發(fā)現(xiàn)鋼鐵的銷量和房地產(chǎn)的施工面積正相關(guān),而每一次房地產(chǎn)的調(diào)控也將會(huì)影響鋼筋的產(chǎn)量。“鋼筋的產(chǎn)量遠(yuǎn)遠(yuǎn)脫離了房地產(chǎn)的發(fā)展情況,這就是鋼筋賣不出去的重要原因。”而在大數(shù)據(jù)時(shí)代之前,這種關(guān)聯(lián)是無(wú)法做到的。潘院士說(shuō),大數(shù)據(jù)在優(yōu)化規(guī)劃方面的作用顯而易見(jiàn)。
最后是深化認(rèn)知。潘院士以《本草綱目》為例,說(shuō)明大數(shù)據(jù)可以用來(lái)幫助中國(guó)中草藥形成更好的知識(shí)系統(tǒng),將傳統(tǒng)的中醫(yī)遺產(chǎn)進(jìn)行綜合研究,產(chǎn)生新的知識(shí)。通過(guò)打通圖像、視頻、期刊、網(wǎng)站等不同媒體和中、英、法、印等不同語(yǔ)種的數(shù)據(jù)來(lái)重組知識(shí),使知識(shí)之間產(chǎn)生新的聯(lián)系,方便科研活動(dòng),從而幫助我們的中草藥走向全世界。endprint