傅正++邢黎聞
4月26日,在北京召開的中國
首席信息官(CIO)聯盟第一次工作會議暨互聯網創新與信息化論壇上,工業和信息化部副部長楊學山指出,黨中央國務院確定中國要建設網絡強國,其中一個關鍵的基礎問題是人才,而首席信息官是信息人才隊伍的領軍者和中堅力量。因此首席信息官聯盟應該帶領中國的首席信息官隊伍,在中國信息化發展過程中發揮作用。
同時,他在論壇上作了“大數據的現狀與發展”的主題報告。在報告中,他強調,要高度重視大數據相關技術的重要性,利用信息技術在大數據的體系下提升核心競爭力。
從歷史發展的角度看大數據
楊學山指出,最近兩年多來,大數據的概念在全世界引起了關注,大數據的應用廣泛而且發展很快,2013年全世界每天所產生的信息量等于2000年一年所產生的信息量。信息技術的廣泛深入應用,使得信息資源真正變成了推動社會進步的基本資源。
原聲重現 在人類社會發展的過程中,信息從來都十分重要。我們看人類社會發展史,語言的產生和有記錄的文字的產生,對人類文明的發展具有重要的作用;再看國與國之間的競爭,中國的驛站、長城的峰谷,一直到后來從郵政系統、電話系統、到互聯網系統,我們可以看到信息在人類社會的發展過程中,歷來在各個方面都十分重要。為什么到了今天,我們要研究大數據?這是因為在信息技術、信息資源和應用的一起推動下,猛然使得信息資源在人類社會發展中站的位置,回歸到它應該站的位置上去了。我在說這句話的時候,意味著什么?意味著我們原來沒有把它放在它應該站的位置上。我們說近的,德國的工業革命史里邊有一個重要的歷史性概念,叫“信息互為體系”,或者叫“信息物理系”,是什么呢?原來工業革命那么多年,使得物理系統如材料、能源、裝備、工藝都十分強大,但是信息在這個評分中,是處于比較弱的。而德國工業革命就表明,新的技術革命、新的產業發展方向是要在信息物理空間里發展的。我們再往前推40多年,在上世紀70年代初,哈佛大學的肯尼迪政府學院有一個信息資源研究組,當時他們就提出了資源三角形,就是材料、能源、信息,在管理之下一起推動社會的進步,這已經四十多年了。這四十多年理論的階段,卻沒有得到實踐的支撐,尤其在中國,信息和我們的物質財富相比,它的重要性要低很多。但是現在這個局面已經發生了變化,這個變化是因為信息技術能夠有能力獲取、處理、傳輸、存儲。由于我們的社會在發展的過程中,產生了越來越多的問題,這些問題需要信息來解決。所以,人類社會在走向現代化的過程里面,進入了一個新的階段。這個新的階段,就是材料、能源、信息真正成為了推動社會文明進步的基本資源。所以,我說,從這樣的歷史角度來看大數據,就能夠把前面、后面連接起來。
大數據的本質、核心、基礎是數據本身
楊學山認為,大數據的本質、核心、基礎是數據本身,要把對信息的管理和處理水平提高到一個新高度。
原聲重現 我們講到大數據,它的本質、它的核心、它的基礎是數據本身,是信息本身,也就是說真正重要的是數據本身,是信息本身。我們想想,用在互聯網上購買藥品的信息來預測流感的發生,那也是因為你有購買藥品的信息,否則的話,光有互聯網上那么多天量的信息,也是沒有價值的。我們大家都在做位置服務,GPS導航。我在一個地方(忘了是哪個地方),他們跟我說,這個導航的地圖可以精確到一個大院,它能告訴你什么地方有一個缺口,從這個缺口你可以進到這個大院里面去。這意味著什么?如果沒有這么細膩的信息的話,它這個功能是做不到的。所以在講大數據的時候,一定要聚焦到信息本身、數據本身。所有的變革、所有的作用、所有的革命性影響都要依賴于信息的數量和質量。信息的數量、信息的質量再加上恰當的應用連接,就成了關鍵數據。反過來說,即使有了這么多信息,但是如果沒有恰當的處理能力的話,這個信息依然是無效的。這就需要我們對信息的處理和管理提高到一個新的水平。如果沒有對信息進行有效地組織和管理,信息利用就是空談。所以在講信息的質量的時候,我們不僅要講數量、系統性、及時性,還得講前面的處理究竟是構織成什么樣的。
數據一定要和應用連接起來
楊學山指出:要把數據和國家、企業、社會服務連接起來,根據需求采集、處理、應用數據,大數據才能落到實處。
原聲重現 我們一定要抓住大數據,不論是國家、機構、企業、還是社會服務,一定要把數據和應用連接起來,而不是為數據而數據、為大而大、為變而變。同樣一個信息結合,對著不同的應用,數據的價值實際上是不一樣的。北京市的霧霾究竟怎么形成的,現在專家也有一些結論了,但為了這個結論花費了很多的時間和金錢。但我們為什么要花那么多時間那么多錢去得出這個結論呢?那是因為我們對原來客觀存在的數據,有的雖然收集了但是沒有集合在一起,沒有為了分析這個成因去做合理的構建;另外一個重要原因是很多信息客觀存在,但是沒有去收集,所以為了分析成因,還要再去抓取。所以,不管是管理、服務,還是企業、老百姓的各種各樣的信息需求,都要和信息資源的收集、處理、利用連接起來,這樣前面所講的才能夠落到實處。
數據利用要包羅眾項技術
楊學山強調,要高度重視技術,技術是信息實現價值的核心所在,沒有技術,數據再大、再動態、再前沿、再細,也不能產生價值。
原聲重現 其實我在剛才講的過程中,已經把技術的重要性說了出來。為什么會有那么多的信息、信息從哪兒冒出來?很簡單,我們現在人手一個智能手機,這個智能手機就是信息的一個發生源;我們有互聯網,所以人人都可以把信息加上去、拿下來;我們有那么多的傳感器,那么多的傳感器產生了天量信息。這些都是由于技術,如果沒有技術,剛才說的2013年一天就產生2001一年的信息量,是不可能實現的。十年,人的變化是十分有限的,社會形態的變化也是十分有限的,但是技術的變化使得13年一天的信息量相當于01年一年的信息總量,所以我們一定要包容技術。
但對大數據來說,除了剛才說的要有傳感技術來傳感,要有傳輸技術來傳輸,要有終端技術來獲取利用,中間還有一大堆存儲和處理,這些技術都可以歸納到大信息技術應用上來。但是對于大數據來說,除了這些技術之外,我們還要關注一個更加重要的技術,就是如何按照兩個途徑處理好數據本身?一個途徑是數據本身的途徑,第二個途徑是應用維度的統計集合,按照這兩個結構如何把信息處理好、管理好和應用好的技術,是大數據技術和其它技術如云計算、物聯網和智慧城市不一樣的地方。而這個技術是信息實現價值的核心問題,沒有這個技術,數據再大、再動態、再精密、再系統,它也是不能產生價值的。這個技術本身是極其難得的,我多次講過,在未來我們談信息技術的發展,假定放眼三十年,最關鍵最困難的技術是這個技術,我只能說我希望三十年后我們真正能夠把這個技術做好。
面對大數據的幾大重點
楊學山明確需要對大數據系列相關技術的發展進行統籌規劃,要有長遠規劃,也要有近期的著力點,不斷滿足發展需求;不管是機構還是企業,都要根據自身急需解決的問題,不要為大數據的概念框架所累,利用信息技術在大數據的體系下提升核心競爭力。
原聲重現 我們面對大數據,重點是什么?很多人建議國家要有大數據戰略。國家大數據戰略,我們的朝向是什么?對于國家來說,我想首先是要有和國家經濟社會發展、國家利益、國家安全相匹配的、相一致的數據資源;其次,一定要對數據進行高水平地組織和管理,所以,第一要務,作為國家的長期目標就是要有資源,但是這樣的資源又是在隨著技術和歷史的發展不斷地發展起來的,絕對不是說有就有的。因此,我們既要有長期的規劃,又要有當前的著力點。
其次,我們一定要對一系列相關的技術進行統籌考慮。在發展過程中,要不斷滿足資源的利用和其它相關傳輸處理技術能夠同步發展。目前,最短腿的兩塊是傳感和數據本身,中間經過幾十年的發展相對來說要好一些,但是我們要讓他并行起來,要和我們的目標結合起來。同時我們在構成這樣一個系統之后,如何保證它的安全?因為實際上這個資源和其它的如礦產資源具有同等的重要性,那么這樣的資源,如何根據網絡的特征和數據本身的特征來保證安全,這是技術問題,當然還有自我認識問題,但首先得有技術手段,沒有技術手段,你認識再高,也沒有用。那么,切入點是什么?切入點是不管是企業還是政府機構,我們一定要圍繞著我想要解決的問題或者是現在履行的職責或者企業發展,從什么樣的信息最被需要,用什么樣的處理方式、什么樣層次的數據和應用能夠連接最能解決問題切入。我們在座的所有機構,千萬不要為大數據的概念方框所累,我們要用它來解決問題,用它來提高在大數據體制下的核心競爭力。