鄭渝川
大數據時代已經到來。這句話已經被重復過無數次。先別忙著進行樂觀地展望,我們現在所談到的大數據,其實幅度和深度都相當有限,大量信息被封鎖在信息孤島上。各級地方政府和各部委,自上世紀90年代起上馬了各自的電子政務工程,發展到現在,已實現基本的數據積累,各項業務辦理和機關運轉也切換到電子平臺上。但各項電子政務工程并未實現真正意義上的信息共享,跨部門調閱數據很多情況下需要部門或地方領導出面,就更談不上這些數據無障礙開放給社會和企業了。
電子商務、金融、電信等行業的龍頭企業,深耕大數據也很有成效,沉淀了大量的有效數據,以及對于該企業價值不大,卻有著較高社會應用價值的數據。這些信息和數據被認為是企業的核心資產,企業在加大信息采集、數據挖掘分析的成本投入同時,拒絕與其他企業、公共組織共享。
孤島化的大數據,帶來的最突出問題是數據采集分析的重復化,造成大量社會成本無謂消耗,也使得數據挖掘分析的水平長期難以提高。對于創業者和初創企業來說,信息和數據采集的成本之高,常常超出他們的負擔能力,因而信息孤島造成的結果是抑制創新創業,現有的創業者和企業也將盡可能避免在信息和數據采集上投入過多成本,將更主要的精力放在營銷噱頭上。
可以說,中國大數據發展已經走到了一個重要關口,如果繼續延續現有的信息孤島局面,政府、企業、社會組織、科研機構各自為政,數據挖掘分析的水平還是會繼續提升,經濟和社會應用價值也會體現,但必然因此滯后于美國等國家,且差距也將越來越大。與之相應的另一種選擇就是,積極推進信息開放、數據共享,實現數據資源的融合集聚,跟上大數據的發展潮流。
《塊數據》這本書針對條塊分割“條數據”,提煉出一個對應的概念“塊數據”,即以開放、共享、連接為特征的數據融合集聚機制,不但匯集了現有分隔化的大數據實體的數據資源,而且還借助智能設備、社交網絡 擴張數據來源。“塊數據”圍繞人及其活動而產生,不但要收集人的靜態數據,還要記錄人的行為活動數據,以及思想、意識和意愿數據。但要真正走出目前的“條數據”,走向“塊數據”,仍面臨著諸多現實障礙。