鄭渝川
大數據時代已經到來,先別忙著進行樂觀的展望。
我們現在所談到大數據,其實幅度和深度都相當有限,大量信息被封鎖在信息孤島上。孤島化的大數據,帶來的最突出問題是數據采集分析的重復化,造成大量社會成本無謂消耗,也使得數據挖掘分析的水平長期難以提高。根據有限數據所作的實時判斷和前瞻分析,很難避免細節甚至方向錯誤。《塊數據》這本書針對條塊分割“條數據”,提煉出一個對應的概念“塊數據”,即以開放、共享、連接為特征的數據融合集聚機制,不但匯集了現有分隔化的大數據實體的數據資源,而且還借助智能設備、社交網絡擴張數據來源。
書中第三章探討了塊數據的重要價值:首先將帶來新一輪商業革命;其次將改善社會領域的社會服務、社會議題管理、社會組織運行水平,使這個領域內的組織和個人擺脫目前受限于信息劣勢的困境;第三,將推動政府管治提升;第四,形成崇尚誠信、分享、開放的文化。
但要真正走出目前的“條數據”,走向塊數據,仍面臨著諸多現實障礙。一是要改變數據生態系統和規則,二是數據結構化挑戰壓力較大,三是塊數據的數據安全問題和隱私安全問題,重要性緊迫性也在凸顯。書中第六章提到的數據脫敏(數據保密、數據匿名化)可以有效解決數據安全和隱私安全問題,但究竟哪些、什么樣的數據/隱私細節需要進行脫敏處理,這方面的理念和規則還沒有統一。