■ IUD中國政務輿情監測中心
《塊數據2.0: 大數據時代的范式革命》
■ IUD中國政務輿情監測中心

《塊數據2.0》一書從塊數據的定義,塊數據概念模型,塊數據全產業鏈、全服務鏈、全治理鏈,塊數據安全四個層面,通過十個章節對塊數據進行了深入研究和探討。闡釋了塊數據的基本屬性和本質,塊數據的形成機制及其運行規律,塊數據在民用、商用和政用方面的應用價值,塊數據開放應用中的數據風險等重要概念和重大問題。
從人類思維范式的演進看,知識、信息、數據呈現出一種螺旋上升的循環周期。無論是在人腦時代、電腦時代還是云腦時代,人類思維邏輯和人類思維范式都是同時存在的,數據、信息和知識都是其中最基礎性的資源,三者相互交叉、相互促進,共同推動人類發展。
大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。這一新的定義,蘊含著大數據時代的三個基本特征,即新模式、新技術、新業態。
大數據強調開放共享,但在“條時代”,大數據的發展面臨共享難度大、壟斷程度高、融合能力差、應用價值低以及安全風險大等一系列制約因素。塊數據是具有高度關聯性的數據在特定平臺上的持續集聚,既是數據集聚的結果,也是數據聚合的過程;既包括點數據、條數據,也包括面數據;既有數據空間的填充、空間數據的重構,也有聚合過程中的組構和組構過程中的聚合,同時還伴隨新數據的匯集和原有數據組合后衍生數據的產生。這種聚合是持續進行的,并伴隨著數據的不斷更新。這個過程既是塊數據自我重構和自我修復的過程,也是對條數據組合、糾偏、選擇的過程。
隨著計算機科學與技術的不斷發展,計算機處理的數據也由純粹的數值發展到字符、表格、圖形、圖像、聲音等具有一定結構的數據。相應的,數據結構化也經歷了無結構化、結構化、面向對象三個階段。數據結構化發展歷程

抽象化數據是介于結構化數據與暗數據之間的,人腦通過視覺、聽覺、味覺等感官很容易感知到,但是不容易被電腦識別的數據。在現階段,只有部分抽象化數據能夠被電腦記錄,但還不能實現測量和計算。目前,對數據離散化處理是抽象化數據轉化的重要方式。通過對抽象化數據的加工處理,即編碼、存儲、提取、遺忘,實現計算機對數據的可識別、可感知,就是抽象化數據的轉化過程。計算機將人的感知活動合理地“分割”或“碎片化”,把對感知的整體性、連續性分析轉化為“個體性”的離散化處理,將人的感知解構為無數計算機可識別、可記錄的數據,再通過計算機數據分析系統,對這些數據進行重構,以達到對人腦感知活動的模擬。
暗數據通過數據引力波在不同數據引力場里的聚合、裂變,對明數據、暗數據以及所在的引力場都會發揮作用,釋放能量。與明數據顯性的數據引力不同,暗數據的數據引力是隱性的力,只有通過自激活或他激活,暗數據的價值才能顯現出來。在暗數據被激活之前,這種引力波對事物的作用和影響不大,但會形成一定的干擾。

塊數據的關聯性集聚并不局限于某個物理空間或行政區域,而是在特定的平臺上實現的,這個平臺既包括特定的物理空間,也包括虛擬空間、操作環境,比如軟件等,還包括某種工具,比如閱讀器等。塊數據的關聯性集聚,將打破傳統的信息不對稱和物理區域、行業領域對信息流動的限制,通過對不同類型、不同領域數據的跨界集聚,極大地改變信息的生產、傳播、加工和組織方式,進而給各個行業的創新發展帶來新的驅動力,推動各個領域的徹底變革和再造。
高度關聯性是塊數據的本質屬性。它主要表現為三個方面:首先,眾多高度關聯的數據在特定平臺上集聚;其次,數據與數據之間構建了一種彼此連接、相互交錯,集靈活性與網絡性于一體的組織連接格局;再次,集聚于平臺上的數據之間形成一種相互影響的關聯機制。

《第四范式:數據密集型科學發現》將人類科學的發展定義為4 個“范式”,每一個范式的出現都帶來了一場新的科學革命。

數據搜索是激活數據學中的準備階段,是塊數據系統依據某種信號組織相關數據的一種行為。激活數據學強調的是對所有關聯數據的整合、分析和創造性挖掘,需要通過數據搜索來實現整個關聯數據體系的建立,為數據處理提供盡可能完整的數據資源基礎,以確保處理結果的準確性,同時防止出現數據價值挖掘的盲點。激活數據學中的數據搜索延續了傳統數據搜索的原理和各種技術,即將用戶的需求在原始數據庫中進行比對,通過匹配機制計算信息的相似度,并輸出結果。
根據激活數據學,塊數據具有在非平衡和非線性共同作用下的高度靈敏性,并在宏觀層面表現出長程的秩序并演化出多樣化的自激活、自流程、自組織狀態。塊數據一旦被激活,其所蘊含的數據價值被釋放和放大,并且將產生大于個體價值總和的放大效應,達到“1+1>2”的效果。
激活數據學以發現塊數據內海量復雜數據的潛在關聯和預測未來為目標,以復雜理論的系統思想為主要范式,不僅論證了塊數據即是適應性主體的探索前提,而且根據激活數據學的運行規律,發現了引爆塊數據的基本流程:通過數據引力波對信號進行傳導,以控制多種自激活機制共同作用,來實現驅動塊數據自流程化運行,在非線性與非平衡的共同作用下,自組織成為具有高度靈敏性的復雜自適應系統。
模型最主要的特點是對客觀事物、客觀規律的抽象,最后回歸于實際應用之中。構建塊數據模型是為了更加精準地理解和把握塊數據的內涵和本質,要解決的問題主要有促進數據流動、建立數據連接、發現數據價值、再造數據價值,其中再造數據價值是需要解決的核心問題。
從平臺到平臺化,描述的是海量數據通過流動實現聚集的過程,也就是從數據到數聚的過程。平臺為數據的自由流動提供了一種可能,這種流動實現了數據之間的連接。在塊數據中,平臺化強調數據流動的速度,數據流動越快,數據之間建立的連接就會越多,就越能促進數據聚集。隨著大數據技術的發展,現代社會逐漸成為一種數據化社會。流動的數據可以消除數據的不對稱,破除時間和空間的限制,實現數據之間的更多碰撞,發現并重構價值,從而促進數據化社會發展。
融合化的關鍵是打破數據壁壘,實現跨界關聯。傳統的社會分工使不同領域和行業的數據以“條”的形式存在,加之行業因素、利己主義及數據風險防范等原因,造成數據壁壘,成為數據融合的障礙。只有打破數據壁壘,才能實現數據之間的自由流動,實現跨界關聯以及融合,最終形成新的關聯模式。融合讓不同領域、不同類型的數據成為高度關聯的整體,最終形成新的數據形態。
解構與重構是塊數據高級形態的重要特征。離散化解構就是打破原來的數據結構,將其分解為不連續的、基本的數據單位,即數據元。全息化重構是對數據元多維度、多方位、多類型的重組。解構與重構強調數據價值產生之后,還可以再次返回塊數據平臺,進行循環的解構與重構,從而不斷再造更高階的數據價值,離散化解構與全息化重構過程貫穿于聚合環節的始終。
塊數據價值鏈的任何環節創造價值都要涉及5個步驟:采集、傳輸、存儲、分析和應用數據。價值創造主要由基本價值活動和增值性活動兩部分來完成,而這些相互關聯的價值活動便構成了價值鏈。
塊數據全產業鏈

從全治理鏈的驅動機制看,治理體系和治理能力是一個有機整體,推進治理體系的現代化及增強治理能力,是同一政治過程中相輔相成的兩個方面。有了良好的治理體系,才能提高治理能力。反之,只有提高治理能力,才能充分放大治理體系的效能。
數據流是塊數據價值鏈的核心資源。數據流之于塊數據價值鏈就如同石油之于工業社會一般,是塊數據價值鏈中的血液,只有充足順暢的數據流循環再造輸送“能量和養分”,才能夠保證整個塊數據價值鏈體系的正常運行。數據的流動帶動了技術流、物質流、資金流、人才流等在整個價值鏈中的合理分配和循環升級,將各行業、各領域的數據進行深度關聯融合,進行系統性的整合、分析,發現新的突破點和增長點,產生價值放大效應。
隨著互聯網和大數據時代的到來,數據爆炸正在驅動新的組織與共享模式,微博、微信、團購網站、社交媒體等成為新的矚目焦點。這是一個人人時代,是一個數據人的時代,更多的組織將是一種基于話語的、臨時的、短期的、當下的組合。數據改變了人類社會的溝通和認知方式,在未來塊數據組織中的所有人和物都將作為一種數據而存在,作為一種數據而聯系,作為一種數據而共同創造價值。
數據人假設強調人的行為關系和存在方式的利他化。人作為客體被接入了互聯網,成為一個不斷采集數據并向云端傳輸數據的節點,開啟了人的數據化。人的存在形式、生活習慣、思維意識等都可以由數據表達,同時可以通過共享、交易等方式獲取任何其他人和物的數據表達。組織獲取數據和產生數據的能力不僅大幅增強,而且實現了跨界關聯,這種能力包括分享的能力、與他人特別是不特定關聯人合作的能力,以及采取集體行動的能力等。
組織結構是組織運行系統的框架,是組織內部進行價值創造的秩序,而有序性是秩序的基本要求。塊數據組織是一種超穩定結構,表現為其具有自我調節的修復機制,能夠進行內部協調和平衡,實現從混沌到有序,并具有混沌與有序的雙重特征。在面對組織脆性和強控制的時候,塊數據組織能夠吸收和應用無組織力量平衡組織的結構,以無組織的組織力量進行修復,同時激活個體和組織的活力,是共享型組織的新范式。價值創造的目的是價值分享,以共享利益的方式驅動各方參與價值創造才能實現價值創造的最大化。
數據力是大數據時代人類利用數據技術認識和改造自然的能力,它既是一種認知能力,又是一種發展能力,歸根結底就是一種數據生產力。數據力是塊數據組織的核心競爭力。數據力與數據關系影響著社會關系,數據力的改變將推動數據關系的改變,而數據力與數據關系的改變,又將引發整個社會發展模式前所未有的變革和重構。

塊數據經濟帶來的是一種新動能,將成為引領新一輪新經濟發展的風向標。進入互聯網時代,集中化遭遇了碎片化,二八法則被長尾理論戰勝,平臺經濟應運而生,需求集中但客戶分散的問題得以解決。塊數據經濟強調平臺集聚,但集聚的不僅僅是需求,還包括創新、運營等各個方面的價值關聯,從而形成新經濟的新動能。
金融是現代經濟的核心。互聯網金融能否成為下一個藍海,也許將取決于區塊鏈技術的發展。區塊鏈最大的特征是去中心化,整個網絡沒有中心化的硬件或者管理機構,全網絡的每個節點都依據共識開源協議進行分布式記錄、分布式存儲、分布式傳播,節點與節點之間的權利和義務都是均等的,且任一節點的損壞或者失去都不會影響整個系統的運行。區塊鏈本質上是由交易各方信任機制建立起的一個完美的數學解決方案,具有高安全性、高容錯性、高包容性的特點。
痛客是行動,是模式。痛客能夠從各種社會現象和問題中,找到普遍存在的尚待解決的關鍵問題,形成并提出痛點。無論是政府機構、企業、社會組織,還是自然人,都可以成為痛客,痛客計劃就是一場“大家一起發現”的行動。當前存在這樣一種社會共性問題,即有辦法的人沒想法,有想法的人沒辦法。痛客計劃的提出,在有辦法和有想法兩類人之間搭建起了互動交流的平臺,從而激發大眾創業、萬眾創新。
容錯,就是當試錯過程中出現了重大損失和決策失誤的時候,啟動相應的程序,進行及時止損,并對相應的責任人實施豁免。允許試錯是正視失敗的一種態度,更重要的是,應盡可能規避錯誤。允許在創新中試錯的關鍵是設立止損值和止損位。同時,通過科學的容錯機制,防止有意試錯,減少無意犯錯,建立基于塊數據技術的監督和考核評價機制,讓創新在陽光下進行,謹防少數人鉆容錯的空子。
數據的透明化就是要實現數據的無邊界化。數據的透明化能夠推動社會發展,最直接的就是帶來更迅速、更公開、更靈敏的響應和交流。大數據時代,越來越多的數據被采集,但是數據的種類繁多,不同的組織、企業、部門獲得的數據是不一樣的,為了能夠實現數據的開放共享,就必須讓數據透明化、無邊界化,這樣才能使數據發揮出真正的價值。此外,數據在開放過程中,數據的使用包括與第三方的合作,這使安全和隱私遭到極大挑戰。開放的個人數據是具有身份標識的數據,加大了個人隱私泄露的風險。匿名化技術帶來的去匿名化技術讓如何進行原始身份數據的保護成為一大難題。數據的開放與保護是天平的兩端,只注重數據的開放,不注重其安全保護,將會給世界帶來一場災難。因此,必須在開放中保護,在保護中開放。

對于數據行業,要制定嚴于一般行業的管理制度,加強對于從業人員的教育、管理以及內部防御。采取更高規格的信息安全等級管理保護措施,明確不同人員相應的管理權限,加強監督制約,實現層層管控,時刻嚴密管控網絡信息安全動態,及時有效處置網絡信息安全問題,保障網絡信息安全。在國家層面加強對數據的掌控,規避數據聚集利用給國家安全帶來的風險,在法律層面對信息資源制定保護措施。數據安全問題,在很大程度上應該用倫理道德來規范和約束。
數據治理打破了原有公權力對數據傳播流向和內容的控制與壟斷,極大地提升了政府治理的“能見度”,通過量化不同事物之間的數理關系,實現一種極致治理。以往,遇到某些重大事件或為解決某一重大問題,政府往往會成立一個由各職能部門組成的工作組,通過信息共享、工作聯動的方法加以推進。塊數據能夠比領導小組做得更好。它能夠以更接近于零的邊際成本,構建出整個政府和社會數據資源之間的全連接、全流程和全治理框架。這“三個全”打通了政府部門、企事業單位之間的數據壁壘,實現了合作開發和綜合利用,有效促進了各級政府數據治理能力的提升。同時,大數據與互聯網、微信、微博等新媒體深度融合,可以突破時間和空間的限制,從更深層次、更廣領域促進政府與民眾之間的互動,形成多元協同治理的新格局。

“數據鐵籠”是以權力運行和權力制約的信息化、數據化、自流程化和融合化為核心的自組織系統工程。建構“數據鐵籠”的重中之重是回答并解決好“問題在哪里、數據在哪里、辦法在哪里”這三個問題,由此優化、細化和固化權力運行流程,確保權力不缺位、不越位、不錯位,實現反腐工作從事后懲戒、事中防治轉變為事前免疫。