王寧江
·首席論衡·
大數據智庫
王寧江
回顧一年前啟動“首席論衡”欄目的約稿,很是誠惶誠恐,怕辜負刊物和讀者的期待。首篇寫的是建設中國特色新型智庫,算是有感而發,對智庫建設泛泛地談談,寥寥幾句個人的觀點。一年后,在大數據的風口之上,對于原先隱隱約約定位于大數據建新型智庫,又有了更加清晰的認識。
未來新型智庫的發展,大數據至少可以有兩方面定位,發揮兩方面作用。一個層面,大數據作為新型智庫的支撐。兩辦《關于加強中國特色新型智庫建設的意見》文件中有明確表述,評判中國特色新型智庫基本標準之一就是,要具備有功能完備的信息采集分析系統。如果大數據在智庫中是輔助支撐的定位,那么大數據和大數據技術更多地是發揮工具的作用。另一個層面,圍繞大數據建設新型智庫。大數據則是智庫的核心與基礎,大數據產品就是智庫的主營,以此,大數據和大數據技術在智庫中的作用將是不可替代的。我們姑且把這一類智庫稱為大數據智庫。
既然稱為大數據智庫,那還是需要一些特征條件的。一是大數據智庫要有數據庫。傳統的文獻庫,想必任何一個智庫都不會忽視的。大數據智庫掌握的數據資源不能僅局限于傳統的文獻庫,還應涉及政務數據庫、商務數據庫、民調數據庫、輿情數據庫、監測數據庫等。這些大數據可能源自互聯網,也可能源自局域網或相關信息化系統。二是大數據智庫要有大數據分析方法。數據分析挖掘有數據理解、數據準備、建模、評估以及部署等幾個階段,在建模和評估階段離不開分析工具、算法研發和使用等。三是大數據智庫要有大數據產品。無論是政務主體還是商務主體,大數據產品主要是要圍繞咨詢對象和咨詢需求來設計,可以是純大數據產品,也可以是為智庫的決策咨詢報告提供量化的結論支撐。
大數據庫智庫要聚集一批大數據復合型人才,人才是大數據智庫生存和發展的關鍵和基礎。數據可以交易,工具也可以購置,而人才是最緊缺的,而且大數據智庫對復合型人才的要求更高。
一是思維方式要復合,即實現傳統思維方式和互聯網思維方式的復合。傳統思維方式有幾個特點,如系統性和整體性、感性和悟性等。春秋戰國時期的孺子百家的各學術思想成果,無不寥寥幾筆,靠悟、理解和發展,影響著中華民族幾千年。而互聯網思維典型的特征便是共享和開放、平臺和協同、生態和融合。傳統思維和互聯網思維之間有些是共通的,有些確實是顛覆性的。
二是數據理解要復合。既要有專業需求的視角,也不能太超越目前大數據技術的實現條件,這一點,有點類似于IT序列的系統分析員角色,這里姑且稱為數據理解。所謂復合就是要把兩個不同語言體系打通,翻譯成“普通話”,然后實現交流。從大量的信息化系統建設實踐看,業務需求和技術設計之間確實存在“語言不通”的情形,業務需求不知道如何釋義他所要的功能,IT人員聽不懂業務需求究竟想要實現什么功能,于是兩者之間,總是存在隔閡。大數據時代,需要復合型人才在源頭上突破這個瓶頸。
三是專業要復合。復合型人才最好有與業務需求對應的專業和大數據技術專業的學科背景。智庫團隊可以通過不同層次、專業、年齡等人才結構實現團隊復合化,但如此,還是會在內部造成不同層次之間脫節,打造復合型人才是破解復合化的最好方式。以前總是在講,高校要打破“近親繁殖”,其實,每個學科都有自己獨立的學術體系,也有自己的邏輯表達習慣,需要復合型人才在學科之間“穿針引線”。
四是分析方法要復合。主要是定性和定量要結合。人工智能可以實現無人駕駛汽車,卻無法取勝圍棋,這就是人腦的勝利。只要有模糊性存在,定量替代不了定性;憑借感覺、經驗來衡量判斷,是人腦定性之所長。同樣,定性分析會受分析員的情緒和情感、有限的記憶存儲量、有限的分析維度、有限的勞動強度等方面制約。大數據技術發展之后,定量技術可以在無限量的大數據之中通過無限的維度、不間斷地進行定量分析,挖掘隱藏在數據中的秘密,這是定量的優勢。只有實現定量和定性結合、優勢互補,才能發揮最大價值。當然,在現階段的經濟管理和社會治理領域,定量和大數據技術更多地是為定性和決策咨詢服務。
作者為浙江省經濟信息中心副主任、浙江省信用中心主任