戴玉
《關于運用大數據加強對市場主體服務和監(jiān)管的若干意見》、《關于積極推進"互聯網+"行動的指導意見》、《關于促進大數據發(fā)展的行動綱要》—短短兩個月時間,國務院就密集通過了3份涉及大數據發(fā)展戰(zhàn)略的指導性文件,甚至出臺了較為具體的規(guī)劃,重視程度可見一斑。
但是,政府究竟能如何運用大數據提高執(zhí)政能力,大數據能如何輔助領導人進行科學決策,其間的障礙和風險又如何?《南風窗》記者專訪了國家統計局中國統計信息服務中心大數據研究實驗室主任江青。
《南風窗》:談及現狀之前,我們不妨先來暢想一下未來,如果能將大數據充分運用到政府服務和國家治理當中,會是一種什么樣的情景?
江青:毫無疑問,決策和治理過程會變得非常智能。如果我們搭建一個匯總了各方面數據的大數據可視化平臺,“一把手”們就只需要通過電腦、手機或者大屏幕來隨時查看自己想了解的數據。那時,所有的數據都已實現互聯共享,可以隨時分析不同數據之間的變化和關聯。根據數據分析的結果去決策,工作就可以有的放矢。
輿情、政務管理、行業(yè)管理、旅游、醫(yī)療、交通、社區(qū)生活、產業(yè)規(guī)劃、社會信用等等,基本上都可以跟大數據結合。一些大數據會提供實時監(jiān)測的結果,職能部門可以在監(jiān)管時非常動態(tài)地隨時調整工作方向。
《南風窗》:領導們的工作越來越有數據分析的色彩?
江青:對,領導決策會從主觀變得越來越客觀,大數據基本上可以介入決策的整個過程。一個項目是否上馬,可以先從大數據分析可行性,這也是實地調研之外的數據調研方式。大數據并不是排斥以前的調查結果,而是讓數據結果更全面立體。在資源優(yōu)化配置方面,大數據非常有用。傳統調研只能考慮有限幾個要素的影響,但大數據廣泛的數據源可以讓你參考各方面數據,綜合評判之后得出最優(yōu)結果。
對領導來說,還可以通過大數據隨時查看各部門實際工作狀況,選人用人也可以用大數據分析一個領導的聲譽、工作成績等各項指標。中央巡視組在去各地巡視之前,就可以把某個領導的朋友圈用數據分析出來。
現在最核心的是數據思維的問題,領導決策應該時時刻刻養(yǎng)成用數據說話的習慣,讓數據規(guī)劃進程。
《南風窗》:思維要貫徹到行動中才有真正的效果,我想先問一句,目前政府是否會經常使用基于大數據的智庫報告或者分析結果?
江青:直觀感受是國家領導人在用大數據,但省部級單位用得不是太多。像大數據、“互聯網+”這些新概念,一部分地方領導、部門負責人可能還沒有真正理解。產業(yè)發(fā)展太快,領導們需要慢慢消化。
領導決策現在主要靠直覺經驗,除了班子集體會議,最多搞個小型專家組,由若干經驗和直覺合在一起形成決策。你要說一些領導沒有數據思維,他們肯定不承認,但他們具體決策的時候就能看出來,一些領導還是比較缺乏真正的、徹底的數據思維。
《南風窗》:現在用大數據進行輿情監(jiān)測好像是比較常見的,但像危化品爆炸、踩踏事件等等方面的應急管理,好像對大數據的運用不是特別充分?
江青:將大數據用于輿情,主要是形象管理、社會穩(wěn)定的需要。實際上應急管理最容易用到大數據,比如說某旅游景區(qū)的當前人口密度超過警戒值,就不能再往景區(qū)里放人了。同理,上海外灘的踩踏事故也可以提前得到預警和有效應對。
現在的交通實時監(jiān)控、公安等領域,還是有比較好的大數據使用基礎,但挖掘方面不太理想,還停留在呈現階段,下一步就要做一些應用。但一個個的應用不代表就擁有了“大數據思維”。一些應用被放在了“信息化”的概念里面,從“信息化”放入“大數據”概念里面,需要有個過程。
真要發(fā)展大數據,就肯定是“一把手”工程,因為這需要調動到方方面面的資源。大數據技術并不是最難的地方,分析和研究人員都有,但你要不要用這些人?要不要用這種思維來做這件事?這就需要領導拍板,一個小小的部門負責人是做不了的。
《南風窗》:有一個現實情況是,有的領導并不是不重視數據,但他們仍然認為數據都是虛假的,分析也沒用。請問你如何看待數據質量的問題?
江青:但那些數據有可能就是他們自己生產或者通過他們審核后報出來的呀!現在大數據對科學決策主要有兩個隱患,首先,如果模型算法不科學的話,大數據的預判、分析等功能就有可能出現失誤。其次就是數據質量的問題。
減少虛假數據的影響有兩個方法,一是數據公開,一旦數據實現了共享和公開,就會倒逼數據必須得是真實的,接受監(jiān)督。第二,大數據的特點就是它會有其他數據源來佐證,當數據量足夠大、數據源足夠多的時候,我們可以根據關聯數據分析出貼近真實的情況,少量的虛假數據很難影響整體結果。傳統調研是對未知情況的調查,但大數據是對已知情況的記錄。當數據搜集越來越智能,人為干預的因素就會越來越少。
我覺得應該明確一下,現在的大數據和傳統的抽樣統計數據是不同的。大數據更重視挖掘數據背后的價值、更多考慮關聯研究。傳統的統計數據能出個總數都很不容易,所以后期處理就是把數據分類、匯總一下,很少關注A和B之間的關系—不是說不能,只是到這兒就覺得一年的工作已經完成了,大家都沒想著繼續(xù)挖掘它或者工作職能里也沒這要求,但如果稍微有個人或機構多做了一點挖掘工作,就會比別人強很多。
《南風窗》:大數據行業(yè)的人才現在非常搶手,政府能持續(xù)吸引這方面的人才嗎?
江青:在我眼里,談論大數據的現在分成兩類人:一類是專家群體,主要在談一些概念,另一類人講技術比較多,集中在IT行業(yè)。但兩類人中間沒有環(huán),沒辦法扣起來、結合到一起。
大數據方面的人才確實很不充沛,各地發(fā)展大數據還需要非常堅實的信息化基礎,思維、環(huán)境、人才必須一個都不缺,所以政府在這一塊的外包力度比較大,因為政府暫時不具備相關能力。但對政府來說,需要的并不是單純的IT人或者統計人,而是同時兼具管理學、傳播學知識的復合型人才,這才能幫助領導在管理決策上更好地判斷。這些人需要將大數據跟本身擅長的技能相結合,打開大數據的思維。
《南風窗》:如果完全外包的話,是否會產生數據安全方面的擔憂?
江青:會。目前有的企業(yè)做完政府外包以后,就把數據截留了,它們也不一定會把數據泄露出去,只是拿著自己內部使用。但有些地方政府沒有意識到這種風險,認為這些數據放在自己手里也沒什么用,一些遲鈍的官員在追求政績的時候盲目跟風,讓人感到擔心。你自己發(fā)現不了數據的價值,別人卻有能力知道,因為有些人或機構會有目的地去研究你。
之前有某個做國家委托課題的教授拿到了某區(qū)域的人口數據,但課題組有個美國留學生把數據帶回去了。美國那邊分析數據發(fā)現,某個很偏僻的地點違背常理地聚集了一大片博士、博士后,最后分析出那里有個不宜對外公開的地方。數據會呈現很多規(guī)律,透露很多信息。
《南風窗》:對數據安全的擔憂會阻礙數據開放的進程,但要想讓大數據助力科學決策,一個很重要的前提就是數據的互聯共享和開放。
江青:我們希望推進數據公開,這可以倒逼政府改進工作方法,提高數據質量,提高公共服務能力。但是,這肯定不是近階段能完成的。我都沒有搞清楚我自己家有什么數據,怎么去公開?公開哪些,有沒有風險?我們目前正在討論的是部門間的內部共享,公開還到不了。
現在正要做的,就是摸清數據方面的“家底”。《關于運用大數據加強對市場主體服務和監(jiān)管的若干意見》要求相關部門探索建立政府信息資源目錄,并在2016年12月底前出臺目錄編制指南,這意味著這個工作目前應該還沒有大規(guī)模地開始著手。一旦打通了數據,各方數據會像萬花筒一樣勾兌出很多新內容,但我們前期數據的打通還沒解決。
《南風窗》:那先不談數據開放,打通數據、實現內部共享的難度大嗎?
江青:打通政府數據不是一般的難度,首先就是條塊分割的問題。數據共享是必需的,但無法做到的部委可能還不是少數,有些人覺得共享會出“麻煩”的。而且我保留自己的一塊權力,讓別人來找我商量,我不就更有話語權了嗎?
第二個就是瞻前顧后。看看別人干了沒有,別人沒干,我就先等等看。為什么大數據叫“一把手工程”?就得“一把手”統一思想才行。現在大數據已經提到國家戰(zhàn)略高度了,上面在拉,下面在技術層面推,中間不動也是不可能的。
如果說這些數據能拿出來讓大眾使用,而不是讓某些有國際資本背景的企業(yè)給置換走的話,這是可以的。不同的視角會挖掘出公開數據中的不同價值,這會釋放大眾的智慧,大眾創(chuàng)業(yè)也有了創(chuàng)新的途徑,從而真正實現數據取之于民、用之于民。