《支點》記者 袁陽平 特約記者 張 穎
喚醒大數據中沉睡的規律
《支點》記者 袁陽平 特約記者 張 穎
大數據中潛伏著許多沉睡的規律,找到了這些規律,大數據才有價值。建好智慧城市數據平臺,就是要通過服務和管理來積累數據,挖掘和預測提升服務和管理水平。
呂本富:中國信息經濟學會副理事長、中國科學院管理學院副院長
倪 東:原北京市東城區信息化工作辦公室主任
李繼剛:神州數碼智慧城市研究院院長
譚仲良:EMC大中華區云計算解決方案業務總監
大數據時代的智慧城市如何規劃建設?政府數據平臺怎樣共享?大數據中沉睡的規律如何發現,又揭示了什么發展趨勢呢?上月初,大數據領域的國內知名專家、企業界人士會聚江城。借此機會,本期圓桌探討大數據的時代價值。
《支點》:大數據已成為眼下的熱門詞,它到底將會給我們帶來什么?它的商業價值如何體現?
呂本富:目前大數據在金融服務、醫療保健、零售、能源、制造業、政府部門及管理等已有運用。它的商業價值承載很多信號,如大眾情緒、消費者喜好、市場潮流、不同人群的關注等。
有一個案例非常經典,叫做大數據帶來的精準營銷。美國一名男子闖入他家附近的商店,進行抗議,這家商店竟然給他17歲的女兒發放嬰兒尿片的優惠券,店員并不知道這是公司大數據運營的結果。一個月之后,這位父親前來致歉,他的女兒確實懷孕了。通過分析女性顧客的購物記錄,公司發現女性顧客在懷孕4個月以后會大量購買無香味乳液,根據懷孕指數推測預產期,商店就搶先一步將孕婦裝、嬰兒床、折扣券寄給客戶,這就是利用大數據營銷的典型。
李繼剛:大數據大不大不是關鍵,關鍵是從數據中發現有價值的東西。政府是由多部門組成的,相互之間的數據根本就是不通的,比如一個政府職能部門要給低保人群發放低保,發現有的低保戶買了車,有的開了公司。由于這個部門只管社保,不知道這個人到底是不是去開公司了,他們要去問工商部門,還要查看該戶主是不是買了豪華汽車,是不是還住著經濟適用房,多頭來回跑顯然很麻煩。大數據怎么樣實現跨信息的共享和利用呢?對智慧城市來說是一個比較簡單的數據應用,不管數據大小,只需對提升城市管理和服務有幫助就行。
《支點》:在大數據時代環境下,智慧城市與數據應在哪些方面謀求融通呢?
倪東:早在10年前,北京東城區在全國率先啟動網格化工程。從2010年起東城區研究城市的信息化發展規劃,并提出到2030年的智慧城市發展規劃。我認為對于智慧城市建設應該關注三個方面的結合:第一要能夠堅持管理創新和應用創新相結合;第二要堅持需求導向與技術應用相結合;第三要堅持政府、企業共同發展相結合。還須認識,在執行大數據環境下的規劃過程中,標準是非常重要的。
李繼剛:智慧城市是什么?我們幫武漢做規劃時就有思考的模型,即三智三通,包括智慧的產業、智慧的管理和智慧的民生。其實跟城市和人的功能相對應,涉及網絡通、信息通和服務通,非常核心的內容就是數據層的融合和服務層的融合。
《支點》:美國政府在全球率先開放數據,歐洲、日韓等開始效仿。我國政府如何建好大數據平臺?
呂本富:大數據在城市治理中的作用越來越大。對于武漢來說,注重發展大數據產業和大數據應用。我覺得武漢以本身的科研基礎,人力資源基礎等,具有發展大數據產業的能力。如果武漢能夠公開、開放各種各樣政府數據,就能引進全國很多的創業公司。據我所知,南京就已經開始做了,稱為“321工程”。武漢具有發展大數據產業的基礎,但是首先政府的數據平臺要建好。
李繼剛:現代大數據應該有兩個方向是值得大家需要去研究和管理的。一個是跨界應用,如我講到的發放低保就需要大數據的跨界運用。另外就是開放運用,從美國政府做開放數據以來,現在很多國家,像新加坡、韓國、日本、加拿大、歐盟等國家都在效仿,非洲已有國家在學習。我國北京、上海等城市已研究多年,但很多城市沒有邁出實質性步伐。
倪東:在大數據時代,特別是以政府為主導的智慧城市建設,我覺得一定要關注安全、隱私問題。北京東城區也做了相應的大數據研究,我們把很多數據放到一起的時候,會發現一個現象。最簡單的經濟數據,各個部門由于統計的口徑不一樣,報上來的有些數據會有不一致的地方。為什么對大數據的公開、開放不敢大步走,除了部門利益以外,我們還有一些擔心數據的安全問題。

《支點》:大數據未來的發展方向和趨勢是什么?未來隨著數據的膨脹,如何架構這些數據?
李繼剛:我認為大數據的核心價值在于預測和決策,通過大量的數據發現一些新的規律。比如美國女子懷孕這一精準營銷的例子,對這個行為的判斷,可能以前沒有研究過這方面的因果關系,而是通過大數據的挖掘來找到的,它不僅能揭示沉睡的規律,而且能夠預測未來發展趨勢。
譚仲良:沒有數據就沒有智慧。為什么這么講呢?是因為我們先有數據,然后再有信息,有了信息,又提煉到智慧,我們判斷200個TB與1個TB誰重要,應以質量來衡量。人類每一天所產生的數據,你猜有多少?2個PB。2個PB等于每一個中國人每一天都有1000頁的書。
我們關注這個過程,就是在數據的架構中,怎么去存儲,怎么去管理、把握、維護,然后去挖掘、分析、分享。我感覺重點還是放在怎么去利用200個TB的數據來提升知識和智慧,這是未來大數據的重點。