◎ 中國工程院院士 鄔賀銓
利用開放數據打造智慧城市
◎ 中國工程院院士 鄔賀銓

信息化的深化應用已經發展到以“大智移云”(大數據、智能化、移動互聯網和云計算)為特征的新時代。“大智移云” 互為關聯,寬帶化、移動互聯網、物聯網和產業互聯網產生大數據,大數據的挖掘應用需要云計算,大數據的應用還提升了移動互聯網、產業互聯網的價值。
信息社會,數據無處不在,數據量以驚人的速度增長。例如,現在視頻監控攝像頭廣泛應用于主要道路、熱點地區、地鐵和小區的安全監視。一個8Mbps攝像頭每小時產生3.6GB,很多城市的攝像頭多達幾十萬個,一個月的數據量達到數百PB,若需保存3個月則存儲量達EB量級。國家稅務總局每月收集全國數據4TB,已集中的結構化數據260TB。北京市政府部門數據庫總量2011年63PB,2012年95PB。北京的“檢立方”系統覆蓋北京市三級檢察院的50萬件案件、380萬份法律文書、9800萬項檢察數據。大量的環保傳感器實時地檢測大氣、河流、湖泊和土壤,不間斷地收集環保數據。
醫療也產生大數據,廣州中山大學第一附屬醫院存儲的數據量在2008年就達到了100TB,預計2015年將超過1000TB。交通也產生大數據,北京交通中心每天數據增量30GB,存儲量20TB。服務業也是大數據之源,國家電網公司年均產生數據510TB(未計視頻),2013年累計產生數據5PB。中國聯通用戶上網記錄每秒83萬條,對應年數據量3.6PB,中國移動每天話單數據10TB,信令數據100TB,上網日志500TB。中國工商銀行企業級數據倉庫存儲量已超過350TB,積累的數據4.5PB。
互聯網公司更是大數據的收集者,阿里公司單日數據產生量超過50TB,峰值處理交易3.8萬筆/秒,已存100PB已處理過的數據,百度每天處理60億次搜索請求,新增800TB,存儲網頁數近1萬億,數據總量達到EB級,騰訊活躍用戶QQ超8億,微信超5億,日新增300TB數據,數據總存儲量100PB。
我國有約300個城市明確要建設智慧城市。關于智慧城市普遍認為無線城市、數字城市、寬帶城市、感知城市是智慧城市的必要條件,創新城市、綠色城市、宜居城市、平安城市、健康城市、幸福城市、人文城市等是智慧城市應有之意。關于智慧城市目前還沒有權威的評價標準,歐盟等國家認為開放政府和市民參與城市管理是重要的標志,開放政府是智慧政府的前提。
2013年6月在英國召開的G8會議,簽署了“開放數據憲章”,提出了開放數據五原則,即開放數據是基本要求、注重數據的質量與數量、讓所有人都可用、為改善治理而發布數據、發布數據以激勵創新。美國政府建立了統一數據開放門戶--Data.Gov,按原始數據、地理數據和數據工具三類開放政府擁有(屏蔽了個人隱私)的公共數據。
政府開放數據助力城市治安管理。紐約市詳盡犯罪記錄數據開放后,出現了提示公眾避免進入犯罪高發區域和提高警惕的手機應用,同時還能將犯罪記錄信息和動態交通數據結合起來,起到指導調配警力的作用。2012年,美國加州大學分析洛杉磯市政府提供的過去1300多萬起案件數據,找到了各小區發案與日期、天氣、交通狀況及其它相關事件的關系,建立犯罪活動預測平臺,該系統已使該地區財產犯罪率和盜竊案件分別下降了12%和26%。
開放數據的應用還可以預測流行病的發生。谷歌把搜索詞和美國疾控中心的流感傳播歷史數據進行比較,在2009年甲型H1N1流感爆發的幾周前,谷歌就給出了預測,與疾控中心數據相關性高達97%。中科院與百度合作,精選了160多條關鍵詞,對5年來的數據進行建模分析,先于衛生部門公布前幾周得出了中國艾滋感染人群的分布情況,估值基本一致。
開放數據能夠促進公用事業效率提升。美國交通部開放了全美航班飛行數據,有市民利用這些數據開發了航班延誤時間的分析系統,幫助旅客選擇正點率高的航班,同時推動航空公司提升正點率,美國航班延誤率從2008年的27%下降到了2010年的20.23%。公共交通系統的動態數據公布后,公眾進行深度挖掘,不僅創造出了手機應用為公眾出行提供實時建議,同時為地鐵系統在客流高低峰時段、熱點站和普通站之間的調配提出了更優方案。
開放數據有利于扶持中小企業發展。美國Panjiva公司(磐聚網)利用政府開放的海關貨運數據建立全球外貿搜索引擎,成為面向采購商和供應商的智能B2B平臺,每年采集上億條貨運記錄,包括發貨人、收貨人、集裝箱內貨物內容和價值等。同時提供信用報告、合格證、網站和供應商等信息。2013年美國政府公布了氣象方面的數據信息,有公司通過數據分析預測某一段時間的氣候變化趨勢,再將結果銷售給農業、物流等領域的企業。據不完全統計,類似的氣象數據應用已延伸出數百億美元的新興產業。
眾包數據能夠幫助改進城市管理。2012年7月,美國波士頓啟動“街道坑洼”項目,支持開發專用的應用程序,司機將裝有這一應用程序和加速器的智能手機放在汽車儀表盤上,當汽車遇到坑洼而顛簸時,手機就會向指定的服務器發送包括所在地GPS位置的信息。這一專用應用程序在應用初期時誤報頻繁,波士頓市政府委托一家眾包公司InnoCentive來完善這一工作,該公司設計出一個游戲化程序,以2.5萬美元獎金公開征集解決方案,現在新版本的應用程序已有很大改進。目前“街道坑洼”網站已報告探測到波士頓有11萬多個坑洼。美國其他城市也在仿效。高德公司以眾包思路采集3億多高德地圖用戶的出行數據,每天近千萬使用高德圖在線導航的用戶給高德實時交通貢獻了大量的用戶出行服務數據。高德還融合了幾十萬輛出租車及幾百萬輛物流車的浮動車數據,得出全國城市擁堵排名。例如2014年第三季度,北京位于我國十大擁堵城市之首,平均速度22km/小時,每10公里需時27.3分鐘、每10公里延時14.4分鐘。電信運營商不僅利用自身收集的數據,還通過發展手機用戶作為網絡性能測試的志愿者,獲得網絡的實時性能,以此來優化網絡性能,改善對客戶的服務,手機的數據還可以用來反映馬路上車流速度以及城市突發事件。
科技開發眾包化。GE公司公開基于3D打印的設計工具并征求噴氣式發動機拖架設計,鼓勵創客社區參與設計,從56個國家/地區將近700件設計作品中選出10件進入決賽,勝出的設計將重量減輕了85%。紐約時報早年的報紙都發黃了,用計算機掃描方法已很難識別其中的文字,不過計算機識別不了而人是可以識別的,但從哪里找這么多人力呢?將待識別的文字貼到網站作為驗證碼,紐約時報130年存檔發黃的報紙的數字化工作在幾個月內就由網民不知不覺完成了。
1935年地理學者胡煥庸根據當時的全國人口數據,在中國地圖上從黑龍江的璦暉到云南的騰沖畫了一根線,后來被稱為胡煥庸線,線的東側面積占43%而人口占94%,東西兩側經濟發展水平差距很大。騰訊給出的QQ用戶在我國的分布密度與胡煥庸線非常吻合,從中可見QQ或者手機用戶的分布能反映地區經濟發展的差異。
綜上所述,移動互聯網、物聯網和云計算產生大數據,城市數據是智慧城市的重要資產。開放政府是智慧城市的前提,數據開放是評價開放政府的重要指標,開放數據將營造創新環境和釋放商業機會。市民的參與性是智慧城市的評價標志,眾包是挖掘社會智力資源潛力的有效模式,推動建設眾志成城和“眾智成城”的生態。