牛 強
中國城市規劃的大數據時代已經來臨。從學術交流來看,2013年開始,中國城市規劃年會已經連續兩年舉辦了關于大數據的自由論壇——“大數據時代的城鄉規劃與智慧城市”和“大數據和城鄉治理”,反響非常強烈。從研究機構來看,北京城市實驗室BCL、北京西城-清華同衡城市數據實驗室UDL、南京大學城市規劃設計研究院規劃技術協同創新中心等開始先后研究城市大數據,一些自媒體網站如城市數據派UDParty、城市界面CITYIF等先后成立并介紹關于城市大數據的研究成果。從開放數據來源來看,近年來國際上許多知名的開放數據組織開始支持國內數據訪問,如開放街道地圖OSM、知識共享CC、開放知識基金會OKFN等;中國政府也在有序推進政府信息公開工作,如天地圖、北京市政務數據資源網、上海政府數據服務網等;大批互聯網公司開始在一定程度上開放自己的數據,或者提供開放的API,如新浪微博、大眾點評網、百度等。
學者們利用這些城市大數據進行了卓有成效的研究,取得了傳統數據環境下無法企及的成果,而大數據的空間化是開展這些研究的有效途徑。
數據收集一直以來在城市規劃編研中占據著十分重要的位置,但傳統數據收集方式(如實地調研、問卷、統計資料等)存在樣本數量小、主觀性強、成本高、周期長等缺陷。大數據時代的到來極大地拓展了城市規劃數據獲取的渠道,為城市規劃提供了大量高價值的數據,概括起來可以分為以下7類。
(1)業務運營數據,例如公交IC刷卡數據、水電煤氣數據、業務審批數據、出租車GPS軌跡數據、移動通訊數據、金融數據、物流數據、超市購物數據、就醫數據等。
(2)普查數據,例如人口普查、經濟普查等。
(3)監控數據,例如視頻監控、交通監控、環境監控等。
(4)社會網絡數據,例如微博、論壇等。
(5)主動感知數據,例如關于溫度、濕度、PM2.5等環境的感知數據、手機定位數據等。
(6)遙感數據,例如航空遙感和航天遙感數據等。
(7)GIS數據,例如關于道路、建筑、行政區劃的地形數據等。
上述這些大數據都具有典型的5V特征,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實性)。對城市大數據全樣本的分析,對于推動城市規劃朝著精細化、準確化、科學化方向發展具有革新性的意義。但是這些數據數量龐大、結構多樣,利用起來技術難度較大,而空間化技術可以在一定程度上方便它們的利用。
較之其他大數據,城市大數據的一個突出特點是它們大多和空間位置有一定的關系,要么是關于某地的信息,例如某街區的人口、經濟、環境等;要么是發生在某地的信息,例如發生在某地的犯罪、通訊、交通等。
城市大數據的空間化就是要把這些信息以空間的方式組織起來,并通過二維、三維地圖展現出來,從而方便查看和空間分析。下面介紹幾類典型城市大數據空間化的效果。
(1)公交刷卡數據的空間化
公交刷卡數據是典型的大數據,它反映了市民的公交通勤軌跡,基于它可以分析城市的職住分布、居住與就業特征、居民的通勤等。龍瀛等(2012)對北京的公交IC刷卡數據進行了空間化(圖1),用于通勤分析、職住分析、人的行為分析、人的識別、重大事件影響分析、規劃項目實施評估分析等。

圖1 基于公交IC刷卡的北京市中心區通勤

圖2 武漢某時段的實時交通量

圖3 六普數據空間化得到的2010年人口密度圖

圖4 2000 年全國縣級農業統計數據的空間化
(2)交通量數據的空間化
交通量監測數據的數據量十分巨大,空間化是查閱分析它的有力手段。圖2顯示了百度地圖對城市實時交通量數據的空間化效果。它根據各條道路上的交通量,用不同顏色繪制道路,從而反映出某時段整個城市的交通量分布情況。
(3)人口數據的空間化
全國人口普查數據是典型的大數據,該數據具有普查區信息,標識了其空間位置。毛其智、龍瀛、吳康(2014)對“五普”和“六普”的人口數據按照普查區進行了空間化,得到了全國鄉鎮和街道尺度的細粒度人口密度圖(圖3)。它將一條條難以查看的普查數據關聯到地圖上的普查小區,變成了一幅高精度的人口密度圖,圖中顏色的深淺變化代表了人口密度的高低。較之傳統的粗粒度、大尺度的人口分布圖,該方式極大地提升了人口大數據的科研價值和使用效果。
(4)經濟普查數據的空間化
經濟普查產生了大量高價值的經濟數據,除了用于傳統數理分析,目前不少學者將其空間化(圖4),從而可以開展經濟空間分析,包括產業、就業、經濟密度等空間分布、產業空間聚類等。
(5)移動終端位置信息的空間化
人類行為數據的采集是研究人類空間行為的關鍵,但傳統問卷和普查的方式工作量極大、效率低、精度不高。當前大數據為這些研究提供了詳實的一手資料,其信息主要來源于手機中的LBS(基于地理位置的服務),它通過移動終端和移動網絡的配合,確定移動用戶的實際地理位置,百度和谷歌根據這類服務主動收集了大量用戶的位置信息。這些位置信息可以反映人類活動的時空軌跡。
例如,“百度遷徙”對其擁有的LBS大數據進行空間化,全程、動態、即時、直觀地展現2014年中國春節前后人口大遷徙的軌跡與特征(圖5)。
(6)社交數據的空間化
社交數據是反映人類活動和聯系交往的重要信息。當前網絡環境下的微博、博客提供了新型的社交平臺,并產生了數量巨大的社交大數據,這極大地彌補了社交數據難以采集的問題。對社交數據的空間化可以反映社交的空間分布以及兩地之間的聯系強度。因此,目前許多學者利用了微博數據中的位置信息來開展研究,例如王江浩抓取了帶有位置信息的微博數據,并以此得到了全國各省市的人類活動強度和區域聯系度(圖6)。
(7)犯罪數據的空間化
毛媛媛等(2014)對上海市浦東新區某時間段的兩起刑事案件根據其發生位置進行了空間化,直觀反映出犯罪的空間分布(圖7),用于分析其與城市空間環境的關系。

圖5 2014年春節期間人口遷徙圖

圖6 基于帶地理位置微博數據得到的江蘇省人類活動強度圖

圖7 犯罪數據的空間化
城市大數據空間化后,信息變得直觀,并拓展了分析和利用途徑,可以更加有效地支持信息發掘和知識發現。
(1)用于信息內容的空間可視化
“一張圖勝過一千句話”,這是對圖紙信息表現力的客觀評價。城市大數據由于數據量極其龐大,要直觀反映其中的內容是非常困難的。而空間化后,用二、三維地圖反映其空間分布,用顏色、線型反映信息的內容(如GDP、人口數量、交通量等),繁雜的信息就能變得有序、易懂。如此就可以將大數據中的數字轉化為對城市的理解。前述各典型大數據空間化后得到的圖紙都是其信息表現力的有力證明。
(2)用于空間分析,挖掘空間知識
城市大數據空間化后,大量的空間分析方法都可以被使用,從而極大地拓寬了分析手段。這些空間分析類型眾多,基于分析目的可以分為以下5類:空間特征分析、模式和格局分析、空間關系和成因分析、趨勢分析和預測、評價。
1)空間特征分析:通過空間統計、密度分析等方法得到研究對象時空分布和演變的特征。例如對人口普查數據空間化后可以分析其空間分布特征,在對出租車軌跡數據分析的基礎上得到出行方式、通勤時間、出行人群識別和比例等。
2)模式和格局分析:通過空間自相關分析、熱點分析、空間聚類等方法找到研究對象空間分布的格局和模式。例如對社交網絡數據空間化后可以識別城市網絡體系、城市間的聯系和等級結構,識別不同類型人群及其聚積方式、范圍。
3)空間關系和成因分析:通過空間回歸分析等揭示變量之間的統計因果關系。例如分析人口空間分布和水電煤氣消耗、道路交通量的關系,城市環境質量和經濟、人口分布、交通網絡之間的關系等。
4)趨勢分析和預測:預測是大數據的核心,大數據空間化后可以預測交通擁堵點發生的時間地點、預測環境即將惡化的區域、預測人行為的路徑、預測犯罪可能會發生的區域等。
5)評價:按照評價模型,分區域對社會、經濟、城市管理、交通、環境、滿意度、規劃實施等進行評價。
此外,大數據的最大魅力在于隱藏于其中的各類知識,數據挖掘是發現這些知識的重要途徑。大數據空間化后,利用空間數據挖掘則可以發掘出空間知識,這正是城市研究的目標之一。空間數據挖掘是指從空間數據庫中抽取沒有清楚表現出來的隱含的知識和空間關系,并發現其中有用的特征和模式的理論、方法和技術,可以找到空間關聯規則,對數據進行分類和聚類,歸納出一般規則和模式,發現空間特征、探測趨勢等。
(3)用于城市大數據之間的信息集成和綜合分析
基于相同空間位置可以在多個大數據之間建立聯系,把不同來源的大數據集成起來,為之后的高效數據挖掘和分析做好準備。例如針對同一街道的人口普查數據和經濟普查數據,由于具有相同的空間位置,兩者可以對應起來,整合成人口和經濟大數據。多個大數據聯合起來后往往會比單個大數據更具價值,例如把人口和交通大數據聯合起來就更容易發現交通和人口之間的關系,找到交通擁堵的原因和防治措施。
(4)用于城市大數據的空間檢索查詢
面對無比龐大的大數據,傳統基于關鍵詞、主題詞的檢索往往達不到預期效果,因為針對大數據的檢索結果往往也會條目眾多,而要從中找到目標信息仍猶如大海撈針。對大數據空間化后,可以基于空間位置來檢索,其檢索精度和效率都相對高得多。用戶可以在地圖上指定查詢的空間位置,例如某條道路、某棟建筑、某個街區等,然后檢索得到這個位置上的相關數據,而把不在該位置的其余數據過濾掉,檢準率和檢全率都比較高,操作相對簡單,并且檢索結果也能用地圖來表達其內容。
根據當前的技術條件,可以采用以下兩種方法對城鄉規劃大數據進行空間化,它們都需要借助GIS平臺來實現。
(1)基于大數據中自帶或關聯的地理坐標信息
部分大數據直接帶有或可以關聯上地理坐標信息。例如微博簽到數據、出租車GPS軌跡數據、LBS(基于地理位置的服務)數據等直接帶有地理坐標信息。通用GIS(地理信息系統)平臺一般都可以將這些地理坐標轉換成地圖上的點,并把其他信息附加到點上。例如ArcGIS提供了“創建XY事件圖層”工具,根據數據表中每行記錄的 X 和 Y 坐標字段創建新的點圖,并附上所有其他字段信息。
人口普查、經濟普查、公交刷卡等帶有標識其空間位置的代碼,可以根據空間位置代碼關聯上普查小區、站點等地理要素,進而獲得地理位置信息。以公交刷卡數據為例,如果刷卡記錄中有起訖站點的編號(公交車刷卡可能只有上車站點編號),同時手邊還有關于站點位置的GIS數據,那么就可以根據共同的站點編號將刷卡記錄鏈接到站點位置GIS數據上,從而實現刷卡數據的空間化。
(2)基于大數據中的地址、地名信息
城市業務部門產生的大數據一般都會帶有地址信息,例如水電煤氣數據、物流數據等都會帶有用戶的地址。基于地址數據庫和GIS提供的地址匹配功能,可以自動實現其空間化。地理匹配的過程是先對含有地址屬性的每個記錄和帶有地址屬性的GIS空間參照要素進行比較,如果找到匹配,GIS空間參照要素上的地理坐標就被分配給相應的記錄,從而可以在GIS中作為地圖顯示并用作進一步的分析。ArcGIS的Geocoding提供了上述功能。
當前我國城市規劃領域對大數據的關注程度日益高漲,對大數據能帶給規劃界的成果充滿期待,但關于城市大數據的研究才剛剛起步,手段也不夠豐富。空間化為城市大數據的研究提供了一條有效途徑,是城市大數據可視化的有力方式,是開展大數據空間分析的前提,是實現多源大數據融合的紐帶。
當前的GIS平臺正在積極支持這一途徑,例如ESRI公司提供的GIS Tools for Hadoop能夠實現對存放在Hadoop中的大數據進行讀取、空間可視化和空間分析。而ESRI的城市瞭望臺(Urban Observatory)項目,則正在基于空間將全球55個大城市的大數據整合到一個平臺下,通過互動地圖將城市大數據轉化成對城市的理解。筆者深信,隨著越來越強大的空間分析工具的出現,隨著智慧城市的推進和越來越多的開放大數據的供給,大數據將會離普通規劃師越來越近,終將成為開展城市規劃必不可少的技術支撐。
References
[1]龍瀛,崔承印,張宇,等. 利用公交一卡通刷卡數據評價北京職住分離的空間差異[C]//多元與包容——2012中國城市規劃年會論文集,2012.LONG Ying,CUI Chengyin,ZHANG Yu,et al. Using Public Transport Smart Card Data to Evaluate Spatial Difference of Jobs-housing Separation in Beijing[C]//2012 Annual National Planning Conference,2012.
[2]毛其智,龍瀛,吳康. 中國人口密度的時空演變與城鎮化空間格局初探:2000—2010[R]. 北京城市實驗室工作論文,2014.MAO Qizhi,LONG Ying,WU Kang.Spatiotemporal Changes of Population Density and Urbanization Pattern in China:2000—2010[R].Beijing City Lab,Working Paper,2014.
[3]齊麗麗,柏延臣. 社會經濟統計數據熱點探測的MAUP效應[J]. 地理學報,2012(10):1317-1326.QI Lili,BO Yanchen. MAUP Effects on the Detection of Spatial Hot Spots in Socio-economic Statistical Data[J]. Acta Geographica Sinica,2012(10):1317-1326.
[4]茅明睿. 大數據時代的城市規劃[EB/OL].城市數據派論壇, http://www.udparty.com/news.php?act=view&id=443,2014.MAO Mingrui. Urban Planning in the Age of Big Data[EB/OL]. Urban Data Party,http://www.udparty.com/news.php?act=view&id=443,2014.
[5]毛媛媛,丁家駿. 搶劫與搶奪犯罪行為時空分布特征研究——以上海市浦東新區為例[J]. 人文地理,2014(1):49-54.MAO Yuanyuan,DING Jiajun. Study on Spatialtemporal Patterns of Robbery and Snatch:A Case Study of Pudong New Area,Shanghai[J]. Human Geography,2014(1):49-54.
[6]秦蕭,甄峰. 基于大數據應用的城市空間研究進展與展望[C]//城市時代,協同規劃——2013中國城市規劃年會論文集,2013.QIN Xiao,ZHEN Feng. Research Progress and Prospect of Urban Spatial Studies Based on Big Data Application[C]//2013 Annual National Planning Conference,2013.
[7]維克托?邁爾-舍恩伯格,肯尼思?庫克耶. 大數據時代:生活、工作與思維的大變革[M]. 盛楊燕,周濤,譯. 杭州:浙江人民出版社,2013.Viktor Mayer-Schonberger,Kenneth Cukier. Big Data:A Revolution that will Transform How We Live,Work,and Think[M]. SHENG Yangyan,ZHOU Tao,translate. Hangzhou:Zhejiang People’s Publishing House,2013.
[8]牛強,宋小冬. 城建檔案管理中的地理空間序化方法研究[J]. 城建檔案,2010(11):53-57.Niu Qiang, Song Xiaodong. The Research on Geographical Spatial Ordering Method in Urban Construction Archive management[J]. The Urban Construction Archives Magazine,2010(11):53-57.