劉宗禹
摘要:經過多年的實踐,上海等國內發達城市已逐步將大數據手段引入交通規劃的數據獲取、問題挖掘等多個方面,在規劃項目與課題研究中取得了階段性成果,并朝著更準確、更高效、更人性化的方向發展。不過目前,大數據手段在交通規劃領域的應用仍處在起步階段,對于大數據概念缺乏統一的認識,與此同時大數據的數據來源與基礎理論仍存在一定缺陷。正如大數據研究方法自身的現實與理論困境中所描述的,上海交通規劃的大數據實踐也同樣面對著“全樣本”的有偏性、基礎理論缺失、官方數據的壟斷瓶頸等問題。面對熱潮中的大數據概念,規劃師需要冷靜面對,在積極擁抱新技術方法的同時保持冷靜。
引言
2009年,google公司通過比對2003年至2008年季節性流感傳播時期的搜索數據,成功預測了甲型H1N1型流感的傳染情況,開啟了時代對于大數據的認知。在我國,2013年被稱為大數據元年,2014年大數據概念被寫入《政府工作報告》,作為一項基礎性戰略資源,進入城市規劃、交通規劃等多個領域。
近年來,大數據(Big Data)概念的火爆與互聯網熱潮的發展有著密不可分的關系,各行各業均產生了不少基于“大數據”概念的實踐行動,交通規劃也不例外。但在熱潮的背后,“大數據”的基本概念和內涵特點仍眾說紛紜,未能形成統一的認識,涉及大數據概念的研究往往數量龐大卻眾說紛紜,大數據概念的不同理解也帶來研究與實踐的差異。對此,筆者傾向于通過數據特征與價值取向兩個方面界定大數據概念,并以此為基礎展開對“大數據”在交通規劃領域的思考。
一、“大數據”概念及其規劃應用
筆者認為,大數據概念包含兩個主要特征。從數據的特征來看,大數據的數據選取往往無限接近于研究對象的全樣本。方法上改變傳統依托少量數據并利用統計學辦法獲得最多信息的做法,研究準確度上避免了樣本選取帶來的必然誤差。值得注意的是,全樣本的數據特征不是一個數據的數量概念,而是指數據與研究對象全體的相對關系。因而一旦研究的數據對象不能視為研究對象的整體,縱使研究的數據量非常龐大,仍不能算作利用大數據的研究辦法。
從研究的價值取向來看,大數據的研究往往更多注重于研究內容的時效性與對未來的預見性。[1]在數據越來越多的情況下,使用全樣本的數據往往需要付出一定的代價,即錯誤數據的獲取。對于傳統研究方法,因統計的數據量較少,些許錯誤的數據容易造成極大的研究誤差,故而研究在數據獲取與清洗過程中往往花費大量的時間,力求數據的精準。大數據方法與此不同,全樣本的獲取與龐大的數據量必然帶來錯誤的數據內容,但錯誤的數據與內容在全樣本中占比比較小,在適度的清洗下,部分犧牲結果的精確性能夠有效提升大數據研究的時效性,提供連貫的、高頻率的研究結果,并利用數據的相關性實現對未來的預見。
大數據方法在城市規劃與交通規劃領域,已有大量研究成果。如龍瀛團隊對北京公共交通使用情況、[2]職住平衡等多方面的研究,利用公交卡刷卡數據基于數據增強設計方法,獲取并挖掘北京市公共交通不同使用人群、不同使用時間的不同特征;[3]楊東媛教授對于使用大數據變革交通規劃理論的探索,嘗試通過建立在理論基礎上的決策、判斷、概念框架,將大數據分析技術、模型、方法納入統一分析模板,提供一個新型理論框架。[4]在規劃實踐中,上海市城市規劃設計研究院、上海城市交通設計院、北京交通發展研究院等北京、上海、廣州、深圳城市規劃、交通規劃從業人員也已逐步通過使用公交卡數據、手機信令數據作為大數據研究的基礎,為各類城市規劃、交通規劃作支撐。例如張天然利用手機信令數據對上海市市域職住空間的分析,[5]丁亮、鈕心毅、宋小冬對上海市就業中心體系的研究等。[6]
從參與團隊的性質來看,大數據在交通規劃中的參與團隊主要包含3類,以百度、阿里為代表的互聯網企業,作為大數據的生產與處理方,生產了POI興趣點數據、道路擁堵數據等大數據分析常用數據,提供了基于智慧城市平臺的智慧交通解決方案,并出臺基于自身數據平臺的研究報告;以交通設計院、規劃設計院為代表的規劃設計與規劃研究機構,作為大數據的應用與挖掘方,將大數據挖掘的成果直接應用于各類規劃項目之中;以大學、研究院為代表的交通研究機構,作為大數據研究方法的探索方,嘗試各類研究模型與研究方法,為大數據在交通規劃中的應用提供理論基礎。
從現有研究內容與規劃方法上看,目前大數據在交通規劃中的應用往往體現研究數據的全樣本特征,無論是使用全年的公交卡刷卡數據還是利用手機信令數據,均嘗試通過全樣本數據研究交通特征,實現對規劃決策的支撐。[7]然而針對大數據分析所帶來的及時性特點則少有涉及,僅百度、阿里等商業性公司提供的交通擁堵預測服務具有及時性特點。筆者認為,此種情況的產生主要源自交通規劃現階段的自身特征。交通規劃作為一項具有延續性的公共政策,不同于商業領域的應用,應具有合法性、權威性、延續性,即規劃成果的內容需經過法定程序從而獲得合法性,并伴隨著政府的強制力獲得權威性。這使得傳統交通規劃難以利用大數據時效性特征,實現對交通問題的及時反饋、實時追蹤、問題預警。
二、“大數據”的技術變革
大數據方法不僅優化了傳統交通規劃的數據方法,實現了規劃方法的量變,更從規劃效果與研究視角上實現了質的變化,并將在未來提供更多的可能。從規劃研究與規劃實踐來看,大數據的應用正從三個方面改變傳統交通規劃的編制。
(一)研究方法統一宏觀至微觀層面
傳統研究交通規劃往往使用抽樣調查的辦法研究規劃項目,因工作量的差異,不同層面交通規劃往往需要不同調查。不同的時間、日期、人員乃至方法,為不同尺度的規劃項目帶來了誤差與矛盾,難以實現對同一區域宏觀至微觀的統籌。
大數據手段不同于抽樣調查,能夠將傳統研究樣本擴展到研究區域的每個個體,并在數據處理層面實現宏觀至微觀的分層,從而實現對宏觀、中觀、微觀的全面統籌。依托同一數據源,針對不同需求使用不同處理方式,宏觀層面獲取區域出行特征,中觀層面明確線網特點,微觀層面深入每個個體出行行為,統一各層面研究基礎,避免研究前后的矛盾,形成一維多體的分析技術體系。
(二)研究成果更為準確與高效
在傳統交通規劃分析研究過程中,規劃師與其他分析人員往往受限于傳統計量模型與調研方式,難以避免其中帶來的誤差與人力物力的大量投入。大數據交通規劃方法通過全樣本數據的使用,部分脫離了對傳統統計模型的依賴,從而規避了使用傳統統計方法不可避免的誤差。在出行特征方面,使用大數據手段通過手機信令數據,直接獲取個體的出行特征,取代傳統通過抽樣調查、模型推導獲得出行特征的辦法。研究避免了抽樣調查帶來的偶然性,使得規劃結果更為精準。
另一方面,大數據手段通過對大數據的重復使用與挖掘,減少了規劃前期調研階段對人力、物力、時間的投入,提供了更為高效的規劃方法。在此背景下,時間的富余為方案的優化、誤差的規避提供了足夠的空間,從而將效率的提升轉而促進質量的提高。
(三)更多的視角與更新的觀察能力
面對不斷復雜化的社會條件,傳統交通規劃往往畏懼于城市復雜特征,與城市精細化管理的發展方向格格不入。大數據手段的出現為交通規劃提供了一種多角度、多層次、多測度的全樣本連續觀察能力。這種觀察視角與觀察能力對于準確把握交通規劃問題的本質、深入剖析研究對象有著極其重要的意義。
全樣本數據形成了基于每個研究對象的細分組群,研究其不同的出行特點,實現規劃研究的以人為本。圖1顯示了上海市楊浦區五角場地區工作日全出行方式的出行量分布情況,利用3個月移動通信數據與公交卡刷卡數據進行分析研究,明確了各條道路的交通出行特征。龐大的數據量反映了居民與城市各功能空間之間的關系,提供了研究不同角度與層次的不同角度。
三、大數據的現實與理論困境
面對大數據在各個方面所產生的深遠意義,無論是規劃師、研究者還是政府主管部門均對大數據手段在交通規劃中的應用抱有較大期待,希望能夠通過大數據手段挖掘以往難以發現的問題,為規劃研究提供更為豐富的角度,但實踐中大數據在交通規劃領域的應用仍存在大量的顯示與理論的困境。無論是數據來源、數據的可信度、大數據規劃方法的理論基礎還是數據本身的挖掘方式都存在著較大的改進空間。針對同一地區的大數據交通規劃研究存在著截然相反的研究結論,部分研究結論帶有顯著性錯誤。
(一)“全樣本”的有偏性
受限于數據獲取的途徑,交通規劃領域使用的大數據往往存在系統性缺失,不能真正代表“全樣本”數據。如交通規劃中常用的手機信令數據就存在著同一個體擁有不同手機信號的普遍情況,老年人與孩童不使用手機等情況。手機信令數據在特定群體信息缺失的同時被當作全樣本處理,使得規劃研究成果難以顧及這些群體的出行需求,為規劃帶來偏差。
一方面,大數據的偏差來自數據的自身特點,選擇了手機信令數據就不可避免忽視了非手機用戶的出行情況,選擇公交IC卡刷卡數據不可避免非公交卡乘客出行信息缺失情況,不同的大數據來源或多或少存在著樣本的系統性缺失。另一方面,大數據偏差來源自數據的獲取渠道。國內數據的主要獲取渠道之一是為以百度、阿里為代表的互聯網公司。作為以盈利為目的的企業,大數據的獲取與應用往往基于商業視角,數據標準與規劃需求存在差別。例如高德地圖與百度地圖POI興趣點信息作為常用的大數據類型,其興趣點的種類與分類標準往往基于商業服務的對象,與城市規劃、交通規劃中的分類標準存在差異。缺乏商業價值的信息,則會帶來大數據的偏差。
(二)基礎理論的缺失
年輕的學科與研究方法一般都缺乏廣受認可的基礎理論,缺乏對于各類猜想的實證研究,大數據也是如此。因基礎理論的缺失,使得規劃編制過程中往往存在著規劃指標混亂,成果權威性缺失,數據挖掘深度不足等情況。
針對交通擁堵情況,不同研究機構基于不同的大數據來源,通過不同的指標形成了完全不同的評價結果。在滴滴媒體研究院發布的《中國城市交通出行報告(2016年上半年)》中,2016年上半年最擁堵城市依次為石家莊、重慶、西安、濟南、北京,然而在高德地圖發布的《中國主要城市交通分析報告2016Q2》中,2016年上半年最為擁堵的城市依次為北京、哈爾濱、重慶、濟南、杭州,兩者存在較大偏差。在數據源方面,前者采用滴滴打車數據,后者采用高德導航數據;在指標體系方面前者使用暢通車速與高峰車速的比值,后者采用高峰的通行時間與暢通通行時間的比值。在缺乏廣受認可的大數據研究標準情況下,大數據在交通規劃領域的應用往往難以項目比較、項目校對并各自為政。
(三)數據管理的缺位
對于規劃從業者與規劃研究者而言,大數據在交通規劃領域應用的另一瓶頸在于數據管理的缺位。一方面除了已在商業領域廣泛使用的大數據類型與POI興趣點等數據外,交通規劃中所使用的大數據涉及居民的隱私與國家安全,缺乏專門的法律界定與規范信息時代下的個人隱私與國家安全。[8]另一方面,部分大數據的獲取在受到政府的嚴格管理后往往時效性有所折扣,數據的獲取門檻明晰,限制了大量學者進入大數據的交通規劃領域研究。于此同時,雖然部分數據的獲取在受到管制的同時卻缺乏政府背書,使得基于此類數據的研究缺乏權威性。現階段交通規劃領域頻繁使用的收集信令數據、公交卡刷卡數據、車載GPS數據主要為商業數據,在缺乏合理的法律規范、政府管理的情況下,數據的真實性與傾向性往往容易招致質疑,不利于規劃研究的展開與優化。
四、上海的應用與問題
自2011年起,上海已逐步將大數據方法應用于交通規劃過程中,但目前上海交通規劃中對大數據的應用仍處于起步階段,數據來源較為缺乏,挖掘深度有所不足,數據結果的公信力不高是現階段上海交通規劃中大數據應用的主要問題。即便如此,上海交通規劃編制過程中仍不斷嘗試使用大數據方法,改進原有數據獲取與處理辦法,以希望更精確、更快速獲取交通現狀、梳理城市交通問題,并方便形成對過往交通問題的追蹤評價。
(一)大數據在上海交通規劃中的應用
目前,上海交通規劃中對于大數據的應用主要體現在出行特征獲取、公交特征獲取以及對過往問題的追溯方面,數據來源以手機信令數據與公交IC卡刷卡數據為主。
傳統交通規劃中一般采用問卷調查、流量統計等方法,通過抽樣調查獲得OD矩陣、吸引量分布等出行特征。隨著大數據手段的使用,上海在各類交通規劃項目中逐步使用大數據手段取代部分傳統抽樣調查獲取交通出行特征。在五角場城市副中心綜合交通示范區的研究、崇明綜合交通規劃等多個項目中,規劃師使用手機信令數據作為研究的基礎,通過分析不同時段手機信號的位置、停留時間、重復出現的次數,獲得各個分析單元的到發與過境情況,從而明確項目地的實際出行需求,明確各類交通出行方式的結構特征,構建OD矩陣。在交叉對比其他傳統規劃信息的基礎上,實現對出行特征的精準把握。
在研究五角場交通現狀的過程中,通過綜合手機信令數據與公交卡刷卡數據,快速獲取五角場各區域工作日與周末到發量特征,確定各片區出行密度差異。在出行方式方面,明確了不同片區的公共交通與小汽車出行比例,發現江灣居住區公共交通出行比例遠低于五角場核心區的結構特征,從而確定了五角場周邊交通擁堵的原因(圖2~4)。
在歷年的《上海市公交客流調查專題報告》中,依托公交卡刷卡數據、公交車載GPS數據、手機信令數據,獲得了研究公共交通問題更高的視野,全面了解上海1 000多條公交線路逐站客流情況與運行速度,并實現對公共交通出行特征的準確梳理。通過不斷挖掘具有潛力的公交走廊,優化全市公共交通網絡,為上海市公共交通體系優化提升提供精準支持(圖5)。
大數據在使用過后仍有較高的可挖掘價值。自使用大數據工具以來,上海市對公共汽車運行速度、線路逐站客流量、中心城區居民出行特征進行了持續調查,逐年形成專題研究報告,并改變傳統僅僅回顧過往交通發展報告的情況,通過對過往數據挖掘,實現對交通發展歷程的數據梳理、持續追蹤。
(二)規劃實踐中的問題
上海交通規劃的大數據實踐過程也不可避免地面對各種各樣的問題,一部分源自大數據自身的現實與理論困境,另一部分源自規劃思維方式未能及時轉變。正如大數據研究方法自身的現實與理論困境中所描述的,上海交通規劃的大數據實踐也同樣面對著“全樣本”的有偏性、基礎理論缺失、官方數據的壟斷瓶頸等問題。
規劃中往往因大數據樣本的系統性偏差、數據來源缺乏具有公信力的機構背書、數據分析方法缺乏扎實的理論基礎,使得部分依托大數據手段獲取的交通出行特征分布成果存在爭議,與常識不符。在崇明綜合交通規劃研究中,規劃師通過手機信令數據分析獲取的交通出行特征與常識不符,與通過傳統研究方法獲得出行特征存在矛盾。為項目的完善與推進帶來了障礙。
在方法創新方面,上海交通規劃的大數據實踐過程往往僅將大數據分析手法用于分析獲得現狀出行方式、出行特征等方面。通過大數據手段優化提升傳統研究方法的精度與規劃項目的工作效率,暫未提供新的研究視角與預測方式,大數據分析方法的價值主要體現在工作過程之中,未能在成果上得到充分體現。
在數據獲取上,上海交通規劃領域常用的手機信令數據與公交刷卡數據因隱私保護與數據安全原因,獲取的數據往往源自過往一年,交通規劃中的大數據研究難以獲得即時的數據支持,為研究的深化與完善帶來隱患,也使得交通規劃研究難以及時發現問題。
五、總結與反思
近年來,將大數據手段不斷引入交通規劃領域并不斷深化已是必然發展趨勢。正如上海、北京、深圳等城市通過大數據手段對交通規劃開展的實踐,大數據對于傳統交通規劃的現狀調研手段的匱乏、研究數據的不足有著極大的改善。但與此同時,我們也逐漸看到現階段大數據在交通規劃領域發展的先天與后天不足。無論是數據本身的偏差還是基礎理論的缺失、研究方法與標準的不統一,都促使每一個從業人員在當下面對這份不成熟與不足的大數據時需要保持謹慎,避免因為盲目輕信而陷入數據陷阱。
對于大數據發展本身,規劃從業人員、學者與政府需要通力合作,不斷從數據來源、數據獲取方式、數據的質量等多個層面優化大數據市場,構建一個具有政府背書、高質量、高開放程度的大數據平臺,克服當下規劃研究的數據困境。同時,不斷深化研究,構建基于大數據的規劃理論基礎,在為大數據在交通規劃中的應用提供理論支撐的同時,豐富可供研究與挖掘數據的種類。
參考文獻:
邁爾-舍恩伯格,庫克耶,盛楊燕,等.大數據時代:生活、工作與思維的大變革:Big data a revolution : that will transform how we live, work, and think[M].杭州:浙江人民出版社,2013.
龍瀛,孫立君,陶遂.基于公共交通智能卡數據的城市研究綜述[J].城市規劃學刊,2015(3):70-77.
龍瀛,崔承印,張宇,等.利用公交一卡通刷卡數據評價北京職住分離的空間差異[C]//2012中國城市規劃年會.2012.
楊東援.通過大數據促進城市交通規劃理論的變革[J].城市交通,2016,14(3):72-80.
張天然.基于手機信令數據的上海市域職住空間分析[J].城市交通,2016,14(1):15-23.
丁亮,鈕心毅,宋小冬.上海中心城就業中心體系測度——基于手機信令數據的研究[J].地理學報,2016,71(3):484-499.
張品立.大數據環境下的城市交通規劃與管理模式變革——以上海智能化的公交集群調度為例[J].上海城市管理,2015,24(6):51-55.
李翔敏,戴帥.對基于大數據道路交通管理的冷思考:“小”即是美[C]//2015年中國城市交通規劃年會暨第28次學術研討會.2015.
責任編輯:許 丹