
開放數據:公共交通機構的機遇與挑戰
作 者:Carol L.Schweiger
出版單位:TRB
出版時間:2015年
如果你是公共交通從業者,又碰巧關注美國公共交通開放數據,那你很難沒有聽說過GTFS(General Transit Feed Specification)數據。簡單來說,GTFS是一種用于分享公共交通車站、線路和時刻的標準數據格式。GTFS誕生于2005年,波特蘭地區的大都市交通局(Tri-County Metropolitan Transportation District of Oregon)為了能讓乘客在谷歌地圖上計劃公共交通出行,與谷歌合作制定了一種數據格式,用來與谷歌地圖的數據結構融合,這便是GTFS的前身。那時GTFS還代表著Google Transit Feed Specification(谷歌公共交通數據上傳規范)。
早在1998年,舊金山的灣區快速公共交通系統(Bay Area Rapid Transit,BART)就以CSV的格式分享了車輛運營時刻信息,這被認為是美國公共交通業界的首次數據開放。在世界另一端的歐洲,公共交通部門的數據開放潮流受到2003年發布的公共部門信息再利用指令(Directive 2003/98/EC on the Re-Use of Public Sector Information)的極大推動。這份指令要求所有歐盟成員國的公共事務部門提供開放數據,其中就包括公共交通部門。
或許有人會好奇,除了GTFS之外,公共交通運營機構怎么開放運營數據、開放到什么程度。2015年,波士頓TransSystems Corporation的咨詢師Carol L.Schiweige,通過美國交通研究委員會(Transportation Research Board)設立的公共交通研究項目(Transit Cooperative Research Program),發表一篇名為《開放數據:公共交通機構的機遇與挑戰》(Open Data:Challenges and Opportunities for TransitAgencies)的報告。
報告使用了倫敦開放數據研究所(Open Data Institute)的定義,認為好的開放數據有以下特征:1)分享便利;2)使用標準的結構化格式;3)數據一致且可以持續獲得;4)可以追溯復原。Carol認為,成功的開放數據格式應易于被應用程序開發者使用。作者將目前公共交通領域的常用開放數據標準總結如下:
1)GTFS。如前所述,GTFS是谷歌開發的靜態數據格式,包含公共交通車站、線路和時刻表信息。GTFS由13個逗號分隔的TXT文本組成,每一個TXT文本包含一個關于公共交通運營的獨立信息。這13個TXT文本中,6個是必需的,包括公共交通部門信息、車站、線路、車次、進出站時刻和運營日歷;7個是可選的,包括日歷起止日期、票價、票價規則、線路空間數據、頻率和數據提交機構信息。
2)GTFS-Realtime。GTFS實時數據格式包括車輛位置、服務通知和車次更新的實時信息。
3)SIRI。SIRI(Service Interface for Real Time Information)是歐洲廣泛使用的實時數據格式。紐約大都市交通局(Metropolitan Transit Authority)也采用SIRI格式開放實時數據。SIRI數據格式包括調度數據,比其他實時數據格式更為復雜。
4)TCIP。TCIP(Transit Communication Interface Protocols)是美國公共交通協會(American Public Transportation Association)制定的、兼容靜態和實時數據的格式。TCIP開發于開放公共交通數據潮流的早期,試圖盡可能多的兼容運營模式和服務類別,是相對比較復雜的格式。
5)NextBus。NextBus是使用可拓展標記語言(XML)的應用程序接口(API),公共交通部門用它來提供實時公共交通到達信息。
6)TransXChange(TxC)。TxC是英國在全國范圍內共享公共汽車時刻表、線路和運營數據的標準數據格式。
Carol通過問卷調查了3個加拿大、14個歐洲和50個美國公共交通機構,詳述其數據開放政策,記錄了這些機構如何使用開放數據改進公共交通規劃和服務質量,并且總結了數據開放對公共交通部門、其他公共部門和私營部門的影響。83%的被調查公共交通部門提供開放數據。他們認為開放數據帶來的透明度改進了公眾對公共交通機構的感知,提升了公共交通服務的曝光度,同時賦予乘客更多的權利。公共交通部門能使用發布的開放數據進行內部提升;盈利機構也有更多的機會根據開放數據開發創新性的應用程序,從而鼓勵公眾使用公共交通;非營利機構(包括高校、研發部門等)均可研究、分析、使用公共交通開放數據進一步改善公共交通服務和數據開放。人力資源不夠、數據清理煩瑣、數據后續使用不可控和對數據準確性的擔憂,是其余的公共交通機構不愿意開放數據的主要原因。
其他主要調查結果包括:
1)應用最廣泛地用于準備公共交通開放數據的基礎技術包括調度軟件、地理信息系統(GIS)、計算機輔助調度系統(ComputerAssisted Dispatching System,CAD)、自動車輛定位系統(AVL)和實時到站預測軟件。
2)發布開放數據的難易程度是公共交通部門決定開放某一方面數據的最主要原因。
3)數據開放度方面,受訪機構中87.3%提供免費開放數據,57.3%數據完全開放(任何人都可以訪問),83.6%使用用戶友好的格式開放,79.2%限制用戶在使用、編輯和發布其數據方面的權限。
4)半數的公共交通部門要求用戶在使用開放數據之前同意使用協議。使用協議最常包含的三大元素是:數據的使用權限,不保證數據始終可獲得、準確和及時,以及對于不正確或者缺失數據的免責聲明。
5)大約1/3的公共交通部門追蹤開放數據的使用情況。用公共交通開放數據來開發面向乘客的五種最常見應用程序是:出行規劃、手機應用程序、實時公共交通信息、地圖和數據可視化。用于支持決策的最常見工具有:數據可視化、服務規劃和評估、線路設計、服務績效分析以及出行時間和容量分析。
6)被調查的公共交通部門認為目前數據開放主要面臨五個方面的挑戰:①公共交通部門內部人力資源和結構問題;②數據質量和時效性問題;③數據標準和格式問題;④宣傳開放數據的廣告策略和權屬標識問題;⑤技術問題。
報告還包括4個案例分析,詳細記錄了美國波士頓的馬薩諸塞灣區交通局(Massachusetts Bay Transportation Authority)、英國倫敦交通局(Transport for London)、美國舊金山BART系統和馬薩諸塞州伍斯特區域交通局(Worecester Regional Transit Authority)的數據開放實踐。有興趣的讀者可以參閱報告原文。報告網址鏈接:http://www.trb.org/Publications/Blurbs/172202.aspx。