張震 孔帥華 彭坤



摘? 要:針對多年來出租汽車行業存在的數據冗余、結構混亂等問題,本文立足行業現狀,以城市出租汽車行業監管服務現實需求為導向,依托城市政務云及電子政務網絡,利用大數據、物聯網、云計算、多媒體和人工智能等技術,建立出租汽車行業信息庫,實現對出租汽車行業信息的整合和管理,為未來基于行業信息資源進行的大數據應用分析提供支撐。運行表明,大數據對出租汽車行業信息資源規劃研究具有一定的指導意義,對提高城市出租汽車的運營效率,緩解城市交通擁擠具有重要意義。
關鍵詞:大數據;出租汽車;信息資源規劃;數據中心
中圖分類號:TP399? ? ?文獻標識碼:A
文章編號:2096-1472(2021)-01-17-04
Abstract: This paper proposes to establish a taxi industry database in order to solve problems of data redundancy and structural confusion in taxi industry over the years. This database is expected to realize the information integration and management of taxi industry, and provide support for future big data application analysis based on industry information resources. Taking advantages of city government cloud and E-government network, the proposed database is designed to meet the needs of urban taxi industry supervision. It uses a variety of technologies, such as big data, Internet of Things, Cloud computing, multimedia, artificial intelligence and so on. Operation shows that big data plays a significant role in planning information resources, improving operating efficiency of urban taxis and alleviating traffic congestion.
Keywords: big data; taxi; information resource planning; data center
1? ?引言(Introduction)
隨著城鎮化的不斷發展,城市占地面積和人口快速增加,城市出租汽車的體量迅速增加,在城市客運方面的占比日益增加,出租汽車已經逐漸成為城市客運交通體系的重要組成部分,并在促進城市經濟發展、方便人們出行、擴大就業等方面做出了積極貢獻[1]。然而出租汽車行業也暴露出從業人員素質參差不齊、假牌套牌現象時有發生、傳統企業經營模式不足、整體服務水平一般等問題,嚴重影響了出租車行業的發展[2]。因此,依靠大數據技術和現代化的管理手段,對出租汽車行業信息資源規劃的研究成為一項急迫的任務,對于提高出租汽車行業的管理水平,解決出租汽車行業存在的問題,促進汽車行業健康發展具有重要意義[3]。
2? ?信息資源規劃(Information resource planning)
基于出租汽車行業相關數據元標準規范定義的業務對象與屬性,結合出租汽車行業各層面現有系統的應用實踐,以城市出租汽車行業和相關規范為指導思想,對信息資源進行自上而下的統一數據規劃。信息資源規劃將行業數據按照業務本質特征進行組織,將出租汽車行業多年來積累的結構混亂、數據繁雜、不合理的“數據庫”進行規劃組織,為出租汽車行業建設提供一個穩定的數據環境[4]。
信息資源規劃的目的是站在出租汽車行業資源規劃管理的高度,組織規劃出租汽車行業業務和數據模型,以及規劃行業業務和數據構架,明確數據內容及其關系,為形成出租汽車行業“一數一源”的基礎性和整體性數據資源中心奠定了夯實基礎[5]。
2.1? ?信息資源規劃原則
(1)命名規范
遵循國家或出租汽車行業數據標準的命名規范。
(2)設計規范
按照數據庫的規范化標準,遵循第三范式的內容要求進行庫、表的設計。
(3)統一數據模型
均采用整體統一的數據模型,并共享所有的公共數據模型。
(4)公共代碼
按照出租汽車行業編碼規范要求,以保證將來業務數據變革時,行業內部相關系統的數據資源保持一致。
(5)元數據管理
實現對數據采集、交換規則、存儲規則等的管理,并對元數據采集信息、交換規則進行修正。采用元數據管理實現對數據結構的全局管控[6]。
2.2? ?信息資源規劃思路和內容
深化貫徹國家出租汽車優先發展戰略,以提升服務水平為宗旨,以提高運營效率和管理水平為重點,以加強出租汽車運行安全保障為關鍵,抓住大數據、物聯網、云計算、人工智能等新技術快速發展的重大機遇,按照“深化數據建設,提高服務水平,建立高效機制”的思想,加強新技術和創新應用,通過先行試點再推廣應用的模式,確保滿足近期需求,并兼顧長遠發展[7]。
(1)整體規劃,建立科學的信息資源規劃體系結構
建立科學的信息資源規劃體系結構,確保業內人員、開發人員等的管理和維護,以及讓使用信息資源的用戶從全局上掌握信息資源,便捷、快速地利用數據資源,準確有效地管理、維護數據資源。信息資源規劃體系結構包括數據體系指標、數據模型等數據標準化方面的內容,也包括數據采集及管理方面的內容。
(2)數據標準化
數據標準化是數據交換、利用和共享的前提條件。數據標準化包括多方面的內容,既包括數據庫結構、數據元、數據指標等數據自身的標準化,也包括元數據的標準和采集數據的標準等工作內容。為了應對將來的工作變化,應建立全局的、多方面的信息資源標準體系。
(3)采用分布采集、集中處理、集中交換的建設模式
分布采集:數據中心根據數據的不同特征,及時把來自不同格式和不同存儲方式的元數據采集到數據中心。
集中處理:使用ETL工具軟件和開發的處理程序對數據進行清洗、轉換的過程,集中在數據交換區中進行。
集中交換:對外交換數據統一由數據中心進行整體規劃,進行交換策略、方式的管理,使數據交換過程規范化、標準化[8]。
2.3? ?信息資源建設流程
出租汽車信息資源建設流程如圖1所示。
(1)確定數據源
對各業務系統和數據資源進行梳理,確定需要采集的數據源。
(2)數據建設方案設計
按照數據源的相關信息,設計一整套數據建設處理方法,包括數據采集、數據整理、數據錄入、數據格式化、數據轉換入庫、入庫核驗和數據共享等方案[9]。
(3)數據審核校驗
由各相關部門共同審閱數據建設方案,主要對系統采集數據的內容規范性、完整性、有效性和可行性進行校驗審核。
(4)數據采集
按照設計的數據建設方案,由專門部門和專業人員在規定日期內對規定數據內容進行采集。
(5)紙質數據整理
當數據資源為紙質資料時,遵循系統數據要求,錄入前對紙質數據進行歸類,明確錄入紙質數據的內容、統計口徑、歷史口徑等相關工作。
(6)紙質數據錄入
依據整理好的紙質數據,遵循有關標準,明確錄入數據的要求,由專業人員進行數據的錄入。
(7)數據格式化
對采集的電子數據或錄入的紙質數據,按照系統要求進行數據轉換,由專門部門、專門人員,按照要求進行分類、標準化和格式化。
(8)數據轉換入庫
通過現有的轉換程序或編寫相應的轉換程序,將處理后的數據信息轉換入庫。
(9)入庫校驗
對轉換入庫數據的整體性、精準性和安全性進行校驗,保證轉換入庫的數據規范化、標準化。
(10)數據共享
在規定時間,按照跨部門、跨行業的管理和服務需求,對所需的數據進行共享。
2.4? ?出租汽車元數據標準規范
元數據是關于出租汽車信息資源標識、內容、質量、狀況及其他有關特征的全面描述,是出租汽車行業數據標準的主要體現形式,其目的是為幫助發現數據、管理數據、使用數據和共享數據提供服務,元數據已成為當今世界范圍內信息資源組織和共享必不可少的重要方法和工具。
基礎信息資源數據結構類型復雜,對其進行描述的元數據本身也是復雜的,因此相對于基礎信息資源庫還需要建立一個獨立的元數據庫,并實現好元數據與其表達的實際數據集或數據集系列之間的鏈接。元數據庫直接對外開放,提供多種途徑供第三方系統或最終用戶查詢,使用者通過查詢和檢索這些組織良好、結構標準的元數據,快速定位到自己需要的信息,進而在經過驗證后被導向到實際的數據集服務處,最終檢索到自己感興趣的信息。因此,一個定義、維護良好的元數據庫標準是進行出租汽車基礎信息資源有效共享的基礎,也是實現有效多維數據分析和數據挖掘的前提。
2.5? ?出租汽車數據標準指標體系
數據標準應從全面的信息資源范圍進行定義,涉及的數據資源包含多個“數據集系列”和“數據集”。根據目前出租汽車行業信息化的現狀,資源整合庫的設計是該指標體系的一個子集合。隨著信息化建設工作的不斷完善,在今后可以實現指標體系中的所有數據集。
3? 信息資源數據中心設計(Design of information resource data center)
數據中心設計的主要目的是服務于城市出租汽車行業,實現行業信息資源的整合,為數據信息資源規劃奠定基礎,建立出租汽車行業基礎信息數據庫,實現城市出租汽車行業GPS/北斗數據和營運數據的整合,以及基礎數據的管理,建成出租汽車行業數據中心總體框架[10]。
3.1? ?數據中心總體架構
數據中心是城市出租汽車行業信息管理系統的信息資源中心,是系統的重要組成部分。其重要功能包括:數據匯集、數據交換、車載設備、呼叫中心實時數據交換、數據共享、存儲和分析等。數據信息資源總體架構如圖2所示。
3.2? ?數據中心功能
數據中心的重要功能包括數據采集、存儲和交換。數據整合與服務功能圖如圖3所示。
數據采集:完成多元化的、可應對的數據抽取、分析、轉換、清洗和加載的應用平臺,將來自不同存儲方式和不同格式的數據進行組織分類后錄入數據庫。
數據存儲:結合系統需求中數據保存周期的要求,對應用后的數據生命周期管理策略予以明確,如數據在線保存周期、歷史數據清理和備份方式、歷史業務數據存檔策略等。
數據交換:實現各個業務系統之間的數據共享和交換,對各應用數據資源進行整合和共享訪問,防止各應用系統產生數據孤立的局面,完成數據的共享和數據的交換,協同各業務系統之間的數據運行。
3.3? ?基礎數據庫設計
根據出租汽車行業信息基礎支撐的需要,本文研究規劃的基礎數據庫分別為駕駛員數據庫、車輛數據庫和企業數據庫,其中主要庫表如表1和表2所示。
(1)出租汽車駕駛員數據庫
3.4? ?主題數據庫設計
主題數據庫包括綜合運行分析數據庫、服務質量監督考評數據庫、動態稽查數據庫、車輛GPS/北斗數據庫和信息發布數據庫[11],其中主要的庫表如表3至表5所示。
4? ?結論(Conclusion)
科學的出租汽車信息資源規劃可以緩解城市交通擁擠,滿足了廣大人民群眾出行的需求,助推城市出租汽車行業形成規范有序、健康文明、市場凈化、協調發展的新格局,提高了出租汽車行業監管及服務能力。本文從出租汽車信息資源規劃思路、內容、建設流程等方面進行了分析研究,并且對信息資源數據中心設計進行了闡述,給出了數據信息資源總體架構,為出租汽車行業管理提供了依據。
參考文獻(References)
[1] 國務院關于印發促進大數據發展行動綱要的通知.國發〔2015〕50號.
[2] 劉響.城市出租汽車市場運營博弈策略及其影響研究[D].哈爾濱:哈爾濱工業大學,2018.
[3] 楊英俊.城市出租汽車服務管理關鍵技術研究[D].西安:長安大學,2013.
[4] A G W, B E T. Using "Big Data" to understand the impacts of Uber on taxis in New York City[J]. Travel Behaviour and Society, 2020(22):94-107.
[5] 劉增.城市出租汽車監管與服務平臺的設計實現[D].哈爾濱:黑龍江大學,2015.
[6] 蔡籌皚.基于首都機場出租車的信息采集與處理研究[J].產業創新研究,2020(16):111-113.
[7] 劉榮.出租車合理規模研究與應用[D].長沙:長沙理工大學,2013.
[8] 焦紅紅.城市出租汽車決策支持方法研究及系統開發[D].西安:長安大學,2014.
[9] 劉文婧,韓建業.構建電子數據歸檔管理系統的實踐[J].中國國情國力,2018(08):76-78.
[10] Xu W, Huang Y. Mining Urban Congestion Evolution Characteristics Based on Taxi GPS Trajectories[J]. American Journal of Traffic and Transportation Engineering, 2020, 5(1):1.
[11] 陳騫,劉偉,孟慶久.信息資源規劃中主題數據庫規劃研究與應用[J].情報雜志,2006,25(2):136-137.
作者簡介:
張? 震(1966-),男,博士,教授.研究領域:信息與通信工程,大數據技術.
孔帥華(1995-),男,碩士生.研究領域:計算機應用,大數據技術.
彭? 坤(1996-),男,碩士生.研究領域:計算機應用,大數據技術.