999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社會交通中的社會信號分析與感知

2021-07-25 17:49:28陳虹宇呂宜生陳圓圓王飛躍
自動化學報 2021年6期
關鍵詞:信息研究

陳虹宇 艾 紅 王 曉 呂宜生 陳圓圓 王飛躍

交通作為城市建設的重要領域,其發展高度標志著城市的現代化程度.20 世紀第二次世界大戰后,各國交通隨經濟不斷增長而迅速發展,其中以道路交通為代表的城市交通發展尤為顯著.然而隨著城市化進程加快、城市人口和車輛數量激增,我國各大中城市道路交通逐漸出現了擁堵、事故以及污染等諸多問題,各類公共交通的積極探索和大力推廣未能有效緩解普遍存在的不良交通狀況,引起了交通領域研究人員的廣泛關注.為逐漸改善交通污染情況、完善交通安全保障、提升交通運行效率,各國專家學者從20 世紀60、70 年代便開始積極尋找解決方法,在通訊、傳感、控制及計算機等領域的發展推動下,最終在上世紀末就“智能交通”這一整體發展目標達成共識,提出構建智能交通系統以整合交通數據信息,并進行了許多積極的探索與實踐.智能交通系統(Intelligent transportation systems,ITS)是未來交通系統的發展方向,它是將先進的信息技術、數據通訊傳輸技術、電子傳感技術、控制技術及計算機技術等有效地集成運用于整個地面交通管理系統而建立的一種在大范圍內、全方位發揮作用的,實時、準確、高效的綜合交通運輸管理系統.在智能交通研究的早期階段,受限于采集設備、技術條件和經費資金等因素,研究數據多來源于現實世界的物理檢測設備.目前,相關研究技術已發展成熟并得到廣泛應用,但物理檢測設備存在的時空覆蓋范圍有限、運營維護成本較高且更新速度較慢等特點,使其所得數據無法全面實時地反映實際交通狀況以及突發性交通事件信息.

進入21 世紀以來,軟硬件系統和設備的快速發展完善和算法技術的持續更新優化,為智能交通的進一步研究和發展帶來了新的機遇.一方面,智能手機等便攜移動設備的廣泛普及以及移動互聯網和通信技術的快速發展,使得普羅大眾群體成為遍布于城市各個角落的無數“社會傳感器”[1?3].相比于傳統人為布設的物理傳感器,其能夠在一定程度上突破客觀因素的限制,通過人類自發的日常活動為各領域研究提供日漸豐富且多種多樣的數據[4].另一方面,系統設備的更新為數據處理和應用技術的優化提供了良好的發展基礎,進而促進了數學、計算機科學、交通學、語言學乃至社會學等學科領域的交叉融合.同時,大數據時代為數據挖掘、自然語言處理、深度學習等新興技術的研究創造了前所未有的海量信息資源.因此,總體來看,智能交通研究的數據來源已從固定的物理空間逐步拓展到廣闊的網絡空間乃至復雜的社會空間,數據類型也由準確的結構化數據向模糊的非結構化數據轉變.近十年來,作為與城市生活息息相關的用戶共享信息載體,Twitter、微博、滴滴出行和高德地圖等在線平臺的涌現也積累了大量交通相關的模糊非結構化數據,例如用戶對交通事故的描述和交通系統的看法等文字或圖片.這類數據對交通系統管控、交通決策制定等交通服務的提升優化具有重要研究價值,能夠補充、完善甚至替代物理檢測設備所采集的結構化數據.因此,豐富的社會信號[5]為社會交通領域的出現和發展創造了良好的研究環境.

目前,針對社會交通領域的綜述文獻并不多.Zheng 等[6]在社會交通領域發展的初期,針對近年來交通相關研究數據在類型和結構的巨大變化,對該領域應用與研究方向的影響進行分析闡述.Lv 等[7]以圖形和文字的形式分別展示了領域內研究人員、機構和國家層面的合作模式,并分析與概述了近年來的研究方向及成果.經過對國內外現有的豐富研究成果的調研發現,數據來源的多樣性、內容的復雜性及結構的多變性能夠在極大程度上決定相關研究的方向、內容及方法.因此,本文選擇在當前社會交通領域研究發展較為成熟的情況下,以該領域的研究數據為核心,對相關研究方法與應用進行更加詳細的分析與總結,并明確指出該領域在下一階段的發展方向.

本文主要分析與歸納了社會交通領域內針對城市交通的已有研究工作,并對該領域的研究發展趨勢進行展望.全文內容安排如下:第1 節總述社會交通的發展背景、作用意義和研究現狀;第2 節分類介紹社會交通主要研究數據的來源、類型、所含信息及發展趨勢;第3 節分階段闡述數據處理過程所涉及的技術方法;第4 節分層說明社會交通研究與應用的主要內容和方向;第5 節分析與歸納當前研究的不足與挑戰并展望未來的發展趨勢.

1 社會交通

“社會交通”這一概念由王飛躍于2014 年在文獻[5]中首次明確提出,用于描述在線交互式社會信號推動下涌現的智能交通新形態及其研究范式.文中,他指出了五個潛在的研究方向,包括:1)使用數據挖掘、機器學習和自然語言處理等方法進行大數據和社交信號的交通分析;2)基于社交媒體、社交網絡、物聯網乃至萬物聯網的交通眾包機制;3)除基于位置服務(Location-based services,LBS)外的新服務,如交通知識自動化.特別是基于決策的服務(Decision-based services,DBS)、基于任務的服務(Task-based services,TBS)、基于信息或智能的服務(Information or intelligence-based services,IBS)及基于知識的服務(Knowledge-based services,KBS);4)用于交通控制和管理的基于互聯網的代理技術;5)更多其他研究和發展的實際應用和反饋.與以社會學為研究重心的交通社會學不同,社會交通更側重于交通方面的研究.其隸屬于交通(工程)科學,在以往僅考慮工程因素的研究基礎上增加對社會因素的分析,同時結合交通社會學與交通工程學的原理與研究方法,強調在交通系統中利用在線和交互式大數據進行實時計算或嵌入式應用等研究與應用.因此,應將社會交通定義為基于交通工程學與交通社會學的交叉學科.

基于且不限于上述研究方向,社會交通能夠利用駕駛員、乘客、行人等群體在交通出行時相互作用的社會屬性,為其提供包括道路交通管制、交通資源調度和交通出行規劃等服務.根據相關文獻調研,當前社會交通的研究目標可大致概括為:利用海量在線交互的社會信號進一步提高智能交通系統的運行效率.并且,其主要研究范圍為受復雜社會因素顯著影響的城市交通.然而,隨著研究范圍的不斷擴大及程度的逐步深入,現有真實數據因公開數量有限、信息缺失嚴重以及數據融合困難等問題,已無法滿足社會交通領域內日益豐富多樣的研究需求,這使得研究人員萌生了人工完善、補全甚至生成數據的研究思路,這一研究思路逐漸成為引導社會交通發展的新興研究趨勢.

2 數據

大量、準確、可靠的數據是高效開展研究工作的基礎.由于城市交通狀況的變化受各方面復雜因素的影響(見表1),因此相關研究對數據的要求較多.然而,傳統交通研究所用數據主要來自現實物理空間中的硬件檢測設備,其存在時空覆蓋范圍有限、實時更新速度慢、運營維護成本高以及數據信息有限或缺失等問題,導致可利用有效數據不足.同時,數據壁壘廣泛存在于不同數據源之間,阻礙數據利用率的進一步提升.在當今大數據時代背景下,網絡空間不斷涌現出各類多樣的開源跨媒體異構數據,使得研究數據的來源由物理空間逐步拓展到網絡空間,為不同問題的解決提供豐富且充足的信息知識以作為研究依據.且更進一步地,便攜移動設備的普及和網絡通訊技術的發展將用戶關系等復雜的社會信息引入社會交通對網絡空間的研究范疇,進而推動了社會交通這一新興研究領域的產生與發展[5?6].因此,本文將首先按照由“實”到“虛”的發展變化趨勢對社會交通領域的研究數據來源進行闡述.

表1 影響城市交通狀況變化的因素Table 1 Factors affecting the change of urban traffic conditions

2.1 真實數據來源

由于智能交通的研究逐步突破了物理和網絡空間,并在復雜交互式社會信號的推動下形成社會交通這一熱點領域,故本文將按照對應所屬空間將現有應用頻度較高的數據源劃分為物理空間數據源和網絡空間數據源.并根據數據來源的變化過程,分別簡要介紹各自所含數據的類型、信息、特點、應用、挑戰或研究趨勢等內容.

2.1.1 物理空間數據源

物理空間數據主要來源于現實物理世界中傳統的傳感設備[8?12]、配備GPS 和無線通訊設備的浮動車[13?15]以及移動通訊終端[16?18]等媒介,以及近年來迅速發展的共享單車[19?20]、公共巴士[10,21?22]、地鐵[22?35]等交通基礎設施系統和移動通信系統.其中,作為相對完善的交通基礎設施智能系統,城市地鐵系統是應用于社會交通研究的典型及主要數據源之一.其基于地鐵系統的智能卡片記錄,主要包含進出站信息及對應時間記錄等描述移動軌跡和狀態的數據.這類結構化數據雖然相對準確可靠,但由于所含信息內容較少,難以精準描述乘客的具體移動路線和過程.

目前,大部分相關研究將其作為用于數據真實性對比驗證的輔助數據源,以進一步確保研究結果的可靠性.Zhang 等[12]基于社交媒體數據和遙感數據進行探究,提出一種多視圖學習方法來識別城市中的危險交通位置,并通過真實數據證明了提出方法的準確有效性.同時,領域內的專家學者們也在積極探索新興的物理空間數據來源,例如城市中隨處可見共享單車和日漸普及的輕軌、地鐵.基于北京市路網數據信息以及摩拜單車軌跡數據.He 等[20]提出構建一個違法停車檢測系統,并以案例研究證明其效果優于所有基準方法.Lu 等[22]對新加坡公共交通系統數據進行探究,提出一個用于游客出行識別與偏好分析的框架TourSense,并通過真實數據驗證了所提出框架的有效性.其他應用可參考表2中所引相關文獻.

2.1.2 網絡空間數據源

人類的實體活動及社會關系是影響交通變化的關鍵因素.因此,社交屬性是以智能交通系統為代表的復雜社會系統所用研究數據的重要特性.本文以數據信息內容的生產與交換是否基于用戶關系為依據,將網絡空間數據源進一步劃分為非社交類數據源和社交類數據源.

1)非社交類數據源

網絡空間中的非社交類數據源通常為在線地圖服務提供商[26?32]、簽到網站[33?37]、政府部門和公共場所或科研組織機構等官方機構或組織的公開信息發布網站[11,21,38?50],主要提供包括路網信息、交通事件報告、天氣預報或公共場所活動預告等在內的文本信息,主要為單向發布的客觀信息而非用戶間的雙向交互信息.其所含信息能夠在確保真實可靠的前提下包含相對較多類別的內容,但局限在于可用開放數據集相對較少、數據來源較分散且區域性較強.

依據這類信息與交通狀態變化的相關關系,可將其作為處理和分析的補充數據源以用于提高研究結果的精確度,這已成為近年來的一種研究趨勢.例如Rodrigues 等[21]提出了一種貝葉斯加法模型,其結合了智能公交卡記錄數據和公共場所官網的信息內容,用以預測公共特殊活動下公共交通的需求總量.Cui 等[32]通過匹配來自Google Places 的興趣點(Point of interest,POI)數據和Twitter 的歷史數據以獲知每個POI 的對應流行度,并使用貝葉斯神經網絡(Bayesian neural network,BNN)模擬個體的日常出行線路并推斷出行目的.其他應用可參考表2 中所引相關文獻.

表2 可用真實數據的類別、來源、類型、信息及研究實例Table 2 The categories,sources,data types,information and examples of available data

2)社交類數據源

網絡空間中包括Twitter、微博、貼吧、論壇和出行服務等在線應用程序、平臺或網站在內的社交媒體(Social media)即為主要的社交類數據源.作為一種主要由廣大用戶產生內容的新型數據來源,其數據具有大量、實時、易獲得等特點.近年來,多元化社交媒體的涌現與蓬勃發展,將交通相關數據涉及的復雜社會因素引入智能交通的研究范疇.同時,數據收集、存儲、處理技術的快速更新為大量開放且可用數據資源的研究帶來可能,極大豐富了交通相關的各類信息內容,尤其是公眾對交通事件、出行方式和交通系統的看法、分析、評價甚至輿情等非結構化數據[62?63].目前,相關研究將社交類數據源用于挖掘豐富多樣、全面且有價值的交通相關信息,以改善交通運行狀況、提高交通資源利用率.

因涉及文本、圖像等多種數據類型,社交類數據的應用場景相對較廣.Hasnat 等[51]探究了Twitter 中基于位置的社交媒體數據并提出一種用于理解游客出行目的地選擇的方法,應用條件隨機場(Conditional random field,CRF)模型分析并預測游客的目的地選擇模式類型.Giancristofaro 等[79]利用Instagram 社交網絡中的圖片、標題及評論數據,探究圖像和文本數據特征的結合以預測社交媒體中的交通情緒,最終實驗預測效果接近于人工分類.其他應用可參考表2 中所引相關文獻,具體的應用情況將在第4 節中進行詳細介紹與分析.相應地,由于復雜社會因素的影響,所用數據的可靠性是相關研究需解決的首要問題.此外,用戶產生的非規范化、模糊、錯誤或缺失的數據對當前的算法模型同樣提出挑戰.

除上述數據源外,調查問卷[30,32,80?83]、電臺廣播等媒介也能夠提供有效的相關數據,但研究和應用相對較少,在此不做詳細介紹.

2.2 人工數據來源

目前,針對單一數據源或數據類型的研究已經相對成熟,但由于數據規模有限或真實性存疑等問題導致研究結果的準確性和實時性存在一定局限.隨著可靠開放數據源的逐步擴增和數據處理算法技術的不斷優化,社會交通研究趨向于對多源異構的跨媒體數據進行融合、處理與分析[84],以實現各類信息的相互補充和驗證,從而逐步提高研究結果的準確有效性.即便如此,現有真實有效數據的稀疏與缺失以及廣泛存在于不同數據源間的數據壁壘等研究難點仍然限制著社會交通深入且多樣化的發展.針對這些問題,近年來先進技術算法的優化與提出促使研究人員的解決思路由尋找高質量數據源轉變為補充與完善已有數據源,甚至人工生成虛擬的特定所需數據.即從實際研究需要出發,積極發揮主觀能動性,利用先進算法或模型探究人工數據的研究與應用潛力.

人工數據的來源不局限于單一物理或網絡空間,可以是虛擬的軟件算法模型或實際的復雜工程系統.其所含信息內容由研究需求決定,相關數據類型包括且不限于數值、文本和圖像,故具有靈活、豐富、多樣等特點.但同時,對人工數據研究與應用的發展一直受信息真實合理性的制約.因此,人工數據的研究目前主要基于最新的算法或模型,提升已有數據的質量或生成大規模可用數據.其中,以生成式對抗網絡(Generative adversarial networks,GAN)為代表的相關研究與應用已在圖像生成[85]與修復[86?87]、圖像翻譯[88]和風格遷移[89]等研究領域獲得了遠超以往模型的效果.其中,在圖像視頻領域的應用最為廣泛.典型研究實例包括:Ledig 等[86]提出利用GAN 將一張低分辨率模糊的圖片變換成高分辨率清晰的圖片.Wang 等[90]利用合成圖像和真實圖像數據用于訓練人眼檢測模型.另外,其還用于圖像數據補充、圖像風格轉換及語音語言生成等領域[91].而對于涉及復雜社會學因素的社會交通而言,相關人工數據的研究需考慮社會系統的特征規律或知識經驗等信息.且基于此,后續應進一步探究特定的跨媒體、多模態或異構人工數據的研究與應用,包括數據信息的統一表征、關聯、理解、挖掘乃至生成等方面內容,以突破數據壁壘、數據稀疏與缺失等難題.具體研究技術方法等相關內容將在第3 節詳細介紹.

3 典型技術方法

社會交通研究所用具體技術主要由數據決定,因此,本章節將根據常規的數據研究流程按序對典型技術方法進行總結歸納,具體分類及舉例見圖1.

圖1 常規數據研究流程及相應典型技術方法Fig.1 Routine data research process and corresponding typical technical methods

3.1 數據生成與獲取

數據是科學研究的基礎,準確、充足和適宜的研究數據對高效開展研究具有重要幫助作用.因此,有效的數據生成與獲取技術或方法一直是領域內專家學者研究關注的熱點.針對當前社會交通的研究情況,本文將按照用戶生成數據的目的將數據生成分為被動式和主動式,并介紹對應的數據獲取方法.

3.1.1 被動式生成

被動式數據生成是指用戶被動無目的地產生數據,數據所含信息與研究關注內容非直接相關.一般來說,用戶在這一過程中多為自愿且無意識地提供信息.數據的來源包括上一節所介紹的全部物理空間數據源、網絡空間中全部非社交類數據源和部分社交類數據源.

首先,對于物理空間數據源,其主要由行人、乘客或駕駛員的交通行為與自身攜帶或車輛裝配的傳感設備(例如GPS、監控攝像頭等)以及公共基礎設施(如移動通信系統和公交卡系統)交互生成與獲取.舉例來說,公共交通刷卡系統能夠獲取并記錄市民出行時通過交通卡刷卡行為生成的移動軌跡數據和出行方式信息[21?25].

其次,對于網絡空間中的非社交類數據,其主要由官方組織、機構通過互聯網單向發布生成,可通過相關應用程序編程接口(Application programming interface,API)或網絡爬蟲等途徑獲取所需數據.例如,利用網絡爬蟲可以從氣象網站或演出信息網站中抓取由氣象局或演出場館發布的天氣情況或演出信息等[29].而對于被動式生成的社交類數據,其由官方或個人用戶自行無目的發布提供,同樣可通過相應的API 或網絡爬蟲獲取,例如大部分研究均通過API 從Twitter 中獲取交通部門或私人賬號發布的交通事故信息等.

3.1.2 主動式生成

主動式數據生成主要指用戶主動有目的地共享數據,數據所含信息由研究關注內容直接決定.具體來說,官方組織、機構或研究人員將間接引導或直接激勵用戶主動提供更具針對性和準確性的真實數據,用戶按照數據收集要求自愿生成相關信息,如發布道路狀況報告、反饋產品或服務評價.數據的來源主要為各類社交類數據源,即社交媒體.

1)眾包.眾包(Crowdsourcing)[92]是典型的主動式數據生成方式.在智能交通領域中,眾包一般指利用大規模移動群體的感知能力完成無法由單一或小規模個體及計算機實現的交通相關復雜信息收集任務,例如共享單車的車輛故障報告、移動出行服務的行程評價以及在線地圖的標注信息報錯[93?94].Zimmerman 等[93]提出構建信息轉換系統Tiramisu,其由用戶共享GPS 軌跡與提交問題報告,能夠處理用戶上傳的軌跡并預測公交實時到達時間.這些信息收集任務大多由社交媒體運營商根據自身優化發展目標設置發布,而用戶則通過社交媒體不斷提供數據.這些數據逐漸積累形成規模可觀的數據集,其同樣可通過相應的API 或網絡爬蟲進行獲取.

但就目前來說,這類眾包數據大部分并未對外開放使用且難以利用現有技術進行獲取,而相對易得的數據卻又普遍存在內容質量參差不齊或有效數量無法滿足研究需要等難題.

2)人工生成.隨著數據挖掘、深度學習等領域技術手段的革新和發展,研究人員創造性地提出人工生成大量可用數據,這也屬于主動式數據生成方式.生成人工或虛擬數據的研究思路為:通過算法擬合、模型構建等方式對現有小規模真實數據集的關鍵信息或特征進行挖掘、分析和學習,進而將獲得的知識經驗拓展應用于大規模人工數據的生成,或直接利用已知規則、知識等方式產生數據.人工生成數據的數量、內容和表達形式均由研究需要決定,具有靈活多變的特點.王飛躍教授于2004 年提出基于ACP 理論與方法體系的平行系統的概念和方法,其為一種以人工系統(Artificial systems)、計算實驗(Computing experiments)和平行執行(Parallel execution)為核心的復雜系統計算理論與方法的基本框架.其中,軟件定義的人工系統可通過計算實驗生成大規模數據,為人工或虛擬數據的研究提供了一種新的思路[95?99].此后,王飛躍教授及其團隊還陸續發表了一系列關于人工交通系統的研究成果[96,100?107].另外,研究人員還嘗試通過PARAMICS (Parallel microscopic simulator)[108]、VISSIM[109]、Transworld[105]以及SUMO (Simulation of urban mobility)[47]等交通仿真軟件和生成式對抗網絡(Generative adversarial network,GAN)等前沿方法[110?112]生成交通數據,圖2 所示為一種用于交通預測的GAN 框架示例[111].盡管相關技術方法的研究還不夠成熟完善,且所生成數據的真實可靠性仍待提高,對各領域數據的探究均具有重要意義.

圖2 一種用于交通預測的GAN 架構示例[111]Fig.2 An example framework of the conditional GAN for traffic prediction[111]

總體而言,被動式生成的數據目前來源較廣且數量相對較大,相應數據的獲取技術手段或方法也較為成熟.然而,可用的有效真實數據數量仍然相對較少,數據所含信息的內容較為局限且無法完全與研究需要相對應,研究人員往往需要融合來自多類別數據源的數據進行數據擴充或信息交叉驗證,但又往往還需面對普遍的數據壁壘問題.而數據的主動式生成方法雖已得到廣泛應用,其仍存在可獲得的有效數據規模較小這一研究難點.

依靠大量用戶生成大規模真實數據仍是目前主要的數據生成研究思路,但數據生成過程所需的時間、資金或其他資源成本較大,且由大部分信息數據表達形式的差異而形成的數據壁壘會阻礙多源異構數據的融合.未來的數據生成方式會更趨向于由小規模真實樣本數據生成大規模人工或虛擬數據,重點研究內容則將集中于多源異構數據的融合技術和有效且多樣人工數據的生成技術.

3.2 數據處理與分析

數據準確、快速且有效的處理與分析是進行高效研究與應用的關鍵.由于當前應用于社會交通領域研究的數據類型較多,因此所涉及的數據處理與分析技術算法也相對廣泛.其中,除由數據所決定的對應基本研究技術方法外,還包括針對不同研究對象、內容和目的所衍生出的一系列基本技術方法的變體形式.受篇幅所限,本文將主要從研究發展趨勢這一角度對相應技術方法進行簡要劃分和整體概述.

3.2.1 統計分析

在社會交通的早期研究中,可用研究數據規模相對較小,數據的處理與分析主要為采用統計學方法對研究對象進行數學建模或量化分析,從而得出數據在時間、空間或其他方面的分布特征或規律性信息,能夠輔助后續實驗測試過程中參數的選擇、設定和調整.并且進一步地,可將所得信息以圖表的形式進行簡明直觀地展示和描述[25,39,73,83].目前,社會交通領域內僅單獨采用數據統計分析的研究與應用相對較少,但仍存在部分研究將其作為數據的初步處理與分析過程,主要為其他相關行業領域內非專業研究人員的探究使用.

3.2.2 數據挖掘

隨著計算機性能的大幅提升以及技術手段的更新優化,可用數據呈指數型爆炸式增長.這促使專家學者對數據所含信息進行深入探究、提取及知識轉化,數據挖掘、深度學習等前沿學科隨之應運而生.

廣義的數據挖掘[113],是指在大規模數據集中進行知識發現的處理分析過程,或稱為KDD.其步驟組成包括數據選擇、數據預處理、數據變換、數據挖掘和模式評估或解釋.各步驟過程均可使用包括k最近鄰法(K-nearest neighbor,K-NN)[114?115]、卡爾曼濾波(Kalman filtering)[47,116]、貝葉斯網絡(Bayesian network)[11,21,30,32]、支持向量機(Support vector machine,SVM)[72,117]、深度學習(Deep learning)[118?123]、自然語言處理(Natural language processing,NLP)[49,52?53,63,72,74,77?78]、仿真模型[47,105,108?109,124]等各類先進技術算法[22,36?37,43?44,51,57,76]進行研究.

在社會交通領域的研究中,數據挖掘的研究發展呈現由單向多、由實向虛的趨勢.在研究初期,研究數據主要來自單一數據源,例如GPS 等物理空間或網絡空間的非社交類數據源或Twitter 等網絡空間的社交類數據源.其處理思路簡明直接,即根據數據類型特點、所含信息以及對應研究技術的發展選擇相應常規或改進優化的技術算法直接對原始數據的直觀信息進行處理分析.這一階段的研究主要集中于技術算法的優化,以期逐步提高結果質量或加快運算速度.而隨著研究的不斷深入,這種研究思路的局限性逐漸顯現,原因主要在于:1)作為復雜的社會行為之一,交通行為的產生受多方面因素影響,例如節假日、音樂會、體育賽事等既定事件和不利天氣、交通事故等非既定事件,使得相關數據隱含某些特定規律性特征.而直接單一的研究思路可能會導致對研究對象特征或重要信息的挖掘與分析片面化.2)在數據規模不足的情況下,由于人為誤差、設備偏差、數據稀疏等主觀或客觀原因,單一數據源不能確保數據及研究所得結果的真實有效性.因此,后續的研究轉為嘗試探索新的思路,以期進一步提升運算速度和結果精度.鑒于現代交通行為的復雜特性,研究數據的來源逐步從單一數據源擴展到多源異構數據,即對多個不同類型或不同類別數據源進行綜合處理與分析,從而推動相關新興技術的研發與應用.同時,相關研究在根據數據類型、內容類別等直觀信息進行挖掘分析的基礎上,綜合考慮多類有關影響因素以深入探究研究對象的時間、空間及其他規律性特征,并據此填補和完善缺失數據甚至生成人工或虛擬數據以解決數據壁壘問題,為深度數據挖掘提供新的可能.

在單一數據源有效數據量受限的情況下,多個具有相同類型和結構數據源的融合能夠對可用數據進行補足或擴充,以更好地滿足實驗需要并增強所用算法技術的泛化能力.而對于多源異構數據的挖掘應用,主要依據不同類別數據源的可信度或重要性區分側重地進行融合補充或交叉驗證應用.常見的多數據源結合形式分別為:社交類與非社交類數據源的融合、網絡空間與物理空間數據源的融合.參照文獻[125]可將綜合利用多源異構數據的現有思路分為三類:1)在研究過程中先將多模態數據源融合,提取及分析相關數據的綜合特征或信息后進行進一步具體的處理、分析與應用,例如文獻[11,19,42?43,50].2)在研究過程中先按照數據類型或內容類別分別提取、處理與分析多模態數據源的特征或信息,對初步所得結果進行融合后總結得出結論或進行進一步探究應用,例如文獻[12,30,32,39,79,82].3)在研究過程中分別處理與分析多模態數據源的特征或信息后,按照數據結構或信息內容對初步所得結果分別進行同一研究目標的具體不同探究與應用,例如文獻[21,23?24,54,117].

對應的研究應用目的目前主要分為兩類:

1)數據內容或結果的交叉驗證.相關研究大多數以新興數據源的使用為主要探究內容,通過其他多模態異構數據源的可靠信息驗證所探究數據的內容或所得研究結果的可靠性.例如,將新興多變的社交類數據源與傳統穩定的非社交類數據源交叉驗證[39,41,79,82].

2)數據特征或信息的相互補充.相關研究大多數以內容可信度或重要性較強的數據源為主要挖掘對象,輔以其他多模態異構數據進行特征或信息的補充,從而更加全面深入地挖掘與探究相關研究內容,并提升與完善研究結果的可信性和可行性.例如,將較真實可靠的物理空間數據源與豐富復雜的網絡空間數據源融合互補[15,19?20,23?24,30,32,42?43,50,54,117].對于跨媒體信息的分析與推理,Peng 等[84]從跨媒體統一表征理論與模型、跨媒體關聯理解與深度挖掘和跨媒體知識圖譜構建與學習方法等7 個方面進行綜述,歸納總結了現有研究方法、進展、挑戰及發展方向.

進一步地,可在多源異構數據融合研究的基礎上進行探究,即在綜合分析影響交通行為或狀況變化的多方面因素的同時,將現實世界的真實數據及由人工系統或仿真模型所產生的人工或虛擬數據相結合,以擴大可用研究數據的規模,從而突破以往研究思路的兩大局限,并實現研究效果的提升以及技術算法的優化[126].但相應地,數據的真實可靠性仍是目前研究一大挑戰.劉昕等[127]在平行系統的基礎上進一步探究并提出平行數據,其中的虛擬數據由實際數據經計算實驗產生.所提出平行數據的概念和框架,為數據處理、表示、挖掘和應用提供了一個新的范式.

同時,研究人員在不斷發掘有效且可用的新興數據源的基礎上,也積極探索數據處理和分析的新思路.Yao 等[60]提出一種用于預測出租車需求的深度多視圖時空網絡(Deep multi-view spatial-temporal network,DMVST-Net),同時對時空相關性進行模擬,其結合了卷積神經網絡(Convolutional neural network,CNN)、長短時記憶網絡(Long short term memory,LSTM)以及譜嵌入(Structural embedding)三種技術對數據進行處理與分析,并構建了對應的時間、空間和語義視圖.Chen 等[128]突破以往交通擁堵預測研究中常用的一維時間序列結構,提出使用二維矩陣結構對原始數據進行建模重構,以進一步突出體現研究對象的隱含特征.

3.2.3 數據可視化處理

在社會交通領域的研究中,可視化處理作為數據處理與分析中一項重要但非必要的研究環節,其應用常與上述前兩類關鍵必要過程相結合,根據實際需要對數據信息進行拓展探究或知識轉化.

1)可視化處理與統計分析相結合,即以統計學圖表等簡明直觀的形式對統計分析結果進行具體描述和展示.其通常僅針對單一數據源,由人為觀察初步歸納得出有助于研究開展的變化特征、影響關系或其他重要信息,從而為高效的數據挖掘指明探究切入點[19,25,35?36,39,62,68,73,83].圖3 展示了文獻[35]為探究出租車需求量的空間特性所用數據統計結果.

圖3 已完成出租車需求量統計結果[35]Fig.3 The statistical result of fulfilled taxi demands[35]

2)可視化處理與數據挖掘相結合,即以熱點圖、動態帶狀圖、關鍵字云圖等更多樣的形式對數據挖掘所得結果進行轉換表達,更直接地從多方面揭示數據的變化趨勢與規律、影響關系以及知識經驗.這類可視化處理涉及多種數據類型,相對于統計分析結果的直接輸出展示,其有助于多模態異構數據中隱含信息內容的協同表達與闡述及多領域的研究與應用[13,23?24,40,59,65,72,129].圖4 為文獻[24]在分析智能公交卡和社交媒體數據后可視化生成的多視角圖.

圖4 特大城市大數據的可視化融合[24]Fig.4 Visual fusion of mega-city big data[24]

特別地,若將算法模型、仿真交通環境、人工交通系統或平行交通系統等方法生成的仿真模擬或計算實驗數據可視化,則可對確定已知交通場景進行整體、全面、具體且直觀地描繪,實現特定環境中交通情況的重現與分析.另外,還可對隨機未知環境中的交通狀態進行預測,例如交通意外事故、大型自然災害等不可預知事件發生時的交通狀態,這對于以重大交通事故防范及應急預案的制定、完善與實施為代表的城市交通安全的研究與應用具有重要意義.

此外,由于應用場景和用戶群體的不斷變化與擴增,為滿足多元化研究及應用需要,相關研究進一步提出探究性可視化.其與數據挖掘可視化相似,具體形式與內容由研究目的決定,主要以交互的方式不斷獲得所需要的特定類型數據,從而結合社會群體的力量與智慧探究“以人為本”的智能交通應用形式,例如利用手機應用軟件交互式收集用戶共享的實時路況信息.因此其目前主要應用于相關軟件平臺的開發或智能交通系統,為用戶提供所需交通信息[22,54,56,75,130].

根據相關數據、內容和技術的研究發展趨勢,當前社會交通的技術研究熱點集中于包括交通工程學、數學、物理學、計算機科學、信息學、社會學等學科領域的現有研究技術、方法或思路的集成與融合,以及新技術算法、模型或框架的提出、優化與結合,從而進行人工或虛擬數據與跨媒體異構數據的生成、分析與推理,解決多元知識信息的融合問題.

4 研究與應用

由于社會交通領域的研究與應用內容主要取決于可用數據源及相關數據處理技術,故本文根據數據的研究發展趨勢分類介紹研究與應用的思路,具體將按照數據處理及分析的過程由淺入深進行分析闡述.社會交通的早期應用主要依賴于物理空間數據,初步探究交通現象的典型基本特征或變化規律,從而指導交通相關交叉學科的研究或應用,例如城市交通規劃和城市交通系統優化.近年來,跨媒體異構數據的全方位擴增、人工數據研究的提出以及前沿算法技術的優化革新都為交通問題的探究思路和方法帶來新的靈感和啟發.目前,社會交通的現有應用探究主要集中于圖5 所示的三類內容,具體內容及大致發展趨勢分別如下.

圖5 社會交通研究與應用的發展趨勢及分類Fig.5 The development trend and classification of social transportation research and application

4.1 交通場景中客觀對象或既定事實的性質

新興領域的探究往往從典型研究情景中的單一基本點入手.對應于社會交通領域的研究與應用,通常表現為對常見交通場景中存在于物理或網絡空間的交通主體(人或車)[20,22?24,40,65]、行為[25,36?37,58,65,117]、事件[52?54,68?70,72,131?133]乃至輿情[23?24,39,49,57,63,73?75,77,134]等基本組成元素信息的檢測與識別,或對基本組成元素所屬類別或特征屬性的判定.Maghrebi等[58]通過分析墨爾本市區內所發布的Twitter 數據內容來檢測用戶的交通出行方式,結果表明社交媒體數據可作為信息的有效補充來源用以幫助出行需求的確定等相關研究.

4.2 交通狀態或現象的潛在成因、影響或經驗知識

作為典型的復雜系統,現代交通系統并非僅由獨立存在的客觀對象所構成,還包括客體對象彼此之間的關系.因此,將交通場景中客觀對象或既定事實等成分視為獨立散點的研究與應用具有一定的局限性,難以在宏觀層面準確描述由多方面因素影響的交通狀態或現象.深入的探究需要依照特定的內在聯系將多個點串聯成線,并逐漸形成復雜的關系網絡,從而在空間尺度上對相關研究及應用進行拓展,從整體上揭示交通狀態或現象的本質.現有研究主要集中于交通狀態或現象的變化規律[25]、隱含關系[11,41,60,135]或成因影響[15,19,81]等信息的歸納分析,以及普適性知識經驗的挖掘.Zhao 等[25]對深圳市的智能交通卡數據進行探究,提出一個有效獲取個體乘客公共出行模式的數據挖掘過程,并使用基于統計學和無監督聚類的方法理解出行模式的隱含規律和異常現象.

4.3 特定情況下的未知交通行為、狀況或需求變化

進一步地,綜合利用所掌握的各方面確定性數據信息、相關關系或知識經驗,能夠推進對交通基本對象、常見事件以及正常或異常狀態的變化情況或其他相關未知信息的探究,即在擴大空間研究范圍的基礎上為突破時間尺度局限的深入研究與應用起重要輔助作用.其作為社會交通領域當前的熱點研究問題,所涉及的典型實際應用為交通行為[11,30,32,61]、交通事件[39,44,128,133]、交通狀況[11,21,38,42?43,48,136?138]、交通需求[19,35,60,139]及其他信息的預測[79,116,140].Lin 等[43]提出構建一個主題增強高斯過程聚合模型(Topic-enhanced Gaussian process aggregation model,TEGPAM)的概率框架,對傳統速度傳感數據與社交媒體數據進行融合,以改善道路交通速度預測結果.

結合跨媒體數據的檢測與識別能夠顯著提高感知和獲取信息的全面性和實時性,而大規模人工或虛擬數據的生成與使用則能夠增強技術方法和所得結果的泛化性和普適性.同時,綜合利用處理與分析跨媒體數據或人工數據所得特征規律或知識經驗等信息,有利于整體全面感知與理解交通場景及其成分的變化和內在聯動關系,為后續研究與應用提供合理有效的依據,從而提高研究結果的準確性和可靠性.

4.4 城市交通的統籌協調、管理控制或優化提升

在此基礎之上,上述數據的融合研究可應用于城市交通的統籌、管控與優化,包括信息的雙向傳播、交通狀態的管控、交通服務的優化及交通資源的規劃,乃至突發或特殊公共事件的信息上傳、資訊發布及相關應急預案的制定等應用,例如交通信號燈的智能調控、大規模人群狀態變化的預測與應對乃至重大傳染病患者移動軌跡的確定、引導與管控等[141?142],這些都對城市的快速且平衡發展具有重大意義,因而該研究方向將逐漸成為未來研究與應用的重心.目前,已有許多集成上述單項或多項研究應用的應用程序、網絡平臺或智能交通系統,為多類用戶群體提供全面的服務[11,20,50,52,66,69?70,74?75,130,133,136?139,143?149].鄭治豪等[75]開發了一套基于社交媒體大數據的交通感知分析與可視化系統,分別利用支持向量機算法、條件隨機場算法和事件提取模型實現微博的分類、命名實體識別與交通事件提取等任務,系統可視化模塊見圖6.

圖6 基于社交媒體大數據的交通感知分析與可視化系統[75]Fig.6 A traffic sensing and analyzing system using social media data[75]

鑒于當前研究應用的發展主要受限于可用數據的數量和質量,上述應用程序、平臺或系統趨于嘗試根據研究對象的自身性質、變化特征以挖掘與利用多源跨媒體數據,或由相對較少的數據中提取有價值的深層隱含信息后通過多種技術方法的使用與結合逐步實現知識自動化,又或利用平行系統的ACP方法人工生成大規模可用有效數據以解決這類研究困難,具體可參照文獻[96,100?101,106,150].

而進一步地,由于依據平行理論在實際系統的基礎上構建的人工系統,能夠設計模擬受各類復雜因素變化影響的交通系統,突破了一般應用場景的實踐研究局限.因此,通過平行系統進行大量的計算實驗能夠明確各類社會交通數據的適用場景,并驗證相關研究成果實際應用的有效性,進而實現多種復雜社會場景下的智能決策.

5 總結與展望

目前,社會交通在研究數據、方法思路、算法技術以及實際應用等方面均仍存在諸多問題與挑戰,領域內基本要素如圖7 所示.相關研究方向和內容還較為局限和分散,尚未形成完整且成熟的研究體系.

圖7 社會交通領域研究的基本要素Fig.7 Basic elements of research in the field of social transportation

從當前來看,充足的可用有效數據是社會交通領域研究所需面對的首要挑戰,其在數量和質量兩個方面均亟需擴增和提升.首先,數據的覆蓋范圍和數量有待擴增,主要表現在物理空間中實際數據覆蓋范圍有限、數據缺失和稀疏問題嚴重以及網絡空間中相關可用社交類數據量較少等方面.其次,數據的微觀準確性有待提升,主要表現在物理空間與網絡空間中數據信息可信性難以保證,且跨媒體數據間的融合存在壁壘阻礙.針對上述問題,研究人員提出利用仿真軟件及生成式對抗網絡生成大規模人工數據的思路,以及對跨媒體異構數據進行融合、互補及驗證等方法.相應地,對數據的探究間接引發了對用于數據處理與分析的算法技術的挑戰,其中包括應對同數據類型多源數據的普適算法或模型的泛化能力、人工數據生成模型搭建思路的邏輯合理性,以及融合分析多模態數據的技術方法的綜合性能.克服上述挑戰的關鍵在于深入探究前沿技術算法,對其進行優化、集成或融合.

作為交通工程學與社會學的交叉學科,社會交通與城市整體的規劃、建設及發展具有密切的聯系.然而,社會交通領域內的研究與應用還未充分發揮其在推動城市發展方面的作用.在具體實際應用方面,不足之處包括:廣泛且有效的探究并利用社會輿情、人際關系和群體智慧不足;充分挖掘數據信息得出有效知識經驗或可行智能決策不足;與城市交通系統較好地融合并形成合理的體系結構不足;與城市的規劃、調控及發展深入結合不足.為克服上述問題,研究應結合與交通不可分割的社會因素,從而進一步推動智能交通系統的未來發展.Xiong等[151]結合人類因素和社會因素提出的基于CPSS(Cyber-physical-social systems,CPSS)的交通系統,恰好符合王飛躍所指出的下一代以社會為中心的智能交通系統(又稱交通5.0[152])的典型特征,即基于CPSS.同時,作為交通5.0 的基本解決方案,包括ACP 理論等結構框架或理論方法在內相關研究的推廣與應用[153]則是未來交通系統發展的必經過程[154],而這一過程需要由大量來自信息、物理和社會空間的數據推動.

大規模的跨媒體數據能夠驅動社會交通研究的發展,尤其是需要依靠豐富多樣的數據信息來支撐的平行交通系統.構建實際城市交通系統對應的人工交通系統,根據真實數據信息利用計算實驗生成虛擬或人工數據,可對多種具體或特定場景下的交通狀態變化進行模擬與分析,從而為引導城市交通綜合管理走向智能化提供可靠的實驗基礎和指導,進而逐步實現平行智能交通.此外,為進一步擴大社會交通的影響效應,研究人員應嘗試拓寬研究思路和范圍,并結合技術算法的發展趨勢[155],發掘社會交通領域研究與應用的更多可能性,例如多人工交通系統的構建及協同運行.

猜你喜歡
信息研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 91精品福利自产拍在线观看| 国产AV毛片| 四虎AV麻豆| 亚洲欧美国产视频| 亚洲狼网站狼狼鲁亚洲下载| 日韩色图区| 超清无码一区二区三区| 99热这里只有精品5| 国产免费网址| 毛片最新网址| 欧美中文字幕无线码视频| 日日拍夜夜操| 青青草原国产av福利网站| 国产白浆在线观看| 国产丝袜丝视频在线观看| 找国产毛片看| 97国产在线观看| 91成人在线免费视频| 毛片免费观看视频| 在线国产91| 亚洲最新网址| 热99re99首页精品亚洲五月天| 国产一级无码不卡视频| 国产在线精品网址你懂的| 91午夜福利在线观看精品| 免费jjzz在在线播放国产| 亚洲伊人电影| 欧美午夜网站| 中字无码av在线电影| 在线色国产| 深爱婷婷激情网| 亚洲αv毛片| 国产精品极品美女自在线看免费一区二区| 久久国语对白| 婷婷色在线视频| 午夜福利视频一区| 一级毛片在线播放免费| 亚洲精品国产自在现线最新| 真人高潮娇喘嗯啊在线观看 | 久久久久久尹人网香蕉| 国产成年女人特黄特色毛片免| 婷婷午夜影院| 在线观看国产小视频| 自慰网址在线观看| 色偷偷男人的天堂亚洲av| 精品久久久久久中文字幕女| 日韩在线成年视频人网站观看| 亚洲侵犯无码网址在线观看| 国产拍在线| 网久久综合| 久久综合亚洲色一区二区三区| 欧美亚洲香蕉| 久久99精品国产麻豆宅宅| 久久天天躁狠狠躁夜夜躁| 97视频精品全国在线观看| 精品中文字幕一区在线| 国产免费久久精品44| 天天躁夜夜躁狠狠躁图片| swag国产精品| 黄色福利在线| 2021亚洲精品不卡a| 亚洲成人黄色网址| 国内精品免费| 欧美一区中文字幕| 狠狠色综合久久狠狠色综合| 亚洲国产精品日韩欧美一区| 91色在线视频| 自拍偷拍欧美日韩| 国产微拍一区二区三区四区| 午夜综合网| 无码福利视频| 国产成人8x视频一区二区| 在线亚洲天堂| 色综合日本| 亚洲啪啪网| 在线观看亚洲人成网站| 日韩亚洲综合在线| 国产精品内射视频| 免费精品一区二区h| 国产精品成人久久| 看你懂的巨臀中文字幕一区二区| 性网站在线观看|