摘要:提出了一種基于Agent的智能交通控制系統,并對各Agent及其交互進行建模,闡述了各Agent交互協調的過程。在該系統中,每個交通元素被定義為具有自主性、適應性和合作協調性的智能化Agent。各Agent可自主地進行道路數據采集、處理,并通過相互通信實現資源共享,從而使每個交通元素都具有足夠的智能參與交通的智能化決策,在很大程度上降低交通系統中的不確定因素和不完備信息對交通穩定性的影響,提高了交通控制的精確度。
關鍵詞:Agent;智能交通; 建模; 交通控制
中圖法分類號:TP301文獻標識碼:A
文章編號:1001-3695(2007)01-0103-04
1引言
ITS(Intelligent Transportation System)在早期曾被稱為智能車輛道路系統(Intelligent VehicleHighway System,IVHS),它是目前世界各國交通運輸領域競相研究和開發的熱點。它由若干子系統所組成,通過系統集成將道路、駕駛員和車輛有機地結合在一起,加強了道路各元素之間的聯系[1~3]。借助于系統的智能化技術,駕駛員可以實時了解道路交通以及車輛的狀況,以最為安全和經濟的方式到達目的地。同時,管理人員通過對車輛、駕駛員和道路實時信息的采集來提高其管理效率,以達到充分利用交通資源的目的。
針對智能交通系統是由若干道路元素組成,從而共同完成系統最終目標這一特點,目前提出的基于Agent的智能交通系統模型的構建思路是將整個系統看作是一種典型的、大規模和粗粒度的Agent系統[4],將交通系統中各組成元素如車輛、交通燈和路段等用Agent建模,這些基本交通元素Agent都有自己的行為目的和準則,并互相影響和互相作用,從而共同完成對整個實際交通系統的模擬,并在此基礎上對交通信號進行控制,實現系統優化。目前,各交通元素Agent的實現以及對道路信息的充分利用達到了很好的效果,但Agent之間如何更好地交互以實現資源共享還處于研究階段。
本文在此基礎上提出了一種基于Agent的智能交通控制系統建模。
2Agent理論
Agent是一個具有控制問題求解機理的計算單元,它可以指一個機器人、一個專家系統、一個過程、一個模式或求解單元[5~7]。Agent既能完成各自的局部問題求解,又能通過協作求解全局問題,Agent相互協作產生不同的行為,適應不斷變化的環境。每個Agent根據當前的狀態決定自己的行為,協作解決當前的全局任務。
Agent有許多特性[5],本文主要研究Agent下面三個特性[5,6,9]:
(1)自主性。它是指Agent具有自己的目標模式,并由目標引導自己的行為,這種行為不是簡單的反應行為,而是具有主動性,能達到單個Agent最優。車輛Agent的基本目標是行車時間最短,它基于自己的知識庫和復雜的決策判斷能力,在行駛之前確定出自己的選擇路徑。
(2)適應性。它是指適應環境,具有從經驗中學習的能力,以實現在變化的環境中改善自己。Agent在接受任務、完成任務的過程中不斷地更新自己的知識庫,使自己的行為計劃與實際目標的偏差不斷減小。
(3)合作性和協調性。它是Agent的一個重要的特性,特別是在多Agent系統中。車輛Agent和主控中心Agent之間進行協調已達到個體用戶和系統用戶的較優,同時達到它們各自的目標;路段Agent 不斷地與車輛Agent和主控中心Agent交互,將信息提供給交通燈Agent,使其更好地控制整個交通系統。
在Agent 系統中,Agent總處于一定的環境中并能通過某種感知方式探測環境,單個Agent是具有行為能力的實體,基于預先制定的目標主動地采取行動,并在執行過程中不斷地與環境進行交互、充分地了解和適應環境的變化[5]。在智能交通系統中,不可預知的情況較多,交通元素總是處在一定的交通環境中,并且系統要求各交通元素具有獨立的行為能力,在實現系統目標的同時,充分實現個體的目標。Agent對不斷變化的環境的適應性和求解問題的自主性,以及Agent間的相互合作和協調的特性很適合于解決交通控制問題。
3系統各Agent的建模
3.1車輛Agent的建模
3.1.1車輛Agent的內部結構
作為交通系統的主要元素,不斷運動的車輛是最重要的對象,因此車輛Agent是系統中最為重要的一種Agent。它應該是高度自治的主體,可自動獲取外界環境的信息,并且擁有自己的知識庫和復雜的決策判斷能力,可根據周圍的交通情況實時調整自己的駕駛行為。
車輛Agent能夠制定行車計劃,并且可以與主控中心Agent進行交互。從而協商得到一條對系統和個體都較優的道路選擇,幫助主控中心Agent作出最終的道路規劃。車輛Agent的構造如圖1所示。
圖1車輛Agent的內部結構圖
車輛Agent通過環境感知系統檢測環境信息,結合通過通信模塊從其他Agent得到的信息和自己已有的知識庫,通過信息處理以及信息核實模塊產生自己的行為,確定出滿足用戶最優的可選道路集。
圖1中知識庫包括ROM區和RAM區,在本系統中將其分別定義如下:
ROM區存放的是相對穩定的信息,即車輛的特性、道路的靜態權重、支持決策的知識庫(包括駕駛規則、交通控制規則和事實、習慣路徑等)、問題求解知識及通信知識。這部分信息保持相對穩定,道路的靜態權重由主控中心Agent提供,此知識庫由系統定時進行更新。
RAM區存放的是車輛Agent 自身的動態信息、駕駛員特性(駕駛員類型和疲勞程度)及狀態(駕駛的緊張程度)、行車計劃(目的地及沿途要完成的任務)。這部分信息需要實時更新。
3.1.2車輛Agent對道路效用值的確定
在車輛引入Agent后,該車輛Agent以使本車輛最佳的原則出發,基于內部各功能塊協調進行道路選擇,達到個體用戶最優。
車輛Agent的道路選擇模型主要是基于兩個參數,即各條道路的靜態權重集和車輛的行車意圖。
車輛Agent知識庫的ROM區中存放著關于道路的靜態權重,即由道路上諸多相對不變的因素得到道路可供車輛選擇的程度值。這里,影響權重的主要靜態因素有紅綠燈的數量、坡度、限速、路寬、單雙向、公交車的通行量、道路長度、其他(如彎度、加油站個數、停車廠個數和天氣情況等)。
依據車輛Agent動態知識庫RAM區里的信息,結合靜態權重確定出基于車輛Agent的道路的效用值。車輛Agent依據道路的效用值給出所提供道路的有序集 (依據效用值從小到大的排序) 。
為了使擁有不同權重范圍的道路可以互相比較,道路的效用值可通過對數傳遞函數來標準化使其范圍限定在0~1之間[6]。
其中, n是車輛Agent在行進中必須完成的任務個數,把每個任務的權系數設為1;m是次任務(可以不完成或推遲完成)的個數,其權系數為0.5;Wg是道路的靜態權重;v是進行標準化前的道路效用值;Ug是標準化后得到的道路效用值。
3.2主控中心Agent的建模
在第3.1.2節中給出了車輛Agent 的數學建模,主控中心Agent采取的建模方法與車輛Agent相同,不同的是它在得到了各個路段Agent的信息后綜合權衡(為用戶提供的路徑,在保證實現用戶必須完成的任務的基礎上,滿足路段Agent的交通流量需求的同時,最大可能地實現用戶的次任務),得到滿足條件的道路效用值,然后依次將道路效用值以及該道路能完成的次任務提供給車輛Agent。
3.3路段Agent路徑判斷建模
3.3.1區間平均車速
為了確定路段的整體通行情況,這里引入了區間平均車速。區間平均車速是指在特定的時間區間內,占據一定道路區間的所有車輛的速度平均值。
其中,所測區間的總長度是s, ti為第i輛車的行程時間 (i=1,2,…,n),車輛經過一端路口的時刻為t1i,經過另一端路口的時刻為t2i,而ti=t2i-t1i。這里t1i和t2i由主控中心Agent提供給路段Agent。
3.3.2交通流量模型
路段的路徑判斷建模運用了一種已成型的并且較合理的QV關系模型[10](其中Q表示交通量,V表示速度,km指最佳密度,Vf指自由車速)。其函數圖形如圖2所示[10]。
第3.3.1節已經得到了區間平均速度,將其帶入式(4)所表示的模型中,即可判斷出該路段該時刻的交通狀況,當區間平均速度小于Vm,則路段Agent會同意車輛Agent的路徑選擇;若平均速度大于Vm,則路段Agent拒絕車輛Agent的路徑選擇。
4車輛Agent與系統中其他Agent之間的交互
4.1系統中各Agent的功能
(1)交通燈Agent
交通燈Agent位于控制系統的底層,具有包含關于本交叉路口及其所連路段的特點的知識、數據信息的知識庫,與路段Agent進行實時通信,并根據本交叉路口的交通流狀況以及周圍的交通情況實時自動地計算優化交通控制參數,對交通信號進行調整,以使控制效果達到最優。交通燈Agent是實現交通控制任務的主要承擔者。
(2)路段Agent
路段Agent是智能控制系統的中間層,接受車輛Agent的注冊和主控中心Agent的預警,負責本路段的監測、維護和協調工作。向上對主控中心Agent負責,實時提供該路段的狀況,以便主控中心Agent及時處理突發事件,并依此為車輛Agent尋求路徑;向下為路段所連接的兩個交通燈Agent提供知識庫數據,以便實時有效地控制交通信號。(3)車輛Agent
車輛Agent作為交通系統的主要元素,一方面可自動獲取外界環境的信息,并且擁有自己的知識庫和復雜的決策判斷能力,確定出滿足單個車輛最優的行車路徑。另一方面,車輛Agent能夠制定行車計劃并且可以與主控中心Agent進行交互,從而協商得到一條對系統和個體都較優的道路選擇,幫助主控中心Agent作出最終的道路規劃。(4)主控中心Agent
主控中心Agent位于控制系統的頂層,負責城市整體交通的控制、監測和協調工作。主控中心中存有車輛從源節點到目的節點的所有路徑,以及旅行時間和速度的歷史數據,同時也會不斷地記錄所有進入系統的車輛Agent及其源節點和目的節點。它接收車輛Agent的任務請求以及路段Agent 的信息提供,由此作出判斷,為車輛Agent提供可行的道路選擇,并接收它的確定反饋信息,為路段Agent提供預警。具有最高的決策權力,并可在此基礎上進一步與智能交通系統中的其他Agent 進行協作,共同完成城市交通系統的精確管理和控制。
4.2交互系統構建
在單個用戶和整個交通系統之間創造一個合作模式很困難,因為其各自的目標是矛盾的。傳統的交通分配有兩種模式,即系統最優(System Optimum,SO)[2]和用戶最優(User Optimum,UO)[13]。通常認為交通管理者期望實現系統最優,而用戶最優更易被用戶所接受。在用于誘導時,兩者的缺點也很明顯,SO策略可能向用戶推薦行程時間過長的路線,而UO策略可能將用戶誘導到行程時間短但擁擠嚴重的路線上,從而大大增加其他用戶的行程時間,使系統效益受損。比較可行的解決方法是在沒有嚴重危害任何一個單個用戶的道路選擇以及行程時間的期望的基礎上,在時間和空間上對交通網絡進行有效的分配,達到系統較優。
在交通各元素引入Agent后,從整體看來,單獨一種Agent的最佳并不是全局最佳,交通網絡控制的目的是實現整個網絡交通堵塞和交通延誤最低[3],所以Agent之間的交互協調對智能交通系統的精確控制的實現就極為重要。基于以上分析,提出了系統中各Agent的交互模型,如圖3所示。該模型在可以為各道路元素實時預報交通狀況的基礎上,滿足系統和用戶最優。提出這一模型的目的在于探究一種新的方法,使其在增強網絡性能的同時也能夠提高用戶接受的可能性,從而確定行車路線。實現這一目標的主要依據如下:
(1)可以使多個車輛Agent的目標綜合成系統的統一路徑分配;
(2)可以使系統Agent把僅依照自己的目標進行道路分配變成結合各車輛Agent提供的路徑以及路段Agent提供的信息進行分配的形式。
4.3多Agent的協調過程
在由多Agent構建的交通系統中,強調Agent的自主性和Agent間的相互操作性,在這個開放的多Agent系統中完成Agent所有者的任務。各交通元素Agent之間可以達到一種互相接受的一致性,最終完成系統目標[11,12]。各Agent的交互結構如圖3所示,交互的過程可以歸納如下:
(1)車輛Agent開始執行行車計劃時,基于自身的知識庫計算出各條可選路徑的效用值,向主控中心Agent提交旅行任務并同時提供一條用戶最佳路徑(如果該車輛曾經在該路段行駛過,通常會提供一條習慣路徑,這一點表現出車輛Agent的自主性與學習性。若第一次路徑選擇成功,可以避免主控中心Agent為車輛Agent提供選擇路徑的工作量)。
(2)主控中心Agent接收到任務后,立即與路段Agent進行交互,確定車輛Agent的路徑選擇是否可行。
(3)路段Agent基于自身的知識庫會確定出該路徑選擇是否可行。
(4)若路段Agent準許,主控中心Agent立即通知車輛Agent其選擇得到批準, 并要求其返回確定信息;若路段Agent不準許,主控中心Agent會從已經獲取的信息中推理計算出合理的路徑選擇(可以是按優劣依次進行排序的多條路徑),然后通知車輛Agent,要求車輛Agent從其提供的路徑中再作選擇。
(5)車輛Agent的路徑選擇得到準許,則向主控中心Agent返回確認信息;否則,從主控中心Agent提供的路徑中選出一條較佳的,并返回確定信息。每一個車輛Agent與主控中心Agent從它們選擇的比較優的一組路徑中進行協商,由車輛Agent來最終決定選擇哪條路徑。
(6)主控中心Agent在車輛Agent駛進路段前,對其要經過的路段Agent 預警,通知路段Agent車輛Agent進入的時間及預定駛出的時間,以便路段Agent具有預知性,路段Agent會將這一信息提供給交通燈Agent,以便其控制交通信號燈。
(7)車輛Agent進入路段時需向路段Agent注冊,并在行進中接收該路段Agent的實時信息,以調節自己的運行狀態。
(8)車輛Agent離開路段時,需要通知路段Agent來注銷先前的注冊。路段Agent注銷車輛Agent的同時將信息報告主控中心Agent,以便主控中心Agent把車輛Agent實際行車時間與其對該車輛Agent作出的預定行車計劃作比較,用來更新主控中心Agent的知識庫,對車輛Agent 的道路選擇作出精確的決策。
(9)路段Agent在與主控中心Agent進行實時交互的同時,也不停地向交通燈Agent傳遞信息,使交通燈Agent作出精確的策略來控制交通信號燈,以達到交通的系統最優。
當車輛駛出當前路段(步驟(8)),需要注銷先前的注冊,在車輛駛入下一路段之前,依照步驟(7)進行新的預注冊。而在車輛駛入源節點的時刻,主控中心Agent為從源節點到目的節點所要歷經的所有路段預警。當車輛Agent到達目的節點后,整個任務結束。開始新任務時,從步驟(1)重新執行。
5結論
本文提出了一種基于多Agent智能交通控制系統的結構,各Agent之間進行交互,并能自主地適應環境。該設計有以下幾個優點:
(1)單個車輛Agent可以獨立地確定行車路徑,也可以與主控中心Agent協商,Agent都試圖實現本車輛的行車路徑最佳。
(2)各Agent具有適應性,在運行和求解問題時不斷地更新自己的知識庫,隨著知識的逐漸增長,Agent能更高效地解決問題。
(3)各Agent之間通過交互達到資源共享,減少了知識的冗余。
(4)由于各Agent 的自主性,可以通過分別完善獨立的Agent來實現系統的不斷改進。
Agent技術已成為人工智能和計算機領域發展最快的課題之一,本文對基于Agent的交通系統的建模進行了初步研究。Agent系統作為解決交通控制問題的一條途徑有很好的前景。
參考文獻:
[1]李振龍. 城市交通誘導策略的探討[J].交通科技,2003,(1):13.
[2]葉懷珍,周賢偉,陳常嘉.系統最優的動態交通網絡流分配模型的研究[J].西南交通大學學報, 2001,36(4):396400.
[3]李江,傅曉光,李作敏.現代道路交通管理[M]. 北京:人民交通出版社,2000.
[4]路海明,盧增祥,李衍達.信息Agent的研究開發現狀[J].計算機科學,1999,26(12):3840.
[5]何炎祥,陳莘萌. Agent和多Agent系統的設計和應用[M]. 武漢:武漢大學出版社,2001.
[6]Ashri,Ronald,Luck,et al.From SMART to Agent Systerms Development[J]. Engineering Applications of Artificial Intelligence, 2005,18(2):129140.
[7]周立柱,趙洪彪. Agent行為及其新的服務方式[J]. 計算機科學,1999,26(3):5154.
[8]唐文彬, 朱淼良. 基于強化學習的多Agent系統[J].計算機科學, 2003,30(4):1618.
[9]苑泉樂,孟慶春,殷波,等. Agent 在交通信號控制中的應用設計[J]. 計算機應用研究,2002,(增刊):1214.
[10]李筱菁,孟慶春,熊建設,等. 基于GPS系統的城市交通狀況實時檢測技術[C].上海:第四屆全球智能與自動化大會,2002.
[11]Pivk, Aleksander, Gams,et al. DomaindependentInformation Gathering Agent[J]. Expert Systerms with Application, 2002,23(3):207218.
[12]Jeffer L Adler,Goutam Satapathy, Vikram Manikonda,et al.A MultiAgent Approach to Cooperative Traffic Management and Route Guida ̄nce[J].Transportation Research Part B,2005,39:297318.
[13]Rnoald van Katwijk, Paul van Koningsbruggen. Coordination of Traffic Management Instruments Using Agent Technology[J]. Transportation Research Part C 10:Emerging Technologies,2002,10(5):455471.
作者簡介:
王娜(1982), 女,陜西人,碩士,主要研究方向為智能交通、圖像處理;
王國宇(1962),男,山東青島人,電子系系主任,教授,博士,主要研究方向為信號處理、模式識別;
孟慶春(1958),男,山東煙臺人,副院長,教授,博士,主要研究方向為智能控制、機器人;
殷波(1976),男,山東青島人,博士,主要研究方向為智能機器人。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文