李蒙,丁凌靈,林從謀
(華僑大學 土木工程學院,福建 廈門361021)
近年來,人員疏散問題一直面臨著嚴峻的挑戰.尤其是當地質災害發生時,一些場所由于人口稠密等原因導致疏散十分擁擠,一旦人群中發生擁擠踐踏事件,后果十分嚴重.地質災害的發生常常具有突發性,提前作出預測并及時采取有效、合理的人員疏散方案有其必要性.目前,針對人員疏散的研究可大體分為兩類:一類是關于數學理論在人員疏散中的應用;另一類是利用元胞自動機(CA)來模擬人員疏散的過程.彭華等[1]利用平面解析幾何知識為解決緊急疏散情況下的路徑規劃問題,提出一種新的算法;李?。?]則介紹了國內外常用的疏散模型算法,并比較分析出最優的算法,利用仿真軟件具體標定了算法中的參數,為建模及計算提供了參考;周金旺等[3]應用元胞自動機模擬了行人疏散的過程;宋偉等[4]用元胞自動機建立了人員的疏散模型;任書君等[5]則將元胞自動機與Agent技術相結合來研究人員的疏散過程;何大治等[6]從子空間網絡方面建立了人員的疏散模型.以上方法雖對人員疏散過程進行了較好地描述或模擬,但都沒有將人的行為因素考慮在疏散過程中,模擬結果可能存在較大的偏差.本文認為地質災害中人員疏散也可看作一個演化博弈過程[7-8].因此,提出一種基于演化博弈的地質災害人員疏散仿真,結合演化博弈將人的行為因素補充到人員疏散的過程中.
假定在一個時間步長內,每個個體隨機選擇另一個個體,并觀察其行為模式.當個體之間的行為模式相差不超過其觀測距離時,個體之間的行為模式會發生變化.假設每個個體為一個智能體Agent,那么Agent之間的行為模式會按照一定的比例更接近對方,也有可能完全趨同.假設每個Agent在逃生的過程中,都會對逃生方向及方法持有自己的行為模式,令行為模式為I,I∈(0,1).
若從人員中任意選擇某兩個個體Agent,他們各自的行為模式用Xi和Xj表示,其行為模式的觀測距離為d,則當d>|Xi-Xj|時,這兩個個體才能夠進行行為模式的交互.再假設行為模式之間的交互比例為p,兩者進行交互后,各自的行為模式為


改變p值可以獲得不同性質的群體.極端情況下,當p=0時,參與交互的雙方不發生行為模式的改變;當p=1時,一方完全轉變為另一方的行為模式.一般情況下,當p=1/2時,是指交互雙方均將發生一定的行為模式的改變,而改變值為其行為模式距離的算術平均值.
地質災害有多種,以山體滑坡為例,假設山體上已經出現滑坡趨勢時,人群中會出現兩類個體:A類和B類.每個個體都會對自己的行為模式(假定為是否逃生及逃生的路線和方法)持有自己的觀點,A類個體I,I∈(0.5,1),B類個體I,I∈(0,1).如果兩類個體隨機地一一配對,則可以構成了無數同質且獨立的博弈單元.
若A類個體對于信息具有一定的優勢,如年齡較大的個體有過躲避山體滑坡的經驗,或受過一定的逃生培訓,具有一定的逃生知識,或掌握正確及時資訊的個體,而B類個體則不具備此優勢.當山體滑坡發生時,A類個體與A類個體進行配對,假定不會發生行為模式的交互,此時p=0;而當A類個體與B類個體配對時,A類個體選擇說服B類個體的概率為q,選擇不說服的概率為1-q.B類個體也會采取相應的策略,那么B類個體選擇相信的概率為i,選擇不相信的概率為1-i.由于天氣對災害的發生會造成影響,天氣良好,山體滑坡不發生的概率為j,山體滑坡如預期發生的概率為1-j.
當與選擇說服策略的A類個體配對的B類個體,選擇相信A類個體.若因天氣良好,山體滑坡不發生,那么對于A類個體,除了得到固有收益之外,還可能會得到額外收益S(S=1/d),同時A類個體也要付出說服成本C,則A類個體的總收益為R+S-C,而B類個體可能獲得收益r,也可能因疏散造成家中無人而財物意外損失u,B類個體的總收益為r-u;若山體滑坡如預期發生,則B類個體有損失v(如房屋受損,但人身安全得到保障).如果B類個體對A類個體的選擇策略是不相信,對于A類個體,除了得到固有收益R之外,同樣付出了說服成本C,則其收益是R-C;若因天氣良好,山體滑坡不發生,則B類個體可能獲得收益r,B類個體的總收益為r;若山體滑坡如預期發生,則B類個體有損失V.
當A類個體選擇不說服的策略時,A類個體的收益仍然為R,如果B類個體選擇盲目相信的策略,此時若跟著A類個體的疏散行為模式,若因天氣良好,山體滑坡不發生,B類個體可能獲得收益r[8],也可能因疏散造成家中無人而財物意外損失u,B類個體的總收益為r-u;若山體滑坡如預期發生,則B類個體有損失V.但若是跟錯了個體,跟著自己同類的個體則可能有被誤導的可能性,從而造成一定的損失d,其中,d為兩個隨機選出個體之間的行為模式距離的絕對值.假設A類個體在疏散群體中所占的比例為k∈(0,1),而群體總數為n,則此時B類個體的收益期望值為r(k/n)-d(1-k)/n;如果B類個體選擇不相信的策略,則A類個體的收益仍然為R,若因天氣良好,山體滑坡不發生,則B類個體可能獲得收益r,B類個體的總收益為r;若山體滑坡如預期發生,則B類個體有損失V.假設A類個體的可能獲得收益與其付出成本成比例C=x/d.
在上述假定的情況下,每個個體的收益不僅與自己的選擇有關,也與和自己博弈的對方的選擇有關,還與天氣狀況有關.分別計算每類個體的期望收益和平均收益.
A類個體的收益為

當UA(說服)不等于UA(不說服)時,得益較差的一方早晚會發現得益的差異,從而在再次面對災害時,改變自己的策略,模仿得益較好的另一類型.因此,說服與不說服兩種類型的個體的比例是隨時間變化的函數,分別為q(t)和1-q(t),則說服博弈方的動態變化速度可用復制動態方程表示為[9]

根據動態方程,如果x=i,則dq/dt始終為0,所有q都是穩定狀態,意味著只有比例為q的A類個體選擇說服策略,其余個體均選擇不說服策略.如果x>i,Q(x)<0,則q=0,q=1是q的兩個穩定狀態,其中q=0是演化穩定狀態,所有A類個體均選擇不說服策略.若x<i,Q(x)>0,則q=0,q=1是q的兩個穩定狀態,其中q=1是演化穩定狀態,所有A類個體均選擇說服策略[10].
同理可得,B類個體的收益為

根據動態方程,如果x=j,則dq/dt始終為0,所有i都是穩定狀態,意味著只有比例為i的B類個體選擇相信策略,其余個體均選擇不相信策略.如果x>j,I(x)<0,則i=0,i=1是i的兩個穩定狀態,其中i=0是演化穩定狀態,所有B類個體均選擇不相信策略.若x<j,I(x)>0,則i=0,i=1是i的兩個穩定狀態,其中i=I是演化穩定狀態,所有B類個體均選擇相信策略.當博弈達到均衡時,也即A類和B類個體之間的觀點趨向一致.
采用連續的疏散模型,利用Repast仿真工具進行仿真.A類個體的疏散觀點定義在(0.5,1)區間內;B類個體的疏散觀點定義在(0,1)區間內;個體個數為N.其中,A類個體占個體總數比例為y,B類個體占1-y,每個個體在初始狀態隨機的選擇觀點值,每次博弈時,在A類和B類的個體中隨機選擇,每個個體選擇自己的觀點,并進行疏散觀點的交互,將相應改變自己的觀點值.假設每個個體在博弈過程中所選擇的觀點與他們以前和其他個體交互所采取的觀點所獲得的收益有關.
取N=100,y=0.5,R=1,r=0.5,V=0.5,u=0.21作為初始情況,疏散模型演化圖如圖1所示.由圖1可知:隨著交互次數的增加,每個個體的疏散觀點會逐漸演化,收斂形成幾個觀點群體,經過一段時間后,最終達成觀點統一,形成一個觀點群體.

圖1 初始情況疏散模型演化圖Fig.1 Initial evolution chart of evacuation model
由圖1中觀點演化的情況表明:在剛開始的時候,由于B類個體選擇相信策略的收益并不高,而A類個體為了減少不必要的損失而選擇不說服策略,B類個體由于信息方面不具有優勢,隨機選擇觀點,但隨著時間的推移,A類個體發現選擇說服策略可以獲得更大的利益,B類個體則發現選擇相信策略比不相信策略的收益大,因而疏散觀點逐漸演化合并,最終形成一個統一的觀點.
當增加B類個體選擇相信策略的收益r,會發現收斂時間得以提前,可以更快捷有效地疏散人群.例如,取N=100,y=0.5,R=1,r=0.7,V=0.5,u=0.2,仿真圖如圖2所示.

圖2 增加B類個體仿真圖Fig.2 Simulation of increasing agent B
由圖2可知:由于B類個體選擇相信策略的收益提高,所以B類個體會更多地選擇相信策略,相應的,A類個體為了獲得最大的收益,在一開始便大量使用說服策略,從而疏散觀點的交互過程較為簡單,疏散觀點可以很快達到一致,交互時間得到大量減少.
當減少A類個體選擇說服策略的收益R,發現導致疏散觀點一片混亂,最終沒有達成一致.例如,取N=100,y=0.5,R=0.5,r=0.5,V=0.5,u=0.2,仿真圖如圖3所示.

圖3 減少A類個體仿真圖Fig.3 Simualtion of decreasing agent A
由圖3可知:由于A類個體選擇說服策略的收益降低,所以A類個體出于獲得最大的收益的考慮,選擇說服策略的機率也大幅降低,將有大量A類個體選擇不說服策略,也會有大量B類個體選擇不相信策略,從而會出現多個疏散觀點群體.
疏散策略收斂的時間與A,B兩類個體的比例有直接的關系,例如,當分別取y=0.3,y=0.5,y=0.7,而其他參數不變,即N=100,R=1,r=0.5,V=0.5,u=0.2,仿真圖如圖4所示.圖4中:n為仿真次數;t為收斂時間.

圖4 y對收斂時間的影響Fig.4 Influence of yon convergence time
由圖4可知:隨著A類個體占總體比例的減少,即對信息擁有優勢的個體在人群中的比例的減少,遇到的選擇相信策略的B類個體的概率也降低,從而造成疏散觀點收斂時間變長,疏散時間也相應變長,反之則變短.
將個體異質性引入個體的行為中,提出演化博弈收益函數,模擬仿真博弈模型,得到以下4點結論.
1)由于受教育程度和社會關系等因素的不同,受災人員中必然會有一些人具有信息優勢,當其中一部分人發現適當透露自己已知的信息去說服別人可能獲得超額利益,他們可能會繼續采取說服策略.
2)信息劣勢者發現選擇相信后能夠提高收益,減少損失,會繼續相信并吸引更多人追隨前者,反過來也激勵更多信息優勢者選擇說服策略,從而實現博弈均衡.
3)提出一個基于演化博弈論的災害人員疏散仿真模型,與其他的人員疏散仿真模型不同的是,考慮了個體的消息不對稱問題,通過個體的不同選擇,使得模型可以更好地研究個體行為對逃生結果的影響,從而制定出更加有效的疏散方案.
4)不同策略的收益、具有信息優勢者的比例等因素均對災害人員的疏散過程有著顯著的影響.
[1] 彭華,許斌,羅燦華,等.一種基于幾何方法的人員疏散多威脅規劃算法[J].建筑科學,2010(3):84-86.
[2] 李俊.體育場館人員疏散時間數學模型研究[J].哈爾濱商業大學學報:自然科學版,2011,27(2):13-20.
[3] 周金旺,陳秀麗,孔令江,等.基于元胞自動機的行人流疏散模擬研究[J].廣西師范大學學報:自然科學版,2008,26(4):14-17.
[4] 宋偉,李美彥,胡曉琴.基于元胞自動機的人員疏散微觀仿真[J].交通科技與經濟,2011,65(3):85-88.
[5] 任書君,汪波,歐陽朝輝,等.基于Agent和元胞自動機的人員疏散過程建模與仿真[J].福建電腦,2011,27(3):99-101.
[6] 何大治,謝步瀛.基于子空間網絡的人員疏散模型[J].工程圖學學報,2009,12(2):24-26.
[7] 韓少春,劉云,張彥超,等.基于動態演化博弈論的輿論傳播羊群效應[J].系統工程學報,2011,26(2):275-281.
[8] 夏茂森,朱憲辰,江波,等.農產品交易行為的動態演化博弈分析[J].技術經濟,2009,28(8):123-127.
[9] BRAUER F,DRIESSCHE P.Models for transmission of disease with immigration of infectives[J].Mathematical Biosciences,2001,171(2):143-154.
[10] 朱孔金,楊立中.房間出口位置及內部布局對疏散效率的影響研究[J].物理學報,2010,59(11):7701-7707.