999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

離散奇異隨機Markov跳變系統(tǒng)的N人Nash博弈

2021-10-13 07:42:10周海英
南昌大學學報(理科版) 2021年3期
關(guān)鍵詞:控制策略策略系統(tǒng)

周海英

(廣州航海學院港口與航運管理學院,廣州 510725)

1 引言與研究背景

現(xiàn)實實際中的許多系統(tǒng)在結(jié)構(gòu)和參數(shù)等方面往往都表現(xiàn)出隨機變化的規(guī)律,當這種規(guī)律服從Markov過程時,這樣的系統(tǒng)被稱為Markov跳變系統(tǒng)[1]。Krasovskii和Lidskii在1961年首次提出了Makov跳變系統(tǒng)的概念,隨后,Sworder基于隨機最大值原理討論了帶Makov跳變參數(shù)的混合線性系統(tǒng)并成功將其應(yīng)用到實際控制問題。此后,Markov跳變系統(tǒng)因其在制造系統(tǒng)、飛行控制器系統(tǒng)、機器人操作系統(tǒng)、通信系統(tǒng)、神經(jīng)網(wǎng)絡(luò)中的分析仿真等方面都有著非常實際的應(yīng)用背景,引起了國內(nèi)外學者們的廣泛關(guān)注。近些年,Markov跳變系統(tǒng)逐漸成為研究熱點,相應(yīng)的研究成果日益豐富[2-6]。一般地,僅由微分方程描述的系統(tǒng),稱為正常系統(tǒng);由微分代數(shù)方程(組)描述的系統(tǒng),稱為奇異系統(tǒng)。奇異系統(tǒng)相較正常系統(tǒng),更具廣泛適用性,其實際應(yīng)用背景豐富,如電網(wǎng)系統(tǒng),化工過程,核能源反應(yīng)堆以及社會經(jīng)濟領(lǐng)域等等。因此,學者們也越來越重視對奇異Markov跳變系統(tǒng)的分析以及研究。Tao等研究了時滯奇異隨機Markov跳變系統(tǒng)的容許性問題[7],Chávez-Fuentes等探討了離散奇異Markov跳變系統(tǒng)的正則和穩(wěn)定性條件[8],Yu等探討了時變奇異馬爾可夫跳躍系統(tǒng)的觀測控制問題[9],Zhang等探討了奇異Markov跳變系統(tǒng)的控制問題[10]。

另一方面,微分博弈理論由于在經(jīng)濟、管理、自動控制等領(lǐng)域應(yīng)用廣泛[11-13],備受關(guān)注。雖然確定性微分博弈向不確定隨機微分博弈的過渡是項艱巨的任務(wù),但卻是更符合客觀實際的。隨著時間的推進,微分博弈的相關(guān)研究已從一般系統(tǒng)擴展到奇異隨機系統(tǒng)、Markov跳變系統(tǒng)等更為復雜的系統(tǒng)。

Moon等研究了馬爾可夫跳躍系統(tǒng)線性二次隨機零和微分博弈的充分條件[14]。Zhou等用配方法研究了連續(xù)時間和離散時間奇異隨機系統(tǒng)的線性二次微分博弈問題,得到均衡策略存在的條件[15-16]。Mukaidani等給出了奇異隨機系統(tǒng)的Pareto策略及其數(shù)值求解算法[17]。Song等研究了Markov跳變系統(tǒng)二人零和微分博弈均衡策略[18]。Zhang等系統(tǒng)的研究了線性Markov跳變系統(tǒng)連續(xù)時間和離散時間下的Nash博弈均衡策略,并給出了其在金融保險中的應(yīng)用[19]。Cao等研究了連續(xù)時間奇異隨機Markov跳變系統(tǒng)的Nash博弈問題,給出了N人Nash均衡策略存在的條件及其顯式表達式[20]。縱觀上述文獻,關(guān)于隨機奇異系統(tǒng)、Markov跳變系統(tǒng)微分博弈問題已有一定成果,而關(guān)于奇異Markov跳變系統(tǒng)隨機微分博弈問題的研究還處于起步階段。

基于此,本文對離散奇異隨機線性Markov跳變系統(tǒng)的N人Nash博弈問題進行分析,得到有限時間和無限時間下Nash均衡策略存在的條件及顯式表達式,并將所得結(jié)果應(yīng)用于隨機H2/H∞控制問題。本文討論N人博弈問題,相較于兩人博弈問題,實際應(yīng)用范圍更廣且更具一般性;其次,討論的受控系統(tǒng)為離散奇異隨機Markov跳變系統(tǒng),充實了微分博弈的理論研究;最后,將所得結(jié)果應(yīng)用現(xiàn)代魯棒控制中的隨機H2/H∞控制問題,豐富了微分博弈的應(yīng)用研究。

2 預備知識

考慮一類離散奇異隨機線性Markov跳變系統(tǒng):

{Ex(t+1)=A(rt)x(t)+C(rt)x(t)w(t),

x(0)=x0∈n

(1)

其中,x(t)∈n是狀態(tài)變量,w(t)是在給定的完備概率空間(Ω,F(xiàn),P)上的實隨機變量序列,且滿足ε(w(t))=0和ε(w(t)w(s))=δts,δts為克羅內(nèi)克算子。rt是一個取值于狀態(tài)空間Ξ={1,2,…l}的離散時間Marko過程,其轉(zhuǎn)移概率為Pr{rt+1=j/rt=i}=πij,轉(zhuǎn)移概率矩陣為Λ={πij}l×l,其中πij≥0且對于任意的i,j∈Ξ滿足和w(t)相互獨立。(x0,r0)∈n×Ξ是初始狀態(tài),E∈n×n是給定的奇異矩陣,rank(E)≤n,A(rt)、C(rt)為適維常數(shù)矩陣,當rt=i(i∈Ξ)時,A(rt)=A(i),C(rt)=C(i)。

為保證系統(tǒng)(1)解存在的唯一性,給出下述引理1。

引理1[21]對所有的i∈Ξ,如果存在一對非奇異矩陣U(i),V(i)使得對三元組式(E,A(i),C(i))滿足下述條件之一,則系統(tǒng)(1)存在唯一解。

(2)

其中A1(i),C1(i)∈r×r,C2(i)∈r×(n-r),C3(i)∈(n-r)×(n-r)。

其中Nn2(i)∈n2×n2是冪零的,且n1×n1,C2(i)∈n1×n2,n1+n2=n。

定義1[22]離散奇異隨機Markov跳變系統(tǒng)(1)是:

(Ⅰ) 正則的,如果對所有的i∈Ξ,det(sE-A)不恒為0;

(Ⅱ) 無脈沖的,如果對所有的i∈Ξ,deg(det(sE-A))=rank(E);

(Ⅲ) 均方穩(wěn)定的,如果對任意的初始條件(x0,r0)∈n×Ξ,都有

(Ⅳ) 均方容許的,如果它是正則,無脈沖和均方穩(wěn)定的。

引理2[21]離散奇異隨機Markov跳變系統(tǒng)(1)是均方容許的,如果存在矩陣P(i)=P′(i),使得對每一個i∈Ξ,下式成立:

E′P(i)E≥0,

(3)

3 有限時間N人Nash博弈

3.1 問題描述

考慮以下離散奇異隨機線性Markov跳變系統(tǒng):

(4)

其中,x(t)∈n表示狀態(tài)變量,uk(t)表示博弈人k(k=1,2,…,N)的控制策略,其容許策略空間記為Uk。w(t)是實隨機變量序列,且滿足ε(w(t))=0和ε(w(t)w(s))=δts。rt是一個取值于狀態(tài)空間Ξ={1,2,…,l}的Markov過程,rt和w(t)相互獨立。當rt=i,i∈Ξ時,系數(shù)矩陣A(t,rt)=A(t,i),A1(t,rt)=A1(t,i),Bk(t,rt)=Bk(t,i)。

對于博弈人k,其性能指標取經(jīng)典的線性二次型:

(5)

當rt=i,i∈Ξ時,Rk(t,rt)=Rk(t,i)≥0∈Snk,Qk(t,rt)=Qk(t,i)≥0∈Sn;當rT=i時,Mk(rT)=Mk(i)≥0∈Sn。

我們將研究限定博弈人的控制策略均為線性狀態(tài)反饋情形,即uk(t)=Kk(t,rt)x(t),其中Kk(t,rt)是適維矩陣。

3.2 主要結(jié)論

利用配方法,我們給出上述有限時間N人隨機Nash博弈問題均衡策略的顯式表達和最優(yōu)性能指標值。

定理1如果下述差分方程組(6)存在解Pk(t,rt)=Pk(t,i)∈Sn(i,j∈Ξ),

(6)

其中

則有限時間內(nèi),系統(tǒng)(4)-(5)的N人博弈問題的Nash均衡策略集存在,其顯式表達式為

(7)

且最優(yōu)性能指標值為

(8)

證明考慮任一博弈人k的最優(yōu)策略,其面臨的最優(yōu)化問題為

s.t.Ex(t+1)=A-k(t,rt)x(t)+Bk(t,rt)uk(t)+A1(t,rt)x(t)w(t)

(9)

從而有:

(10)

(11)

對式(11)中的加和項進行配方,得

(12)

此時,最優(yōu)控制策略和最優(yōu)性能指標值如式(7)和(8)所示。

4 無限時間N人Nash博弈

4.1 預備知識

首先介紹無限時間隨機最優(yōu)控制中的一個重要概念——隨機穩(wěn)定性。

考慮如下離散奇異隨機Markov跳變系統(tǒng):

Ex(t+1)=A(rt)x(t)+B(rt)u(t)+A1(rt)x(t)w(t),t=1,2,…

(13)

其中,x(t)∈n是狀態(tài)變量,u(t)是容許控制過程,w(t)是實隨機變量序列,且滿足ε(w(t))=0和ε(w(t)w(s))=δts。

定義2[23]給定任意初始狀態(tài)x(0)=x0,r0=i,系統(tǒng)(13)是(均方意義下)隨機穩(wěn)定的,如果存在一個反饋控制u(t)=K(i)x(t)(i∈Ξ),其中K(i)均為常數(shù)矩陣,使得閉環(huán)系統(tǒng)Ex(t+1)=[A(rt)+B(rt)K(rt)]x(t)+A1(rt)x(t)w(t)是漸近均方穩(wěn)定的,即limt→∞ε[‖x(t)‖2]=0。

需要注意的是,與有限時間情形相比較,無限時間情形的不同之處表現(xiàn)為

(ⅰ) 系統(tǒng)(13)是時不變的且性能指標中的權(quán)重矩陣為常數(shù);

(ⅱ) 當T→∞時,Mk(rT)=0;

(ⅲ) 要求系統(tǒng)(13)是均方穩(wěn)定的。

4.2 主要結(jié)論

考慮式(14)所示的奇異線性Markov跳變系統(tǒng):

(14)

其中,x(t)∈n是狀態(tài)變量,uk(t)是第k(k=1,2,…,N)個容許控制過程,表示博弈人k的控制策略,其容許策略空間記為Uk。w(t)是實隨機變量序列,且滿足ε(w(t))=0和ε(w(t)w(s))=δts。rt是取值于狀態(tài)空間Ξ={1,2,…,l}的Markov過程,rt和w(t)相互獨立。當rt=i(i∈Ξ)時,系數(shù)矩陣A(rt)=A(i),A1(rt)=A1(i),Bk(rt)=Bk(i)為適維常數(shù)矩陣。對于任一博弈人k,其性能指標取經(jīng)典的線性二次型:

(15)

當rt=i(i∈Ξ)時,Rk(rt)=Rk(i)≥0∈Snk,Qk(rt)=Qk(i)≥0∈Sn。

∈U1×U2×…×UN,使下式成立:

同樣地,我們將研究限定博弈人的控制策略均為線性狀態(tài)反饋情形。

假定1[20]系統(tǒng)(14)是均方可穩(wěn)的。

利用配方法,得到無限時間離散隨機奇異Markov跳變系統(tǒng)N人Nash博弈問題的均衡策略如定理2所示。

定理2在假定1成立的基礎(chǔ)上,若如下代數(shù)方程組(16)存在解Pk(rt)=Pk(i)∈Sn(i,j∈Ξ),

(16)

其中,

則無限時間內(nèi),系統(tǒng)(14)-(15)的N人博弈的Nash均衡策略集存在,其顯式表達式為

且最優(yōu)性能指標值為

定理2的證明過程與定理1類似,此處不再贅述。

5 應(yīng)用于隨機H2/H∞控制

現(xiàn)代魯棒控制理論越來越廣泛應(yīng)用于工程實踐及社會科學領(lǐng)域,隨機H2/H∞控制獲得廣泛關(guān)注[17]。近年來,將Nash博弈方法應(yīng)用于H2/H∞控制問題,成為了一種有效的方法[24]。其基本思路是將控制策略設(shè)計者和隨機干擾性(不確定性)視為博弈的雙方,H2/H∞控制問題就是控制策略設(shè)計者如何在預期到各種隨機干擾(不確定性)策略情況下設(shè)計自己的策略,在實現(xiàn)與隨機干擾性(不確定性)均衡的同時又使自己的目標最優(yōu),這樣就可以把H2/H∞控制問題轉(zhuǎn)化成Nash博弈問題[24-25],利用Nash均衡策略得到相應(yīng)的魯棒控制策略。

本部分擬將前文所得結(jié)果應(yīng)用于離散奇異Markov跳變系統(tǒng)的隨機H2/H∞控制問題。為分析簡單,本文僅探討有限時間情形,無限時間情形可類似分析。

考慮如下的受控系統(tǒng):

(17)

受控輸出:

式中,x(t)∈n是狀態(tài)變量,uk(t)是第k個容許控制過程,v(t)表示外界干擾。當rt=i(i∈Ξ)時,系數(shù)矩陣A(t,rt)=A(t,i),A1(t,rt)=A1(t,i),Q(t,rt)=Q(t,i)≥0,Bk(t,rt)=Bk(t,i),Qk(t,rt)=Qk(t,i)≥0。rt和w(t)相互獨立,v(t)和w(t)互不相關(guān),且初始值r0與w(t)相互獨立。其他符號含義如上文。L2(Ω,n)表示n值平方可和隨機向量空間。l2(NT,q)表示所有有限序列y(t)構(gòu)成的空間,其中y(t)∈L2(Ω,q)且對t∈NT是可測的,空間l2(NT,q)滿足

下面給出有限時間隨機H2/H∞控制的定義:

定義3[25]對于任意給定的γ>0,0

(ⅰ) ?v(t)≠0∈l2(NT,v),初始狀態(tài)x(0)=x0∈n的閉環(huán)系統(tǒng)(17)的狀態(tài)過程滿足:

(ⅱ) 當最壞干擾v*(t)∈l2(NT,v)存在時,把v*(t)代入系統(tǒng),同時使性能泛函

‖uk(t)‖2]達到最小。

引入表示干擾抑制水平的標量γ>0,定義如下性能指標:

根據(jù)定理1,可得有限時間隨機H2/H∞控制的最優(yōu)策略以及最壞干擾的結(jié)果如定理3所示。

定理3對系統(tǒng)(17),如果下述差分方程組存在解Pk(t,rt)=Pk(t,i)∈Sn,P(t,i)∈Sn(i,j∈Ξ)

6 結(jié)論

針對噪聲依賴于狀態(tài)與控制的離散奇異隨機Markov跳變系統(tǒng),分別討論其在有限時間和無限時間情形下的N人Nash博弈問題,得到均衡解存在的條件及顯式表達式,并將所得結(jié)果應(yīng)用于相應(yīng)的H2/H∞控制問題,得到了最優(yōu)策略存在的條件,充實了微分博弈理論和應(yīng)用研究。

猜你喜歡
控制策略策略系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
考慮虛擬慣性的VSC-MTDC改進下垂控制策略
能源工程(2020年6期)2021-01-26 00:55:22
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
例談未知角三角函數(shù)值的求解策略
我說你做講策略
工程造價控制策略
山東冶金(2019年3期)2019-07-10 00:54:04
現(xiàn)代企業(yè)會計的內(nèi)部控制策略探討
消費導刊(2018年10期)2018-08-20 02:57:02
高中數(shù)學復習的具體策略
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主站蜘蛛池模板: 久青草免费在线视频| 欧美成人日韩| 国产精品私拍在线爆乳| 91精品国产综合久久不国产大片| 欧美激情一区二区三区成人| 国产XXXX做受性欧美88| 亚洲人在线| 久久精品中文字幕少妇| 538国产视频| 99这里只有精品免费视频| 免费人欧美成又黄又爽的视频| 性69交片免费看| 亚洲一区二区精品无码久久久| 91九色国产在线| 国产精品一线天| 九九热这里只有国产精品| 久久综合伊人 六十路| 欧美成人精品高清在线下载| 欧美啪啪视频免码| 欧美不卡视频在线观看| 精品无码视频在线观看| 丁香亚洲综合五月天婷婷| 欧美激情视频一区二区三区免费| 伊人久综合| 国产一区二区三区在线观看免费| 久久青草精品一区二区三区| 精品久久久无码专区中文字幕| 精品国产电影久久九九| 午夜福利在线观看成人| 国产经典在线观看一区| www.99在线观看| 97久久超碰极品视觉盛宴| 人妻丰满熟妇αv无码| 在线看AV天堂| 日本欧美一二三区色视频| 成人福利在线免费观看| 99视频精品在线观看| 午夜国产理论| 福利视频一区| 亚洲午夜国产精品无卡| 久久99精品久久久久久不卡| 久久亚洲中文字幕精品一区| 国产一级毛片yw| 日本不卡在线视频| 91精品国产丝袜| 狠狠色丁婷婷综合久久| 久久精品丝袜| 香蕉精品在线| 久久这里只精品国产99热8| 九九九精品成人免费视频7| 蜜臀av性久久久久蜜臀aⅴ麻豆| 日韩高清一区 | 国产97区一区二区三区无码| 99re视频在线| 国产精品流白浆在线观看| 91丝袜在线观看| 中日无码在线观看| 欧美成人精品欧美一级乱黄| 久久人搡人人玩人妻精品一| a级毛片一区二区免费视频| 日韩在线影院| 成人噜噜噜视频在线观看| 二级特黄绝大片免费视频大片| 国产黄网站在线观看| 日本道中文字幕久久一区| 婷婷激情亚洲| 国产在线拍偷自揄观看视频网站| 日韩欧美国产三级| 99ri国产在线| 精品视频一区在线观看| 日韩AV无码一区| 漂亮人妻被中出中文字幕久久| a色毛片免费视频| 亚洲男人的天堂网| 夜夜拍夜夜爽| 久久永久视频| 中文字幕天无码久久精品视频免费| 精品亚洲麻豆1区2区3区| 午夜啪啪网| 精品国产成人a在线观看| 91亚瑟视频| 国产真实乱子伦精品视手机观看|