張 婷, 彭云飛, 張大永
(貴州大學數學與統計學院,貴州貴陽550025)
首先建立數學模型.讓Rn表示n維實歐氏空間,U∈Rm是非空有界閉凸集.本文的控制集為U[t,T]={u:[t,T]→U|u 可測,t∈[0,T)},受控系統為常微分方程

目標泛函為

模型中的受控系統是基于確定型投資組合模型提煉所得,性能指標是雙曲貼現和期望方差組合的特例,更一般地是相應的隨機模型.本文的問題是極小化目標泛函,即問題(P):尋求一個反饋控制ˉu,使得對任意的 ε >0,v∈U 和任意的(t,x)∈[0,T]×Rn有

其中

如果問題(P)有解ˉu,則稱ˉu為均衡控制.
上述問題與經典最優控制問題有著本質區別,主要是最優控制問題的目標泛函不依賴于初始狀態,只優化一個目標泛函,最優策略具有一致性(符合動態規劃原理),通常將具有此特征的問題稱為時間一致問題.經典最優控制問題之所以有一致性,是因為假設了決策者在做決策時不受決策者的心態以及外界環境變化等因素的影響.這一假設雖然對許多工業問題是合理的,但遇到金融等復雜領域時,此假設往往由于過于理想化而導致問題失真.為此,不得不考慮環境變化以及決策者的心態等因素對決策的影響,體現在數學模型上就是目標泛函始終依賴于初始狀態.因此,需要優化一族性能指標(無窮不可數多個),而非一個,這導致所謂最佳策略不具有一致性(不滿足動態規劃原理),這樣的問題常被稱為時間不一致問題.關于此問題的研究,至少可追溯到 1739年 Hume[1]和 1759年Smith[2]所做的工作.特別是 1955 年 Strotz[3]進行數學公式化后,引起許多學者興趣,相關工作可參考文獻[4-11].特別地,Yong[9]在 2012 年將時間不一致問題視為時間一致問題的極限,從非合作博弈的角度出發,研究時間不一致問題,獲得開環形式的均衡控制.2017年Yong[7]進一步研究了時間不一致隨機LQ控制問題,深入研究了開環閉環均衡策略.
本文雖然也將時間不一致問題視為時間一致問題的極限,但構造時間一致問題系列的方法完全不同于雍炯敏教授的構造方法(分割時間區間).其次,雍教授主要獲得了開環形式的均衡控制.雖然也考慮了閉環形式的解,但與本文閉環形式解的定義有本質的不同(可參閱文獻[7]).經濟學家大多認為,只有閉環控制才能刻畫時間不一致問題的特征,即閉環控制能夠吸納環境以及決策者心態變化等因素對決策的影響,而開環控制不具備這個特征.本文的閉環形式的均衡控制是許多經濟學家希望引入的.
在陳述主要結果之前,首先引進一些基本假設.
[F]映射 f:[0,T)× Rn→Rn關于時間變量 t可測,且存在常數L>0使得對任意的xi∈Rn(i=1,2),t∈[0,T)有

[G]映射 g:[0,T)× Rn× [0,T)×Rn→R 關于時間變量t可測,且存在常數L>0使得對任意的(ti,xi,yi)∈[0,T)× Rn× Rn(i=1,2),s∈[0,T)有

[H]對任意的開環控制u(·),都能找到一個閉環的二元可測函數u(·,·)使得

其中x(·)是受控系統對應的解.
雖然假設[H]中等式兩端的同一符號表示的內涵不一致,但在本文不至于引起混淆的情況下,為了簡潔,用同一符號表示(其它地方同此).此外,假設[F]和[G]是通常的假設,即使是時間一致問題解的存在性也是需要的.對于假設[H],類似于Filippov選擇性定理,在適當的條件下,此假設是可驗證的.在本文中,由于篇幅限制,在此不再證明.
在上述假設下,有如下的主要結論.
定理 A若假設[F]、[G]和[H]成立,則問題(P)至少有一反饋均衡控制.

引理1若假設[F]成立,則下列結論成立:

和


證明根據假設[F]有

結合Gronwall不等式,可知(5)式成立.而且,

由此可斷言(6)式成立.
引進問題(P1):尋找控制 u1∈U[0,T]使得

其中

對問題(P1),不難證明下面的存在性結論.
引理 2若假設[F]和[G]成立,則問題(P1)至少存在一個最優閉環控制u1.
引進偏微分算子Av為

不難證明下面的偏微分方程

有唯一解

其中(s,y)∈[0,T)×Rn.令

問題(P2):尋找控制函數 u2∈U[0,T]使得

類似地,對問題(P2),也有如下存在性結論.
引理 3若假設[F]和[G]成立,則問題(P2)至少存在一個最優閉環控制u2.
繼續上述過程,構造控制函數列{uk}k≥1、.
根據關于控制策略集的假設,存在{uk}k≥1的子列(不妨設為其自身)在L2[0,T]中弱收斂到某個ˉ.結合假設[H],存在閉環控制ˉu使得

根據 Ascoli-Arzela定理和引理 1,不難證明在 C[0,T]中是緊的并且

進而可推斷函數列

其中

是Rn中的有界閉集,且

其中(t,x)∈[0,τ)×E.進而能夠證明


及

于是下列HJB方程

有粘性解 Vk.進而,結合(12)~(14)和(16)~(17)式,可推斷下列的HJB方程

有粘性解V并且適合



結合(23)式有


結合(22)式可得

對任意的(t,x,v)∈[0,T)× E × U,上述結論均成立,因此是問題(P)的一個均衡控制.這就完成了主要結果的證明.
時間不一致控制問題是數學與金融交叉的前沿課題,其研究一直方興未艾.但一直未取得理論上的突破,未能像最優控制理論那樣有完善的求解方案.本文對一類常微分系統支配的時間不一致控制問題進行討論,提出了一個求解方案,特別是解的定義不僅符合數學要求,更是經濟學家希望的.不僅如此,本文所給的方案,對建立時間不一致控制問題的一般理論也是有益的.
致謝貴州省科技計劃項目(黔科合平臺人才[2017]5788號)對本文給予了資助,謹致謝意.