耿曉琦, 張志雄
(四川大學數學學院, 成都 610064)
無窮時區上的最優控制在經濟學中有廣泛應用[1-2].在實際應用中,由于貼現率往往不是常數,此類問題的最優控制則具有時間不一致性.1955年,Strotz較為系統地研究了有限時區上的時間不一致最優控制問題[3], 指出非常值的貼現率是導致最優控制問題具有時間不一致性的原因之一.文獻[4-6]提出了時間不一致的Ramesy模型中容許控制成為均衡控制的必要條件.在離散時間框架下,文獻[7]構造了一個階梯函數并證明其為均衡控制.在連續時間框架下,當值函數充分光滑時文獻[8]推導了關于值函數的微分方程和與其等價的積分方程,并證明當貼現率為常數時此微分方程即為HJB方程.此外,在一定條件下,該文獻也證明了均衡控制的存在性.此外,文獻[9]運用微分對策來處理時間不一致的問題,并提供一個具體例子來說明任意初始狀態的最優控制在下一時刻不再保持最優.

在本文中,我們研究一類無窮時區上的時間不一致問最優控制問題.當貼現率充分大時,我們通過針狀變分的方法推導了容許控制成為均衡控制的充要條件.當貼現函數為指數型時,此結果退化為無窮時區上的Pontryagin最大值原理.最后本文給出了一個應用.
考慮如下受控方程:
(1)
目標泛函

(2)
其中f:[0,+∞)×Rn×U→Rn,g:[0,+∞)×Rn×U→R,ρ:[0,+∞)×[0,+∞)→R,x0∈Rn,U是Rm的非空子集,u(·)取值于U.對任意(t,x)∈[0,+∞)×Rn,(x(s),u(s))滿足方程

(3)
考慮如下容許控制集:
U={u(·):[0,+∞)→

(4)

(5)


|f(t,0,u)|≤K(1+|u|);
|g(t,x,u)|≤K(1+|x|λ+1+|u|2);
|f(t,x1,u1)-f(t,x2,u2)|≤
|fx(t,x1,u1)-fx(t,x2,u2)|≤
?(|x1-x2|+|u1-u2|);
|gx(t,x,u)|≤K(1+|x|λ+|u|2).
注1當條件(A1)滿足時,對任意(t,x)∈[0,+∞)×Rn,(x(s),u(s))及u(·)∈U,系統(1)和(3)有唯一解.當λ=1時,該控制問題包含具常系數的無窮時區上的LQ問題.在投資-收益模型中,x(·)表示資本,u(·)表示投資,目標泛函(2)表示總收益,條件 (A1)第二式和第五式則表示收益有某種增長性限制.
條件(A2) 對任意s,t∈[0+,∞),ρ(s,t)≥0,ρ(t,t)=1;ρ在[0,+∞)×[0,+∞)上連續可微;存在K0>λK+K,以及連續函數c0(t),對于任意t>0,存在T≥t,使得對任意s≥T,ρ(s,t)≤c0(t)e-K0s成立.
注2若ρ(s,t)=e-ρ0(s-t),原問題退化為時間一致的最優控制問題,ρ0即為貼現率.

記H(s,t,x,u,p):[0,+∞)×[0,+∞)×Rn×U×Rn→R為Hamilton函數
H(s,t,x,u,p)=〈f(s,x,u),p〉+
ρ(s,t)g(s,x,u).

(6)
引理 3.1對任意的t∈[0,+∞),x∈Rn,u(·)∈U,J(t,x;u(·))有限.

c1(s,t,x,u)eKs
(7)

引理得證.

(8)
其中
g(t,x*(t),u*(t))+

(9)
證明步驟1當t≤s≤t+ε時,由條件(A1)和系統(3)可得
其中



我們有
從而
(10)
同理,我們可以估計x*(·)在[t,t+ε]的模
|x*(s)-x*(t)|≤
(11)
由式(10)(11),對任意t≤s≤t+ε,有
(12)
其中

當s>t+ε時,由條件(A1),式(12)及Gronwall不等式,對任意s>t+ε有
(13)
由式(12),(13),對任意s>t,有
(14)



f(t,x*(t),u*(t))]+o(ε)
(15)
步驟3令Yε(·)為下列方程的解:
(16)

(17)
其中
且
記

當s≥t+ε時,由式(15)和Gronwall不等式得
其中
且對任意s≥t+ε,
由此可得
(18)
類似推導式(17)的方法,對任意s≥t+ε有
(19)
因此,對任意s≥t+ε,由條件(A1),式(19)及Gronwall不等式,對任意s≥t+ε有
|Y(s)-Yε(s)|≤
(20)
最終,我們有
(21)
其中,關于o2(ε,s)有如下估計:
(22)
這里
步驟4計算得出
g(s,x*(s),u*(s))]ds+
g(s,x*(s),u*(s))]ds=
(23)

因此

g(t,x*(t),u*(t))
(24)
令

由之前的計算可知
當0<ε<ε0時,由條件(A1)(A2),式(19)及式(21)和(22)有
[c1(s,t,x*(t),u*)+1]λeλKs+
C(t)+1)eKsds<+∞.
由控制收斂定理,我們有

(25)
由式(24)(25),定理得證.
推論3.3假設條件(A1)(A2)成立,且u*(·)∈U.則u*(·)是系統(1)~(3)的弱均衡控制當且僅當下列等式成立:
H(t,t,x*(t),u*(t),ψ(t,t))=
(26)
其中ψ(·,·):[0,+∞)×[0,+∞)→Rn滿足
ψs(s,t)=-Hx(s,t,x*(s),u*(s),ψ(s,t)).
證明 記D(·),Z(·)分別為下列方程的解:
(27)
(28)
其中I為n階單位矩陣,AT為矩陣A的轉置.對任意s≥t,我們有
Y(s)=D(s)D-1(t)Y(t).
對任意s≥0,我們有Z-1(s)=DT(s).記M:[0,+∞)×[0,+∞)→Rn,ψ:[0,+∞)×[0,+∞)→Rn.令

gx(r,x*(r),u*(r))dr
(29)
ψ(s,t)=Z(s)M(s,t)
(30)
容易證明:對任意s,t≥0,Z(s)和M(s,t)是有限的,且|Z(s)|≤eKs,|Z-1(s)|≤eKs.直接計算可得
ψs(s,t)=-Hx(s,t,x*(s),u*(s),ψ(s,t))
H(t,t,x*(t),u*(t),ψ(t,t))]+
(31)

因為U是可分的,故存在U的可數稠子集,記為Q,我們可以將其表示為Q={v1,v2,v3, …}.令
其中n∈N,j∈N+.這樣所構造出的控制依然滿足uj,n(·)∈U.
記Fj,n=Euj,n∩[n,n+1).則[n,n+1)Fj,n為零測集.故
H(t,t,x*(t),vj,ψ(t,t))-
H(t,t,x*(t),u*(t),ψ(t,t))≤0,t∈Fj,n.
記Fn=∩j≥1Fj,n.則[n,n+1]Fn仍為零測集,且
H(t,t,x*(t),vj,ψ(t,t))-
H(t,t,x*(t),u*(t),ψ(t,t))≤0,t∈Fn,j∈N+.
由條件(A1),我們可以推出H(s,t,x,u,p)關于u是連續的.由于Q是U的稠子集,我們有
H(t,t,x*(t),u*(t),ψ(t,t))=
(32)
因n是任意的,故式(26)成立.

H(t,t,x*(t),u*(t),ψ(t,t))≤0,t∈E.
由定理3.2可得
J(t,x*(t);u*(·))≤εo(1,t),
0,a.e.t∈[0,+∞).
故u*(·)為系統(1)~(3)的均衡控制.證畢.

|f(t,0,u)|≤K;
|g(t,x,u)|≤K(1+|x|λ+1);
|f(t,x1,u1)-f(t,x2,u2)|≤
|fx(t,x1,u1)-fx(t,x2,u2)|≤
|gx(t,x,u)|≤K(1+|x|λ).
注3記U1為所有可測函數u(·):[0,+∞)→U構成的集合.根據以上的證明過程,當以條件(A3)替換條件(A1),以U1替換U時,引理3.1,定理3.2及推論3.3依然成立.若控制集U是無界的,該控制系統不再包含LQ問題,但容許控制集的范圍可以變得更大.對于閉環情形,我們仍可采取種方式來證明閉環均衡策略的充要條件.
我們給出該方法在經濟學上的一個應用.考慮如下方程
(33)
目標泛函

(1-θ)e-ρ2(s-t))(x(s)-σu(s)2)]ds
(34)
其中x0∈R,U=[0,1],0<δ≤1,0≤θ≤1,ρ1≥ρ2>1,0<σ≤1,這里x(s)代表在s時刻的資產總量,x0代表初始時刻的資產總量,u(s)代表在s時刻的投資,σu(s)2代表投資過程中產生的花費或者消耗,δ代表資產的損耗系數.如果0<θ<1,ρ2<ρ1,則該控制問題具時間不一致性.
可以驗證,條件(A2)和(A3)成立,且K=1.通過計算,我們有

H(t,t,x*(t),u,ψ(t,t))=
x*(t)(1-δψ(t,t))+(-σu2+ψ(t,t)u)
(35)

從而此控制即為該模型唯一的均衡控制.


當然,在初始時刻,uv*(·)也依然可能不是最優的.但即使可能找到初始時刻的最優控制,根據上述的計算此最優控制也不是該模型的均衡控制.