徐鳳敏,景 奎,梁 循
(1.西安交通大學經濟與金融學院, 陜西 西安 710061; 2.中國人民大學信息學院, 北京 100872)
投資組合的參數估計是現代金融研究領域中的一個熱點問題[1-3]。Markowitz于1952年提出的均值-方差模型[4]是現代投資組合理論的基石。該模型旨在給定風險水平下最大化預期收益或給定收益水平下最小化投資風險,已經在投資組合資產選擇和配置當中得到了廣泛的應用。
根據風險度量方式以及真實市場條件的不同,經典的均值-方差模型發展出了很多拓展形式。其中一個重要的方面是將基數約束納入考慮,因為實際投資組合中資產數量是存在限制的[5-6]。這一改進能夠減輕投資者的管理負擔,降低交易費用。Chang等[7]最早建立了帶基數約束的均值-方差模型。由于帶基數約束的投資組合優化問題是混合整數二次規劃問題,容易證明此問題是NP難的[8]。針對基約束下的投資組合問題的研究主要集中在兩個方面,一是采用放松約束條件或者目標函數來逼近原問題從而得到解析解,二是采用啟發式算法求解基數約束問題。
對帶基約束的投資組合模型涉及的參數進行有效的估計能夠使該模型更好地為投資者決策發揮積極的指導作用。Best和Grauer[9]發現由樣本得到的最優投資組合對風險資產收益率的變化非常敏感。Broadie[10]指出參數的估計誤差對最優投資組合有明顯的影響且會促使各風險資產的投資比例產生極端結果。由此可見,最優投資組合的有效性與參數的選擇有著緊密的聯系。
為了給出市場參數更有效的估計,盡量減輕估計誤差的影響,學者們進行了不懈地探索,逐步發展出以下兩種策略:用統計方法取代樣本方法重新估計市場參數;優化構造出的參數集(例如擾動集或優化問題的最優解集合)。對市場參數的統計重估方法可以被分為三類。第一類是結構因子模型,即CAPM[11]、FF3[12]、BARRA[13]和ATP[14]方法。第二類是貝葉斯收縮估計,這類方法可進一步分為考慮投資者的先驗信息與否兩種。對于前者,BL模型[15-16]是最受歡迎的方法之一,如Lejeune[17]給出了考慮VaR和交易約束的FOF基金選擇問題的VaR BL模型,然后設計了一種特殊的分支定界算法來構造最優FOF基金。對于后者,Ledoit和 Wolf[18-19]提出了一種變形的股票協方差矩陣收縮估計方法,這種方法可以估計樣本協方差矩陣和單指數協方差矩陣之間的最優加權平均。最后一類是分層抽樣[20-21]和時間序列聚類[22-23]。如Wang Meihua等[24]提出了一種新的投資組合策略:這種策略結合了已有抽樣策略和用于求解指數追蹤問題中混合整數規劃模型的優化抽樣策略。Focardi 和Fabozzi[22]引入了距離函數的概念,并提出了利用時間序列聚類來識別具有相似行為的資產。Dose和Cincotti[23]將時間序列聚類方法應用于指數跟蹤中,發現聚類方法提高了噪聲抑制能力,且與隨機選擇技術相比,在魯棒預測應用中有更好的效果。
參數集合的優化方法分為兩類。一類是在設計的擾動集上進行優化,在數學上稱為魯棒優化[25-26]。它已被廣泛地應用于現代投資組合中,以系統地對抗最優投資組合對相關市場參數估計中統計和建模誤差的敏感性[27]。如對一個魯棒最優資產分配問題,Lobo 和 Boyd[28]在考慮資產收益率均值和協方差的不確定性的情況下,對組合的最壞情況風險進行建模,并提出一種比蒙特卡羅方法更精確、更快的內點方法。Tutuncu和 Koenig[29]針對資產收益率結構不可靠情況下的基金穩健優化配置問題,提出了保守策略,并構造了最優最壞情況資產組合。Garlappi等[30]通過最大似然估計將MV 投資組合模型擴展到多階段,以明確地考慮預期收益估計的不確定性。另一個是對參數優化問題的最優解集進行優化,稱為雙層規劃(BLP)。相應的求解方法有三種。一種是通過最優條件將內層規劃轉換為均衡約束[31],另一種是利用內層規劃的值函數設計迭代算法[32],最后一種是通過構建內外層規劃的可行方向集進行直接搜索[33]。如Chen Xiaojun[34]針對雙層組合管理模型,提出了一種平滑直接搜索算法,其中內層為經典MV模型,外層為夏普比率最大化。他們精確地求解了投資組合權重和風險厭惡因子的最優上界和下界,或者得到了它們的緊致范圍。
傳統的投資組合模型中參數主要包括各個風險資產的預期收益率以及這些預期收益率之間的協方差矩陣等,通常根據歷史數據對這些參數的值進行估計。Merton[35]于1980年指出預測各風險資產的收益率的均值比預測這些收益率的協方差更加困難,同時他還指出均值的估計誤差比協方差矩陣的估計誤差對投資組合的影響要大得多。1993年Chopra和Ziemba[36]的研究表明預期收益率均值的估計誤差對最優投資組合的影響要比協方差矩陣估算誤差的影響要大數倍。因此,對稀疏投資組合模型的預期收益率進行科學的估計是參數估計的重點。
與傳統的投資組合選擇模型不同,帶基約束的投資組合問題還有一個特有的參數,即投資組合的規模,通常用稀疏度表示。雖然帶基約束的投資組合問題在求解方面取得了很多進展,但是對稀疏度的最優選擇問題,研究還十分匱乏。許啟發等[37]使用LASSO分位數回歸方法(1范數)對帶有范數約束的CVaR高維投資組合進行求解,并建立了SIC準則與GS準則對最優的約束參數進行了估計。因為Zhao Zhihua等[38]發現當使用p(p∈[0,1])范數對投資組合的稀疏性進行刻畫時,隨著p的減小,投資組合模型的稀疏性增強,即0范數對最優稀疏約束的刻畫更為精準。因此本文在對控制標的資產的數目時采用了更有優勢的0范數。
本文基于帶基約束的投資組合模型,從一個全新的視角出發,對該模型的預期收益率和稀疏度進行了估計。在帶基約束的均值-方差模型的基礎上,以投資組合效用(用夏普比率度量)極大化為外層目標,內層極小化投資組合的風險,以0范數控制投資組合中的資產數量,并利用上下界約束控制各項資產的權重,建立了雙層參數估計模型;其次分析了該模型的收益率以及投資組合的稀疏度選取范圍,并結合無導數優化方法設計了基于ADMM的雙層參數估計算法;在實證部分,我們對投資組合預期收益率以及稀疏度進行了數值分析。仿真結果表明,本文模型得到的參數估計結果更符合實際,對投資活動有指導意義。
考慮一個由6支股票的6期收益率組成的收益率矩陣(如表1所示),在此矩陣中,不同股票的收益率是高度相關的。表2列出了分別由MV模型和稀疏MV模型求解得到的最優解。從表2可以看出,稀疏MV模型只投資其中兩支股票就可以達到MV模型投資6支股票所取得的夏普比率,這個結果說明對于中小投資者而言,關注相對少量的投資標的而不影響組合的整體回報是可能的,同時,也可以節約交易費用。
下面通過一個數值算例來闡述我們研究的動機,即為何要對稀疏投資組合模型的稀疏度進行選擇。圖1是OR-Library中五個標準數據集[39]的稀疏度-夏普比率曲線,圖中折線的折點表示在稀疏度取相鄰的五個整數時,夏普比率的平均值。由圖1易知,稀疏投資組合的夏普比率并不隨稀疏度單調地進行變化,因此,研究稀疏度的最優選擇問題是十分有價值的。

表1 股票收益率矩陣

表2 最優投資比例

圖1 稀疏度-夏普比率圖線
Markowitz的均值-方差模型[4](MV):

對基約束的刻畫主要有兩種方法,一種間接控制投資組合中風險資產數目的稀疏優化方法是在目標函數上增加一個關于投資組合權重的懲罰項。Brodie等[40]于2009 提出了基于1范數的稀疏投資組合模型,但是1范數并不能有效地與賣空機制結合,因此Chen等[7]提出了基于p(0

在投資組合問題的研究中,為了同時對存在一定沖突的不同目標進行優化,往往應用雙層規劃構建模型進行求解。樓振凱[41]構建了應急物流系統LRP的雙層規劃模型并設計了一種帶啟發式規則的兩階段混合模擬退火算法對其進行近似求解;李鏡儒[42]運用雙層規劃對投資組合中風險與收益的沖突進行建模,為投資者選擇理想的投資方案。夏普比率在投資組合績效評價領域有著廣泛的應用[43],其含義是投資組合每承受一單位總風險,會產生多少的超額回報。根據William Sharpe的工作,夏普比率可以表示為:
(1)
本文基于雙層規劃的思想,建立了帶基約束的投資組合雙層參數估計模型(SBPE)。
ω(ρ,K)=argminωTCω
s.t.ω∈W
(2)

模型(2)是一個結合了夏普比率的雙層參數估計模型,包含了未知參數ρ和K,我們的目標是選取最優的ρ和K,使得組合的績效最大。該模型外層目標函數為極大化夏普比率,其自變量為ω(ρ,K),該自變量的可行域由模型的內層決定。由于外層目標是含參的非凸函數,梯度類方法難以施展,求解十分復雜;模型的內層是考慮上下界約束與基數約束的均值-方差模型,其中的投資上界u是給定的非負常數,預期收益率ρ是未知參數,而在給定ρ時,模型的內層則是一個混合整數二次規劃問題。含0范數的基約束條件使其成為了NP難問題,很難找到該問題的全局最優解。
模型(2)是一個稀疏約束非光滑非凸優化問題,具體地,其外層目標函數不能直接進行求導運算,故使用無導數優化方法[44]求解,而內層由于含有基約束,使用ADMM[45]對子問題進行求解。



SBPE 直接搜索算法步驟1 選擇一個初始點x∈Ω, 步長h和迭代系數alpha;步驟2 計算ω(x)和f(x)的值;步驟3 計算ω(y)的值,其中y=x±hν,ν∈V且y∈Ω并計算fmax;步驟4 當fmax≤fx時,用αh更新迭代步長h;否則, 設x=y*且f(x)=f(y*),其中y*∈y|f(y) =fmax,y=x±hυ,υ∈v且y∈Ω;步驟5 當h≤β時,終止計算, 否則返回步驟3。
ADMM(Alternating Direction Method of Multipliers) 算法是機器學習中使用比較廣泛的約束最優化方法,它是增廣拉格朗日乘子法的一種延伸,將無約束優化的部分用塊坐標下降法分別進行優化,因此可以有效地對模型(2)的內層進行求解。首先我們引入中間變量τ和約束條件ω=τ將模型(2)的內層轉化成如下形式:
minωTCω
s.t.Aω=b,
l≤ω≤u,
ω=τ.
(3)
其中A=[μ;e]T,b=[ρ;1]T。利用增廣拉格朗日函數,則模型(3)可轉化為:
(4)
其中λ是關于約束條件ω=τ的拉格朗日乘子,φ是懲罰因子。模型(4)可以分成兩個子問題,第一個子問題是關于變量τ的約束優化問題,另一個則是關于變量ω的無約束優化問題。我們用L(τ,ω,λ,φ)來表示模型(4)的目標函數,用Δ表示模型(4)中關于變量τ的可行域,通過分別對兩個子問題進行求解并更新拉格朗日乘子,得到ADMM算法框架如下:
(5)
設定ε1>0,φ>0,U>0,ζ>0,并有初始值ω0,λ0,σ0,我們用k代表算法迭代次數,則算法的第k+1次迭代過程為:
研究發現A會計師事務所在合并之后CPA的人數不斷增長,員工的專業水平和獨立性都有了提高,事務所的業務收入綜合排名都有提升,非標審計意見的數量也有所增加,表明審計質量有所提高,但是審計質量提高的幅度較小,事務所的合并對審計質量的影響還不是很顯著,非標審計意見比例這個指標體現得最為明顯。但由于選取的衡量指標較少,數據樣本的有限,可能結論會有一定的局限性。
1.求解τk+1,即求解下列方程:
(6)
轉步2;
2.求解ωk+1,即求解下列方程:
(7)
轉步3;
3.更新拉格朗日乘子λk+1:
λk+1=λk+φ(ωk+1-τk+1)
(8)
轉步4;
σk+1=min(ζσk,U)
(9)
轉步5;

否則返回步2。
在第k+1次迭代中,子問題(6)可轉換為如下形式:
Bτ≤d.
(10)
其中B=[-eT,eT],d=[lT,uT],為簡化運算,取l是n×1維元素全為0的列向量。該問題是一個0范數約束的優化問題,目標函數為一個凸函數,利用硬閾值算法[46]可以獲得該問題的顯式解為:

中前s個最大值對應在指標序列。對于子問題(7),這是一個無約束優化問題,結合式(8)其一階最優性條件為:
2∑ω+λk+1+σkAT(Aω-b)=0
(11)
解之得:
(12)
我們使用HangSeng31、DAX100、FTSE100、S&P100和Nikkei225等5個標準數據集[39],以及來自于中國市場的上證50和中證100數據集。其中來自OR-library的5個數據集是從1992年到1997年的周收益率數據,上證50以及中證100數據集則是從2013年到2015年的日收益率數據。將每個數據集都等分成兩部分,分別作為訓練集和測試集。訓練集用于得到得到模型(2)中的最優參數,測試集用于測試訓練集所得參數的性態。

(13)
同理,記含上下界約束的MV模型的夏普比率為SRMV,SBPE方法相對于等權重策略的優勢可表示為Sup(A,C)。SBPE方法得到的夏普比率的估計值與該數據集上夏普比率的最大值之間的差值記為:
(14)
由于本文選取的數據集記錄的是各指數成分股每周或每日的收盤價格,對應無風險利率較小,因此我們設定無風險利率rf=0。考慮到沒有賣空機制,投資者不會考慮將資金投入到負收益的資產上,因此預期收益下界取min(0,ρ),其上界則不應超過成分股中的收益率最大值max(ρ)。投資權重的上界約束u取為n×1維分量全部為0.5的列向量。算法精度ε=10-5,初始迭代步長為h=0.005并且設置步長更新比例α=0.6。


圖2 預期收益率-夏普比率圖線
根據表3,比較SBPE模型得到的預期收益率與等權重策略的預期收益率,結果顯示71.43%(5/7)的數據集中,SBPE模型估計得到預期收益率取值更大。將SBPE模型參數估計值對應的夏普比率與等權重策略的夏普比率進行比較,結果表明SBPE模型遠優于等權重策略,對應的夏普比率至少提升了19.5%,從而說明了參數估計的有效性。
本節用基于ADMM的無導數優化算法對投資組合預期收益率ρ及稀疏度K進行估計,然后通過分析數值實驗結果,驗證算法的有效性。稀疏度的K初始值設置為5,其它參數設置均保持不變。圖3依次分別是HangSeng31指數、DAX100指數、FTSE100指數、S&P100指數測試集的預期收益率-稀疏度-夏普比率三維圖線。在各圖中,紅色直線在預期收益率-稀疏度平面上的投影坐標即是預期收益率ρ及稀疏度K的估計結果,而直線與曲面的交點則是估計參數在測試集中對應的夏普比率。從圖3中可以看出,在預期收益率固定的情況下,隨著稀疏度的增加,對應的目標函數值大約是呈倒U型變化的,目標函數值先逐步增大,在某個固定的稀疏度之后,開始逐漸減小。因此,對最優稀疏度進行估計可以優化投資策略,從而獲得更高的預期回報。另外限于篇幅,訓練集對應的圖片未報告,備索訓練集中兩個參數對應的最優夏普比率取得了比較好的效果,即通過算法得到的參數在樣本內有非常好的表現。對于測試集,SBPE模型估計出的參數對應的目標函數值(夏普比率)也在測試集最優目標函數值的附近,其中圖3的前三個子圖的效果非常好,而最后一個子圖的效果則相對較差。

表3 BPSMV與1/N 策略的樣本外表現對比(單參數估計)

圖3 預期收益率-稀疏度-夏普比率三維變化圖
表4分別列出了由SBPE模型估計出的預期收益率、稀疏度。從表4可知,由SBPE模型得到的稀疏度值遠小于各指數中包含的風險資產數量,將極大地減輕投資組合的管理難度和降低交易費用。在表5中將SBPE方法得到的夏普比率與等權重策略、含上下界的MV模型進行了比較。其中,相較于等權重策略,樣本外夏普比率提高了至少18.99%;相較于含上下界的MV模型,樣本外夏普比率至少提高了39.03%。另外,在訓練集中,由SBPE模型估計得到的夏普比率與真實的最大夏普比率差值非常小,測試集中該差值有85.71%(6/7)小于5%,最大也不超過15%,因此可以認為SBPE模型取得了比較好預測效果。綜合上述兩個方面的結果,就說明了SBPE方法對參數估計的有效性。

表4 BPSMV的參數估計結果(雙參數估計)

表5 三種投資策略的樣本外表現對比(雙參數估計)
本文構建了一種新的基于效用的帶基數約束的雙層投資組合模型SBPE。利用國內外股票市場的數據,該模型可得到預期收益率與最優稀疏度的估計值。實證結果表明,SBPE模型能夠較好地對參數的真實值(在最大夏普比率下取得)進行逼近,從而為投資者的最優決策提供了可資借鑒的工具。事實上,本文提出的SBPE模型可以進一步推廣得到其一般形式GSBPE:

ω(a,b,c)=argming(ω(a,b,c))
s.t.ω∈W
(15)

1)當f(ω(a,b,c))和g(ω(a,b,c))均為凸的,則GSBPE模型可以用CVX、CPLEX等優化軟件包求解;
2)當f(ω(a,b,c))是非凸的,而g(ω(a,b,c))是凸的,則GSBPE模型可以使用無導數優化算法框架,對子問題使用ADMM、NPG[47]等算法求解;
3)當f(ω(a,b,c))是非凸的,g(ω(a,b,c))也是非凸的,則GSBPE模型可以使用無導數優化算法框架,對子問題使用遺傳算法等求解。