王云龍,沈春根
(上海理工大學 理學院,上海 200093)
隨著我國金融市場的形成和發展壯大,金融投資已成為我國居民日常生活中的一個熱門話題。金融投資組合可以通過挑選特定的投資標的資產,在有限的投資資本下,降低風險并提高期望收益。這種在風險與收益之間的權衡,關鍵在于不同投資標的之間配資比例的確定。經典的馬科維茲均值?方差模型(Mean-Variance,MV)將投資組合中標的資產的配資問題轉化為一個帶約束的二次規劃問題[1],通過求解此最優化問題,確定在獲得期望收益時使風險最小或在可承受風險內期望收益最大的投資配比[2]。后續的研究中,不少學者在此基礎上繼續探索如何使風險最小并且收益最大[3-6]。在MV模型中,風險通過方差定義,并且假設標的資產的收益率服從正態分布或橢圓分布,這種假設在金融投資領域應用中并不完全可行。首先,由于方差的對稱性,無論正向偏離還是負向偏離均會被同等考慮進模型中,即如果減少方差會帶來正向偏離和負向偏離的同步減小,投資組合的收益同時被對風險的管理所影響,因而以方差作為風險度量的MV模型一直廣受詬病[7]。其次,MV模型需要計算所有標的資產收益率的協方差矩陣,這在大規模場景下會使計算成本急劇增加,求解極其困難。
現實中的風險度量傾向于區分正向偏離和負向偏離[8]。Markowitz[9]曾提出半方差(Semi-Variance)模型度量低于平均水平的收益波動性(風險)。在險價值(Value-at-Risk,VaR)[10]和 期 望 損 失(Expected Shortfall,ES,或稱條件在險價值,Conditiona lValue-at-Risk,CVaR)[11]是目前廣為流行的風險度量,它們注重于對尾部損失(風險)的度量[12]。對VaR和CVaR數學性質的分析和比較可見Rockafellar和Uryasev的文章[13]及Pflug的相關書籍[14]。雖然CVaR作為VaR的補充統計量而非可以替代VaR,但值得指出的是,CVaR具有一致性風險度量的良好性質,它考慮了超VaR部分的損失,對尾部風險的衡量更準確和穩定[14-16]。求解Min-CVaR模型實際上是一個線性規劃問題,而當輸入情景數據(行數)過多時,此線性規劃需要增加等量級的輔稀疏誘導性質的懲罰項有L1范數和L0范數。L0可以直接衡量解中非零元的個數,稀疏效果最好,而實際上是NP-hard的問題,求解不夠高效。文獻[21]研究以L1范數為懲罰項的稀疏馬科維茲投資組合模型,并分析了引入L1范數帶來的理論影響和實際意義。本文選擇L1范數作為懲罰項加入Min-CVaR模型的目標函數中,L1可以取得較少的非零元,相當于挑選較少的標的資產。相比于L0范數,L1范數會懲罰較大的元素,相當于分散配資比例避免極端頭寸。文獻[6]中的原始模型很難通過對偶模型加速。本文在文獻[25]的基礎上改進了求解稀疏投資組合問題的優化模型。相比之下,本文引入L1范數作為稀疏項有利于對偶模型求解。L1范數作為懲罰項,會使原本投資組合優化模型變得復雜,如L1范數具有非光滑性。關于帶L1范數的優化問題一直被廣泛關注[26-28]。此外,不同于文獻[25],本文增加了允許賣空的市場環境。因而,利用對偶思想求解稀疏投資組合模型,通過變換原始問題,降低了求解難度,可以極大地提高大規模稀疏Min-CVaR投資組合模型的計算效率,這對在大數據時代高頻助變量,且約束的數目也急劇增加,這對一般線性規劃求解而言極具困難。實際上,使用最新的商業求解器(如CPLEX、GUROBI)求解,當情景數據在十萬量級,資產個數在百千量級時,需要花費數個小時。為了避免這種情況,不少學者設計了各種解決思路,如情景分解方法[17-18]、二階段方法[19]、切平面法[20]。上述研究均沒有考慮解的稀疏性要求。稀疏性目標可以利用一系列稀疏方法優化實現,通過添加懲罰項或者增加約束,使優化問題的解具有較少的非零元素。常見的具有稀疏模型雖然具有以上優點,但增加稀疏約束或懲罰項會使模型更加復雜,尤其在數據規模很大的情況下。目前國內外對稀疏投資組合模型的研究[22-24]中,情景數據的規模仍為幾百個或一千多個,在大數據時代,尤其是高頻交易場景下,利用超大規模歷史情境數據建立投資模型是一種趨勢。文獻[25]曾利用對偶方法求解投資組合優化問題,文獻[6]利用SCAD函數作為懲罰項并利用QR技術求解稀疏的投資組合優化問題,但交易場景下高效構建投資組合模型具有一定的指導借鑒意義。
本文假設投資組合中有N個標的資產,樣本的時間長度為T,投資組合的數據觀測記為R=[R1,···,RN]∈RT×N,資產i在時間t的收益率記為假設資產i的配資比例(權重)記為則投資組合在t時刻的收益率為

式中:y(w)∈RT;記pt∈[0,1]為過去每個時刻可能發生的概率(p∈RT,1Tp=1),并假設pt=1/T,即所有時刻重現的概率相等,則投資組合的期望收益率為

上述1(后續的0)為維數與上下文匹配的全1(0)向量或矩陣。投資組合各標的資產間的協方差矩陣記為Σ=cov(R)∈RN×N,Σ具有對稱性和半正定性。整個投資組合收益率的方差為σ2(w)=wTΣw。
在險價值VaR有3個關鍵要素:置信水平或概率α,時間段Δt,損失值VaRα。即基于當前時刻t的信息,預測在一定置信水平 α下經過時間段Δt后的上限損失值,即未來Δt時間后損失超過VaRα(w)的概率為1-α。離散情況下的數學表達為

式中:yk(w),k=1,2,···,K滿足y1(w)≤y2(w)≤···≤yK(w);pk為yK(w)對應的概率。CVaR定義為超過VaR損失的期望值,離散情況下CVaR的數學表達為

最小化式(4)等同于最小化式(5),即


因此,求解最小化模型(6)可以同時得到配資比例wopt、在險價值VaR=ζopt和條件在險價值由于模型(6)引入輔助變量s∈RT,使得總的變量個數為T+N+1,同時增加了T個結構復雜的約束,大規模情景下這無疑會使線性規劃問題的求解難度增加。
在上述Min-CVaR模型中,配資比例是在所有標的資產之間計算的。首先模型求解是分散在所有標的資產上的,無法實現挑選標的資產的目的,其次,在假設允許賣空時,為了實現最優,模型會產生在某些標的資產上的極端頭寸(比如看跌資產i并借10倍杠桿,看漲資產j并配資11倍)。通過增加L1范數約束可以避免以上問題,‖w‖1=會對數值較大的權重加以約束,可同時實現只挑選少數標的資產以及均衡被挑選標的資產間的配資比例,達到權重的稀疏性(較多零元)。稀疏Min-CVaR模型可以表達為

模型(7)中可以通過調整參數n控制解的稀疏度,n越大,最優解中的非零元個數越多且分布范圍越大。當n→+∞,帶L1范數約束的Min-CVaR模型將退化為標準的Min-CVaR模型。在一定條件下,模型(7)的等價形式為

其中,λ>0為調和參數。對于模型(8),其拉格朗日函數為


其中,?‖w‖1表示L1范數的次微分。

則模型(8)的拉格朗日對偶函數為

得對偶模型:

其中,Dom為滿足式(12)中約束(I)~(III)的集合。模型(13)中變量總數為T+1,約束總數為2(T+N)+1。實際上,由于約束(II)為簡單的盒子約束(boxconstraints),不會影響求解問題的復雜程度,所以只有結構稍微復雜的約束(I)和(III)會影響問題求解,因而影響對偶模型(13)求解難度的約束個數只受股票池規模(矩陣R的列數N)的影響。當計算大規模情景數據時(T?N),求解原始模型的難度驟升,而通過對偶方式則會極大地提升求解效率。
在數值實驗中,本文使用模擬數據和真實數據測試求解對偶模型策略的時間優越性。首先介紹了利用三因子模型模擬生成大規模數據,以及選擇調和參數的具體步驟,結果顯示,在模擬數據上,隨著情景規模的增加,對偶模型提升求解效率的表現更顯著。另外,給出了在真實高頻數據(標普500)上的試驗結果,同時和標準Min-CVaR模型進行了對比,結果顯示,稀疏模型可以明顯地增加解的零元個數,達到挑選標的資產的目的,對偶模型能夠有效提升求解效率。本文試驗環境為MATLB2017b,Inter(R)Core(TM)i5-3230M,CPU@2.6 GHz,RAM 8 GB,GURIOBI求解器通過MATLB2017b調用。
假設收益矩陣記為R∈RT×N,本文根據經典的三因子模型[29]生成隨機的收益矩陣為

式中:F為因子矩陣,服從多元正態分布N(μF,ΣF);B為因子載荷矩陣,服從多元正態分布N(μB,ΣB);假設噪聲矩陣 ε與因子矩陣獨立并且服從伽馬分布Γ(aε,bε)。上述的分布參數選擇依據文獻[29]中的表1,這里重新給出:

文獻[30]進行了大規模情景數據模擬實驗(T=50000),本文也采用相似規模設置,不同的是,本文收益矩陣由式(14)描述的三因子模型生成。
通過表1可以發現在計算大規模情景數據時,對偶方法在計算效率上具有明顯的優越性。表1統計了每個問題計算20個 λ對應的問題的總耗時,λ∈λmax[10-3,1],其中λmax是可確定的合適的調和參數,使得?λ≥λmax時,原問題(8)的最優解不再變化。實際上,當 λ非常小的時候,對偶模型的求解效率提升不太明顯,稍微比原始問題快2~3倍;當 λ較大的時候,效率提升至10倍左右(依賴于收益矩陣的規模,情景維數越大,提升效果越顯著)。具體地,隨著 λ的增大,求解原始模型的耗時呈上升趨勢,求解對偶模型的耗時呈下降趨勢。圖1展示了T=50000,N=20,α=0.9時,λ大小對求解時間的影響(其中i對應于 λ序列的位次,i/20=-3lg(λ/λmax),i=1,···,20,i越小,對應的 λ越大)。從數學優化的角度看,當λ→0時,L1范數的影響降低,原始模型逐漸趨向于標準Min-CVaR模型,即模型變得簡單,而對偶模型中約束(I)的上下界間隙越來越小,即模型變得復雜。因而當 λ非常小時,求解對偶模型的效率提升相對較小。一般情況下,模型傾向于簡潔時,會選取稍大的 λ值,此時,求解對偶模型的效率提升相對較大。

表1 不同概率水平下計算整個 λ路徑所需時間(T=50 000)Tab.1 Time consuming for solving a path of λ with different probability levelss

圖1 求解對偶模型與原始模型的耗時變化Fig. 1 Time paths for solving the primal and dual model
在原始模型和對偶模型中,參數 λ扮演著不同的角色,但都會導致解的稀疏性(0除外)。λ在原始模型中被稱為調和參數,具有平衡稀疏性和最小化目標函數的作用。調和參數越大,獲得的解稀疏性越高(零元越多)。在對偶模型中 λ是復雜結構約束(I)的上下界,影響著約束的嚴苛程度,根據對偶性質,原始問題也是其對偶問題的對偶問題,原始變量與對偶問題的對偶變量間存在一一對應關系。較大的 λ意味著對偶問題中約束的上下界距離較遠,則積極約束的個數會相應減少,積極約束集的大小與對偶問題的對偶變量非零元個數一致,即原始問題的解非零元少(稀疏性大)。模型參數的選擇有不同的準則,如交叉檢驗(Cross-Validation)[31]、赤池弘次(Akaike)信息準則(AIC)[32]。本文選取貝葉斯信息準則(BIC)[33-34]作為判斷不同參數下模型好壞的依據,BIC越小則模型越優越。記wλ為問題(8)的最優解,則

現給出其他維數規模的模擬數據實驗結果,仍然用式(15)的三因子模型生成模擬數據,情景維數T分別為1000,5000和10000,資產維數N分別為50和100,給出了3個置信水平(α= 0.99,0.95, 0.90)下的計算結果。其中,總時間表示為求解3個置信水平下的最優模型所用的總時間。在實際操作中,資產池和數據的情景維度一般是保持不變的,因此,最優調和參數λ ?可事先設定(表2),亦無須變化,這緩解了必須求解多個逐漸變化的λ才可以確定模型優越性的壓力。根據前文的分析,實驗中利用的對偶模型,主要受資產池規模的影響,情景規模對對偶模型的求解效率影響不大。實驗結果表明(表3第3列),隨著情景規模的增加,對偶模型在求解效率上的優越性表現更明顯。表3中,EWP(equal weight portfolio)指等權重組合策略。

圖2 BIC走勢圖與投資組合系數路徑圖Fig.2 BIC path and portfolio weights solution paths

圖3 模型的稀疏解和時間變化圖Fig.3 Sparse weights solutions; Time paths for solving primal and dual model
本文采用標普500高頻交易數據作為真實數據進行了實驗。資產池共有483個資產,情景維數為25805,(391條/d,共66 d)。由于高頻交易數據本身的性質,價格變動幅度小,收益率量級普遍較小,在結果分析中,均將收益率轉換為日收益率格式。

表2 最優模型對應的調和參數Tab.2 Tuning parameters corresponding to optimal models
表4給出了在真實高頻數據——大規模情景數據上的實驗結果。表4所用的參數同樣遵循BIC準則下兼具模型簡潔性的原則。相比于標準Min-CVaR模型,本文提出的對偶策略提高了求解效率,同時兼顧了稀疏性以利于同步篩選投資標的。稍微遺憾的是得到的CVaR比Min-CVaR大,盡管差別不大。這也可以從數學優化的角度解釋,由表4可知Min-CVaR的最優解稀疏度非常小,因為Min-CVaR利用資產池里幾乎所有標的資產構建投資組合,勢必會得到更優的目標函數。因此,Min-CVaR不具有同步挑選標的資產的特性。本文原始模型的解具有稀疏性,兼顧了自動挑選標的的特性,同時利用對偶模型求解,數倍地節省了原有模型的求解時間。

表3 在模擬算例上的表現Tab.3 Portfolio performance on a variety of simulation data cases

表4 在真實算例上的表現Tab.4 Portfolio performance on real-world data cases
表5給出了在真實數據上,不同概率下稀疏Min-CVaR模型所確定的兩個調和參數,其中最小BIC準則的模型對應的調和參數為1,最小BIC的基礎上,為了使模型更加精簡,遵循一個標準差內最簡潔原則確定的模型調和參數為2。觀察可知2比1更大,根據前述分析,越大的調和參數將導致越稀疏的解。觀察表5和圖4均可發現,較大的調和參數2對應的模型的解具有更高的稀疏度,而相比于1,它們對應的風險度量(分別參考表5中VaR與CVaR值)相差并不明顯。

表5 最小BIC準則對應的調和參數與兼具模型簡潔性的調和參數Tab.5 Tuning parameters corresponding to minimum BIC and the ones with model simplicity

圖4 權重路徑圖Fig.4 Portfolio weights solution paths
本文研究了大規模情景數據背景下的L1范數稀疏Min-CVaR投資組合模型。L1范數稀疏Min-CVaR模型可以同步完成從資產池中挑選標的資產和確定各標的資產配資比例的工作,且避免極端配資的情況,但此模型求解復雜性較高。本文通過對原始模型進行變換,得到對偶模型,利用單純形法求解對偶模型得到最優解繼而求得原始模型的最優解。本文對對偶模型和原始模型求解效率差異的理論原因進行了分析和解釋,同時通過數值試驗證實了求解對偶模型的策略在時間上的優越性。在計算大規模數據時,情景維數越大,效率提升的效果越顯著。