徐維軍, 彭子衿, 張衛國, 黃靜龍
(1.華南理工大學 工商管理學院, 廣東 廣州 510641; 2.廣州金融服務創新與風險管理研究基地,廣東 廣州 510641; 3.廣州白云國際機場股份有限公司規劃發展部,廣東 廣州 510405)
在投資組合理論框架下,學者們主要關注的是,在復雜多變的市場環境下,如何實現投資組合最優配置的決策問題。在均值-方差模型[1]的基礎上,針對靜態模式的投資組合問題,國內外已有眾多學者[2,3]開展了相關研究。為了模擬更真實的現實交易環境、設計更加合理的投資策略,越來越多的學者[4,5]開始探討在線投資組合理論研究,與靜態模式下投資組合研究最大的區別在于該理論研究關注以長期收益最大化為目標的投資組合問題。根據有效市場假說,投資者無法根據歷史信息獲得超額收益,但“市場異象”和投資者非理性行為等相關研究成果的出現對這一結論的正確性提出了質疑。Debond和Thaler[6]、Jegadeesh[7]分別通過實證發現國外市場同時存在長、短期均值回歸特征。宋玉臣和寇俊生[8]、李佳和王曉[9]等國內學者也發現我國證券市場存在顯著均值回歸特征。
利用均值回歸特征,國外內學者們拓展了在線投資組合研究。在利用價格相關關系刻畫價格波動特征的基礎上,根據啟發式算法的設計思想,Borodin等人[5]提出了Anticor(AntiCorrelation)策略。Li等人[10]借鑒被動主動學習的權重更新思想,利用懲罰函數構造以權重變化最小為目標的優化模型,提出PAMR(Passive Aggressive Mean Reversion)策略。在多期均值回歸的情況下,Li等人[11]利用滑動平均算子和被動主動學習,提出OLMAR(On-Line Moving Average Reversion)策略。
目前已有的均值回歸策略均只考慮了價格信息,但隨著不同學科理論與技術的相互交叉和滲透發展,可用于在線投資組合理論研究的信息類別不斷得到擴充。借助機器學習等技術工具,目前已能較為便捷地從海量的文本數據中挖掘出與投資者行為、情緒有關的信息[12,13]〗,從而存在將文本信息運用于在線投資組合理論研究的可能。本研究主要關注利用股票論壇的文本信息,例如發帖內容等,構建投資者情緒指標,從而提升在線投資組合算法的性能。
綜上所述,本研究將首先對文本數據進行處理,通過挖掘文本信息刻畫投資者非理性行為特征;結合均值回歸并嵌入在線投資組合模型,提出新的均值回歸策略;利用國內市場數據進行實證檢驗,證明本研究提出的新的均值回歸策略具有更好的收益表現。本研究的論述結構安排如下:在第1節中,對在線投資組合的基本問題和假設進行簡單介紹;在第2節中,利用發帖內容等文本數據構建反應投資者情緒的量化指標;在第3節中,利用第2節構建的情緒指標,提出一種新的均值回歸策略;最后通過第4節的實證檢驗,驗證本研究提出策略性能和有效性。
參照Cover[4]的設定,本研究關注的具體問題為針對包含m個資產的投資組合進行n期交易的投資決策問題,有以下相關定義:
(2)xt=(xt(1),xt(2),…,xt(m))T表示相對價格向量,其中xt(i)=pt(i)/pt-1(i);
(4)bt=(bt(1),bt(2),…,bt(m))T表示投資權重向量,其中bt(i)表示資產i的投資權重。



(1)
接下來,首先利用股吧文本數據構建投資者情緒指標,然后利用該指標刻畫投資者非理性行為,結合均值回歸特征,設計新的均值回歸策略。

接著,考慮到討論活躍度對投資者情緒的影響,可利用討論活躍度指標對投資者情緒傾向表達的極性進行強化。由于發帖數越大一般代表討論越活躍,因此可使用發帖數量作為情感傾向指標的權重系數,即OSt(i)=(Gt(i)/Gmax(i))×Ot(i),其中,Gt(i)表示第t期關于第i只股票的發帖數,Gmax(i)表示關于第i只股票在過去一段時間內最大的日發帖數。
最后,由于投資者情緒對價格和收益的影響持續存在但又有所減弱,因此本研究對情感傾向指標做加權處理,對距離當前交易日較遠的情緒傾向賦予較小的權重,構建得到如下投資者情緒指標
(2)

對價格走勢如下圖1所示的兩只股票,兩者價格變化存在跨期的正相關關系,即股票i在前一個時間窗口與股票j在后一個時間窗口同跌,而股票j在前一個時間窗口與股票i在后一個時間窗口同漲;同時,兩只股票在連續兩個時間窗口上又各自有價格反轉的表現。那么,根據均值回歸理論,在接下來的時間窗口中,兩只股票的價格走勢可能再次反轉,因此可以通過兩只股票之間的資金配置權重轉移實現獲利。
將上述兩個連續時間窗口[t-2w+1,t-w]和[t-w+1,t]中相對價格對數序列分別記作LX1和LX2,具體地,LX1=[ln(xt-2w+1),…,ln(xt-w)],LX2=[ln(xt-w+1),…,ln(xt)],其中,ln(xk)=(ln(xk(1)),…,ln(xk(m)))T。
再令μk=(μk(1),μk(2),…,μk(m))T和σk=(σk(1),σk(2),…,σk(m))T分別表示LXk的均值和方差。接著,定義
對于圖1的情形,由于兩者價格變化存在跨期的正相關關系,那么必有Mcor(i,j)>0。又由于兩只股票在連續兩個時間窗口上各自有價格反轉的表現,則有Mcor(i,i)<0和Mcor(j,j)<0。在第二個時間窗口中,由于股票i的表現優于股票j,因此有μ2(i)>μ1(i)。此外,顯然有Mcor(i,j)∈[-1,1]成立。在此基礎上,Borodin等人[5]設計了轉移強度指標claimi→j,用以刻畫資金的權重配置從股票i轉移到股票j的強度大小,并且轉移強度claimi→j越大,表示從股票i轉移到股票j的權重越大;轉移強度claimi→j越小,表示從股票i轉移到股票j的權重越小。具體地,即在滿足Mcor(i,j)>0和μ2(i)>μ1(i)的情形下,有
claimi→j=Mcor(i,j)+max(-Mcor(i,i),0)+max(-Mcor(j,j),0)
行為金融理論認為,投資者在不確定環境中,其決策易受情緒影響,產生非理性投資行為。因此可在如上圖1所示的價格反轉基礎上,利用股吧評論信息構建投資者情緒指標,綜合投資者情緒和均值回歸特征構建新的在線投資組合策略。對于任意的股票i和股票j,假設在第2個窗口中股票i的表現優于股票j,即μ2(i)>μ2(j),分別考慮投資者情緒對這兩只股票的影響。
對于表現較好的股票i。一方面,當市場情緒較樂觀,即ISt(i)>0時,投資者容易出現過度自信的局面[17],具體表現為:傾向以更樂觀的態度預判未來市場走勢,高估預測市場的能力。在這種情況下,未來發生價格反轉可能性較小,因此,從股票i向股票j轉移資金的量就需要相應減少,即采取更小的轉移強度claimi→j。另一方面,當市場情緒較悲觀,即ISt(i)<0時,投資者對“壞消息”容易反應過度[18],均值回歸現象發生的可能性增大,因此,從股票i向股票j轉移資金的量就需要相應增加,即采取更大的轉移強度claimi→j。
對于表現較差的股票j,投資者情緒對轉移強度的影響則正好相反:一方面,當市場情緒樂觀時,即ISt(j)>0,應當增加從股票i向股票j轉移資金的量,也即采取更大的轉移強度claimi→j;另一方面,當市場情緒悲觀時,即ISt(j)<0,應當減少從股票i向股票j轉移資金的量,也即采取更小的轉移強度claimi→j。

max(-Mcor(j,j),0)+IS(j)
(3)
在該權重轉移強度的基礎上,令transferi→j表示股票i的權重向股票j轉移的量:
(4)
最后,得到下一期投資權重:
(5)
綜上,將按式(5)進行投資組合更新的策略記作ACIS(AntiCorrelation with Investment Sentiment)策略,算法流程如表2所示。

表2 ACIS策略算法流程
本研究采用的股票樣本選自滬深300成分股,包括恒瑞醫藥、興業銀行、中國平安、貴州茅臺、招商銀行、伊利股份、格力電器、美的集團、五糧液、中信證券,以上是成分股中權重較高的十只股票。文本數據為這十只股票的東方財富股吧發帖數據,包括時間、標題和內容。包含243個交易日,從2018年9月7日到2019年9月6日。
在實驗中,將ACIS策略的情緒影響有效期參數設為lag_w=3,時間窗口參數設為W=50,對比策略及其參數設置如下:
(1)Market策略;
(2)PAMR策略,ε=0.5[10];
(3)OLMAR策略,ε=10,w=5[11];
(4)Anticor策略[5]。
為考察ACIS策略的性能,本研究首先在無交易費用的假設下進行實驗對比,然后再考慮不同交易費率對ACIS策略的影響。具體采用以下兩類評價指標,并通過表3展示各個策略關于這些指標結果的對比情況。

表3 各策略的不同指標結果對比
(1) 收益類:累積收益、年化收益率(Annualized Return)、夏普比率(SharpeRatio)、Calmar比率(Calmar Ratio);
(2) 風險類:波動率(Volatility)、最大回撤(MaximumDrawDown)。
通過觀察表3可以發現:一方面,與PAMR、OLMAR和Anticor三個近利用價格信息的均值回歸策略相比,無論在收益類指標還是風險類指標上,本研究提出的ACIS策略都有更好的表現。例如,ACIS策略的期末累積收益和夏普比率、Calmar比率比這三個策略的指標結果更高,而波動率和最大回撤比這三個策略的指標結果更小。另一方面,與平均買入持有Market策略相比,ACIS策略的期末累積收益和年化收益率更高。但在風險類指標的對方上,ACIS策略的表現不如Market策略,這也導致在夏普比率和Calmar比率的比較上ACIS策略表現不如Market策略。
圖2展示了ACIS策略及各個對比策略的累積收益變動情況,圖3展示了除累積收益以外的五個收益和風險評價指標的對比情況。
接著,本研究還對ACIS策略中滯后期參數lag_w和時間窗口大小參數W進行了穩健性檢驗。圖4展示了ACIS策略在上述兩個參數不同取值下的期末累積收益熱度圖,其中橫坐標為情緒影響有效期(取值范圍為[2,5]),縱坐標為時間窗口大小(取值范圍為[2,100]),右側標明不同灰度對應的期末累積收益,顏色越深、期末累積收益越小,反之顏色越淺、期末累積收益越大。總體而言,對于不同取值的滯后期參數和時間窗口參數,ACIS策略的累積收益變動幅度較小,因此該策略關于滯后期和時間窗口這兩個參數相對穩定。
最后,根據式(1)計算不同交易費率下的期末累積收益,結果如圖5所示。相較于Market策略,PAMR、OLMAR、Anticor和ACIS策略都無法承受多少交易費用。但與其他三個均值回歸策略相比,ACIS策略在不同交易費率下收益變化更為平穩,且有更高的累積收益。
本研究考慮投資者情緒對投資行為的影響,利用非理性投資行為中“過度反應”與“反應不足”的特征,提出新的均值回歸策略ACIS。利用滬深300成分股的股票交易數據和股吧評論數據進行實驗,以檢驗ACIS策略的性能。通過與基準策略Market以及前人提出的三個均值回歸策略對比,發現在不同交易費率下ACIS策略具備更好的收益性能。同時,ACIS策略關于自身參數具有一定的穩健性。值得注意的是,在交易費率大于零的情形下,雖然ACIS策略收益變化較平緩,但總體表現依然不如Market策略。因此,如何進一步提高策略對交易費用的承受能力是本研究未來主要考慮的問題。