摘要:本文采用支持向量機與F—F3因子模型結合的方法構建投資組合,并獲得了較為顯著的收益。在構建投資組合時,首先用支持向量機預測出中國股市所有股票下一天的漲跌情況,然后利用三因子模型對預測上漲的股票進行排序,選取前排名靠前的股票進行持有構建投資組合。從結果來看,全年的累計收益超過了50%,最高時達到120%。遠遠超過了同一時期上證300的收益。說明支持向量機的方法在股票預測,選股策略構建時是有效的。
關鍵詞:支持向量機;三因子模型
一、引言
中國股票市場從建立至今已經經歷了二十多年的發展歷程,市場的成熟程度不斷提高。越來越多的人們參與到股市的投資中。在參與過程中如何利用既有信息對股票買賣的決策是非常重要的。
雖然在傳統金融學的框架下,我們假設市場是有效的,即我們不能從歷史價格信息中獲得關于股票未來價格趨勢的信息,但是從國內外的研究來看,很少有市場是完全符合有效市場的特點的,而且,由于各種金融異象的存在,使得有效市場理論面臨許多的挑戰。比如動量效應,反轉效應,日歷效應的存在,都對弱有效市場產生了挑戰。這就說明投資者可以利用現有信息在股票市場上獲得超額利潤。
在本文中,我們利用的支持向量機與傳統三因子模型結合的方法來構建投資策略,從結構來單獲得的顯著的超額收益,說明中國股票市場并不符合弱有效市場的特點。具體文章安排如下:第二部分為理論部分,第三部分為實證部分,第四部分為結論。
二、理論
1、支持向量機的原理
對于給定訓練樣本集 ,分類學習最基本的思想就是基于訓練樣本集D在樣本空間中找到一個劃分超平面,將不同類別的樣本分開。但是一般來看,可以把樣本分成不同類別的超平面可能不止一個,應該如何進行選擇。我們選擇分類結果最穩健的那個超平面,即對泛化能力最強的那一個。所以該分類問題就轉化為了如下的優化問題:
這就是支持向量機的基本型。 為劃分超平的線性方程, 為法向量,b為位移項即決定與原點之間的距離。我們可以通過求解上述規劃問題,獲得超平面。
在實際工作中,原始樣本空間并不總是存在可以正確劃分兩類樣本的超平面。對于這種情況我們的解決辦法是,將其映射到一個更高維度的特征空間,使得樣本在這個空間線性可分。而且,如果原始靠肩是有限維,即屬性有限,那么一定存在一個高維的特征空間使得樣本在新的空間內線性可分。為了簡化計算過程我們引入了核函數,每一個核函數都隱式的定義了一個特征空間。這就使得核函數的選擇變的非常重要,這也成為了支持向量機最大的變數。一般情況下常用的核函數有線性核,多項式核,高斯核,拉普拉斯核等,在本文中我們選取經常用到的高斯核進行計算。并且選取了股票的日收盤價與換手率作為分類特征。
2、三因子模型選股原理
三因子模型是Fama和French提出的,他們在capm模型的基礎上加入了市值因子與賬市比因子來解釋股票市場的超額收益,獲得了較為顯著的結果。如下:
其中 為市場超額收益率,SMB為市值因子,即小市值相對大市值公司的超額收益率,HML為賬市比因子。一般來說我們所獲得的超額收益都可以由上面這三個因子來解釋,那么在這種情況下,α的長期均值就應該為0,所以如果該值在這段時間中回歸結果為負值,那么我們認為該只股票的收益在這段時間內偏低,而根據有效市場的假設,股票市場是一定會回到他的正常狀態的,所以其價格在未來必然會上漲。基于這種原理,我們把經過支持向量機算法篩選后的股票全部按照三因子模型進行性回歸,然后按照回歸結果中的截距項進行有小到大的排序,取前二十只股票做為我們的投資組合。
三、數據選擇及結果
1、數據選擇
本文的數據全部來自于銳思金融數據庫,事件跨度為2010年到2015年六年數據,為了保持數據的完整性,我們提出掉了2010年以后上市的公司的股票,并且出于數據穩定性的考慮我們也剔除了ST開頭的公司股票。共得到1503只股票數據。
2、策略構建
在構建策略組合時我們首先將每只股票的數據分成兩個部分,2015年1月1日以前的為第一部分是我們的訓練集,以后的部分即為測試集。對于每只股票首先用訓練集來訓練我們的支持向量機模型,然后用訓練后的模型,對測試集中的數據進行預測。即用前一天的收盤價與換手率預測下一天的漲跌,對于每天的股票只保留預測為漲的,然后用三因子模型對每只股票的數據進行回歸,將每天預測為漲的股票利用回歸后的阿爾法截距項按照從小到大的順序進行排序,保留前二十只股票作為每日的股票池進行持倉,每天按照此種方法進行調倉。每日組合的收益即為策略的收益。
3、結果
如上圖所示,為策略組合收益與滬深300指數的對比圖,從圖中可以看出策略組合的收益遠遠超過了滬深300指數的收益。
表一為策略組合每日收益的統計數據,根據表中數據可以看出策略組合的每日平均收益為0.26%,并且p值為0.0005,說明均值顯著大于零。從此可以看出,策略組合的收益是顯著的。
表二為策略組合的累計收益的統計數據,從表中可以看出,策略組合的累計收益最高時可以達到126.9%,并且年終的累計收益也達到了56.6%。
2、結果分析
從以上的結果可以看出本次構建的投資組合可以獲得顯著的收益,說明支持向量機在股票預測方面是有效的,另一方面也間接的說明了,中國股票市場并不符合弱有效市場的特征,投資者可以通過挖掘歷史價格信息而預測未來股票的價格。
四、結論
通過以上的分析,我們找到了一種通過支持向量機進行選股的策略并獲得了顯著的收益,并且顯著高于滬深300股票指數。所以我們可以看到將支持向量機運用于股票收益的預測可以獲得顯著的結果。
參考文獻:
[1]陳蓉,陳煥華,鄭振龍.動量效應的行為金融學解釋[J].系統工程理論與實踐,2014,(3):613~622.
[2]陳卓思,宋逢明.圖形技術分析的信息含量[J].數量經濟技術經濟研究,2005,(9):73~82.
作者簡介:任正紅(1991—),男,山西忻州人,山西財經大學2016(金融工程)學術碩士研究生,研究方向:金融資產定價.