摘要:近年來,通過量化投資方法進行科學選股成為許多證券公司的研究方向。隨著中國金融改革的不斷加深,如何深入理解量化投資模型逐漸成為了目前研究的重點。其中多因子量化投資模型是目前國際上的主流趨勢,多因子模型是采用建立數學分析模型來對股票市場的股價變化的影響因子進行建模和分析。目前,在實際應用中多因子模型已經對證券、基金公司的選股具有輔助性的作用。未來,隨著學者們在這一領域的深入研究,多因子量化選股模型勢必會對證券、基金公司產生深遠的影響。本文選取的樣本數據為2019年第三季度財報中具有A股代表性的上證50大藍籌股票市場上的財務指標和其他因子指標。通過綜合考慮各股市場表現及因子對上市公司的代表性選出因子,并利用MATLAB軟件建立股票的基本面指標、技術面指標(共包含12項因子)模型,并通過逐步回歸法改進相對收益率的多元線性回歸模型,并對所建立模型的多重共線性和異方差性進行了適當的檢驗。
關鍵詞:回歸法;多因子選股模型;量化投資;MATLAB
1.多因子選股模型
多因子模型是目前量化選股模型方法中應用最廣泛的,基本原理為:多因子模型會選出特定的某些因子作為投資股票的依據,因子表現良好則買入股票,因子表現較差則賣出股票。多因子選股模型風險較低,因為因子的選取既關注基本面又包括技術面,所以選出的這一系列因子可以通過構建量化選股模型來預測股票的收益率及走勢。
比如根據價值投資原理,認為低PE(市盈率)的股票表現會更優異,因此就同時買入低PE的股票,這就造成了股票價格的上漲,使得PE因子變得有效。但以PB(市凈率)為因子時A股票卻大于B股票的PB即A股票的基本面好于B股票。所以,A股票與B股票孰優?這就需要用到多因子選股模型。
2.數據的選取與處理
建立多因子選股模型首先要確定候選因子,有效精準的因子指標可以使模型發現的股票規律最大化,有效提高模型的參考價值。本文的選取候選因子的參考標準如下:
(1)候選因子具有很強的代表性,同時對上市公司普遍適用;
(2)股票收益隨著因子取值的變化而變化;
(3)因子對于收益的影響在時間變化中較為穩定;
(4)戰勝比率和盈利比率較高;
(5)單因子選股組合與股票池的收益差明顯大于零。
綜合考慮多方面因素,并結合以往的市場經驗,本文最后選取了如下7類指標,12個因子:
(1)成長因子:總資產增長率,凈資產增長率,每股收益增長率,營業收入增長率,凈利潤增長率;
(2)盈利因子:凈資產收益率ROE,資產凈利率ROA;
(4)估值因子:市盈率PE,市凈率PB;
(5)運營能力:總資產周轉率;
(6)流動因子:換手率;
(7)其他因子:資產負債率。
選取2019年12月發布的上證50作為樣本,以2019年第三季度(Q3)財報,共計50組數據為樣本。其中每組數據又包含12項選股因子,共計600組數據。
3.基于多元回歸分析的多因子選股模型構建
首先以相對收益率為變量建立12個影響因子的多元回歸模型,計算后的具體模型如表1所示。
模型的可決系數R2=76.9%,說明整體股票質量因子相對收益率的擬合精度并不高,由表1可以看出,在置信度0.05的水平下,因子x2、x4、x5、x6、x7和x11對于相對收益率的影響顯著,也進一步說明再利用上述12因子進行回歸法選股時,凈資產增長率、營業收入增長率、凈利潤增長率、市盈率PE、市凈率PB、換手率這6項因子賦予較大權重。
利用MATLAB將50支股票的歷史數據代入線性多元回歸模型,進行檢驗。紅色點是計算出來的數據,藍色點是上節定義的相對收益率標準值(-1、0、1)。可以看出50支股票被明顯的分為三部分,這說明MATLAB模型能夠區分出好壞股票,說明模型是成功的。
作者簡介:谷思(1992.1-),女,漢族,遼寧省鐵嶺人,碩士研究生學歷,金融專業。