α收益是基金追求的超過市場平均收益的部分,量化選股多因子模型一直是市場量化分析選股的熱點,如何找到一個有效的選股因子一直是每個投資者關注的問題。常見的阿爾法策略有動量Alpha策略以及基本面Alpha策略。本文綜合考慮基本面以及市場交易層面的因素,在過往的研究基礎上進行創新。首先根據基本面篩選出特定的股票池,并根據市盈率及換手率構建出衍生的?PET因子,并探討?PET選股的有效性。本文采用2007-2017年上證綜指及深證成指成分股數據的基本面和行情數據進行分析,并對因子選股的有效性進行分析論證,通過回測歷史樣本數據以及對樣本外數據檢驗,證明了選股因子的有效性。
本文首先利用上證綜指及深證成指的2007到2017年十年期數據進行模擬實證得出模型中參數的最優化設置。選取該時段的數據目的在于這段時間內A股市場經歷了一個完整的周期,市場環境不僅僅有上升或者下降的趨勢,這樣可以看到因子在不同環境下的表現。為防止牛市效應使得選股因子失效,以每年為周期,用每年的數據進行進一步驗證不同年份、不同行情中得分較高的組合的平均收益會超過得分較高組合的平均收益。
一、有效因子構造
(一)實證思路
一般來說,投資者會購買估值被低估的公司股票,若A公司股票被低估,其市盈率會遠低于同行業平均市盈率(以下簡稱“PE”),且低于收益增長率。市場中絕大多數股票交易者會對公司進行盈利性估值,通過買入低估值的股票來獲取風險利潤。相對估值法中多數估值類因子受到行業及市值規模因子影響較大,即便估值成長較好,財務數據也會有較為的嚴重滯后性,從估值企業效益提升傳導到資本市場中股票價格上漲,也存在著一定的時間差。因此應該對估值及市場交易因素綜合考慮。估值類因子選取中,市凈率(以下簡稱“PB”)對應于重資產的公司估值,市銷率決定于企業擴張成長率,投資者要求的回報率以及銷售的收入,而PE以及EP應用則相對廣泛, 但不同行業不同市值的股票估值差異較大,因此在構建因子時要剔除行業市值影響。
(二)基礎數據處理
由于不同行業市值規模的股票估值不具有可比性,因此首先得對股票的市盈率進行市值行業中性化處理。取出個股的歷史時間序列截面PE,去極值之后在截面的基礎上做出標準化處理,減去均值后除以標準差,得到一個新的近似于標準正態分布的序列,將缺省值填充為均值(即0,表示持中性看法)。再將標準正態分布的序列作為因變量對于市值規模因子,行業因子啞變量進行多元線性回歸,測試出相應的殘差進行替代,得出剔除行業及市值規模因子的PE序列。回歸調整模型如下:
是股票i在T時刻截面期的PE值,是股票所屬申萬一級行業的啞變量,為股票i在T時刻的流通市值,為殘差,即調整后的PE。處理以后采取的,作為選股構建模型的PE基礎,所計算IC值也在此基礎上進行。
估值方面的因子選取完畢之后,在市場交易因素的選取中,需要考慮諸多問題。交易量及交易額是絕對值數據,往往因為數值較大對模型產生較大影響從而干擾了其他因素對模型帶來的影響。換手率作為一個相對指標,同時考慮市值規模因素和成交量,能夠從量綱上與PE結合起來。所以選取換手率作為考察的市場交易因素。
PE是每只股票在調倉期開始時的截面PE,對它進行一些調整有利于對不同行業、不同規模的企業進行估值對比。而換手率因子具有特殊性,一個區間內可能會存在極值問題。且換手率的距離調倉日的遠近對于下一個交易日的股票價格影響大小是不一樣的,較遠日期的換手率信息可能沒有什么影響,而較近日期的換手率有著較強的影響,所以選取的換手率是調倉區間的日換手率,根據加權移動平均法,賦予近期換手率較大權重,賦予較遠期的換手率以較小的權重來得出每個調倉日最后所使用的換手率。
其中:wi是按日加權的換手率的權重,Ti是股票距離上一個調倉日i天的換手率。對于調倉期內有停牌的股票,換手率缺失值用該日市場平均值代替[1]。
(三)因子體系組合
調整完參數指標后,就可以對二者結合來看,用以反映個股的基本面及市場交易因素的綜合。若兩個方面都較好,則該個股就是投資組合的選取目標。
由于每只股票的情況各不相同,單個時點的市盈率的高低無法反映這個股票的具體情況,市盈率越低,代表投資者能夠以較低價格購入股票以取得回報。所以使用市盈率的縱向變化量。用換手率結合PE,從側面可以反映出交易者對股票估值關注的程度,當估值較前一交易周期下降較大且換手率也下降較大的情況下,若交易者對該個股估值的預期較好,且此時個股的關注度較低,此時提前進入,交易的成功率較高。而相反若一個個股?PET較高,則說明在相同估值的情況下,該股關注度可能已經偏高,股價已經充分反映,此時交易的成功率較低。舉例來說?PET較低組合去年交易勝率均值為0.52196,而?PET較高組合去年交易勝率均值為0.44608。
綜上,?PET作為相應的選股基準,具有明顯的特點:(1)在研究投資者預期及交易模式中,具有短中期選股的特征;(2)不會選出具有很強動量效應的強勢個股;(3)注重選取前期強勢后下跌,但在短中期存在右側行情的個股。基于這些特點,選股調倉周期不能太長。在所有組合中,得分綜合排名靠近前2,3左右的組合是選取的目標,因為此時可能出現的結果是PE以及換手率降到底部后,出現趨勢性反彈,但還有可能會繼續下跌,但此時換手率已經下降較多,即使出現下跌的情況,后續的空間的預期也不會太大。若?PET因子有效,則實證的預期結果應該為總體靠前的組合應當小于靠后的組合,因子收益率IC值應該顯著為負。
?PET=?Turnover ratio+?PE
?Turnover ratio=(Turnover ratioT -Turnover ratioT-1)/Turnover ratioT-1
?PE=(PET-PET-1)/PET-1
Turnover ratioT是移動加權調整過后的換手率,Turnover ratioT-1是上一期換手率調整值, ?PE為調整PE本期與上一周期的一階差分。如果當前PET發生顯著變化,那就能清楚的從?PET中反映出來。
對于?PET因子,使用它而不是直接用PET因子的優點在于,對于不同行業不同風格的股票樣本來說,PE和換手率均有巨大差異,所以PET因子會有絕對值上的差異,而使用相對值可以進一步剔除一部分行業以及風格因子的影響,同時又考慮股票基本面及市場交易面的變化。
選擇全部上證A股加上深證成指成分股作為整個股票池。這是因為深證成指成分股中剔除了一部分財務狀況較差有重大違規的股票,?PET因子的構建中涉及基本面,對基本面要求較高。由于?PET反映了股票的一個短中期趨勢,所以調倉頻率不應太低,將調倉頻率設為每隔45個交易日[2],從而保證了被低估的股票有足夠的時間來回歸正常值。所有參數設置都通過反復數據實驗檢測選取最優的。
二、實證結果
(一)基本假設條件
基本假設:
1.假設市盈率及換手率兩個因子對?PET的影響相同,因此賦予兩個因子等權重[3]。
2.假設利潤及凈利潤同比增長率都為負的個股市場對其預期較差,未來表現不會太好。
3.假設中短期內個股市盈率僅有行業及市值規模為外部影響因素,其他影響因素為內部因素。內部影響因素可能有每股股利增長率,股息發放率等。
4.假設落單量不會影響最后成交平均價,調倉日按開盤價的2%滑點全部成交,即買入按101%的開盤價成交,賣出價按開盤價99%成交。盤中數據用真實數據測試,考慮漲跌停限制。
本節中,討論組合的具體構建以及選股能力。使用歷史分層回測的方法來計算?PET的選股能力,不僅區分不同組合的選股效果,更能考察選股因子的單調性,操作可行,是一種廣泛使用的手段。
回測時間段:2007年1月1日至2017年3月8日
初始資金:10,000.00萬元[4]
樣本空間:選取所有上證指數及深證成指成分股,剔出了PE以及凈利潤同比增長率為負以及調倉日停牌的股票,剔除ST、ST*、退市股票以及上市不滿一年的次新股。
調倉標準:期初調倉,每隔四十五個交易日調倉一次。以每次調倉日的開盤價滑點2%進行調倉。在每個調倉周期的的最后一個交易日核算調倉因子,滿足因子指標要求的保留,不滿足的賣出。新加滿足指標的股票,等權重構建投資組合。
交易費率設置:2013年一月一日以后為買入萬分之三,賣出萬分之十三。2011年1月1日到2013年1月1日之間為買入千分之一,賣出千分之二。2009年1月1日到2011年1月1日為買入千分之二,賣出千分之三。2009年1月1日之前為買入千分之三,賣出千分之四。所有日期最小交易費每筆5元。
數據處理方法:按照之前已經闡述的方法構建因子,其余的不做處理,缺失值為空值的采取該日市場均值填補[5]。
分層回測,針對多空組合分別構建8個資產組合,考察多空組合中大體表現差異以及每個組合的單調性。其中,多方組合為可行股票池中,得分靠前的前八十只股票(?PET因子值最小),每十只股票構成的股票組合,空頭組合為得分靠后的八十只股票構成的資產組合(?PET因子值最大),按照預期多頭組合的總體表現應該優于空頭組合,且在多空組合中,按照得分從高到低收益應該呈現一定的單調性[6]。
分層組合回測凈值圖。按前面說明的回測方法計算組合 1~組合 8、基準組合的凈值,與同期上證綜指凈值對比作圖。
評價方法:年化收益率、夏普比率、 信息比率、 最大回撤、 日勝率等,波動率等。
(二)分層回測
1.多頭組合績效統計
多頭組合為市場中?PET因子值最小的組合,統計了其各項績效指標,結果如下:
從收益結果來看,未做風險規避的多頭組合排名靠前的兩組的收益十分接近,分別在952.71%以及962.01%,組合年化收益26.89以及27.00%,最大回撤為75.387%左右,日勝率為0.542,反映了交易日中日收益超過大盤的概率為54.2%,市場較差環境下組合的收益都出現了大幅的回撤,總體來說組合的選股效應較為良好。單調性方面組合從1到8年化收益率及對數收益率和夏普比率都呈現一定下降趨勢,波動率和最大回撤無明顯單調變化,說明組合的收益隨著因子的暴露度有一定的負相關關系[7]。
根據圖表3所示,多頭各組組合在不同年份的收益及排名,排名靠前的組合在橫盤震蕩及市場弱勢的年份中的表現比較偏中性,而在牛市中都能取得遠大于靠后組合的收益,年度排名具有較為明顯的單調性。如圖表4結合風控的組合會有不錯的收益,每五日判斷組合凈值是否低于上一周的0.95倍(基于樣本數據回測最優化得出),若小于則平倉,多頭第一組組合累計收益6138.693%,組合年化收益52.94%,最大回撤22.92%。
2.空頭組合績效統計
空頭組合為市場中?PET因子值最大的組合,統計了其各項績效指標,結果如下:
從空頭組合收益結果來看,單調性分化更加明顯。空頭組合定義為得分排名為股票池中最靠后的80只個股,未做風險規避的空頭組合收益得分第一和第三的組合表現較好,年化收益率467.28%,568.13%,年化26.89%以及24.32%。勝率都在0.51左右,而全股票可選池內得分最低的一組收益僅為19.14%,年化1.7%,空頭組合內部分化明顯。夏普比率索提諾比率等績效指標以及空頭的八個組合的整體平均收益也明顯小于多頭組合,說明PET因子區分選股的能力較為明顯。
(三)相關性分析
因子IC值是指因子在T期的暴露度與T+1期的收益率的斯皮爾曼秩相關系數,反映的是因子的收益相關性,若因子收益率關于因子暴露度是一個嚴格單調遞增或者單調遞減的關系,則系數的絕對值為1,當值越接近1時反映收益率與因子的正相關關系越強,越接近-1則表示負相關關系越強,該函數優點在于既能反映線性又能反映非線性關系。公式如下:
其中ICT是因子x在T時刻的秩相關系數,RT+1是股票在T+1時刻的收益率向量,XT是股票在T時刻的因子暴露度值截面向量,這樣一來求出一個的因子IC值的時間序列。本文中,采用的因子值是經過剔除市值以及行業因子后的PE值以及加權后的換手率因子,衡量一個因子的IC值序列具有以下幾個標準:
1.IC值的均值,反映了整體因子的顯著性,越接近正負一為佳,或絕對值很大;
2.IC值的標準差,反映了因子的穩定性,越小越好;
3.IR信息比率,反映了因子的有效性,越大越好(用均值除以標準差的絕對值);
4.IC值的方向性,用小于0的占比來反映,反映了作用的方向性;
構建IC計算模型回溯區間2013年到2016年四年48個月,測算出?PET因子秩相關系數,圖11給出了每個月因子值與次月收益的秩相關系數,其中5%的概率顯著的有27個,顯著為正的5個,顯著為負的有22個。IC值小于0的占比為81.48%,說明因子作用方向為負方向,驗證了之前按照較小?PET因子值選股的方法結論,IC值均值為-0.12154,標準差0.149167,IR信息比率為0.68,大體上來看,?PET的選股因子的穩定性,顯著性,方向性,有效性各方面較為良好。
三、研究結論與不足之處
本文通過綜合運用估值及市場交易層面信息選取相關因子,并利用2007-2017上證綜指、深證成指成分股財務數據以及行情數據,建立了?PET衍生因子選股的思路。實踐表明所選組合的收益在較大概率下高于指數基準。投資組合的主要特點有:短中期收益較高;右側交易意圖明顯;熊市環境下的損失小于指數;震蕩市及牛市能獲得不錯的收益,因子的效果會受到市場環境的影響。
同時,本文還存在一些不足:
(一)本文假設兩類因子對?PET的影響相同,但很多文獻在對不同多因子選股權重問題的討論中,會采用層次分析法對因子賦權,實證表現要稍微優于等權重賦權。通過動態或靜態賦權的方法能使得因子得到進一步優化,在后續的研究中會進一步拓展。
(二)在因子的選取中,市場及交易層面中可能會有更好的待選因子組合優于本文中選取的因子組合。同時,本文無買入、賣出點設置,具體買入、賣出點有待量化擇時理論進一步完善,因此本文實證只是構建了選股因子,并檢驗有效性,不可單獨作為選股策略使用。(作者單位為華東政法大學商學院)
注釋:
[1]具體到本文中,本文中由于沒有賣出點的設置,為被動持倉的指數化投資,持倉周期為固定的四十五天(根據樣本內數據實證最優化分析所得),所以w_i為距離上一個到期日的天數。
[2]參數根據樣本內數據實證結果最優化所得。
[3]多因子選股中賦予權重的方法常見的有等權重法及層次分析法,這里借鑒等權重法[7]。
[4]過高的資金有較高的手續費,過低的資金無法配置資產。
[5]表示市場中性看法。
[6]由于每個截面值的不同,每次回測均能覆蓋到股票池中不同的個股,?PET相差較大的個股收益差別比較明顯,而因子值相差較小組合回測沒有意義,故這里做抽樣。
[7]基于實驗數據的不同,每組的收益可能不是嚴格單調,但大概率下排名靠前的組合的整體平均收益大于靠后的組合整體平均收益,則說明因子有一定的選股區分性。