耿玉淦,王剛貞,顧天燁,李 霞
(安徽財經大學 金融學院,安徽 蚌埠 233030)
在我國,創業板也被稱為二板市場(Second-board Market),即第二股票交易市場,與主板市場不同,創業板是專為暫時無法在主板上市的創業型企業、中小企業和高科技產業企業等融資和發展的企業提供融資途徑和成長空間的證券交易市場,主要用于補充主板市場。
創業板以其進入門檻低,運作要求嚴格的特點,幫助有潛力的中小企業獲得融資機會。但是,這些企業往往處于初創期,企業規模較小,沒有突出業績,所取得的成果較小。所以,在創業板上市的公司往往有很高的增長潛力和巨大的增長空間,根據投資效用最大理論可得,創業板的投資空間較大,值得進行投資。
2020年10月,深交所對股票市場中創業板進行了一次改革,改革的主要內容是完善創業板企業退市規則和信息披露制度。其中,對強制退市的情形、強制退市的流程以及交易安排等進行了相應的規定。同時,針對于2012年創業板暴露出來的問題,深交所對信息披露制度開展了進一步的完善,減少了投資者潛在風險的發生。
金融行業一直是新興信息技術探索和應用的前沿。隨著新興信息技術特別是智能信息技術與現代金融產業的深度融合,智能金融應運而生。近年來,信息技術的發展,云計算、大數據、移動互聯網、手拉葫蘆、物聯網、深度學習、數據挖掘、機器學習等人工智能技術成熟和應用,使人類社會的電子、信息、網絡、數字智能時代逐步走向一個更高的階段。
此外,對于像深圳和杭州這樣的金融科技城市來說,他們也在努力建立自己的金融科技生態系統。所以,在這些新興金融科技城市的企業能獲得更大的機會。
1.候選研究因子
對于Logistics模型來說,最重要的就是參數的確定,而選擇參數所依據的是參數的代表性情況。所以,本文采用多因子選股模型進行有效因子的確定[1]。
首先,候選因子需要有一定的普適性,對大多數成分股收益率有一定作用;
其次,因子對股票收益具有一定的穩定性,波動率較小;
最后,候選因子與收益率之間的相關性較強。
根據上述要求,本文候選因子如表1所示。

表1 候選因子統計表
2.因子有效性檢驗
(1)單因子有效性檢驗
第一,檢驗準備
本文采用Fama-MacBech法對因子進行相關性檢驗,具體如下。
①由于需要進行相關性的檢驗,所以本文采用一元線性回歸方程對候選因子和收益率進行回歸,得到回歸系數;
②完成回歸系數的求解后計算相應系數的t-統計量,設置臨界值為2,與其進行比較,最終得到顯著性結果。
下面進行相關性的檢驗:
對于本文研究的對象進行相關性檢驗,選取當期因子值作為解釋變量,下一期股票的收益率作為被解釋變量,從而得到每個候選因子的統計顯著性[2]。設定本文的回歸方程如式(1)所示。
yt+1=at+btxt+et
(1)
其中yt+1表示的是t+1期的股票收益率,bt表示的是相應因子的相關系數,xt則表示因子在第t期時的大小,et則是隨機誤差項。
根據式(1),利用一元線性回歸可求得各候選因子每期的回歸系數,之后利用Fama-MacBeth對其進行檢驗。設定本文t統計量的計算公式如式(2)所示。
(2)
其中T代表的是時間周期長度,本文僅對前12期的數據進行相關性檢驗以及討論。
第二,預處理檢驗因子
根據本文上述內容以及表1中候選因子的統計,我們發現在候選因子中依然存在類似于其他因子(股利支付率、資產負債率)的不確定因素,所以,在進行單因子檢驗之前,我們首先通過散點圖以及殘差圖的比對對因子的有效性進行預處理[3]。通過Eviews對上述回歸方程的相應系數進行散點圖和殘差圖的繪制,如圖1-圖4所示。

圖1 DBA資產負債率散點圖

圖2 DBA資產負債率殘差圖
圖1-圖2是資產負債率的收益率與相關因子取值的散點圖和殘差圖。在散點圖中,資產負債率的取值始終圍繞在收益率曲線上下,可以看出二者之間具有很強的相關性,可以對其進行下一步的線性相關檢驗;從殘差圖中可以發現,除了少數極端值較為明顯之外,其他的值大部分都圍繞在0附近。所以,綜合上述兩點,我們可以對該因子進行下一步的相關性檢驗。

圖3 股利支付率散點圖

圖4 股利支付率殘差圖
圖3-圖4是股利支付率的散點圖和殘差圖??梢钥闯?,與DBA資產負債率相比,其回歸檢驗效果相對較差。從散點圖可以看出在收益率曲線周圍并未分布相應的股利支付率,散點圖分布較為散亂,無明顯的相關性;對于殘差圖來說,與DBA相比,并沒有太大的集中性,僅從圖中來看,并未獲得太大的相關性信息。
之后,采用Fama-MacBeth方法對因子與股票收益率進行檢驗:
①將所有需要進行檢驗的單因子依次代入上文設立的一元線性回歸方程式(1)計算其回歸系數;
②計算相應因子回歸系數的t統計量;
③設定置信度α=0.05,并對比各因子的t統計量和臨界值2,若|t|>2或|t|=2,則通過檢驗,反之為不通過;
④帶入數值,進行檢驗,結果如下:
在檢驗過程進行前,首先將因子分類為成長因子、估值因子、盈利因子、償債因子、營運因子、流動因子及其他因子等幾部分,其次對上述各類因子與股票收益率分別進行Fama-MacBeth檢驗,具體結果如表2所示。

表2 候選因子F-M檢驗結果統計表
從表2我們可以看出,由于t統計量臨界值為2,所以表2中凈資產增長率、凈利潤增長率、PS、凈現金流量比、總資產周轉率以及股利支付率由于t值中|t|小于2未能通過檢驗。所以,綜合上述預處理以及分析,最終選取的候選因子為OGT、PE、PS、ROE、ROA等通過F-M檢驗的共計12個因子。另外,我們需要考慮的是,不同因子之間存在多重共線性,所以仍需進行進一步的處理,剔除不必要的候選因子,得到最終的實驗因子[4]。
(2)剔除重復因子——因子間相關性檢驗
上文提到,不同因子之間由于計算方式以及分類方法相同,可能導致最終的檢驗結果具有很強的一致性,即為多重共線性。為了避免多重共線性對實驗結果造成的干擾,還需要對不同因子間進行一定的相關性檢驗,減少實驗結果的誤差,并從中挑選出相關性較高的因子繼續試驗。對保留的12個因子進行的相關性檢驗分析如表3所示。

表3 因子間相關性校驗結果統計表
表3是對通過F-M檢驗的12個備選因子進行因子間相關性檢驗的相應結果,從中我們可以很直觀的看出有四組因子之間的相關性系數遠遠大于其他組,分別是資本回報率(ROIC)-資本負債率(DBA)、資本回報率(ROIC)-總資本增長率(TAGT)、總資產增長率(TAGT)-ROA以及營業收入增長率(OGT)-ROA,其相關性系數更是高達0.95、0.99、0.98、0.99。可以推斷出這四組因子之間存在嚴重的同質化現象,現需要對這四組因子分別進行顯著性(t)檢驗,通過對比分析實驗結果,舍棄顯著性低的因子。下面對四組因子中的5個因子進行顯著性檢驗,結果如表4所示。

表4 剔除因子顯著性檢驗結果
由表4可知,在上述5個因子中,顯著性較好的是DBA、TAGT、OGT,所以,根據顯著性檢驗結果以及模型建立要求,我們選擇將ROA以及ROIC剔除。
3.構建多因子選股模型
本文利用MATLAB中的Stepwise函數對其進行構建,并進行計算,相應的計算結果如表5所示。

表5 逐步回歸結果統計表
表5為10因子進行循環逐步回歸分析后所得結果,從表中數據可以看出:在循環的過程中存貨周轉率(ITR)、流動比率(CR)以及PE等3個因子由于和回歸模型的適配度未通過檢驗,顯著性較差,因此將其剔除解釋變量。最終得到的7個解釋變量分別為總資產增長率(TAGT)、換手率(hsl)、資產負債率(DBA)、PB、營業收入增長率(OGT)、ROE以及每股收益增長率(EPGST)。根據表5中的數據,可以得到回歸方程中這7個解釋變量相應的系數(除常數外保留兩位小數,四舍五入),具體如表6所示。

表6 最優解釋變量組相關系數
表6即為經過兩輪篩選得到的最終的解釋變量的相應系數,根據表6數據可得設定的回歸方程結果如式(3)所示。
Y=1.1PB+0.06OGT+0.03hls+
0.01EPGST-0.18ROE-0.08DBA-
0.03TAGA+2.5341
(3)
4.建立Logistics選股模型
(1)Logistics解釋變量選取
本文的研究方向是基于我國股票市場創業板,所以我們在創業板指數成分股中選取合適的相應股票,由于數據的來源問題,這里選取2016年的成分股作為選股池,以創業板知識為基準,研究個股收益超過指數收益的概率問題,篩選出10支代表性的股票進行實證分析,最后進行的回測分析依據日級別數據[5]。具體過程如下:
①令個股收益與指數收益為Logisitics模型中的響應變量;
②設定:Rit為個股的每日收益(i為第i支個股,t為相對應的時間),Rt為指數的收益率;
③規定:當Rit>Rt時,令y=1;當Rit