謝淳鈺 萬文君(通訊作者)
(武漢工程大學管理學院 湖北武漢 430205)
多元回歸分析方法應用于股票定價邏輯剖析的思路,源于傳統定價理論中的多因素定價模型,該模型在發展過程中多是基于實證觀點建立起來的。
實證分析研究經濟狀態“是什么”,它側重研究經濟系統如何運作,分析經濟活動的過程、結果和發展方向。實證分析在一定的假定條件下,描述、解釋或說明已觀察到的事實,對將會出現的情況或現象進行預測。客觀事實是檢驗由實證分析方法得出結論的唯一標準。
有學者指出,實證分析的基本特征:以對經濟現象分析歸納出的基本前提假設為起點,并基于這些假設進行邏輯演繹,推導出一系列結論,再逐步放松一些假設,使結論更接近具體事實。
上市公司的整體價值由其股權資本價值和債務價值兩部分組成。為了方便,我們將占比較小的優先股暫時忽略,以普通股價值作為企業資本的衡量標準;債務違約風險一般較小,其市場價格的變動也不會很大。由此,在企業資本結構不變的前提下,企業的整體價值越大,其股權資本的價值就越高,股票價格也就越高。
一般投資者都認可股價是由企業的內在價值決定的,但“內在價值”是財報中的哪些指標及怎樣的權重決定的?如果這種定價邏輯在二級市場的行業板塊中是普遍適用的,那么我們可以用截面數據擬合出定價的回歸方程,從而揭示二級市場行業板塊的定價邏輯。
多元線性回歸模型(multivariable linear regression model)中,當預測對象同時受到多個解釋變量,,…,影響,且各個解釋變量都與預測對象有線性相關時,可以建立多元線性回歸模型進行預測和分析,模型為:

其中:為解釋變量的數目;為回歸系數(regression coefficient);為隨機干擾誤差。式(1)也被稱為總體回歸函數的隨機表達式。
由公式可以看出,解釋變量有多個,我們構造模型時,應選取對被解釋變量影響較大的幾個解釋變量,并且確定對應系數,再判斷模型能否較好地擬合實測數據,才能進一步通過模型來預測。
在使用多元線性回歸模型時,有四個基本假定:
假設一:各解釋變量之間互不相關。
假設二:隨機誤差項是一個平均值或期望值為零的隨機變量。
假設三:解釋變量與隨機干擾項不相關。
假設四:隨機干擾項滿足正態分布。
首先,行業板塊概念清晰,定價邏輯成熟,即全新的概念板塊可能定價邏輯尚在磨合中,對當前的股價沒有指導意義。
其次,被評估企業所處的資本市場應有效或接近有效,上市公司在同等條件下相較非上市企業在接受資本市場評估時更易于獲得有效價格。
再次,企業不能過于特殊,同一行業中寡頭企業也許在收入模式上與其他企業有明顯差距,所以應該盡量避免寡頭壟斷企業數據對行業板塊數據的影響。
最后,多元線性回歸模型要求解釋變量之間互不相關,即不存在多重共線性。
數據來源為同花順股票交易軟件中的財報數據,易查找、更官方;截面數據時間選為2021年3月31日,股價選擇20日均價;行業板塊選為可降解塑料;指標選擇綜合考慮盈利能力、償債能力、營運能力和增長能力等。
表1所列財務指標都是經過理論和實踐長期檢驗的,因此首選將其列為備選指標。

表1 備選解釋變量一覽
2.1.1 繪制散點圖矩陣
散點圖矩陣如圖1所示。

圖1 散點圖矩陣
2.1.2 擬合多元線性回歸方程
以前述股票數據中的“股價”為因變量,擬合各財務指標的多元線性回歸方程,運行R語言summary()函數返回的信息如下:


從回歸參數的顯著性可以看到:每股凈資產、每股收益、凈利潤同比增長率通過t檢驗,擬合優度值達0.8849,多元線性回歸方程整體通過F檢驗。
以通過t檢驗的回歸參數每股凈資產、每股收益、凈利潤同比增長率,重新優化擬合回歸方程,運行R語言summary()函數返回的信息如下:

各自變量的p值為0.05水平上顯著不為零,通過顯著性檢驗;多元線性方程的擬合優度達到0.8588,通過F檢驗。
運行R語言bptest()函數,返回的信息如下:

通過異方差檢驗。
由于此次回歸分析中各自變量的數值為各股的財務指標,數值之間沒有時間順序上的相關性,因此自相關性檢驗在本例中沒有意義。
運行R語言vif()函數,返回信息如下:

各回歸參數的vif值均小于10,通過多重共線性檢驗。
我們獲得了關于股價的多元線性回歸方程:
股價=0.5432+1.9018每股凈資產+34.4049每股收益-0.5417凈利潤同比增長率
運用關于股價的多元線性回歸方程,可計算得到個股的擬合價格,用擬合價格減實際價格的偏差計算偏差率,其偏差率數列的描述統計如表2所示。

表2 個股擬合價格偏差率數列的描述統計
由表2可以看出,有少數股票的擬合股價正向偏差過大,牽動行業板塊整體擬合股價正向偏移。
我們以擬合股價正向偏差大于90%的4只個股(蘇美達、紫江企業、湖北宜化、雙星新材)為例,觀察2021年3月31日—2021年11月30日的股價波動,發現各股20日均價的最大漲幅依次為33.95%、110.70%、685.95%、152.08%,而同期可降解塑料指數(代碼885901)的最大漲幅僅為56.13%。
由此發現,擬合股價正向偏差較大的個股(實際股價遠不及按行業定價邏輯擬合的股價)均在此后約半年的時間中有強于板塊的補漲沖勁。
3.1.1 降低了研究者的進入門檻
與通過財務報表對股價進行分析相比,數理統計分析方法無需分析人員深刻把握宏觀經濟、產業發展趨勢、市場競爭條件、企業經營狀況等,僅需掌握數理統計分析技術和初步的財務知識即可。
3.1.2 有效防范研究者的主觀臆斷
多元線性回歸分析僅依據行業和個股財報數據作出分析結果,排除了分析人員的主觀因素,也可以降低因分析人員經驗不足導致的分析偏差。
3.2.1 需要數據量龐大
在數據量較少時,回歸分析更容易得到顯著結論。一般認為,樣本數量大于30時,分析結論才更有保障,同時因為要在眾多的自變量中篩選具有顯著性的自變量,所以有大量的數據收集和整理工作。
3.2.2 忽略了非上市公司在行業中的影響
此次行業股價回歸分析中,由于非上市企業的財報不公開披露,同時非上市企業才是行業市場中的多數,所以抽樣范圍受限造成結論偏差在所難免,但沒有影響我們探索市場定價的基本邏輯。
相較傳統的企業價值評估,數理統計分析的特點在于客觀性、時效性、普遍性,只要有足夠的數據,就可以充分揭示復雜經濟現象下深刻的內在規律。
此次對可降解塑料行業二級市場定價影響因素的辨析,我們發現:多元線性回歸分析對于行業板塊股價的定價機制揭示準確、可靠,可以作為一種投資參考工具。
隨著市場周期性的波動,在市場不同趨勢階段,二級市場股票定價的影響因素是否保持穩定?會不會在市場盤整趨勢和下降趨勢中顯現出其他影響因素的顯著作用?值得我們進一步研究和揭示。