王瑞臻+林婧
[摘 要]文章利用四種不同的分類模型Logistic模型、決策樹模型、BP神經網絡以及隨機森林對2015年創業板與主板上市公司差異性財務數據進行了識別。研究發現不同的識別方法,識別結果有一定差異,在識別差異性數據的此類問題上,隨機森林具有一定的優勢。隨機森林識別出的兩板差異性數據主要有速動比率、流動比率、應收賬款周轉率等。
[關鍵詞]隨機森林;上市公司;財務數據;差異性識別
[DOI]10.13939/j.cnki.zgsc.2018.02.188
1 引 言
2009年啟動創業板,至今已有600多家公司成功發行。雖然創業板與主板市場的準入條件、交易規則以及投資者特征等方面不同,但可以根據統計財務數據對兩市場進行對比研究,找出兩個市場在哪些方面存在差異,分析差異的原因,并通過彼此之間的借鑒來加以完善,這對我國股市持續穩定的發展具有參考價值。為識別出兩板上市公司差異性財務數據,通常涉及傳統的ANOVA方差分析,與此同時,分類模型可為此類問題提供一種方法。分類問題在醫學、經濟管理等領域經常涉及,針對這一類問題通常采用統計學方法Logistic進行分析。近年來,越來越多的機器學習方法對分類模型給出了新的解決方案,常見的機器學習分類模型如決策樹模型、BP神經網絡、隨機森林等,一般來說,建立的分類模型是用來預測。但無論是Logistic模型還是上述的機器學習都可以對輸入的變量按重要性提取出關鍵變量,這對我們識別創業板與主板上市公司的差異性財務數據提供了另外一種可行的方法。……