張望舒
摘要:本文選取了28支在我國交易所掛牌上市的房地產行業(yè)股票,9項分別從盈利能力、成長能力、償債能力以及公司的股本擴張能力中選取的具有代表性的公司財務狀況指標。對其進行聚類分析,主要思路為:先對其應用NbCIus咆中NbcIust()函數得到最優(yōu)聚類類數,再應用六種系統聚類方法以及K-means聚類方法對其進行聚類,畫出樹狀圖并得出分類結果,再結合實際對其進行分析。
關鍵詞:房地產行業(yè)股票 Rstudio 聚類分析
一、數據描述性分析
(一)數據來源
因考慮到不同行業(yè)間的數據差異可能會很大,這對分析結果會帶來較大誤差。故本文僅以房地產行業(yè)為例,隨機選取28家上市公司2018年上半年度相關信息進行分析。數據如表l所示。
由于衡量上市公司的股票價值的財務指標數量紛繁復雜,為了使統計分析更易進行,經過分類與挑選,最終在不損失衡量股票價值有效信息的前提下,盡可能地縮減了指標個數。查詢資料發(fā)現,目前評估上市公司基本面狀況最為核心的財務能力指標是上市公司的贏利能力、成長能力、償債能力以及公司的股本擴張能力。由此,本文在上市公司財務指標中選取如下反映這些能力的9項重要指標:總資產、每股收益、流動比率、速動比率、應收賬款周轉率、凈資產收益率、營業(yè)收入增長率、凈利潤增長率,總資產增長率。
(二)相關性分析
為了更加清楚所選擇的各指標間的相關關系,接下來,我又對每股收益,流動比率,速動比率,應收帳款周轉率,凈資產收益率,營業(yè)收入增長率,凈利潤增長率,總資產增長率這些指標兩兩之間進行了相關性分析,做出相關系數矩陣圖(如圖1所示)。
二、關于股票評級的聚類分析
(一)評判聚類的類數
為了得到更加準確的最終聚類方案就必須事先確定類的個數,此處,我應用了NbClust包中NbClust()函數所提供的30個不同指標來幫助我進行選擇。最終,我發(fā)現所有聚類方法的最優(yōu)類數均為2類。故之后,我主要將所討論的房地產行業(yè)股票聚為2類。
(二)系統聚類法
運行Rstudio程序后我發(fā)現,6種系統聚類法(最短距離法、最長距離法、中間距離法、類平均法、重心法、Ward法)所聚出來的結果是完全相同的。且各種系統聚類方法所聚類數為2時的指數評分均為7或8分,足以看出這個聚類結果還是十分有可信度的。(聚類圖如圖2所示,分類結果如表2所示)。
(三)K-均值聚類法
K-均值聚類的目的是將幾個點劃分到k個聚類中,使每個點都屬于離它最近的聚類中心。通過事先評估,發(fā)現類數為2時,評分已經高達了11.所以在這里,我將這幾支股票聚為兩類,并得到兩個聚類中心各項指標的均值,如下表所示:
(四)評價與分析
聚類后我發(fā)現,聚類結果主要分為2種:系統聚類法中的6種方法所聚出來的結果是相同的,而K一均值聚類法又聚出了另一種結果。通過與實際情況對比,可以發(fā)現,并不存在哪種聚類方法好或者不好,因為它們的分類依據是不同的。即系統聚類方法將其聚成了地產行業(yè)龍頭企業(yè)與非龍頭企業(yè)。即:萬科A,保利地產,綠地控股這三家地產上市公司均屬于該行業(yè)龍頭企業(yè)。不僅在總資產與每股收益排名在所選樣本前三,而且增長穩(wěn)健,流動比率與速動比率也十分適中。
而K-均值聚類所聚出來結果,則將其聚成了正常企業(yè)與問題企業(yè),即2類中有三支都被打上了sT標志,有一家天業(yè)更是打上了星號。這意味著這家公司已經連續(xù)三年虧損,并正在面臨退市風險。而另外兩家企業(yè),陽光股份總資產只有68.71億元,增長率更是全部為負。嘉凱城每股收益,凈資產收益率,凈利潤增長率,總資產增長率也全部為負值。
綜上所述,兩種聚類方法都具有實際意義。故在使用這兩種聚類方法時,僅需根基自己實際需要選擇。