


[摘要]文章利用主成分分析與聚類分析法對金融業中貨幣金融服務板塊的16只股票的2016年會計年度綜合財務狀況進行了系統分析。首先按營運能力、盈利能力、發展能力、股本擴張能力將11個財務指標歸納為4個一級指標,并對其進行主成分分析,再利用提取出的主成分進行聚類分析。希望通過對上述銀行業上市公司客觀全面的綜合分析,為中小投資者提供理性的投資參考數據,幫助其選取財務狀況良好、具有發展潛力的股票,最大限度地提升股票投資價值。
[關鍵詞]銀行板塊;主成分聚類分析;綜合評價
[DOI]1013939/jcnkizgsc201730034
1引言
11研究背景及意義
隨著我國宏觀經濟的進入持續穩定增長的“新常態”,近幾年國內銀行業的景氣度持續回升,上市銀行也面臨難得的發展機遇,在資產規模、資產質量、盈利能力等方面都取得了驕人的成績。銀行板塊是藍籌股的重要代表,工商銀行、中國銀行等銀行股成為主力機構調控股票指數的重要工具,上證綜合指數是以其總股本來確定權重。
依據財務報表對銀行板塊上市公司綜合實力的評價的重要性就愈加顯現出來。
本文以證監會2012年版行業分類中的16家銀行的2016年度財務數據作為考察樣本,在計算影響綜合實力指標的基礎上,用主成分聚類分析方法來進行評價,進而得出不同能力指標下的結果,對其進行綜合分析并給出相應建議。
12國內外研究現狀
綜述當前的研究現狀,以及本文的研究問題和研究思路
劉倩(2010)得出主成分分析可以有效解決我國企業財務數據高維性和多重共線性的特點,使判別模型更具說服力,但只針對28家上市創業板公司做了研究,數據量不夠大,說服力不夠強。
王德清等(2012)針對經典聚類分析和普通主成分聚類分析極端情形下的失效問題展開討論,通過定義客觀賦權的主成分距離為分類統計量,并以實證檢驗取得良好效果為依據,有效地解決了主成分聚類分析在極端情形下所不能揭示的問題。
國外學者做過一些利用數據挖掘算法來分析預測客戶行為的研究,例如,采用K-median聚類算法對超級商場消費者的偏好情況進行細分。[5]采用K-means、SOM(self-organizing map)、Fuzzy K-means聚類算法對股票交易客戶進行細分[6]。運用模糊聚類算法對在線音樂愛好者進行用戶細分等。[7]
2研究方法
21主成分聚類分析法
在多指標綜合評估的排序問題中,若主成分累計貢獻率不夠大,即提取出的主成分表達的原始數據不夠完整全面,僅按主成分得分對樣品直接排序評價會有片面性,這時候可以將主成分分析與聚類分析兩種統計方法聯系起來,稱為“主成分聚類分析”。
將主成分分析與聚類分析相結合,即先進行主成分分析,然后對提取出的幾個主成分進行聚類分析,結合主成分的綜合排序進行對象分類排名。這種方法一是可以降低指標的維數,將復雜的問題簡化;二是可以對聚類分析方法中的每一類進行評價,根據每一類的主成分得分進行排名,得到的排名結果更符合實際。
22聚類分析方法的原理
本文采用的K-means聚類分析算法是麥奎因提出,算法的要點先確定K值,然后將數據集劃分成K類,然后進行反復迭代,把每一個樣本重新分配到距離最近的中心類別中。
23聚類分析分類數的確定
K-均值聚類分析方法能夠將數據群體迅速、合理地劃分成K個子群體,比較適合解決大量數據信息的問題。對于K-均值聚類分析算法,需要著重考慮K值。這是本算法的關鍵步驟,對聚類產生的結果有很大的影響。
K-均值法具體分類數的確定,離不開實踐經驗的積累,可以反復進行多次的初值選擇,根據各個產生的聚類結果中找出最優的分類。但我們這里借助系統聚類法以一部分樣本為對象進行聚類,其結果作為K-均值聚類分析法確定類數的參考。
24主成分聚類分析的計算步驟
設有n個樣品,每個樣品觀測p個指標,將原始數據寫成矩陣
X=x11x12…x1p
x21x22…x2p
xn1xn2…xnp
(1)將原始數據標準化。這里不妨設上述矩陣已標準化了。
(2)建立變量的相關系數陣:
R=(rij)p×p
rij=nk=1(xki-x-i)(xkj-x-j)nk=1(xki-x-i)2nk=1(xkj-x-j)2
(3)求R的特征根
λ1≥λ2≥…≥λn>0
及相應的單位特征向量:
a1=a11a21ap1,a2=a12a22ap2,ap=a1pa2papp
(4)計算寫出主要成分
Fi=a1X1+a2X2+…+aPxP
計算主成分貢獻率及累計貢獻率
√貢獻率
λipk=1λk(i=1,2,…,p)
√累計貢獻率
ik=1λkpk=1λk(i=1,2,…,p)
一般取累計貢獻率達85%~95%的特征值λ1,λ2,…,λm所對應的第1,第2,…,第m(m≤p)個主成分。
(5)求p個觀測對象在前m個主成分的得分。根據各個主成分的貢獻率進行加權求和。
(6)根據前m個主成分得分運用K-均值聚類,得到個案的類別,依據主成分分析確定每個個項的類別排名,并進行綜合評價。
3綜合評價因子分析
31指標變量的選取分類及公式計算
選取了11個變量指標,較全面地反映銀行上市公司的基本財務狀況。
32主成分聚類分析endprint
本文使用SPSS 170統計分析軟件,選取上述11個變量的財務指標,
采用主成分探索性因子分析以及K-均值聚類分析方法的對16家上市銀行的基本財務狀況進行綜合評價研究。數據來源于《國泰安CSMAR系列研究數據庫》。下面將進行過程分析及解釋。
主成分分析是用于把眾多相關變量縮減為較少的不相關的主成分變量的一種方法。因此,用于主成分分析的原始變量之間必須有相關性,如果變量之間相互獨立,則無法用主成分分析法來進行數據降維,但如果每一個變量反映的信息都不相同,沒有任何冗余信息,這種數據分析方法是沒有用武之地的。檢驗變量之間的相關程度,判斷是否適用主成分分析法,需要用到KMO和Bartlett球形檢驗。
KMO統計量比較樣本相關系數和樣本偏相關系數,它的取值在0和1之間,該值越大,則樣本數據越適用于主成分和因子分析。一般要求大于05,方可運用這種分析方法。根據Kaiser(1974)給出的經驗原則,0549的適合性為middling(中度的)。如果顯著性值小于005,則認為主成分分析是適宜的。本例中卡方值為193895,大于卡方的臨界值18,顯著性值小于005,故主成分分析法可以應用在此案例中。
(1)主成分的統計信息
根據標準化公式處理原始數據,由此計算出各數據變量的相關系數矩陣R,以及相關系數的特征值、貢獻率和累計貢獻率。
上表顯示了主成分的統計信息,包括特征值由大到小的次序排列,各主成分的貢獻率及累積貢獻率。第一主成分的特征值為4677,它解釋了11個原變量的總方差的42516%(因子旋轉前),第二主成分的特征值為3143,它解釋了11個原變量的總方差的28576%,前三個特征值的累積貢獻率為85796%,即前四個主成分包含了原有變量指標的85796%的信息,所以本例中可以取前三個主成分來替代原始十一個指標。
(2)旋轉后的因子載荷矩陣
通過四次方最大旋轉后,得到了11個變量在3個因子上的新的因子載荷。結果顯示,因子1支配的變量有X3(凈資產收益率)、X5(基本每股收益)、X9(每股凈資產)、X10(每股資本公積)、X11(每股未分配利潤)。
因子2支配的變量有X2(總資產凈利潤率ROA)、X3(凈資產收益率)、X4(營業凈利率TTM)、X8(營業總收入增長率)。
因子3與X1(營運指數)、X6(總資產增長率)、X7(凈利潤增長率)有很強的相關關系。
故可以粗略地認為,因子1集中反映銀行每股價值指標,稱為綜合擴張因子;因子2重點反映資產與營業收入的各方面情況,稱為盈利發展因子。根據(現金)營運指數定義,它反映企業現金回收質量、衡量現金風險的指標,同時這個主成分體現企業在規模擴大、增加盈利等方面的表現,即總資產、凈利潤的增長率,故因子3可稱為風險價值因子。
(3)因子得分系數矩陣及主成分得分
SPSS可以將通過旋轉后計算的4個因子得分Z1、Z2、Z3、Z4作為新變量自動存儲到原始數據文件中,操作為{轉換}→{計算變量},如表4所示,Y為最終得分,根據以上分析,可了解各個指標的潛在本質。
具體來說,根據各個主成分的貢獻率進行加權求和,因子旋轉后三個主成分更精確的特征值分別是4373、2703、2361。因此綜合得分為:
Y=4373/9437Z1+2703/9437Z2+2361/9437Z3
在主成分得分表中,我們可以看到寧波銀行、民生銀行、興業銀行、華夏銀行和南京銀行表現突出,綜合排名在前五。這些銀行大多是區域性銀行,依托經濟活躍的地帶,發展勢頭很好,而排名較靠后的建設銀行、北京銀行、農業銀行、工商銀行和中國銀行,除北京銀行外其余四家網點遍布全國,資本雄厚,基礎較好,已經過了股本快速擴張的階段,也許是這個原因讓這幾家銀行的各項指標數相對較低。
4板塊的聚類分析
聚類分析對于變量的選擇比較重要,一般變量個數越多,得到的類越難以解釋。依上例,選取的代表上市銀行財務狀況的數據變量比較多,考慮先用主成分分析法進行降維,然后應用主成分變量做聚類變量進行聚類分析。
K-均值法是一種比較流行的動態聚類法,選擇一批凝聚點或給出一個初始的分類,讓樣本按某種原則向凝聚點聚攏,對凝聚點進行不斷的修改或迭代,直至分類比較合理、迭代穩定為止。
在SPSS中選擇K-均值聚類分析可得到類成員列表。上圖第三列Cluster給出了每個個案所屬的類,第四列Distance顯示的是個案和所屬類中心的距離。經過20次迭代計算,對比結果,我們發現選擇分類數為5較合理,既能有效分離數據,又能呈現較小的聚合系數。
5研究結論
51研究結論
根據上述主成分聚類分析可得出:
第一類有興業銀行與招商銀行,這兩家銀行在綜合擴張方面表現突出,分別排序1、2,雖然在主成分分析法下排名中上(第3與第6),但根據銀行區別于一般企業的性質特點,可以認為財務狀況良好,具有較大的發展潛力。
第三類有建設銀行、北京銀行、工商銀行、農業銀行和中國銀行,與主成分加權綜合得分后五名的排序一致,這幾家在上市公司中屬于老牌銀行,實力雄厚,股本很大,在一定程度上影響了各項能力指標,綜合表現不是很突出。在圖7最后聚類中心的表中也可以看出,第三類的指數較低。
第二、四和五類的銀行,在綜合擴張、盈利發展和風險價值三個方面處于中等水平,主成分的綜合評分也是不好不壞,采取保守策略的投資者可以選擇這些銀行。
綜上所述,相對于只采用主成分分析法,對主成分法提取的因子進行聚類分析的方法能更為精確地解釋主成分綜合加權排名。
關于模型的合理性,本文選取了四個指標,衡量盈利、發展、營運能力的變量較為全面地概括了企業當前的財務狀況。值得一提的是,針對商業銀行的行業特點創新地選取了股本擴張能力這一指標,這是比較切合實際的。endprint
52對策建議
521外部環境方面
由于金融業是當前國際激烈經濟競爭的關鍵環節,而商業銀行體系是現代金融的核心,我國的資本市場相對于發達國家還不成熟,銀行部門在國民經濟的運行中發揮著重要作用,在資本充足率、資產質量以及創新能力上需改進提高。
522行業現狀方面
互聯網金融對傳統銀行業有很大的沖擊,時代發展浪潮下,人們已經習慣新的支付方式,加之融資渠道的豐富多元化,傳統商業銀行該思考如何去改變。
523資源能力方面
首先,商業銀行需積極地進行金融產品的開發,認真研究競爭對手的情況,切實做到以客戶需求為中心,以市場細分為基礎,不斷開發出滿足不同類型客戶需要的產品。尤其是要加大開發和擴展高附加值產品的力度,逐步形成自己的特色,適時推出同類銀行難以模仿的金融產品,推動商業銀行的金融創新,改善商業銀行的產品結構,借以樹立專有的名牌產品,增強盈利能力,提高競爭力,降低信用風險。
其次,商業銀行應開展金融產品研制,仔細研究競爭對手的情況,切實以客戶需求為中心,以市場細分為基礎,不斷開發滿足不同客戶需求的產品。特別是增加高附加值產品的發展壯大而努力,逐漸形成了自己的特色,類似銀行理財產品及時引進模仿,促進商業銀行的金融創新,提高商業銀行的產品結構,建立自主品牌產品,提高盈利能力,增強競爭能力,有效地使信用風險降低。
最后,建議監管部門降低準入門檻,試點實行逐步放松銀行業管制。如此在一定程度上提高銀行業的穩定性,降低銀行風險。在減低銀行業進入障礙的同時,應更多地允許具有區域關系型借貸優勢并符合條件的民間金融機構進入銀行業,遏止銀行之間由于競爭度上升而帶來的風險。
524業務流程與組織系統方面
商業銀行業務流程是指商業銀行直接或間接地為顧客創造價值的一系列相關活動的有序集合。一套有序高效的業務流程有助于增強銀行的價值創造能力。因此,需要對業務流程進行優化。具體可以采取下列做法。
(1)簡化業務流程。業務簡化流程,減少不必要的活動,結合業務流程重新規劃各項流程過程或活動,或串并聯轉換改造流程,以為了縮短營業時間,合理配置人力資源,節約成本和有效地增加新的業務目標的數量目的。例如,那些效率低下的非核心業務外包,集中在人力、物力和財力資源的核心業務上,給客戶提供最高效、最全面的業務服務。
(2)建立差異化流程。為了滿足客戶多樣化的需求,需建立差異化的業務流程,最大限度使客戶滿意,與此同時加強客戶關系的管理,最大化實現客戶價值。
參考文獻:
[1]何曉群多元統計分析[M].4版北京:中國人民大學出版社,2015
[2]賴國毅,陳超SPSS 170中文版常用功能與應用實例精講[M].北京:北京電子工業出版社,2010
[3]劉倩基于主成分聚類分析的中小企業成長研究[J].統計與決策,2011(16)
[4]王德清,朱建平,謝邦昌主成分聚類有效性的思考[J].統計研究,2012(11)
[5]Jean-Paul Ruiz,Jean-Charles Chebat,Pierre Hansen Another Trip to the Mall:A Segmentation Study of Customers Based on Their Activities[J].Journal of Retailing and Consumer Services,2004(11):333-350
[6]HWShin,SY Sohn Segmentation of Stock Trading Customers According to Potential Value[J] Expert Systems with Applications,2004(27):27-33
[7]Muammer Ozer User Segmentation of Online Music Services Using Fuzzy Clustering[J].Omega,2001(29):193-206
[作者簡介]劉宇珊(1996—),女,漢族,湖北黃岡人,就讀于北京工業大學,研究方向:財務數據分析與挖掘。endprint