黃瀅
聚類分析是根據研究對象的特征對研究對象進行分類的多元統計分析技術的總稱,它能夠將一批樣本數據(或變量)按照它們在性質上的親疏程度自動進行分類,使同一類中的樣本具有高度同質性。
一、中國商業銀行競爭力指標的選擇
商業銀行的競爭實力包括現實競爭力和潛在競爭力?,F實競爭力從與銀行經營特征密切相關的“盈利性、安全性、流動性”出發, 結合發展能力和市場實力進行考察。在考慮了數據的可獲取性的基礎上,最終選取了包括資產總額X1、負債總額X2、凈利潤X3、凈資產收益率X4、不良貸款率X5、撥備覆蓋率X6、核心資本充足率X7、資本充足率X8在內的以8個指標體系的商業銀行競爭力評價指標體系庫,以綜合考察商業銀行的各項競爭力。
(1)資產總額X1,資產總額是指商業銀行擁有或控制的全部資產。
(2)負債總額X2,商業銀行的負債業務是商業銀行籌措資金、形成資金來源的業務,是商業銀行資產業務和其他業務的基礎。
(3)凈利潤X3,凈利潤是商業銀行在利潤總額中按規定繳納了所得稅之后的利潤留存,它是一個商業銀行經營的最終成果。
(4)凈資產收益率X4,反映商業銀行投資者以及股東權益的高低,反映商業銀行債權人的收益水平。
(5)不良貸款率X5,不良貸款率是商業銀行不良貸款占總貸款余額的比重。
(6)撥備覆蓋率X6,是商業銀行針對不良貸款提取的呆賬、壞賬準備金的比率。
(7)核心資本充足率X7,是指核心資本與加權風險資產總額的比率。
(8)資本充足率X8,是商業銀行的資產對其風險的比率。
二、商業銀行樣本的選取
本文選取的樣本數據主要也是根據《銀行家》雜志刊出的2012年度中國商業銀行競爭力排名榜上有名的商業銀行(表1),參考名單最終選取了綜合實力一致并靠前的12家全國性商業銀行和1家城市商業銀行作為樣本數據,包括工商銀行、建設銀行、中國銀行、交通銀行、中信銀行、興業銀行、民生銀行、農業銀行、招商銀行、浦發銀行、光大銀行、平安銀行和北京銀行共13個樣本。
表1 2012年中國商業銀行競爭力報告單項獎名單
三、實證研究
(一)數據收集
對所選取的指標做一簡單的了解之后,接下來我們針對各商業銀行的經營情況選取數據指標,這些數據大都來自各銀行的年報所披露的信息,各商業銀行的指標選取見下表:
表2 各商業銀行指標數據
數據來源:各商業銀行2012年年報數據整理所得。
(二)層次聚類分析
這里,利用SPSS層次聚類Q型聚類對商業銀行的競爭能力進行分類。其中個體距離采用平方歐氏距離,類間距離采用平均組間鏈接鎖距離,由于數據存在數量級的差異,因此必須進行標準化的處理。生成的聚類分析樹狀圖如圖1所示,其他結果略去。
圖1 13個商業銀行競爭力層次聚類分析結果
由圖1可知,光大銀行,民生銀行相似性較高且較早聚成了一類,其他商業銀行相似性都較低。如果聚成三類,則光大銀行,民生銀行,招商銀行,浦發銀行,興業銀行為一類,則交通銀行,中信銀行,北京銀行,平安銀行為一類,建設銀行,中國銀行,工商銀行,農業銀行為一類。如果聚成四類,則平安銀行自成一類。
表3 層次聚類分析中的凝聚狀態表
聚類表
表3顯示了13個商業銀行根據競爭力聚類的情況。聚類分析的第一步,8號樣本和12號樣本聚成一小類,它們的個體距離是0.314,這個小類將在下面第四步用到;同理聚類分析的第四步,6號樣本與第一步聚成的小類(以該小類中第一個樣本號8為標記)又聚成一小類,它們的距離(個體與小類的距離,這里采用組間平均鏈鎖距離)是0.577,形成的小類將在第七步用到。經過12步聚類過程,13個樣本最后聚成了一大類。
表4 層次聚類分析中的類成員群集成員
群集成員
由表4可知,當聚成三類時,則光大銀行,民生銀行,招商銀行,浦發銀行,興業銀行為一類,則交通銀行,中信銀行,北京銀行,平安銀行為一類,建設銀行,中國銀行,工商銀行,農業銀行為一類。當聚成四類時,則建設銀行,中國銀行,工商銀行,農業銀行為一類,交通銀行,中信銀行,北京銀行為一類,光大銀行,民生銀行,招商銀行,浦發銀行,興業銀行為一類,平安銀行聚為一類??梢?,spss的層次聚類能夠產生任意類數的分類結果。
圖2 層次聚類分析的冰狀圖
圖2是一幅縱向顯示的冰掛圖。由于冰掛圖的樣子很像冬天房檐上垂下的冰柱,因此而得名。觀察冰掛圖應從最后一行開始。由圖2可知,當聚成12類的時候,只有民生銀行和光大銀行聚為一類,其他各聚為一類。當聚為4類時,則建設銀行,中國銀行,工商銀行,農業銀行為一類,交通銀行,中信銀行,北京銀行為一類,光大銀行,民生銀行,招商銀行,浦發銀行,興業銀行為一類,平安銀行聚為一類。當聚成三類時,則光大銀行,民生銀行,招商銀行,浦發銀行,興業銀行為一類,則交通銀行,中信銀行,北京銀行,平安銀行為一類,建設銀行,中國銀行,工商銀行,農業銀行為一類。
四、總結
總之,層次聚類分析能夠得到多個分類解。從層次聚類分析的過程中可以看出,層次聚類分析的每一步都要重新計算每個距離。在大樣本情況下,層次聚類分析方法對計算機的性能要求比較高,需占用較多的CPU時間和內存,可能會出現等待時間過長等問題。