劉勇
摘 要:分類數據在我們日常的分析中比較常見,當探討相異行業的服務與質量時,行業就成了分類的變量,這兒必然會遇到聚類分析與方差分析的方法。在證券業進行較為熱門的行業回報率研究時,也經常會遇到聚類分析方法。本文主要研究了聚類分析的特征概念、評價,探析了當前金融投資業的現狀,最后在應用方面進行了全面分析。
關鍵詞:分類;金融投資;聚類分析
當前在金融投資中,聚類分析方法的深入研究有很大的價值。聚類分析指的是將整個的數據按組或類的形式逐漸分類,使得每一組的數據之間有著較強的相似或者相同性,而不同組或類之間差別更大。在聚類分析下,可以通過數據之間的相似度分析數據模式的分布和數據間的屬性。聚類分析通過股票成長性與收益性的分析研究,以綜合評價的指標分析與衡量樣本中的相似度,這能夠有效指導與分析金融投資。聚類分析是在基礎分析上進行深入研究的,能夠幫助投資者以準確的分析方法探討股票的相關特征,預測股票變動趨勢,讓投資者進行合理、有效投資。聚類分析操作可行度強,受限少,比較適合金融投資分析者。
1 聚類分析相關介紹
1.1 分類與評價
聚類分析認為數據的集中研究與數據之間有著各種相似性,聚類不同于分類,因為分類是早先就知道了的,在數據的集中分析與學習后完成對數據的分類以及有效的學習。而聚類是事先沒有任何先兆的,事先不知道要具體分成哪幾類,聚類就是沒有分類標志的有意義的類。比如信用卡中,在對持卡人的年齡、收入、信用狀況可以將信用度分成高等、中等以及低等這幾類,在對持卡人進行仔細分析、仔細判別后能夠合理的規避風險。而聚類分類能夠通過持卡人的信用額度、用卡次數、消費區域等將持卡人再仔細分類,通過信用資料使得雙方獲利。
聚類分析可簡要分為系統聚類、動態法、分解法這幾部分。聚類分析指的是樣品聚類和類之間的距離然后將樣品各自分類,算出距離然后合并,每減少一類再合成一類。分解法將樣品先分成一類,然后再具體的細分。上兩種方法計算量大,內存多,比較適用樣本較小的單位。而樣品較大比較適用動態法,動態法存在的目的是確定中心然后輸入樣品,看看樣本的歸屬,最后再具體調整。
聚類用途較大,還有些算法的預處理。聚類的類形狀各項迥異,不同的方法適用不同的類型。伸縮性是聚類的優先要求,它能處理百萬數據。數據類型處理需要處理序數、名義和二元變量,低參數、高維數據,以及可解釋的數據性都是數據的幾種類型,聚類存在的意義是解決具體問題,便于解釋與理解。
1.2 數據之間的相似性度量
聚類問題中涵蓋了N個數據XI(I=1,2……n),其中每個數據均有多種屬性,變量的多樣性決定了取值的連續性。比如匯率、價格等能夠以連續值表示的稱其為連續變量,由于變量單位不同,其間很有可能差異懸殊,用聚類分析將數據統一處理,滿足上述條件。在聚類要素的處理中,常見的有總和標準法、極差標準法、標準差標準法,實際中的分類對象較為復雜,需要將各個數據標準化。
1.3 層次聚類
層次聚類又稱之為系統聚類,它對給定數據逐層分層,形成由數據為節點的核心,細分下來包括凝聚和分類兩種方法。凝聚法是一種自底向上的方法,它們將鄰近的點合并成一類,凝聚法以類與類的間隔為度,臨近的類不斷組合加入組成新類,直到得到核定值。根據類間距,一般可分為最大距離法、重心法、中間距離法、最小距離法。最小距離法比較適合條形和S形的,在算法中以最小距離合并起來,最小聚類和最大距離中的距離均是單調的,只有從聚類樹形圖中才能直接窺見聚類情況。與凝聚法相反的分析法把數據看成一個大類,然后再分步細化,將每個大類拆分下來,分成單分裂與多分裂,當然此類分裂法應用并不廣。
1.4 分割聚類法
將數據集中化成K個子集,使每個子集中的點最大程度的相似,其中clara算法與K值算法是較為常見的,clara是用于處理大數據的,K中心點的算法有著自身優勢,但算法較為復雜,且伸縮性差。此類方法往往抽取多類樣品,輸出最好的,這就要保證取樣時的中心點是最好的,否則無法得到最好的聚類。K中心點中可隨意選擇K類點為主點,其余的點就是圍繞在中心點附近的類。K中心點的方法不易孤立,且難度系數不容小覷。
2.針對金融投資業簡要分析
我國投資業的起步較晚,存在著很多不盡人意之處。金融投資加速了貨幣的再分配,其中大部分貨幣的由來是儲蓄,以前貨幣累計的方式是放在銀行或者購買國債,現在金融產品的類型較之幾十年前豐富了不少。就股票而言,證券公司為客戶提供理財方面的服務,比如分析股票、托管賬戶,服務類型多樣化,從中賺取手續費。外匯黃金的兩方面獲利來源于理財服務與點差傭金,在投資中要謹慎小心,防止不法分子的趁虛而入,注意安全問題。
3.聚類分析在金融分析和投資方面的應用
3.1 方差分析
方差分析又叫做變異數分析,這是由兩個以上樣本均數構成的,經方差分析研究多由波形圖呈現。方差分析中的組別可能源于實驗條件與隨機誤差,實驗條件是由組間差異決定的,以變量的形式在各組之中存在著的。隨機誤差是組內差異,這是個體中的差異與測量的誤差導致的。方差分析主要用于有顯著差異的事物之間,在試驗中經常會探討到實驗條件不同導致的試驗結果,這通常是兩種不同實驗環境下樣品的差異。在農作物研究方向、在醫學對于疾病的防患中都可以方差分析法解決此類問題。復雜的事物往往會相互制約相互發展,方差存在的目的經過分析得出對事物決定因素的關鍵。方差的分析與研究可以具體的分為單因素的方差分析和多因素的方差分析。這兩者的步驟基本一致,資料的組成設計以及分解的方式略有差異。
單因素的方差分析重點是研究變量水平對觀測變量的影響,單個因素對于變量的影響被稱為單因素的方差分析。比如按照地域分析婦女的生育率,按照學生生活費分析在校學生的食宿情況,按照天氣條件分析農作物的產值,上述情況都可以利用單因素的變量分析得出。單因素分析中的第一步是觀察哪些是觀測變量哪些又是控制變量,第二步是利用數學方差解決問題,第三部按照變量與平方和之間的比例推測一邊對另一邊的影響。單因素方差分析法理解簡便,變量控制水平的不同對觀測變量的影響并不大,真正變量值的變動是由隨機因素所決定的。
多因素方差是探究兩個及以上變量對觀測變量的影響,這種分析方法不僅考慮到了變量對結果的影響,還需要考慮因素之間的交互影響與作用,比如研究不同大棚中種植出來的蘋果、香蕉、荔枝,研究水果的不同種類,研究不同的大棚使得各事物間性能完全不同,這些效應都是可以添加的,可能與別的水果而言,兩個大棚差別微乎其微,這被稱作交互作用。
3.2 聚類指標體系的選取
經對上市公司的基本情況分析后,選擇了盈利指標、成長指標、股本擴張的指標。盈利指標中的總資產利潤率能夠直接反映公司的盈利水平,凈資產收益率反映了股東投資的報酬大小。主營業務收益率等于主營業務利潤除以主營業務收入,主要業務的收益率越大說明市場競爭中的優勢越大,每股收益越高,獲利能力就越強。成長指標中一般只有業績好的公司才能看到其不斷上升的成長性,凈利潤增長率=本期凈利潤/上期凈利潤-1,在這里上市公司的發展與積累取決于凈利潤。股市擴張指標中股本規模小的公司反而擴張能力更強,流通資本就屬于逆指標,每股凈資產反映了股東的權益額。
3.3 應用研究
我國股票市場近年來正在茁壯發展期,規范化、完善化必然是未來股市的大方向。投資者若想在股市中取得一定的收益,就必須認真分析此公司的歷史發展以及現階段的前景介紹。聚類分析能夠合理指導與分析證券法,以最優的方法配合投資者能夠大體把控股票的特征,確定投資的范圍,預測股票的未來走向。
為進一步分析和論證,本文以上市股票為例,以SPSS軟件隨機選取了三十只股票進行研究,最后將其分為三類,經研究第一類股票收益低,幾乎沒有任何變化,每股凈資產低,股本擴張相對低,發展不好,由負的主營同比增長與低的凈利潤同比增長發現此類公司已經沒有成長空間,買進賣出很有可能虧本,投資價值不會過高。第二類股票成長性高,收益也可觀,但經營現金流較低,資金周轉慢,此類股票可以短期持有,以買進賣出賺取差價。最后一類股票前景廣闊,有較強的擴張背景,可以長期持有。在聚類分析中的分組,組內樣品差異小,組外差異大,為了驗證聚類的分組效果可以方差分析再度進行驗證。
4.結束語
聚類分析以及方差分析是數據分析以及分類檢驗中的重要方法,本文對聚類分析進行詳細分析后探討了其基本理論,以實驗驗證了有效算法。方差分析是數據試驗中的重要手段與工具,是分析數理統計的最基本方法。方差分析主要研究自變量對因變量的相對關系,研究在指標下,因素的顯著和不顯著影響,最后得出有利的研究條件。方差的分析特性決定了社會領域中分類型與自變量的關系,能夠方便使用。方差分析作為常見的統計方法,在質量控制在管理評估以及市場研究中應用廣泛。通過對方差的應用,對總體均值比較與判斷后,尋找到了實際工作中的價值。
參考文獻
[1]劉長義,孫剛.基于聚類分析與模糊可拓AHP的中小企業信用評價——一個供應鏈金融的視角[J].現代管理科學,2011,(5):83-85.
[2]靳劉蕊.基于變化趨勢相異性的金融時間序列函數聚類分析[J].經濟經緯,2010,(2):66-69.
[3]許倩.聚類分析在金融投資分析中的應用[J].財經界,2012,(8):10-10.