□張 苗
(一)數據挖掘的定義。數據挖掘,是指從隱性的、過去未知的、潛在有用的數據中提取信息的過程。數據挖掘(DM)這個概念是最近幾年來,由于人工智能的興起和數據庫的發展而出現的一門新的技術應用,它綜合運用了形式識別、數據統計學、人工神經網絡等一些先進技術。
(二)數據挖掘的主要方法。數據挖掘是一門非常綜合的跨學科技術,不僅在計算機領域有著廣泛的應用,在數學和信息管理等領域也有著廣泛的應用前景。主要方法有:決策樹分類方法、神經網絡法、關聯規則挖掘方法、貝葉斯分類方法、聚類分析方法。
(三)數據挖掘工具與軟件。如何尋找出適合和高效的數據挖掘工具和軟件,對數據挖掘項目是否能成功以及完成質量有至關重要的影響,根據使用工具的用途和方法不同,數據挖掘工具可分為普通數據挖掘工具和專用數據挖掘工具兩大類。三種主要的數據挖掘工具和軟件:Intelligent Miner、SPSS Clementine、WEKA。
(一)財務風險的概念。財務風險,是指企業對未來損失和盈利的不確定性。可能是由于企業經營管理不善,或企業資金運轉等存在一定問題所導致的。其主要的特征:一是客觀存在性。財務風險是固有存在,不會因人意志的變化而發生變化,無法避免也不能夠消滅它,唯一的辦法就是運用技術來發現風險,從而規避風險。二是全面存在性。財務風險伴隨著公司財務管理的整個進程。三是不穩定性。財務風險可能在一方面通過一系列機制會發生,但同時換到另一種環境下不一定會發生。四是共存性。風險與收益是相互聯系相互作用的,財務風險與收益是同步變化的,風險系數越低會導致收益相應的減少,相反的,風險系數越高收益也就會越高。
(二)財務風險的作用。考慮到經濟和貿易在全球化自由的發展,市場交易的運作更加自由,企業在擴大經營的同時,作為企業的管理層,對財務風險的意識更加強烈,往往企業會通過分析提前對財務和公司提出應對策略,想方設法地進行風險控制,然后再把這樣的方法廣泛地應用到其他的領域。企業對待財務風險的分析方法和應用有以下實際的作用:在國家的經濟決策方面。在經濟體制屬于市場的情況下,我們國家的企業,能夠保證經濟活動處在正常范圍以內,但是,國家從整體上對經濟的宏觀調控,卻會很大程度上影響企業的發展,對企業的經營管理也會產生相應的影響,在這樣的影響下,就可以看到國家的決策影響有多大。因為國家的任何一條關于經濟的政策,都或大或小的影響,或者決定企業的生命和活動以及經濟效益。通常國家在出臺相關的政策之前,如果不會考慮到相關企業的經營范圍和承受能力以及資金流現況的時候,只是從單方面的作出經濟調控,這是會影響到國家內諸多企業的。
(三)運用數據挖掘技術分析企業財務風險。
1.風險發生的相關要素,尋找風險發生的隱性征兆。
2.確定風險存在。
3.確定企業財務風險分析的對象。對企業的財務風險分析對象做出歸類,找出企業財務風險的對象是財務風險分析中比較重要的一個方面,由于數據挖掘結果的不可確定性,而人們對問題的分析應該是有目的的有規劃的,沒有目的地對數據進行處理是不可取的。
4.準備財務風險分析數據。數據準備是數據挖掘的首要步驟,數據可以來自于現有的會計信息系統,也可以是其他業務準備企業的實際財務數據,進行目前的風險分析。
5.數據預處理。在對可靠的數據確定之后,可以對數據進行實際的判斷。從專業的角度上選擇與財務和風險有關的一些變量,或者轉變變量。最后,確定風險發生的概率、頻率以及要計量的損失數額。
6.數據挖掘。針對所取得的數據進行分析,并挖掘出潛在的信息。從而,評估風險的性質和程度。并且對風險進行評價,比較風險與風險評價標準,對風險進行排序。
7.結果評價與解釋。選擇企業用戶的財務決策目的,并結合其挖掘的數據,對其結果進行相關的評價。
8.對風險進行監控和審計。
(一)企業的財務風險和分析指標。財務風險指標是分析過程中最為重要的部分,對指標的選擇是在數據挖掘方法過程中對諸多財務指標進行比較。財務指標的具體內容有以下幾方面。
1.企業盈利能力指數。企業盈利能力指數包括:毛利率指數、營業利潤率指數、凈利潤指數、每股收益指數、凈資產收益率指數、總資產收益率指數。
2.經營能力指標。經營能力指標包括:流動資產周轉率、存貨周轉率、固定資產周轉率、總資產周轉率、應收賬款周轉率。
3.企業增長能力指數。企業增長能力指數包括:凈資產增長率、總資產增長率、主營業務收入增長率、凈利潤增長率、每股收益增長率。
4.企業償債能力指數。企業償債能力指數包括:流動性比率指數、速動比率指數、現金比率指數、付息倍數指數、股東權益比率、現金凈流量與負債的比率、現金凈流量與凈利潤的比率、現金凈流量與銷售收入的比率。
5.現金流動指數。現金流動指數包括:現金流償債比率指數,現金流利潤率,現金流資產收益率,現金比率。
(二)財務指標相關性分析。對財務分析理論的研究成果,使用傳統的方法,對分析的變量和相關系數進行檢測,結合分析理論對相關的財務指標進行合理的分析,但是前提是必須拋出一些高度相關的財務指標。相關系數可以表示為:
在公式中,x和y表示兩個變量。rx,y為其的相關系數,-1≤|rx,y|≤1。當|rx,y|=1時,說明x和y是完全線性的。當rx,y=1,表示x與y完全正相關,當rx,y=-1,表示x與完全負企業在利用關聯規則交互挖掘算法,對所在的企業進行財務風險分析過程中,進行財務風險指標的挖掘。
(三)根據時間間隔確定風險等級。在數據分析方法里,關聯規則數據挖掘可以根據挖掘類型分為三種:布爾關聯規則、類別關聯規則和數量關聯規則。五個風險等級的劃分是依據風險水平。當然,不同的設計師對財務風險的看法是不同的。所以,對于風險的定義中,風險劃分區間也有很大的隨機性和不穩定性,因此在實際的分析中要做一些適當的改變。可以利用關聯規則交互挖掘算法對企業財務風險指標進行挖掘,財務風險分析是在風險識別的基礎上,對財務風險的特征進行明確的定義和描述。金融風險評估應從定量和非定量兩個方面進行界定。根據指標的性質,金融危機預警可分為五個層次:危機預警、高風險預警、低風險預警、正常預警和卓越預警。
(四)關聯規則交互挖掘和建立企業財務風險分析模型。風險概念層次樹的構建:第一級表示的是風險的相關方面。第二級涉及到的是一些聯系企業財務風險重要指標,包括利潤率、投資回報率、流動性周轉率等。第三層次是最低層次,是指企業金融中最為代表的指標層次。相關的內容有:毛利率、凈利潤、每股收益、應收賬款周轉率等。在財務風險的挖掘中,低層概念的挖掘便是重點。并將其擴展到相應的高層概念挖掘,在高層概念中找到財務指標的相互規律。支持閾值遞減的交互挖掘策略:策略實際是指每個層次上的最小支持閾值。通常情況下,財務指標水平越低,對應的最小支持閾值越小。假設流量和現金比率為頻繁項集。在高低層次間的關聯規則,根據低層的最小支持度確定最小支持度。
當前社會,行業內對財務風險的分析方法有很多種。許多的研究工作人員,為了研究目標和目的,不斷地為企業尋找控制企業財務分析的方法。從許多不同的角度來看,主要的解決和控制方法有以下幾種:財務報表分析、財務指標分析、德爾菲法。
隨著社會的發展,企業對于公司的風險要求和管理,也越來越嚴格,需要找到一種有效、全面、客觀評價企業風險的方法。本文中,關聯規則的交互挖掘方法是適合于現代的企業的,可以處理每天的有效數據,不需要復雜的數學推理。只需對不同的數據整理分析,就可挖掘出數據庫里的隱性信息。沒有必要建立任何假設。只要對閾值進行調整,數據中的規則就可以自己找到。通過這些方法,可以有效的減小人為的普通因素的影響,從客觀角度上對企業的財務風險進行了合適的評估。此外,也一定程度上提高了對數據挖掘運行的效率。