李成鋒 黃康梅 賈 男
(1.中海油能源發展股份有限公司湛江采油服務文昌分公司,廣東 湛江 524000;2.廣東醫科大學附屬醫院;廣東 湛江 524000;3.中海油能源發展股份有限公司采油服務分公司,天津 300452)
企業發展處于復雜的市場環境體系之下,導致企業發展面臨很多不確定因素,這些不確定性會引發企業財務風險,如果缺乏科學的財務風險預警系統,不僅很難有效規避財務風險,還會對企業的生產經營造成損失。而數據挖掘技術可以在廣泛收集影響財務相關因素指標的基礎上,通過數學方法對財務指標進行自動分析,這樣既避免了傳統財務風險數據計算、收集的弊端,又簡化財務指標計算程序,提高數據處理效率,對形成科學的財務風險預警系統具有重要的意義。
數據挖掘技術是一項綜合的技術,是多項技術輔助而誕生的,思想理論的誕生源于統計學,數據挖掘技術指的是使用人工智能技術、數據庫技術以及統計學原理等來完成的數據收集、收據分析的過程。數據挖掘技術的主要目的是發現和目標群體切合的數據,找到這些數據之間存在的規律,然后將其運用到日常工作、生產等環節,以此減少風險的發生。從數據挖掘技術的工作原理來看,可以將數據挖掘技術看作是一項數據處理技術,這種技術離不開計算機技術的輔助和應用。
數據挖掘技術研究起步較晚,最早產生于1989年,是一項現代化的新型技術,之后在研究的過程中經常將數據挖掘技術和知識發現緊密的聯系在一起,在經過相關學者的研究之后,發現數據挖掘技術就是一個發現新規則、新知識的過程,因此又將其命名為知識發現。數據挖掘是指在紛雜數據中提取有效數據,發現數據之間本質聯系的過程,這個過程的出現是有前奏鋪墊的,它首先是要收集有效的數據;然后針對有效數據的類型特點,對數據庫中的數據進行篩選、清理,去除不相關的數據,將收集好的有效數據轉變成為所要挖掘的數據類型;接著再找到適合轉化后數據類型的挖掘技術;最后通過相應的分析方式找到數據之間存在的關系。隨著數據挖掘技術的實踐水平不斷提高,關聯規則數據挖掘技術方法、時間序列數據挖掘技術方法、聚類算法數據挖掘技術方法等常用的數據挖掘技術方法被廣泛的應用到具體的工作中,為提高工作效率和工作質量提供了有利條件。
處于復雜競爭環境的企業面臨的影響可能有積極影響,也可能有消極影響,積極的影響促進企業的發展,但是消極的影響會使企業經營面臨各種風險,如果不對其進行風險管控,有效的規避市場中存在的風險狀況,就會嚴重影響企業的發展。企業財務狀況作為企業發展經營的風向標,能夠反映企業經營發展的綜合情況,對企業經營決策和發展戰略制定都有重要的引導作用,因此加強企業財務風險管控具有重要的實踐意義。
企業在財務風險的管控中通常采用財務指標、財務報表、專家意見等傳統方法來完成企業財務風險分析,其中財務報表分析方法是最常用的一種風險分析方法,由于會計的日常工作中會涉及大量的財務報表信息,這些信息的收集和處理是會計的日常工作,貫穿于企業的整個發展過程,內容詳細,提供的數據準確,這種分析方法能夠通過報表數據提供有價值的信息,進而實現對企業財務風險的管控。指標分析法指的是運用企業中的綜合數據形成的一種數據分析方法,主要有企業財務數據、企業業務數據、企業統計數據等,是企業財務分析方法的進一步升級,能夠更全面的了解、分析財務中的各項數據,比如營運能力中的流動資金周轉天數、流動資產周轉率、存款周轉率等,還有償債能力、盈利能力、凈資產收益等指標的分析,數據繁多,但是分析具有全面性、綜合性。但是這些傳統的分析方法,一方面,數據量較大,工作分析任務大;另一方面,對財務風險的預測并不基于客觀事實,受管理者認知模式的影響較大,而融入數據挖掘技術進行的財務風險分析方法,改變了傳統數據分析方法的弊端,不僅減少了工作壓力和人工參與,而且大大提高了數據的準確性,為更好地制定企業發展政策,預防財務風險的發生提供有利條件。
數據挖掘技術的使用前提是進行數據類型的確定以及有效數據搜集,因此首要問題是建立數據收集的目標體系,即財務風險預警指標體系。財務指標的選擇應以企業發展中常用的財務評價指標為主,以此構建能夠客觀反映常用財務指標的財務比率,財務預警指標體系中也是主要根據財務指標的財務比率實現的數據預測,通過企業平時的業務經營狀況體現的財務指標的財務比率來進行分析,這種分析能夠找到企業各個數據在發展過程中存在的本質聯系,然后能夠通過這種規律性的聯系,找到相應的規律,為企業制定可行的風險預警策略。但是這種建立在原有數據上的沒有考慮到市場動態的運行情況以及企業受市場影響的發展情況,因此這種數據分析方法具有局限性,僅僅適用于受市場發展變化較小的企業的數據分析。為了為企業提供更為客觀的參考數據,應科學地選擇財務指標,并將市場的動態發展因素考慮在內,為企業制定出客觀、有效的運行政策提供有價值的數據參考。
財務風險預警指標體系應和企業的生產經營活動緊密相連,因此指標體系的構成應包括企業的償債能力預警、運營能力預警、營運能力預警、獲利能力預警、資金結構預警、現金流量預警等,其中償還債務能力預警系統對企業財務風險影響最大,首先,企業要具備償還債務的能力,才能保障企業安全運行,持續為經營目標運轉。因此,預警體系中企業償還債務數據的分析應是考慮的首要因素,主要包括資金流動比例、存貨流動負債比率、債務資本比率等。其次,是企業運行能力的預警。企業的運營能力是企業發展的動力,查看企業資金運營動向、周轉速度等,這些能力對企業獲利具有重要的影響,主要包括固定資產周轉率、資產周轉率等,總之這些預警體系的構建為挖掘技術的使用提供了數據分析方向,提供了數據收集類型,為使用數據挖掘技術提供有利條件。
關聯數據挖掘技術主要是探索事物之間的有效關聯性,通過關聯性找到事物中存在的本質性的聯系,但是這種數據搜集有限定的范圍,即對進行同一項目前提下進行的數據關系的探索,主要包括兩個方面的數據挖掘內容,一方面,是有效數據的搜集,即頻繁項集的產生,通過設置最小閥值來搜集有效的數據;另一方面,是通過上一步提供的數據支持來尋找數據之間存在的本質性聯系,即關聯規則。關于上述兩方面數據挖掘的內容,有效數據的收集是前提,在具體的收集中一般采用格結構來完成,在進行數據收集的過程中,將收集目標設置為d,并作為數據收集標準來完成收集,收集的過程中會產生2d個頻繁出現的數據,這些數據之間會產生多種規則體系,多種規則體系用R來代替,進而構建出數據之間存在的關系。
數據挖掘技術中發現數據項集是數據處理的前提,所以在設置好目標數據之后,需要在數據結構中進行和目標數據有關聯數據的分析,并確定這些關聯的數據的有效性。為了減少龐大數據量的產生,通常會采用減少支持度、數據采集量來簡化計算過程,但是盡管如此,也會存在一種數據項集本身具有繁雜屬性的數據模型,在這種情況下和其具有關聯的數據也是復雜的,會構成對應的復雜的關聯體系。比如數據收集的標準被設置為包含有c、d、e三種數據項集,那么不管是包含其中的子元素還是其中構成的復合元素都是有效的數據,而如果是非頻繁的數據項集,比如設定e、f為非頻繁的數據項集,那么其中包含e、f的項集將會被裁剪。通過上述方式形成候選模式數據挖掘方法以及增長模式數據挖掘方法,以此對財務中存在的關聯屬性強烈的數據進行分析,排除關聯性較低的財務數據分析,被廣泛的應用到企業財務風險的預測中,尤其是金融領域、商品零售領域等,用來進行渠道分析,進而建立財務風險預警模型。
時間序列的數據挖掘技術指的是利用數據中存在的時間屬性來進行數據關系之間的探索,進行數據采集的標準是以時間作為數據收集的切入點進行大量有效數據的收集,進而為提供可行性的決策辦法提供數據參考。時間序列數據挖掘技術的應用特點是以時間為軸心,對不同時間點上的數據進行收集、分析,然后按照數據發生的時間順序來生成數據列表,進而為行業制定政策提供相應的數據參考。數據時間挖掘技術中對時間標準的定性具有差異性,這種差異性主要是由于不同企業的業務經營性質、經營屬性不同而產生的不同的時間序列行為,比如股票數據的搜集時間動向標準點主要為連續的時間數據截取;天氣預報數據的搜集時間動向標準點為多元時間數據截取;超市進行的數據收集多為某一個具體時間段的銷售數據截取,在進行數據挖掘技術的使用中將變化的時間點設置為t,然后進行不同時間點的數據統計,即t1、t2、t3直到tn的時間段截取,接著在對應的具體時間段下進行相應數據的提取,設置為Yt1、Yt2、Yt3直到Ytn,其中Yt為時間序列,序列具有不同的時間屬性和所研究事物的屬性來選擇具體的研究方法,主要包括多變量時間和單變量時間兩種預測方法,其中多變量時間預測主要通過建立時間模型來進行數據挖掘,單變量時間預測主要包括隨機時間、傳統固定時間兩種預測方法,模型構建主要包括循環變動、季節變動、長期趨勢變動等數據模型。由于時間挖掘技術的運用是動態環境的提取,因此對復雜市場變化情況的數據提取具有重要的參考價值,尤其是對股票市場、企業營銷計劃等方面能夠做出客觀的分析,對規避企業財務風險具有重要的意義。
隨著計算機技術的深入發展,數據挖掘技術可以利用計算機技術以及統計學的應用來完成數據挖掘工作,比如改進型模糊神經網絡的數據挖掘技術,主要的應用原理是通過建立財務指標的方式來完成數據挖掘技術,由于企業經營狀況的不同,所以財務指標的獲取具有差異性,因此財務指標的確定主要依靠統計方法、人工方法來制定財務指標,需要注意的是財務指標的選擇要和企業的具體經營狀況具有高度的匹配性。神經網絡數據挖掘技術具有豐富的推廣能力,而且神經網絡設置非常豐富,具有很高的兼容性,能夠實現對不同環境、不同時間段的數據搜集工作,所以能夠對企業提出針對性的預警措施。
模糊神經網絡的數據挖掘技術使用的數據處理方法為粗糙即屬性約簡的處理方法,主要包括兩個方面,一方面,進行數據篩選工作,通過運用粗糙集理論和統計方法來對輸入的數據進行簡化處理;另一方面,利用模糊神經網絡進行數據處理并完成財務風險預警。其中對于數據的篩選工作至關重要,為了讓計算機工作更為便捷,尤其是當前數據獲取越來越便利的情況下,將有效的數據進行簡約轉換,讓人們熟知,更方便地理解數據顯得尤為重要。粗糙的處理方法主要包括信息系統和決策、屬性的核算、約簡的選取等數據處理過程,通過這些數據梳理選擇n個合理的數據元素,然后構建模糊神經網絡,形成財務風險預警系統。該方法目前在保險類型業務具有重大實踐意義。
數據挖掘技術聚類算法就是通過將類似的數據搜集在一起進行的數據處理方法,由于是分類別的數據收集,因此在所構成的數據組合下,這些數據具有高度的相似性,折射到具體的應用中,可以對所聚集起來的類似的數據進行統一應用。聚類分析的模式識別不僅僅是進行數據的識別,通過對數據進行歸類,還包括對圖像、模式、市場研究等識別,總之數據挖掘技術聚類算法就是對數據進行的具體分類,然后對分好類的數據進行處理的一種數據挖掘應用方法,比如將被研究的財務數據樣本定義為數據E,將A定義為和它具有相同屬性的一個子集,然后A在E數據之下,但是并不在D數據之下,和D數據沒有相同的分類屬性,但是在之后的模糊理論的影響下,數據的范圍逐漸擴大。折射到財務預警系統的構建和應用中,聚類數據挖掘方式能夠識別多種類型的數據,比如圖形、密度空間、大小等多類型的數據,當前企業所面對的數據類型日益復雜,通過聚類數據挖掘方法的應用能減少數據搜集、處理的難度,對客觀的反映企業財務信息,制定客觀的財務處理措施具有重要的意義。
財務風險預警本就是針對未知發生的事件進行預測,在這些未知因素中有些因素是無法確定的,是沒辦法進行實際考量的,而一些因素通過數據分析,發現是既定發生的,但是在進行風險預測過程中也會存在不發生的比例,通過對未知風險和已知風險進行對比,從而為未知樣本找到預警類別,主要采用SVM方法來完成財務數據的計算,SVM方法中主要包括塊算法、固定樣本收集兩種方法,其中塊算法排除了非支持向量,通過對樣本中的非支持項量進行優化,進而實現風險樣本的預測,但是隨著處理的數據較多,這種計算方法難度較大,因此在數據挖掘技術中會采用固定樣本集進行數據的整合優化,大大的提高運算效率,在對財務預警系統的構建中,可以通過對財務數據中的具體財務指標,比如資產營運資產率、利潤總額、速動比例、主營業務收入增長率等財務指標采用雙向加權模糊支持向量的數據挖掘技術進行數據分析,通過因素集、評判集、權重向量來進行綜合評判,進而實現對財務指標的風險預測。
由于數據挖掘技術能夠全面的收集企業在市場經濟環境中的相關數據,對財務指標中的數據以關聯、時間、聚類等數據處理技術進行數據分析,所以能夠綜合的反映企業的經營發展狀況,從財務的角度來有效地規避市場經營風險。此外還因為財務指標數據呈現方式不同,企業經營業務類型不同,所以數據挖掘技術的應用方式不同,比如對于金融行業財務風險預測應以時間序列數據挖掘技術處理方式,復雜的數據應選擇模糊神經網絡數據挖掘技術等。我們在應用數據挖掘技術構建風險預測模型時,應仔細分析數據應用場景,選擇合理的數據挖掘技術為構建科學的財務風險預警系統提供有效支撐。