徐宏忠 符正平 聶廣禮
摘要:由于金融危機發生的周期性和規律性,對金融危機風險的預警和分析越來越重要并具有一定可行性。文章從經濟分析和數量方法兩個角度綜述了當前金融市場風險分析與預警的方法,提出了基于數據挖掘的金融市場風險刻畫的方法和步驟,對我國金融市場的風險預警具有很好的借鑒意義和實用性。
關鍵詞:金融危機:數據挖掘;金融市場風險
一、引言
始于次貸危機的美國金融危機給美國以及全球的金融系統帶來了沉重的打擊,在短短一周的時間里世界上最大的四家美國投資銀行全部走入歷史,全球最大的私營保險集團AIG一夜之間成為美國最大的“國有企業”。在十月份美國道瓊斯指數連跌八天,截止2008年10月12日全球股市蒸發6萬億美元,也使很多主權國家背負了沉重的債務。
金融危機的歷史多次重演。金融系統的危機已經出現多次,如1929年美國大蕭條、1990年日本銀行危機、北歐銀行危機等,諸次危機都造成了很大的破壞。雖然危機發生所在的各個國家的狀況各不相同,各次影響也有小有大。但是這幾次危機有著近乎相同的起因,那就是廉價的資金成本加上金融法規的開放,導致投資風氣大盛。刺激股市和房地產價格飆漲(吳玥,2008)。這次美國金融危機的直接原因是金融衍生品過度開發,但是從根本上說也是美國前期過低的利率水平和過松的監管造成的。
金融危機是風險中孕育著機遇。從長遠看,危機能夠暴露經濟發展中長期存在但被經濟發展所掩蓋了的問題,問題集中爆發,能夠引起所有的人注意并進行經濟制度項目式改進,是經濟發展的正常環節。金融危機的教訓能夠幫助制定正確的經濟政策,但是前提是要對金融危機的規律進行正確的總結。
由于歷次金融危機多以共同或者相似的情形肇始、演變、結束,總結歷次金融危機的歷史原因和解救方法。及時發現金融系統中存在的問題。提出解決方案,上升為規則化的知識,在問題還沒有給虛擬經濟和實體經濟造成深遠破壞影響之前,對其及時予以糾正,對確保經濟的健康發展是十分必要的。
數據挖掘技術(Data Mining)是進行金融市場風險知識提取非常好的選擇。數據挖掘是從大量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單的說,就是從大量數據中提取或“挖掘”知識。數據挖掘分為關聯規則、分類、聚類、預測、序列模式、類似時間序列等類別。由于信息技術的進步。數據挖掘和知識發現技術已經取得了長足發展。在處理速度。準確度以及應用領域上都有了很大的突破。
借助金融危機研究金融市場風險的目的是總結知識,吸取教訓。對現行經濟政策中的問題及時予以改正。基于數據挖掘的知識發現能夠通過規則、模型、高頻繁項集等各種方式來呈現總結得到的經驗型知識,可以用于輔助金融市場政策的制定,并具有一定的預警作用。
二、金融市場危機風險研究現狀
目前國內外對于金融危機風險的研究主要集中在兩個方面,一個是從經濟學的角度探討金融危機發生的原因及其對策,另一個是用數量的手段對金融風險進行量化的研究,下面首先從經濟學的角度對其研究現狀進行分析總結。
金融危機本質上也是一種經濟周期,經濟周期理論是本研究的理論基礎。經濟周期(Business Cycle)是指市場經濟生產和再生產過程中周期性出現的經濟擴張或者經濟緊縮交替更迭循環往復的一種現象(宋承先,1997)。在經濟學的研究中已經出現非常多的經濟周期研究理論,大體可以劃分為凱恩斯之前的經濟周期理論和現代經濟周期理論,現代經濟周期理論包括凱恩斯主義、貨幣主義和理性預期學派三個經濟周期理論學派(梁小民。2000)。
隨著信息技術的發展,一些數量或者實證的方法也成為研究的熱點,目前已經有一些進行實證或者數量的金融風險研究。Kaminsky等人的“信號法”(簡稱KLR法)認為。一個指標偏離均值的程度超過閥值時,被稱之為發出了一個信號,噪音一信號比率是實際發出的壞信號的份額(噪音)除以實際發出的好的信號份額。通過噪音一信號比來篩選出對金融危機有預警力的指標,噪音一信號比的倒數確定指標的權重,從而加權平均計算金融危機的發生概率。Frankel等人的概率單位模型(簡稱FR法)。先確定盡可能大量的對金融危機有重要影響的經濟變量作為監測指標,通過解對數方程來得出各變量的權重向量,再加權平均計算金融危機的發生概率。
Sachs,Tomell&Vclasco;等人的橫截面回歸模型(簡稱STV法),利用20個新興市場國家的橫截面數據進行估計。把危機指數(IND)定義為儲備減少百分比和外匯減少百分比的加權和。利用橫截面數據來估計模型的參數,然后檢驗,得到了模型。
這些預警方法在國內外應用廣泛但均有其共同的不足是:主觀性、缺乏非線性處理機制、缺乏整體全局觀念、靜態性。為了避免上述方法的局限性。有些學者在探索使用非線性分析工具——人工神經網絡模型對金融危機進行預警。
數據挖掘在金融預測中也有一些應用。數據挖掘由于具有不需要依靠假設條件、能夠處理大規模數據等優點已經在金融分析中有很多應用。數據挖掘在金融分析的應用主要包括對被預測對象有強力影響的因素的分析以及對某些變量進行預測(Sherry Y.Chen,2005)。
中國科學院管理、決策與信息系統重點實驗室的汪壽陽等以集成思想為核心。以智能技術為集成工具。將文本挖掘技術、計量經濟模型、人工智能技術綜合集成起來,提出了一個處理復雜系統預測的新的方法論——TEI@I方法論。并將該方法論用在外匯匯率(汪壽陽、余樂安、黎建強,2007)和原油油價(Yu LA,Wang SY,Lai KK,2008)的預測上,取得了非常好的效果。
在國外的研究中,由于金融數據多是大樣本、高維度的數據,而數據挖掘擅長處理多變量的大數據。因此有較多應用研究,數據挖掘在金融領域應用主要集中在信用卡審核、股票市場分析,投資決策等(Sherry Y.Chert,2005)。
綜上我們可以看出,經濟學角度的研究多從經濟微觀機理上探討經濟周期、金融危機的發生和發展,試圖從消費、投資以及貨幣等角度解釋經濟周期:數量的方法雖然有一些成果。但是多是用于證明某幾個變量有相關性。驗證研究者的理論假設,不能給出金融市場風險的規則和模式。目前已經有一些人工智能的方法用在金融危機的研究中,但是現在將數據挖掘的時序關聯規則和時序分類方法用在金融危機市場分析的仍然較少。
三、基于數據挖掘的金融市場風險
1、經濟周期的理論研究。金融危機根本上也是一種經濟周期。根據前面綜述可以看出。關于經濟周期已經有比較多研究成果,凱恩斯主義、貨幣主義和理性預期主義等經濟周期理論從不同的角度分析經濟周期,對某些現象做出了不同的解釋。他們的共同之處就是承認經濟周期是
經濟本身的一個內在機制。但是各有各自的側重點。
基于現有的研究理論,兼容并包地吸取各個學派的理論,從實體經濟和虛擬經濟兩個角度分析導致金融市場風險的影響因素,分析預警模型需要考慮到的因素。
(1)從實體經濟角度研究危機影響因素。根據成思危的理論,實體經濟是指資本要經過形態的變換才能產生利潤。即先將資本通過交換變成勞動力、設備、原材料、廠房等生產要素。然后通過生產過程變成產品,產品經流通變成商品。商品再通過交換變回貨幣形態。才有可能產生利潤,這就是實體經濟的運行模式(成思危2008)。生產、消費以及創新等都是實體經濟的范疇。實體經濟是虛擬經濟的根本,系統地研究實體經濟引起的金融周期變化,探討實體經濟的變動對金融市場風險的影響因素,從理論上探討風險刻畫時模型應該使用的影響因素。
(2)從虛擬經濟角度研究危機影響因素。虛擬經濟(Fictitious Economy)簡單的說就是直接用錢生錢(成思危2008),投機、投資以及貨幣因素等都是虛擬經濟的范疇。貨幣主義所強調的貨幣量對周期的關系就屬于虛擬經濟范疇的經濟周期理論,貨幣危機理論強調在發達資本主義國家流通的主要工具是銀行信用,在經濟發展高漲期。銀行會放松銀根,大量放貸,形成積累的信用擴張和經濟高漲。但是當信用擴張到一定程度。銀行會被迫停止信用擴張。從而導致危機和累積的衰退。該理論在一定程度上闡述了當前美國危機的原因,但忽略了實體經濟的影響。系統化分析虛擬經濟范疇的經濟周期理論,進行虛擬經濟周期理論的影響因素分析,得出能夠預警金融危機風險的虛擬經濟范疇影響因素。
經濟周期的理論研究是本預警系統的理論基礎,金融危機本質上也是經濟周期的一部分。預警系統首先從虛擬經濟和實體經濟兩個維度去分析現有因素對經濟周期的影響,并徹底理順各個影響因素之間的關系,形成影響因素列表。
2、數據收集和處理。金融市場預警需要從兩個角度出發建立預警模型。一個是橫向的,通過使用多次危機的數據建立模型;另外一個是縱向的,即同一個國家或者區域的時序數據模型。
橫向的角度。根據設計的屬性。可以收集使用多個危機發生前后的經濟周期和金融危機的相關數據。包括但不限于近三十年來的6次危機:1982年~1983年的拉美債務危機、1990年代開始的日本經濟衰退、1992年~1993年歐洲貨幣體系危機、1994年~1995年墨西哥金融危機,1997年東南亞金融危機,2008年始于美國次貸的金融危機等幾次涉及范圍較廣、影響較大的危機。本模型將以危機影響區域作為研究對象,以年為時間窗口間隔。收集近三十年來在屬性設計部分中所涉及的數據,并收集每一個時間窗口該國家的經濟健康狀況數據。
另一個角度即縱向角度,模型可以選取典型的危機發生區域,采用更加細化的時間窗口,收集處理數據。
3、據挖掘模型研究金融市場風險知識發現。根據前面選取的屬性,主要進行時序分類和時序關聯規則算法的研究,在已有算法的基礎上,進行改進和創新,研究適合進行金融市場風險刻畫的數據挖掘算法。
在前面數據挖掘模型選擇和上述數據處理的基礎上,進行模型建設和知識呈現。首先要進行數據的降維,上述影響因素理論分析時把各時期對金融市場風險相關的因素均盡可能地考慮在內,在模型使用時如果需要收集如此多輸入變量。其成本將非常高。通過降維等技術將上述數據收集處理部分得到的數據進行預處理并建模。根據各個算法各自的優缺點分別建立金融市場健康預測模型和金融市場健康預測規則。
風險預警模型是基于時間窗的時序動態分析,時間窗的設計如下圖所示。研究將用觀察期的數據(T1-T2)作為自變量。用表現期(T2-T3)該樣本的金融風險狀況作為因變量,這樣建立的模型將是動態的時序模型,模型將具有較強的預測能力。
將上述規則進行知識的呈現,通過設計知識管理系統,動態收集所涉及的變量,判斷各個國家的金融風險狀況。
四、結論
本文分析設計一個建立以預警作為基本功能的金融市場風險知識系統的過程。將金融市場風險預警模型以及所得到的規則知識系統化。隨著宏觀統計數據以及各種微觀數據的變化,將通過金融市場風險系統動態化的更新對經濟狀況的判斷,同時借鑒知識管理系統(Knowledge Management System)的建設經驗。從多個維度展示預測結果和規則知識。這個系統將動態收集模型預測所需要的屬性,進行金融市場風險的動態監控。一方面設置閥值,當單個屬性達到風險上限時進行預警:另一方面將提供健康狀況規則知識,動態進行經濟健康診斷。