田勁松
(西華師范大學 商學院,四川 南充637002)
灰色GM(1,1)模型是鄧聚龍教授針對經濟現象預測過程中的“貧信息”而創造的,目前國內學術界對此的研究及實證運用非常廣泛,基本上都以其所需原始數據較少而信息挖掘功能較強為分析基礎。但任何經濟現象的預測都不否認數據更新的有效性,即數據越多越新,建立的模型也相對有效,GM(1,1)模型群的概念也由此提出,根據劉思峰教授出版的《預測方法與技術》一書中,明確提出了四種GM(1,1)方程構成的模型群,即:全信息模型、部分信息模型、去老數據模型和新陳代謝模型,其實質意義是通過對原始數據的增加、刪減及相關變動達到信息挖掘范圍、有效性的調整。筆者認為,任何數學模型都可以借鑒此原理,運用同一個模型而對數據段進行拉長、縮短、類似于“天窗”滾動式數據更新,可以形成任一方法的模型群,從而在不改變數學方法思路的基礎上,增強預測有效性,所以本文所針對的模型群有效性是指灰色GM(1,1)模型基本原理不發生變化下,由于數據序列調整導致的預測有效性。同時,針對具體的經濟現象,金融產業更利于該方法的實證,因為金融產業與其他產業有較大區別,近年來我國金融產業蓬勃發展,虛擬經濟占比越來越高,具有易收外界因素影響及波動性較強的特點,如果在一個發展較為穩定的傳統產業,序列趨勢規律較為明顯,那么通過數據段的調整帶來的預測有效性差異會不明顯,而金融產業則符合數據變動較大這一特征,1997年和2008年的全球金融危機是做數據增減處理的最好節點。同時,本文為了擴大分析范圍,將不局限于上述所說的四種簡單數據處理,加入了曲線數據擬合,均值化數據、緩沖算子等方法,形成衍生原始數據,與上述四種方法一起進行模型群驗證,結合現有的GM(1,1)適用性準則,對群有效性進行考察驗證。


(3)丟棄老信息模型,與(2)講述的部分信息模型較為類似,但局限于j=n,一般可經過多次建模,比較誤差以確定從哪點開始舍棄老數據。因為老數據包含的可用信息較少,過多老信息會導致模型臃腫,這種選取類似于多變量回歸中的逐步處理,以丟棄無效變量。
(4)吐故納新,對(3)中的老信息進行丟失的同時,引入最新的現實數據,簡稱為新陳代謝模型。記為:

假設1至k-1期的數據全部被吐出,而后面新增k+1段信息。
(5)曲線擬合數據模型,往往在實踐中,原始數據并不能真實反映經濟變化規律,那么可以采取一種數據變換方式,將時間作為自變量,而經濟指標作為因變量,那么兩者之間從圖形上看是呈嚴格線性關系?二次項關系?還是其他?不管圖形如何,總會在一個時間段內發現數據有趨勢規律,可以通過擬合出的曲線進行數據更正。

在得到相應數據列后,運用灰色的五步建模方法:一次累加序列序列生成、緊鄰均值生成、構造OLS回歸矩陣、參數運算及預測。為了簡便敘述,具體的灰色GM(1,1)模型請參看相關書籍。
金融產業的波動性來源于其不僅受到實體經濟如經濟增速等原因的影響,一貫被視為經濟景氣的晴雨表,但實際上由于我國金融體制發展目前并不成熟,尤其是樓市的瘋狂進一步放大了我國金融資產波動性,那么什么樣的指標能夠較為現實的與金融市場掛鉤呢,那就是股市成交量。可能有人認為股價更合適,但股價必須在有效市場假說理論成立的前提下,即價格完全反應市場信息的基礎上才能完全和金融市場等同,李丹(2008)通過分位數回歸模型,對我國上市綜指1994~2007年之間的高頻數據進行分析,發現上證綜指和成交量兩者之間存在很強的正相關關系,并且隨著前者波動會導致后者波動程度的放大,且具有不對稱特征。圖1為1992~2009年的年股票成交量數據序列,從最初的681億元增加到了數據末端的535987億元,可以看出我國股票市場帶來的資產繁殖作用是非常強的,同時可知在2005年以前股票成交量是相對穩定的,均值為25476億元,波動標準差為16917億元,如果去除1996年之前的數據,那么穩定性會更強。從2006年開始,股票成交量一躍而起達到了90469億元,較2005年翻了三倍,這與當年外資大量涌入和國家金融政策的調整有關。如果說2006年之前的屬于平穩股市,那么后面屬于牛市和熊市的劇烈震蕩狀。

圖1 股票成交金額
根據第2部分的數據處理方式,可以得到以下6個序列,如表1。值得說明的是,由于新陳代謝需要2010年數據,但目前國家統計局網站仍未公布,故省略,但基本可知最新的信息可以帶來預測效果的提高。
第二二三四六七列的數據可以由公式得出,而第五列中曲線擬合需要進行相應的說明,從1992~2005年的數據可以看作是線性序列,而2006~2009也可以看作另一線性段,這里通過EXCEL軟件進行分段回歸,具體擬合公式和優度見圖2、圖3。

圖2 1992~2005年段回歸結果

圖3 2006~2009年段回歸結果
得到上述數據后,分別進行GM(1,1)回歸,得到響應的發展系數及時間響應式,處理軟件為DPS試用版,測試數據加入了隨機誤差。根據GM(1,1)模型適用性準則,a一般絕對值小于2為適用,且絕對值越小越好;均方差比為進行灰色預測后,預測得到的殘差序列標準差與原始序列標準差之間的比值,強調了預測能力的高低。小誤差概率為時點預測誤差減去平均誤差得到值的絕對數是否小于06745與該誤差的乘積,全部時點上的小誤差概率越大,表明模型包含誤差的能力越強。表1為DPS利用上述各類數據得到的相關參數。
從表2可知,從發展系數a看,部分信息模型的發展系數最小,更具有對我國股市成交量預測的有效性,緩沖算子次之,以此排序,得到部分信息模型>緩沖算子>移動平均>全信息>曲線擬合>丟棄老信息;從均方差比看,緩沖算子>部分信息>移動平均>曲線擬合>全信息>丟棄老信息,而從小誤差概率看,緩沖算子>曲線擬合>全信息>移動平均>部分信息>丟棄老信息。可知緩沖算子及部分信息信息模型從整體上感覺預測效果較好。為了更加直觀的對眾模型進行評價,這里引入模糊數學中的排序方法。如表3。Broda排序法對不同評價對象使用多種評判手段,在單個評判法下,得分較高的表明較有方案,這與西方經濟學中的基數效用論理論類似,如果假定每種評價方案的權重一樣,那么可以將表3中的數據進行橫向加總,得到每個模型的綜合得分,由綜合得分推導出緩沖算子模型得分最高,部分信息次之,由此引出的排名是:緩沖算子>部分信息>移動平均>曲線擬合>全信息>丟棄老信息。這一簡單的結論包含了很強的理論意義:一是丟棄老信息模型在各種評判指標上均處于最后,這與一些認為丟棄老信息可以提高新數據權重以達到效度提升的理論完全背離,筆者解釋為:任何一個經濟現象,即使再老的信息也具有一定的價值,針對到金融市場實際,一只股票的價值包含了所有的信息在現條件下是不可能的,而整個股票市場亦然。二是緩沖算子模型與移動平均模型的次級有效性也足以說明不同期限數據之間整合的重要性,通過相鄰數據的整合達到數據的平滑更能體現規律。通過緩沖算子模型得到的2010~2014年的 513725、582163、659718、747605、847201億元。

表2 模型群GM(1,1)檢驗參數

表3 BRODA排序結果
文章以金融產業中的股票成交量數據為例,構建了以六種模型組成的模型群。這與傳統的模型組合概念不同,主要是從數據本身做文章。我國股票成交量在2006年出現了明顯的轉折點,運用單獨一種模型對未來我國股市進行預測肯定是不合理的,通過發展系數、均方差比值和小誤差概率三個指標的評判和綜合排序,發現緩沖算子在金融產業中的有效性強,并且分析金融市場不易丟棄任何可得的數據,通過該模型得到的未來五年的預測結果顯示股票成交量將以每年12%的速率上漲,這是吻合實際情況的,我國股市在金融體制之間完善后,“暴漲暴跌”不再成為其特征,平穩發展是大趨勢,并且隨著房地產調控的加深,樓市對金融市場波動的放大作用遞減。值得說明的是,GM(1,1)模型群的運用在宏觀經濟管理和工業工程中非常多,如孫慶文(2011)對銷售量、程萬里(2007)黃河水質指標的預測,而對金融產業的實踐較少,這是因為金融業一般數據均為高頻數據,研究者們認為較多的數量信息已經能夠滿足需要,而不存在“貧信息”性,但正如上文所說,目前說股票成交量信息屬于有效市場范圍尚不合理。
[1]劉思峰等,預測技術與方法[M].北京:高等教育出版社,2005.
[2]李丹,董玲.中國股市波動與成交量動態關系研究——基于分位數回歸的角度[J].山西財經大學學報,2008,(7).
[3]孫慶文,朱顯英.銷售量預測的REM-GM(1,1)模型及群預測方法研究[J].數學的實踐與認識,2011,(2).
[4]程萬里等,GM(1,1)模型群在黃河水質預測中的應用研究[J].工業安全與環保,2007,(11).