摘要:在運(yùn)用神經(jīng)網(wǎng)絡(luò)模型對(duì)股票價(jià)格進(jìn)行短期預(yù)測時(shí),一般的神經(jīng)網(wǎng)絡(luò)預(yù)測模型都是以價(jià)格的時(shí)間序列滯后作為輸入變量,但是由于影響價(jià)格的因素錯(cuò)綜復(fù)雜,很多因素?zé)o法準(zhǔn)確測量,而且市場信息的噪音太大,因此預(yù)測效果往往不太理想,于是如何選擇有效的輸入變量就成為一個(gè)困擾這項(xiàng)研究的難題。
關(guān)鍵詞:行為參數(shù);廣義回歸神經(jīng)網(wǎng)絡(luò);股票指數(shù);預(yù)測模型
中圖分類號(hào):F830.91 文獻(xiàn)標(biāo)識(shí)碼:A
General Regression Neural Network Forecasting Model of Stock Index Based on Behavioral Parameters of Investors
FANG Yong,SUN Shao-rong
(College of Management, University of Shanghai for Science and Technology, Shanghai 200093, China)
Abstract:When making short-term forecasting for stock price, general neural network models take lags of price time series as input variables. But the factors affecting price are complex, and many are impossible to be accurately measured and the noise of market information is too heavy, so forecasting effect is not satisfactory. Then how to select effective input variables becomes a disturbing problem in research.
Key words:
一、引言
自2004年初《國務(wù)院關(guān)于推進(jìn)資本市場改革開放和穩(wěn)定發(fā)展的若干意見》(簡稱為“國九條”)發(fā)布以來,中國的資本市場步入了一個(gè)平穩(wěn)、健康發(fā)展的新時(shí)期,市場化程度不斷提高,法制和制度基礎(chǔ)逐步夯實(shí),上市公司質(zhì)量不斷提高,股權(quán)分置改革積極穩(wěn)妥地推進(jìn),保護(hù)投資者利益、防范和化解風(fēng)險(xiǎn)的各項(xiàng)基礎(chǔ)建設(shè)不斷完善。然而,金融產(chǎn)品過少、產(chǎn)品結(jié)構(gòu)過于單一已經(jīng)嚴(yán)重制約了我國資本市場的長足發(fā)展,因此適時(shí)地推出新的金融衍生品對(duì)于我國資本市場能夠在激烈的國際競爭中處于不敗之地有著極其重大的意義。中國證監(jiān)會(huì)主席尚福林在中國期貨業(yè)協(xié)會(huì)第二次會(huì)員大會(huì)上表示,在鞏固和大力發(fā)展商品期貨的同時(shí),要加大對(duì)金融期貨的研究和開發(fā)力度,為適時(shí)推出金融期貨產(chǎn)品做好準(zhǔn)備。作為金融期貨的領(lǐng)頭羊,股指期貨的推出已如箭在弦上。
在這樣的背景之下,各種各樣的預(yù)測模型就能夠在股票指數(shù)的預(yù)測中大顯身手了。在線性類預(yù)測模型中,ARIMA和GARCH應(yīng)用較為廣泛,它們具有良好的可解釋性和穩(wěn)健性。然而金融系統(tǒng)是一個(gè)復(fù)雜的大系統(tǒng),具有非線性、高維度、隨機(jī)性和混沌等特征,因此運(yùn)用線性模型來預(yù)測金融系統(tǒng)精度往往不高。神經(jīng)網(wǎng)絡(luò)由于具有超強(qiáng)的非線性映射能力和向數(shù)據(jù)學(xué)習(xí)的能力從而在金融領(lǐng)域得到了廣泛的重視和應(yīng)用[1]。
在運(yùn)用神經(jīng)網(wǎng)絡(luò)模型對(duì)股票價(jià)格進(jìn)行短期預(yù)測時(shí),一般的神經(jīng)網(wǎng)絡(luò)預(yù)測模型都是以價(jià)格的時(shí)間序列滯后作為輸入變量[2-3],但是由于影響價(jià)格的因素錯(cuò)綜復(fù)雜,很多因素?zé)o法準(zhǔn)確測量,而且市場信息的噪音太大,因此,預(yù)測效果往往不太理想,于是如何選擇有效的輸入變量就成為一個(gè)困擾我們的難題。近幾十年來行為金融學(xué)的蓬勃發(fā)展正好為這個(gè)難題的解決提供了有效的途徑。行為金融理論認(rèn)為,投資者并不是完全理性的,而是有限理性的,投資者的心理、情緒和意志因素在資本資產(chǎn)的定價(jià)中起著不可忽視的作用。國內(nèi)外大量的行為金融學(xué)文獻(xiàn)對(duì)投資者普遍存在的各種認(rèn)知、情緒和意志偏差以及影響投資者交易行為的關(guān)鍵因素作了深入的研究。如Odean(1999)的研究發(fā)現(xiàn)投資者存在過度自信(overconfidence)的心理偏差[4],Grinblatt和Keloharju(2001)利用芬蘭股票市場1995-1996年的投資者交易數(shù)據(jù)對(duì)影響投資者買賣決策的決定因素進(jìn)行了實(shí)證研究[5],趙學(xué)軍和王永宏對(duì)我國股市中存在的處置效應(yīng)進(jìn)行了實(shí)證分析[6]。筆者依據(jù)已有的行為金融學(xué)文獻(xiàn),并結(jié)合中國證券市場的實(shí)際特點(diǎn),將影響投資者交易行為的一些關(guān)鍵因素引入到神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入變量中,這些行為參數(shù)包括歷史平均收益率、歷史價(jià)格的波動(dòng)、歷史交易量的變化、情緒指數(shù)、重大政策和信息的發(fā)布以及假日效應(yīng)。
筆者選擇上證綜指日收盤價(jià)為預(yù)測目標(biāo),樣本區(qū)間為2004年6月22日至2006年1月10日,共300期數(shù)據(jù) ,上證綜指每日的收盤價(jià)和交易量數(shù)據(jù)來源于搜狐網(wǎng)。將2004年6月22日至2005年11月17日共270期數(shù)據(jù)作為訓(xùn)練樣本,2005年11月18日至2006年1月10日共30期數(shù)據(jù)作為測試樣本。
二、廣義回歸神經(jīng)網(wǎng)絡(luò)預(yù)測模型
(一)廣義回歸神經(jīng)網(wǎng)絡(luò)
多層前饋神經(jīng)網(wǎng)絡(luò)能逼近任意從Rm空間到Rn空間的非線性映射,它的工作原理來源于概率論的思想,當(dāng)用作函數(shù)逼近時(shí),網(wǎng)絡(luò)輸出y可理解為網(wǎng)絡(luò)輸入x的回歸函數(shù),當(dāng)用作分類時(shí),網(wǎng)絡(luò)輸出可理解為相應(yīng)類別的后驗(yàn)概率。
廣義回歸神經(jīng)網(wǎng)絡(luò)(general regression neural network, GRNN)最早由Sprecht(1991)提出[7]。作為一種通用的非參數(shù)回歸模型,它是徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function neural network, RBF)的一種變化形式,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
網(wǎng)絡(luò)的第一層為徑向基隱層,隱節(jié)點(diǎn)的個(gè)數(shù)為訓(xùn)練樣本數(shù)Q,將所有訓(xùn)練樣本均作為隱節(jié)點(diǎn)的數(shù)據(jù)中心。設(shè)輸入樣本為P=(p …,pR),網(wǎng)絡(luò)輸入到隱層的權(quán)值矩陣為IW,它的每一行實(shí)際上就是一個(gè)訓(xùn)練樣本。‖dist‖表示輸入樣本P與數(shù)據(jù)中心的歐氏范數(shù),即:
這里,各個(gè)隱節(jié)點(diǎn)采用相同的擴(kuò)展常數(shù)(spread,也稱為光滑因子)σ。
網(wǎng)絡(luò)的第二層為線性輸出層,隱層到輸出層的權(quán)值矩陣為LW,基函數(shù)采用規(guī)范化點(diǎn)積函數(shù)mprod,基函數(shù)輸出為n2=(n2 …,n2k),則有:
激活函數(shù)為線性函數(shù)purelin,最后的輸出記為a2=(a2 …,a2K),則有:
GRNN的權(quán)值學(xué)習(xí)仍然采用BP算法,即誤差反向傳播學(xué)習(xí)算法(error back propagation algorithm),這是一種有導(dǎo)學(xué)習(xí)算法,其基本思想是最小均方差準(zhǔn)則和梯度下降法。輸出層權(quán)值的反向傳播誤差公式為:
輸出層的批處理權(quán)值修正公式為:
其中η稱為學(xué)習(xí)率,一般取較小的值。
GRNN在逼近能力、分類能力和學(xué)習(xí)速度上比BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)有著較強(qiáng)的優(yōu)勢(shì),網(wǎng)絡(luò)最后收斂于樣本量集聚較多的優(yōu)化回歸面,并且在樣本數(shù)據(jù)缺乏和數(shù)據(jù)不穩(wěn)定時(shí),預(yù)測效果也比較好。
(二)預(yù)測模型的變量
預(yù)測模型的輸出變量是預(yù)測日的上證綜指收盤價(jià)格,下面對(duì)輸入變量逐一進(jìn)行介紹。
1.前5個(gè)交易日的股票價(jià)格指數(shù)
2.前5個(gè)交易日的股指收益率移動(dòng)平均
Kahneman和Tversky(1974)通過幸運(yùn)輪實(shí)驗(yàn)發(fā)現(xiàn),人們?cè)趯?duì)不確定的事物進(jìn)行判斷和評(píng)估時(shí)普遍存在錨定效應(yīng)(anchoring effect)[8]。所謂錨定效應(yīng),是指人們?cè)谂袛嗪驮u(píng)估的過程中,通常設(shè)定一個(gè)最容易獲得的信息②作為估計(jì)的初始值(稱之為“錨”),然后在這個(gè)初始值的基礎(chǔ)上進(jìn)行一定程度的上下調(diào)整,但是這種調(diào)整往往是不充分的,并且不同的初始值會(huì)產(chǎn)生不同的估計(jì),從而導(dǎo)致決策上的偏差。金融市場中的錨定效應(yīng)反映在投資者對(duì)未來的判斷過分依賴于資本資產(chǎn)的歷史收益率,他們通常對(duì)新信息反應(yīng)不足,不能及時(shí)地對(duì)原有的預(yù)期進(jìn)行充分的調(diào)整。
3.前5個(gè)交易日股指波動(dòng)的標(biāo)準(zhǔn)差
Kahneman和Tversky(1981)通過心理學(xué)實(shí)驗(yàn)發(fā)現(xiàn),人們的判斷和決策依賴于他們當(dāng)時(shí)所處的情境以及信息的表達(dá)方式(框架),當(dāng)同一問題采用不同的表達(dá)方式時(shí),人們可能會(huì)做出不同的決策,這種認(rèn)知偏差稱為框架依賴(frame dependence)[9] 。國內(nèi)外大量的實(shí)證研究表明證券市場的投資者也存在框架依賴偏差。譬如,在一段時(shí)期內(nèi),假定收益率不變,那么這段時(shí)期內(nèi)股票價(jià)格波動(dòng)程度的高低會(huì)對(duì)投資者對(duì)未來收益的判斷及投資決策產(chǎn)生不同的影響。
4.看漲情緒指數(shù)BSI
看漲情緒指數(shù)BSI(Bullish Sentiment Index)作為一種對(duì)投資者信心的量度,通過調(diào)查投資者對(duì)后市的預(yù)期而計(jì)算得到③,其自身受到歷史收益率、歷史收益率的波動(dòng)、政策、媒體和“傳統(tǒng)智慧”④等諸多因素的影響,同時(shí)它又與未來的收益率有著顯著的相關(guān)性。Fisher和Statman(2000)的實(shí)證研究發(fā)現(xiàn),反映華爾街戰(zhàn)略投資家情緒的組合持股比例和反映美國個(gè)人投資者情緒的BSI都能夠?qū)&P500指數(shù)收益表現(xiàn)出良好的反向預(yù)測能力[10] 。國內(nèi)外已經(jīng)編制了各種各樣的投資者情緒指數(shù),以期通過這些指數(shù)來預(yù)測證券市場的總體走勢(shì),如Shiller設(shè)計(jì)的信心指數(shù)和泡沫指數(shù),我國中央電視臺(tái)的“央視看盤”數(shù)據(jù)以及耶魯大學(xué)國際金融研究中心和北京大學(xué)中國經(jīng)濟(jì)研究中心共同發(fā)起編制的“耶魯-CCER中國股市投資者信心指數(shù)”。
筆者計(jì)算每個(gè)交易日的BSI所用的數(shù)據(jù)來源于華鼎多空民意調(diào)查(發(fā)布在《中國證券報(bào)》上)。這項(xiàng)調(diào)查結(jié)果包含了散戶、大戶和咨詢機(jī)構(gòu)對(duì)后市的看漲、看跌和看平比例以及散戶與大戶的倉位結(jié)構(gòu)和倉位值。筆者將散戶和大戶的看漲、看跌比例分別進(jìn)行算術(shù)平均⑤,然后計(jì)算出平均看漲情緒指數(shù)BSI。
5.重大政策和信息的發(fā)布
“政策市”是我國股市的一個(gè)重要特征。對(duì)于還不太成熟的我國股市而言,重大政策的制定和發(fā)布對(duì)于增強(qiáng)投資者信心、保護(hù)投資者利益、完善資本市場的法制和制度建設(shè)、有效地進(jìn)行宏觀監(jiān)控以及合理引導(dǎo)市場的走向起著舉足輕重的作用。2005年6月6日,上證綜指跌破千點(diǎn),在其后的兩個(gè)月里,國家共發(fā)布了20余條政策,“政策救市”由此可見一斑。表1列出了2004年6月22日至2006年6月9日這一段時(shí)間內(nèi)國家發(fā)布的一些重大的政策和信息,其中第2、4、16、17條為利空政策,其余為利好政策。
6.前一交易日的交易量增量
在證券市場中,交易量的大小反映了交易的活躍程度,而歷史交易量的變化會(huì)影響投資者的買入或賣出決策。Lee和Swaminathan(2000)的實(shí)證研究表明,歷史交易量的變化能夠提供關(guān)于未來價(jià)格走勢(shì)的重要信息[12]。
7.假日效應(yīng)
假日效應(yīng)(holiday effect)是指假日(除雙休日之外國家法定的節(jié)日或傳統(tǒng)節(jié)日)的前后幾個(gè)交易日或假日當(dāng)天的股票收益顯著地高于其他交易日,它是日歷效應(yīng)(calendar effect)的一種,不能由傳統(tǒng)的資本資產(chǎn)定價(jià)理論來解釋,是金融市場中的一種異象(anomaly)。儀垂林和劉淄(2005)通過研究發(fā)現(xiàn)上海股市存在顯著的假日效應(yīng)[13]。和儀垂林一樣,假日包括元旦、春節(jié)、五一長假、十一長假、元宵節(jié)、清明節(jié)、端午節(jié)、中秋節(jié)和重陽節(jié)。為了反映假日效應(yīng)對(duì)股票指數(shù)的影響,預(yù)測模型中引入了如下所示的啞變量。
三、預(yù)測模型仿真結(jié)果
筆者運(yùn)用Matlab7。1中的神經(jīng)網(wǎng)絡(luò)工具包對(duì)GRNN進(jìn)行訓(xùn)練和仿真。在對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練之前,需要對(duì)輸入變量和輸出變量的數(shù)據(jù)進(jìn)行歸一化處理,即將數(shù)據(jù)轉(zhuǎn)換到區(qū)間 中,已經(jīng)位于區(qū)間 的數(shù)據(jù),不必進(jìn)行歸一化處理。可采用下列公式對(duì)數(shù)據(jù)進(jìn)行歸一化處理。
數(shù)據(jù)進(jìn)行歸一化處理之后,就可以用訓(xùn)練樣本來訓(xùn)練GRNN,然后用訓(xùn)練好的網(wǎng)絡(luò)對(duì)測試樣本進(jìn)行預(yù)測。GRNN只需調(diào)節(jié)光滑因子這一個(gè)參數(shù)。從理論上講,光滑因子越小,網(wǎng)絡(luò)對(duì)樣本的逼近就越精確,但是逼近的過程就越不平滑;光滑因子越大,逼近過程就越平滑,但是逼近誤差就會(huì)越大。可以將光滑因子分別設(shè)定為0. 0.2,…,0.5,通過反復(fù)嘗試發(fā)現(xiàn),當(dāng)光滑因子為0.1時(shí),無論是逼近性能還是預(yù)測性能,誤差都比較小,隨著光滑因子的增加,誤差也在不斷增加。因此,從誤差的角度考慮,將光滑因子設(shè)定為0.1。
為了說明本文所提出的模型的意義,筆者將該模型與慣常所使用的模型,即僅以股票指數(shù)時(shí)間序列5期滯后值作為輸入變量的模型進(jìn)行逼近性能和預(yù)測性能兩方面的比較,評(píng)價(jià)指標(biāo)采用平均絕對(duì)誤差MAE、平均絕對(duì)百分比誤差MAPE、均方誤MSE、THEIL的U統(tǒng)計(jì)量THEIL-U、偏差比例、方差比例以及協(xié)方差比例[14]。比較結(jié)果見表2及表3。
從上述比較結(jié)果可以看出,無論是逼近性能還是預(yù)測性能,本文所提出的包含投資者行為參數(shù)的模型比慣常所使用的以股票指數(shù)的時(shí)間序列滯后值作為輸入變量的模型都有一定程度的提高。
四、結(jié)論
行為金融理論認(rèn)為,在股票市場上,信息交易者和噪聲交易者共存,產(chǎn)生價(jià)格波動(dòng)的部分行為機(jī)理是理性的和明智的,而另一些則是愚蠢的和荒謬的,只要股票市場存在下去,這種現(xiàn)象就永遠(yuǎn)也不會(huì)消失[15]。行為金融的研究者們正在孜孜以求將純理性的模型包含到一個(gè)更為廣泛的心理學(xué)模型中去,其中完全理性將作為一個(gè)重要特例[16]。
現(xiàn)在,投資者的認(rèn)知偏差和有限理性行為越來越引起了實(shí)務(wù)界和學(xué)術(shù)界的重視。筆者依據(jù)行為金融理論對(duì)如何選擇有效的輸入因子作了一個(gè)初步的探索,將影響投資者交易行為的一些重要參數(shù)引入到神經(jīng)網(wǎng)絡(luò)短期預(yù)測模型中,仿真結(jié)果表明這種探索是可行且有效的。本文的樣本數(shù)據(jù)只涵蓋了一個(gè)比較短的時(shí)期,在實(shí)際的預(yù)測過程中,要提高預(yù)測的精度就需要增加樣本的涵蓋面和容量、減少樣本的噪音如引入小波分析技術(shù)以及采用組合預(yù)測技術(shù)等。另外,如何提高神經(jīng)網(wǎng)絡(luò)的穩(wěn)健性還值得進(jìn)一步深入研究。
參考文獻(xiàn):
[1]閻平凡,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計(jì)算[M].北京:清華大學(xué)出版社,2005:304-310.
[2] 常松,何建敏.基于小波包和神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測模型[J].中國管理科學(xué),200 9(5):8-15.
[3] 崔建福,李興緒.股票價(jià)格預(yù)測:GARCH模型與BP神經(jīng)網(wǎng)絡(luò)模型的比較[J].統(tǒng)計(jì)與決策,2004(6):21-22.
[4] Terrance Odean. Do investors trade too much? [J]. American Economic Review, 89:1279-1298.
[5] Mark Grinblatt, Matti Keloharju. What makes investors trade? [J]. Journal of Finance, 56:589-615.
[6] 趙學(xué)軍,王永宏.中國股市“處置效應(yīng)”的實(shí)證分析[J].投資與證券,2001(11):44-48.
[7] Sprecht D F. A general regression neural network[J]. IEEE Trans NN, 1991(2):568-576.
[8] D. Kahneman, A. Tversky. Judgment under uncertainty: heuristics and biases [J]. Science, 185: 1124-1131.
[9] D. Kahneman, A. Tversky. The framing of decisions and the psychology of choice [J]. Science, 211:453-458.
[10] Kenneth L. Fisher, Meir Statman. Investor sentiment and stock returns [J]. Financial Analysts Journal, March/April 2000:16-23.
[11] 魏玉根.政策干預(yù)上海股市行為的統(tǒng)計(jì)分析[J].統(tǒng)計(jì)研究,2001(2):52-55.
[12] Charles Lee, Bhaskaran Swaminathan. Price momentum and trading volume [J]. Journal of Finance, 2000, 55: 2017-2069.
[13] 儀垂林,劉淄.上海股市法定節(jié)日及傳統(tǒng)節(jié)日效應(yīng)的實(shí)證研究[J].財(cái)經(jīng)科學(xué),2005(5):99-104.
[14] 高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模——EViews應(yīng)用及實(shí)例[M].北京:清華大學(xué)出版社,2006:86-88.
[15] 拉斯·特維德/周為群譯.金融心理學(xué)——掌握市場波動(dòng)的真諦(修訂版)[M].北京:中國人民大學(xué)出版社,2003:3-10.
[16] Richard H Thaler. The end of behavioral finance[J]. Financial Analysts Journal, November/December 1999:12-17.
(責(zé)任編輯:石樹文)
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。”