999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVR的股市預(yù)測與擇時(shí)研究

2016-04-11 01:13:41
關(guān)鍵詞:機(jī)器學(xué)習(xí)

張 鵬

(太原工業(yè)學(xué)院理學(xué)系, 山西 太原 030008)

?

基于SVR的股市預(yù)測與擇時(shí)研究

張鵬

(太原工業(yè)學(xué)院理學(xué)系, 山西太原030008)

[摘要]本文首先闡述支持向量回歸機(jī)原理,在此基礎(chǔ)上建立了SVR預(yù)測模型,以HS300指數(shù)數(shù)據(jù)為測試樣本,分析了SVR模型在時(shí)間序列預(yù)測問題中的優(yōu)勢,并在此基礎(chǔ)上進(jìn)行了交易實(shí)驗(yàn).結(jié)果表明:支持向量回歸機(jī)適用于預(yù)測股市大盤的短期走勢,并能夠得到比較好的預(yù)測效果.

[關(guān)鍵詞]機(jī)器學(xué)習(xí);支持向量回歸機(jī);時(shí)間序列

眾所周知,股票市場是非線性動(dòng)態(tài)的復(fù)雜系統(tǒng),利用傳統(tǒng)的線性時(shí)間序列分析方法(如ARMA、GARCH等)對其研究并不能得到理想效果,而近些年興起的機(jī)器學(xué)習(xí)算法在對非線性時(shí)間序列的分析中表現(xiàn)出極大優(yōu)勢.作為在數(shù)據(jù)挖掘算法中較為成熟的支持向量機(jī)算法,其在很多領(lǐng)域均能成功處理非線性回歸(時(shí)間序列)和分類(判別)等諸多問題.

1支持向量回歸機(jī)基本原理

支持向量機(jī)算法(support vector machines,SVM)最初是解決模式識別、特征提取等問題,都屬于支持向量機(jī)分類(SVC)問題[1].由于它具有強(qiáng)泛化能力而被推廣應(yīng)用于解決預(yù)測類問題,稱為支持向量回歸機(jī)(SVR).該理論將回歸問題轉(zhuǎn)化為二次規(guī)劃(quadratic programming,QP)問題,屬于黑匣子理論.

1.1支持向量機(jī)SVM的基本思想

首先將低維線性不可分訓(xùn)練數(shù)據(jù)集通過核函數(shù)映射到一高維特征空間(稱為Hilbert空間);然后在特征空間進(jìn)行線性可分的分類或回歸,這樣高維空間輸出層上的線性回歸或分類就對應(yīng)著低維空間輸入層的非線性回歸或分類.大量理論已經(jīng)證明,隱藏層維數(shù)如果足夠高,支持向量機(jī)就能夠逼近任意的非線性關(guān)系,并且核函數(shù)的使用能減少隱層的高維所帶來的計(jì)算復(fù)雜性等一系列問題[2].

該算法的基本原理即為在所有的超平面中搜索一個(gè)最優(yōu)分離面.該超平面不僅能準(zhǔn)確分類,還能使超平面兩側(cè)的間距達(dá)到最大化.

1.2支持向量回歸機(jī)SVR

利用支持向量機(jī)做回歸與做分類大體相同,區(qū)別在于:SVC的輸出變量是分類型,而SVR的輸出變量是連續(xù)型.SVC是通過最優(yōu)分離超平面使兩類樣本盡可能分開,而SVR是希望所有樣本點(diǎn)距離超平面的總偏差最小,由此看出SVR實(shí)質(zhì)上就是一個(gè)最優(yōu)規(guī)劃問題.

1.2.1線性回歸情形

s.t. f(xi)-yi≤ε+ξi

ξi≥0,ξi′≥0,i=1,2,…,n

其中C(大于0) 是對ε以外樣本的懲罰,故稱為懲罰參數(shù)[4];ξi,ξi′稱為松弛變量,表示訓(xùn)練樣本擬合誤差ε時(shí)的損失.

根據(jù)Karush-Kuhn-Tucker條件[5],通過引入拉格朗日乘數(shù),上述問題就轉(zhuǎn)化為對偶問題(dual problem):

αi′,αi∈[0,C],i,j=1,2,…,n

1.2.2非線性回歸情形

非線性回歸首先是通過核函數(shù)將低維非線性問題轉(zhuǎn)化為高維空間的線性問題,然后再利用線性回歸情形分析.

αi′,αi∈[0,C].i,j=1,2,…,n

目前該算法中常用的核函數(shù)有3種類型,分別為線性核、多項(xiàng)式核、高斯核,一般形式分別為

2構(gòu)建SVR預(yù)測模型

2.1建模前的準(zhǔn)備

(1)數(shù)據(jù)的選取.由于時(shí)間序列的特殊性,數(shù)據(jù)的選取是建模前需考慮的一個(gè)重要問題,尤其不能選取特殊時(shí)段,這樣將會(huì)失去一般性.本文數(shù)據(jù)來源于wind資訊,原始數(shù)據(jù)指標(biāo)體系為滬深300指數(shù)2010年1月4日到2012年12月31日的收盤價(jià)等時(shí)間序列,如表1所示.相關(guān)指標(biāo)有基礎(chǔ)指標(biāo)的前5日收盤價(jià)、最高價(jià)、最低價(jià)、成交量的對數(shù),技術(shù)指標(biāo)MA(10)、KDJ、RSI、BIAS、WR、PSY共計(jì)14個(gè)因子.

表1 數(shù)據(jù)集

(2)滾動(dòng)預(yù)測.為了能將最新的市場信息及時(shí)反映在模型中,并且消除市場周期性的影響,本文采用滾動(dòng)時(shí)間窗口進(jìn)行建模,又考慮到時(shí)間窗口最好不要超過一個(gè)交易年,故選取240個(gè)交易日作為時(shí)間窗口,即若當(dāng)前日期為T,則樣本期選為T-1到T-240,找到樣本期內(nèi)最優(yōu)參數(shù),進(jìn)而利用T日的數(shù)據(jù)預(yù)測T+1日的收盤價(jià).

上述公式表示基于t時(shí)期的j步向前的價(jià)格預(yù)測值為給定t時(shí)期前所有信息的j步向前真實(shí)價(jià)格的期望值.這里,t=N1,…,N-j,且令j=1,…,5,也就是說,最短預(yù)測未來一天的收盤價(jià),最長預(yù)測5天的收盤價(jià)(如果t表示每日).可見,預(yù)測區(qū)間固定為j向前,而預(yù)測起點(diǎn)t擇時(shí)逐步向后推移,因而是動(dòng)態(tài)的.

2.2建立SVR預(yù)測模型

(1)數(shù)據(jù)清洗.本文采用Pearson相關(guān)性檢驗(yàn)對解釋變量進(jìn)行篩選.鑒于股市中的變量之間可能存在非線性關(guān)系,本文對原始數(shù)據(jù)不完全直接進(jìn)行Pearson檢驗(yàn),而對于線性不明顯的變量采取一些變換,最終確定因子備選庫中含有13個(gè)解釋變量,基礎(chǔ)指標(biāo)的前5日收盤價(jià)、最高價(jià)、最低價(jià)、成交量的對數(shù),技術(shù)指標(biāo)MA(10)、KDJ、RSI、BIAS、PSY共計(jì)13個(gè)因子.

(2)數(shù)據(jù)標(biāo)準(zhǔn)化.為避免因?yàn)樽兞块g因數(shù)量級差別較大而造成模型預(yù)測誤差失真的現(xiàn)象,本文統(tǒng)一對數(shù)據(jù)采用極差標(biāo)準(zhǔn)化處理.

(3)變量的優(yōu)化組合——主成分分析.如果要真實(shí)、完整地反映實(shí)際問題,往往需要很多變量以及樣本,而各個(gè)變量之間并非獨(dú)立的,它們之間或多或少存在相關(guān)性.這樣不僅使得研究變得復(fù)雜,還可能導(dǎo)致預(yù)測精度降低.本文運(yùn)用主成分分析法將規(guī)范化后的變量壓縮為少量幾個(gè)互不相關(guān)的變量,計(jì)算每日的13個(gè)指標(biāo)值,并對其運(yùn)用主成分分析.當(dāng)主成分個(gè)數(shù)為6個(gè)時(shí),累計(jì)方差貢獻(xiàn)率達(dá)到98.79﹪,包含信息的完整性程度較好,因而選取前6個(gè)主成分作為輸入變量.

(4)核函數(shù)和有關(guān)參數(shù)的選擇.本文尋找最優(yōu)的C和ε的主要思想是:首先將C和ε界定在一定范圍以內(nèi)([2-6,26]),然后用交叉驗(yàn)證進(jìn)行搜索使得MSE達(dá)到最小.為了避免因?yàn)閼土P參數(shù)C太大引起過學(xué)習(xí),所以本文選擇的是具有最小C的組合C和ε.這樣可以在一定程度上利于外推.篩選結(jié)果為Gaussian核函數(shù),C和ε都是0.25.

2.3結(jié)果分析

經(jīng)過變量的篩選組合以及模型參數(shù)的選取最終完成模型的建立,并用2012年的數(shù)據(jù)進(jìn)行測試.SVR預(yù)測值與真實(shí)值及相對誤差比較結(jié)果如圖1、圖2所示.

圖1 預(yù)測值與真實(shí)值對比

圖2 SVR預(yù)測相對誤差

從圖1可以看出,SVR的預(yù)測值基本靠近真實(shí)值.圖2顯示,預(yù)測值相對于真實(shí)值的誤差絕大多數(shù)在2﹪以內(nèi),說明本文建立的SVR預(yù)測模型是有效的.

2.4構(gòu)建時(shí)隔一周交易日的預(yù)測模型

假設(shè)當(dāng)前日為T日,本文以第T+1、T+2、T+3、T+4、T+5日的收盤價(jià)分別作為輸出變量構(gòu)建5個(gè)模型,仍然采取240個(gè)交易日為滾動(dòng)時(shí)間窗口,然后對這5個(gè)模型進(jìn)行比較,如表2所示.

表2 五種預(yù)測結(jié)果與真實(shí)對比

從表2看出,SVR擇時(shí)模型在T+1、T+2、T+3、T+4和T+5日5種情況下,都是對下跌的預(yù)測精度要高于上漲的.在1年的測試數(shù)據(jù)下,SVR擇時(shí)模型均能保持較高的準(zhǔn)確率,5種類型的預(yù)測中,對于下跌的預(yù)測準(zhǔn)確率均能保持在0.65以上,對于上漲的預(yù)測準(zhǔn)確率保持在0.6以上,對整個(gè)市場的預(yù)測則能保持在0.62以上.所以,該模型對預(yù)測HS300指數(shù)具有可行性.

2.5模擬交易

擇時(shí)本質(zhì)上是預(yù)測,即在預(yù)測的基礎(chǔ)上做擇時(shí)策略.SVR模型預(yù)測的結(jié)果只是給出一個(gè)漲跌的信號,然后在此基礎(chǔ)上選擇合適的時(shí)刻進(jìn)行交易.

基于一般性的考慮,本文以HS300指數(shù)作為標(biāo)的資產(chǎn),在實(shí)際操作中,考慮到?jīng)_擊成本與交易成本,選擇T+5日作為實(shí)際的交易時(shí)間,指定如下交易規(guī)則:

(1)如果預(yù)測標(biāo)的是上漲的記為1,相反下跌的記為-1;

(2)如果預(yù)測為上漲,并在市場行情低于T日的收盤價(jià)時(shí)買入并持有;

(3)如果漲幅超過2﹪(止盈點(diǎn))則賣出,否則到T+5日自動(dòng)平倉;

(4)設(shè)定止損點(diǎn)為2﹪,即如果虧損2﹪則平倉.

(5)對于反向操作——做空,2和3則采取相反的操作,其余亦同.

這樣的交易規(guī)則可以避免因?yàn)楣墒械谋q或暴跌帶給人們一時(shí)的收益或損失,該操作進(jìn)行的是長期交易.圖3表示在2012-02-01至2012-12-31期間的按照上述策略進(jìn)行交易的累計(jì)凈值情況.

圖3 2012年HS300和SVR擇時(shí)策略的累計(jì)凈值

T+5日SVR擇時(shí)策略對HS300指數(shù)同時(shí)采用多空操作, 通過利用被動(dòng)掛單的方法, 只要價(jià)格達(dá)到合適的位置則選擇開倉,如果沒有達(dá)到開倉條件則繼續(xù)等待,如果開倉后價(jià)格沒有觸及止盈點(diǎn)或止損點(diǎn)則以最后時(shí)刻平倉.從圖3看出,從2012年2月1日至2012年12月31日,HS300凈值從1增長到1.054,而通過SVM擇時(shí)策略進(jìn)行交易,凈值從1增長到1.576.

3結(jié)語

本文所構(gòu)建的SVR預(yù)測模型創(chuàng)新點(diǎn)是采用滾動(dòng)預(yù)測方案,即不同于處理靜態(tài)數(shù)據(jù)那樣所采用的固定預(yù)測方案.該預(yù)測方案采用迭代估計(jì)而非一次性估計(jì)和預(yù)測.

[參考文獻(xiàn)]

[1]ETHEM ALPAYDIN.機(jī)器學(xué)習(xí)導(dǎo)論[M].范明,昝紅英,牛常勇,譯.北京:機(jī)械工業(yè)出版社,2014.

[2]KIM K J. Financial time series forecasting using vector machines[J]. Neurocomputing,2003 (55):307-319.

[3]邊肇祺,張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,2002.

[4]田盛豐. 基于核函數(shù)的學(xué)習(xí)算法[J]. 北方交通大學(xué)學(xué)報(bào), 2003(2):1-8.

[5]BURBIDGE R, TROTTER M, BUXTON B, et al. Drug design by machine learning: support vector machines for pharmaceutical data analysis[J].Computer and Chemistry, 2001(1):5-14.

[6]TROTTER M W B, BUXTON B F, HOLDEN S B. Support vector machines in combinatorial chemistry[J]. Measurement and Control, 2001(8):235-239.

(責(zé)任編輯穆剛)

Research of forecasting and timing in stock market based on SVR

ZHANG Peng

(Science Department, Taiyuan Institute of Technology, Taiyuan Shanxi 030008, China)

Abstract:This paper firstly expounds the principle of support vector regression machine, on the basis of which SVR forecasting model is established and then the advantages of SVR model are analyzed in time series prediction problem, regarding HS300 index as the test sample. Based on this, trading experiment is conducted to show that SVR is applicable to predict the short-term trends of stock market, and it can get a better prediction effect.

Key words:machine learning; support vector regression; time series

[中圖分類號]C812

[文獻(xiàn)標(biāo)志碼]A

[文章編號]1673-8004(2016)02-0148-04

[作者簡介]張鵬(1989—),男,山西長治人,助教,碩士,主要從事數(shù)據(jù)分析、統(tǒng)計(jì)決策方面的研究.

[收稿日期]2015-10-18

猜你喜歡
機(jī)器學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計(jì)算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
主站蜘蛛池模板: 不卡无码网| 亚洲日韩精品无码专区| 无码高潮喷水在线观看| 欧美自慰一级看片免费| 亚洲婷婷丁香| 波多野结衣一区二区三视频| 欧洲高清无码在线| 99久久性生片| 成人毛片免费在线观看| 亚洲AV人人澡人人双人| 国产欧美专区在线观看| 91青青草视频在线观看的| 超清无码熟妇人妻AV在线绿巨人| 久久国产av麻豆| 亚洲黄色视频在线观看一区| 亚洲成a人在线播放www| 干中文字幕| 伊人久久大香线蕉影院| 久久伊伊香蕉综合精品| 国产一二三区视频| 国产大全韩国亚洲一区二区三区| 国产免费人成视频网| 国产精品高清国产三级囯产AV| jizz国产视频| 99re精彩视频| 国产精品久久国产精麻豆99网站| 国产精品视频公开费视频| 中文字幕精品一区二区三区视频 | 国产精品太粉嫩高中在线观看| 一级毛片免费观看久| 波多野结衣的av一区二区三区| 91无码国产视频| 亚洲精品人成网线在线 | 老司机精品久久| 国产杨幂丝袜av在线播放| 超碰91免费人妻| 夜夜操狠狠操| 91久久国产成人免费观看| 99久久人妻精品免费二区| 欧美精品高清| 国产精品开放后亚洲| 国产剧情无码视频在线观看| 国产午夜精品一区二区三区软件| 99久久精品免费观看国产| a毛片免费观看| 日本成人不卡视频| 国产精品女熟高潮视频| 五月婷婷欧美| 欧美日韩在线第一页| 国产丝袜第一页| 色网站在线免费观看| 色综合a怡红院怡红院首页| 免费人成网站在线观看欧美| 亚洲性影院| 天堂在线亚洲| 99这里只有精品免费视频| 国产成人精品免费av| 久久这里只有精品2| 无码av免费不卡在线观看| 再看日本中文字幕在线观看| 久久国语对白| 亚洲欧洲日韩综合色天使| 日韩欧美国产中文| 精品无码国产自产野外拍在线| 日本三区视频| 久久国产精品无码hdav| 黄色网页在线播放| 国产aaaaa一级毛片| 国产女人在线观看| 一级成人a做片免费| 久久久久亚洲Av片无码观看| 国内视频精品| 国产亚洲精品91| 亚洲成网站| 国产资源站| 在线看片国产| 日本欧美中文字幕精品亚洲| 97视频免费在线观看| 久久精品女人天堂aaa| 亚洲国产91人成在线| 丁香六月综合网| 538国产在线|