999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Boruta-PSO-SVM的股票收益率研究*

2018-03-26 03:33:03郭海山高波涌陸慧娟
傳感器與微系統(tǒng) 2018年3期
關鍵詞:分類優(yōu)化模型

郭海山, 高波涌, 陸慧娟

(中國計量大學 信息工程學院,浙江 杭州 310018)

0 引 言

在股票市場中,對于投資者來說,股票價格走勢的預測一直是熱門問題。準確判斷和把握整個股票市場的變化趨勢,不僅可以減少股票市場中盲目投資的現(xiàn)象,對于提高股市中投資者的理性程度具有較高的現(xiàn)實意義,更可以為國家制定相關經(jīng)濟政策提供參考[1]。

支持向量機(support vector machine,SVM)作為機器學習領域的的新方法,已被廣泛應用于股票價格預測的研究中。彭麗芳等人[2]借助SVM方法構建模型對股票價格進行了預測,實驗結果明顯好于傳統(tǒng)方法。李云飛等人[3]提出了一種基于SVM的股票投資價值分類模型,取得了不錯的實驗結果。Pai Ping-Feng等人[4]提出了一種基于自回歸積分滑動平均(autoregressive integrated moving average,ARIMA)模型和SVM相結合的混合模型預測臺灣股票收盤價走勢,結果表明:混合模型均高于單純的ARIMA模型和SVM模型預測精度。李小琳等人[5]提出了一種SVM修正的模糊時間序列模型,并將其用于上證指數(shù)的預測研究中,結果表明模型的均方根誤差平均為22.73,明顯低于其他模型。張偉等人[6]提出了一種遺傳算法(genetic algorithm,GA)和SVM相結合的方法,并將其用于上證綜指的走勢預測中。上述文獻方法忽略了特征選擇對SVM性能的影響;2)優(yōu)化方法耗時很難精確找到最優(yōu)模型參數(shù)。特征選擇對SVM分類算法起著重要的作用。魏小敏等人[7]提出了一種基于遞歸特征消除(recursive feature elimination,RFE)法的蛋白質能量熱點預測,實驗表明模型預測精度提高了6.25 %。代琨等人[8]提出了一種快速迭代的基于SVM的特征選擇算法。林俊等人[9]提出了一種SVM-RFE-Boruta粒子群優(yōu)化(Boruta particle swarm optimization,BPSO)算法的特征選擇方法。徐國祥等人[1]提出了一種主要成分分析(PCA)-GA-SVM模型,并將其用于滬深300指數(shù)預測精度準確分析中。

近年來有很多學者針對PSO優(yōu)化SVM方法進行了深入研究。姜濱等人[10]通過PSO對最小二乘SVM(least square SVM,LS-SVM)的數(shù)參數(shù)進行優(yōu)化,從而提高模型的精確度。谷文成等人[11]將PSO-SVM應用于雙螺旋分類問題中。武昊等人[12]將PSO-SVM方法進行肌電信號步態(tài)識別,使得優(yōu)化后的平均識別率達到了97.0 %。黃發(fā)明等人[13]提出了一種基于多變量PSO-SVM模型的滑坡地下水位預測方法,可以真實反映地下水位系統(tǒng)發(fā)展演化的本質特征。而目前尚無基于Boruta和SVM方法的股票預測文獻。

本文提出了采用Boruta算法進行特征選擇以減少SVM特征集的復雜度,同時采用PSO算法優(yōu)化SVM的懲罰參數(shù)及核函數(shù)參數(shù)的新算法,并首次將該優(yōu)化后的SVM用于股票交易信號的識別和分類研究中,以獲得更優(yōu)的分類性能和識別判斷能力。

1 理論基礎

1.1 SVM原理[14~16]

設X1,X2,…,Xn為輸入向量xj={xi1,xi2,…,xij},K(X,X1),K(X,X2),…,K(X,Xn)為SVM的核函數(shù)。SVM的輸出分類決策函數(shù)為

0≤ai≤C

(1)

式中ai為系數(shù);C懲罰參數(shù);μ為權系數(shù);b∈R為偏置。核函數(shù)選擇高斯核函數(shù)

(2)

1.2 Boruta特征選擇算法

1)通過增加原始數(shù)據(jù)集所有屬性的隨機性成分(也稱陰影屬性)得到擴展數(shù)據(jù)集,然后在擴展數(shù)據(jù)集上運行隨機森林分類器,獲得評價特征重要性的Z分值。

2)將陰影屬性分值低于最大Z分值(Zmax)的屬性標記為+1,記為hits。

3)使用Zmax對陰影屬性中重要性無法確定的屬性進行雙側顯著性檢驗,標記陰影屬性分值小于Zmax的特征為0。

4)根據(jù)伯努利公式

(3)

計算步驟(3)中hits屬性的概率,將概率值低于0.01的屬性標記為重要,并將其移出擴展數(shù)據(jù)集。

5)重復上述步驟,直到所有屬性均被視為“重要”,或者算法達到隨機森林運行前設置的極限值。

1.3 PSO算法[7]

PSO算法標準公式為

vid=λvid+c1r1(pbestd-xid)+c2r2(gbestd-xid)

(4)

xid=xid+βvid

(5)

式中λ為慣性權重;d=1,2,…,D為空間維度;i=1,2,…,n為群中粒子總數(shù);vid為第i個粒子飛行速度;xid為第i個粒子的當前位置;c1和c2為學習因子。

2 股票交易信號預測模型

為了提高SVM的預測精度并減少計算量, 本文采用Boruta算法先對實驗數(shù)據(jù)集進行特征選擇,再通過PSO算法優(yōu)化SVM的懲罰參數(shù)C和核函數(shù)參數(shù)g得到SVM誤差最小的一組參數(shù),提高SVM的分類準確率。

基于特征選擇和PSO-SVM模型(Boruta-PSO-SVM)的股票交易信號預測算法步驟為:

1)根據(jù)k線圖的N種不同技術指標構建樣本集并對其進行特征選擇,降低SVM輸入維度到D維,即D

2)D維空間中,初始化m個粒子的隨機位置和速度;

3)確定SVM參數(shù),輸入特征選擇后的數(shù)據(jù)訓練模型;

4)計算評價粒子適應度值,并與其經(jīng)過的最優(yōu)pbest,gbest比較,如果較好,則將其作為當前最優(yōu)pbest,gbest值;

5)判斷是否滿足迭代終止條件,若不滿足,根據(jù)式(4)、式(5)更新粒子速度和位置,轉步驟(3);

6)若滿足收斂條件,則得到使SVM誤差最小的懲罰參數(shù)C和核函數(shù)參數(shù)g的最優(yōu)值,然后使用最優(yōu)參數(shù)重新訓練SVM,作為最終的分類器進行股票收益率的識別分類。

3 實驗與結果分析

3.1 股票交易信號數(shù)據(jù)

選擇股票日數(shù)據(jù)的收盤價(Close,C)、最高價(High,H)及最低價(Low,L)構建交易信號Yi={y1,y2,…,yi},其中,i=1,2,…,n為樣本編號。交易信號的具體構建步驟如下:

(6)

2)計算未來k,(k=1,2,…,10)天的算數(shù)收益Vi

(7)

3)計算算數(shù)收益的動態(tài)累加變量Ti為

(8)

4)構建交易信號Yi

(9)

3.2 股票交易信號數(shù)據(jù)分析

樣本數(shù)據(jù)集分別為平安銀行2013年8月16日到2015年11月27日的500個交易日的股票數(shù)據(jù)和滬深300指數(shù),2012年6月1日到2016年1月3日的824個交易日數(shù)據(jù)。對每組樣本序列i,選擇13個特征參數(shù)(ADX,Aroon,ATR,BB,CCI,CLV,CV,EMV,KST,MACD,MFI,ROC,SAR),構成一組特征向量Xj={xi1,xi2,…,xij},采用Boruta算法進行特征選擇(選擇ADX,Aroon,ATR,BB,CCI,CV,KST,MACD,MFI,SAR等10個特征)。

構造PSO-SVM分類器,實驗中分類器選擇了徑向基核函數(shù),C,g參數(shù)分別設置為[10-1,104],[10-1,103]。PSO算法初始參數(shù)[15]設置為:慣性權重λ=0.8,學習因子c1=c2=2.0,粒子規(guī)模為20,迭代數(shù)為100。

根據(jù)適應度值變化曲線選擇最優(yōu)C,g參數(shù)建立最終SVM分類模型。其中,數(shù)據(jù)集按照9∶1的比例隨機抽樣成訓練集和測試集。訓練集用于SVM分類模型訓練,測試集用于測試SVM分類模型準確度。

3.3 結果與討論

實驗中PSO算法迭終止優(yōu)化過程時,準確率為84 %,輸出的最優(yōu)參數(shù)值Cbest=1.725 3,gbest=18.818 3。可以看出:相對于SVM分類模型C,g參數(shù)的取值范圍,PSO算法可以快速準確地進行參數(shù)尋優(yōu),此為采用Boruta-PSO-SVM方法的一大優(yōu)點。圖1為PSO優(yōu)化SVM的適應度變化曲線。

圖1 粒子群適應度曲線

同時在兼顧分類器的泛化能力和識別率的前提下,將訓練集和測試集分別送入未經(jīng)優(yōu)化的SVM分類模型(SVM), PSO-SVM和Boruta-PSO-SVM模型。

表1為2種數(shù)據(jù)集上特征選擇、PSO-SVM的對比結果。可以看出:相比未經(jīng)過優(yōu)化的SVM分類模型,經(jīng)過特征選擇和PSO-SVM分類模型的預測精度在84 %左右,結果明顯優(yōu)于未經(jīng)特征參數(shù)選擇和參數(shù)優(yōu)化的SVM分類模型,此為本文采用Boruta-PSO-SVM方法的另一大優(yōu)點。

表1 Boruta-PSO-SVM結果

為了測試Boruta-PSO-SVM的效果,本文的對比實驗選用了標準的BP神經(jīng)網(wǎng)絡反向傳播神經(jīng)網(wǎng)絡(back propagation neural network,BPNN)、決策樹(decision tree,DT)、極限學習機(extreme learning machine,ELM)3種算法。其中BP神經(jīng)網(wǎng)絡中神經(jīng)元個數(shù)設置為10;決策樹采用R語言的rpart包,參數(shù)均設置為默認值;極限學習機隱含層節(jié)點數(shù)設置為30。實驗結果如表2所示。可以看出:在犧牲測試時間的前提下,本文提出Boruta-PSO-SVM的股票交易信號識別方法優(yōu)勢明顯。

表2 不同算法對比結果

由此可見,Boruta-PSO-SVM模型參數(shù)尋優(yōu),具有精確、穩(wěn)定的特點。

4 結束語

采用Boruta算法進行特征選擇,并結合算法PSO模型的實現(xiàn)簡單、設置參數(shù)少、計算收斂速度快等特點以及SVM小樣本的學習能力、學習速度快、優(yōu)化能力強等優(yōu)點,得到了較優(yōu)的Boruta-PSO-SVM混合模型。實驗結果表明:該模型可以明顯提高SVM的預測精度,并且結論可靠,在股票收益率的研究中具有一定的實用性。

[1] 徐國祥,楊振建.PCA-GA-SVM模型的構建及應用研究滬深300指數(shù)預測精度實證分析[J].數(shù)量經(jīng)濟技術經(jīng)濟研究,2011(2):135-147.

[2] 彭麗芳,孟志青,姜 華,等.基于時間序列的支持向量機在股票預測中的應用[J].計算技術與自動化,2006(3):88-91.

[3] 李云飛,惠曉峰.基于支持向量機的股票投資價值分類模型研究[J].中國軟科學,2008(1):135-140.

[4] Pai Ping-Feng,Lin Chih-Sheng.A hybrid arima and support vector machines model in stock price forecasting[J].The International Journal of Management Science,2005,12(33):497-505.

[5] 李小琳,孫 玥,劉 洋.基于SVM修正的模糊時間序列模型在滬指預測中的應用[J].中國科學技術大學學報,2016,46(3):238-246.

[6] 張 偉,李泓儀,蘭書梅,等.GA-SVM對上證綜指走勢的預測研究[J].東北師大學報:自然科學版,2012(3):55-59.

[7] 魏小敏,徐 彬,關佶紅.基于遞歸特征消除法的蛋白質能量熱點預測[J].山東大學學報:工學版,2014,44(2):12-20.

[8] 代 琨,于宏毅,李 青.一種基于支持向量機的特征選擇算法[J].模式識別與人工智能,2014,27(5):463-471.

[9] 林 俊,許 露,劉 龍.基于SVM-RFE-BPSO算法的特征選擇算法[J].小型微型計算機系統(tǒng),2015, 36 (8):1865-1868.

[10] 姜 濱,孫麗萍,曹 軍,等.基于PSO優(yōu)化LS-SVM的木材含水率軟測量建模[J].重慶大學學報,2016,39(1):48-54.

[11] 古文成,柴寶仁,滕艷平.基于粒子群優(yōu)化算法的支持向量機研究[J].北京理工大學學報,2014,34(7):705-709.

[12] 武 昊,席旭剛,羅志增.基于熵和PSO優(yōu)化SVM的肌電信號跌倒識別[J].傳感技術學報,2015,28(11):1586-1590.

[13] 黃發(fā)明,殷坤龍,張桂榮,等.多變量PSO-SVM模型預測滑坡地下水位[J].浙江大學學報:工學版,2015,49(6):1193-1199.

[14] 高發(fā)榮,王佳佳,席旭剛,等.基于粒子群優(yōu)化—支持向量機方法的下肢肌電信號步態(tài)識別[J].電子與信息學報,2015,37(5):1154-1159.

[15] 於 敏,于鳳芹,陳 瑩.超像素詞包與SVM分類的圖像標注[J].傳感器與微系統(tǒng),2016,35(12):63-65.

[16] 李 彥,梁正桃,李立京,等.基于小波和支持向量機的光纖微振動傳感器模式識別[J].傳感器與微系統(tǒng),2013,32(2):43-49.

[17] 余幸運,孫 茜,王小藝,等.基于粒子群優(yōu)化算法的水質傳感器優(yōu)化部署研究[J].傳感器與微系統(tǒng),2016,35(12):30-33.

猜你喜歡
分類優(yōu)化模型
一半模型
超限高層建筑結構設計與優(yōu)化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優(yōu)化探討
關于優(yōu)化消防安全告知承諾的一些思考
分類算一算
一道優(yōu)化題的幾何解法
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
主站蜘蛛池模板: 久久99国产乱子伦精品免| 精品99在线观看| 丁香五月激情图片| 欧美在线伊人| 噜噜噜综合亚洲| 大香网伊人久久综合网2020| 亚洲不卡网| 91久久青青草原精品国产| 亚洲精品另类| 免费观看无遮挡www的小视频| 91口爆吞精国产对白第三集| 四虎永久在线视频| 91精品人妻互换| 亚洲视频在线观看免费视频| 国产69精品久久久久孕妇大杂乱| 欧美日韩另类在线| 国产精品lululu在线观看| 日本欧美中文字幕精品亚洲| 99精品免费欧美成人小视频| 欧美成人看片一区二区三区 | 无码 在线 在线| 欧美在线伊人| 国产精品久久久久久影院| 亚洲午夜国产片在线观看| 国产精品尤物铁牛tv| 亚洲精品高清视频| 伊人91视频| 国产精品亚洲五月天高清| 欧美福利在线观看| 亚洲成AV人手机在线观看网站| 亚洲精品无码高潮喷水A| 国产精品13页| 香蕉eeww99国产精选播放| 99视频国产精品| 在线观看国产网址你懂的| 亚洲综合网在线观看| 成人午夜天| 波多野结衣视频一区二区| 在线观看亚洲国产| 在线中文字幕网| 高h视频在线| 色婷婷亚洲综合五月| 国产男女免费视频| 久久一色本道亚洲| 在线免费a视频| 欧美精品伊人久久| 91青草视频| 中文字幕无线码一区| 欧美五月婷婷| 91香蕉国产亚洲一二三区 | 亚洲精品国产日韩无码AV永久免费网 | av无码一区二区三区在线| 朝桐光一区二区| 欧洲精品视频在线观看| 色精品视频| 精品人妻无码中字系列| 国产chinese男男gay视频网| 欧美成人精品在线| 99re在线免费视频| 久久人人爽人人爽人人片aV东京热| 国内自拍久第一页| 成人精品在线观看| 2020国产免费久久精品99| 国产va视频| 波多野结衣在线一区二区| 欧美中文字幕第一页线路一| 四虎影视永久在线精品| 国产黑丝一区| 精品少妇人妻无码久久| 国产精品欧美在线观看| 久久性视频| 精品久久综合1区2区3区激情| 欧美成人一级| 国产精品久久久久久久久久98| 熟女视频91| 青青久在线视频免费观看| 亚洲男人天堂网址| 中文字幕无码中文字幕有码在线| 99精品免费欧美成人小视频| 91精品小视频| 国产成人精品午夜视频'| 精品视频在线观看你懂的一区|