999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVM的上證指數預測研究

2017-09-09 00:19:44張晶華莫文柯甘宇健
軟件導刊 2017年8期
關鍵詞:數據挖掘

張晶華+莫文柯+甘宇健

摘 要:國家政策或市場經濟導向等變動會對整個上證指數產生影響,為了尋找上證指數變化規律,提出基于支持向量機的預測算法。算法首先利用數據挖掘技術在某網站上挖掘相關的上證價格數據,并取一部分上證數據作為支持向量機的訓練指數樣本,得到支持向量機的訓練指數集,然后在訓練指數集上利用支持向量機,從而得到上證指數分類的超平面指數函數以及相關的上證指數樣本集,最后對所得的上證指數分3個模型進行預測研究,得到下一個開盤日的上證指數變動預測數據。實驗結果表明,預測2天后的上證指數趨勢只需要前3天的數據作為自變量輸入即可,且所得預測值與實際數值的誤差率較低。

關鍵詞:上證指數;SVM;數據挖掘;股票預測

DOIDOI:10.11907/rjdk.171351

中圖分類號:TP319

文獻標識碼:A 文章編號文章編號:1672-7800(2017)008-0156-04

0 引言

影響上證指數變化的因素諸多,比如企業交易、市場經濟、國家政策導向、居民消費能力、國際交易信息、人民幣匯率變化等,都會直接或間接地對上證指數變動產生影響。上述因素之間存在著彼此交叉影響,能夠對上證指數進行有效預測,這對金融投資者、金融行業,乃至整個股票市場具有重要指導意義和實用價值。

目前,利用支持向量機對股票進行研究的文獻不多。文獻[1]利用回歸預測法對股票進行了短期預測,取得了初步成果,但利用回歸預測方法要求的變量多且難確定,所得預測效果不理想。文獻[2]利用時間序列預測法對股票進行短期預測,也取得了一定的效果,但文獻[2]并沒有對股票變化的規律進行深入研究。文獻[3]和文獻[4]雖然利用SVM對股票進行了研究,但只是簡單拿一些數據用SVM方法進行計算,并沒有進一步研究用什么樣的數據進行預測得到的效果最好。本文在文獻[3]和文獻[4]的基礎上,利用SVM方法,通過對比不同時期的上證指數,并對下一個開盤日上證指數的變化值進行預測。實驗結果表明,本文所得的預測結果與實際相差不大,具有一定的實際意義和指導價值。

1 支持向量機

支持向量機[5-14]是在利用統計學分析數據時面對有限樣本研究其性能不夠高時提出來的新方法,其思路主要是尋找一個超平面,使得正反例之間的距離最大。本文借用支持向量機算法具體過程如下:

首先是訓練上證指數集的選取,本文主要通過網絡爬蟲等數據挖掘軟件,對某交易平臺的上證指數數據進行挖掘,并對所得數據進行噪音等處理后作為訓練指數集,即把所得上證指數數據作為訓練指數樣本集,設為:D={(xk,yk)|k=1,2,…,M,xk∈Rn,yk∈R}其中,xk表示上證指數輸入數據, yk表示上證指數輸出數據。其次是支持向量機相關參數選取。針對上述所得訓練指數集,結合支持向量機的知識,本文得到關于原始上證指數數據的權ω空間中的上證指數函數求解方程:

minω,b,eJ(ω,e)=12ωTω+12γ∑Mk=1e2k(1)由于上述的權空間上證指數函數是非線性的,一般難以直接求解,目前對其求解的方法是直接轉化為相對應的約束條件指數函數的最小值求解:yk=ωTφ(xk)+b+ek,(k=1,2,…,M)

其中: φ(.)代表核空間Rn維到Rm維的映射關系函數;ω是Rm維的權向量;ek是實數域范圍內的誤差變量;b代表偏差量; γ代表可調節的參變量。為了求得約束條件價格函數的最小值或最優值,本文利用拉格朗日方法構造其拉格朗日上證指數函數方程為:L(ω,b,e,λ)=J(ω,e)-∑Mk=1λk{ωTφ(xk)+b+ek-yk}(2)

其中,λk為拉格朗日參數。根據式(2),利用拉格朗日求解的方法對拉格朗日上證指數函數L(ω,b,e,λ)關于所有參數ω、b、ek、λk進行偏導數求解,并令所有的偏導數為零,然后消去參量ω、e,從而得到最優分類上證指數函數方程,為了便于求解,用矩陣的形式給出其方程:

0ITIΩ+1γIbλ=0y(3)其中: x=[x1,…,xM],y=[y1,…,yM],I=[1,…,1],λ=[λ1,…,λM],Ωkl=ψ(xk,xl)=φT(xk)φ(xl),(k,l=1,…,M)。針對式(3)中的Ωkl條件,本文利用mercer條件[15]可知,必有一個映射函數φ和一個核函數ψ(,)使得等式ψ(xk,xl)=φT(xk)φ(xl)成立。綜上所述,本文得到上證指數函數估計的方程為:

y(x)=∑Mk=1λkψ(xk,xl)+b(4)

其中,α、b和λk利用式(3)求解。若所求得的λk不為零,則其對應的指數樣本集就可以作為支持向量機的訓練指數集;若所求得的λk為零,可以適當采取改變松弛變量γ的取值或者改變核函數ψ(,)的選取,再進行驗算,直至λk不為零,此時所得的超平面就是最優分類面。關于式(3)中的核函數ψ(,),其作用就是對原始上證指數數據的特征進行提取,并將其映射為一個高維的特征空間向量,便于原始上證指數樣本分類。目前使用核函數的形式主要有4種,比如線性核函數等。

2 模型實驗結果與分析

2.1 支持向量機模型

本文選取上海證券交易所2010年4月22日-2014年6月10日共1 000條數據并對數據進行歸一化處理,然后利用支持向量機對歸一化的上證指數數據集進行學習訓練,得到最優參數的預測模型;最后根據所得最優參數的預測模型對下一個上證指數變化進行預測,得到下一個上證指數變化的預測數據值,并與實際值作誤差分析。為了尋找上證指數的變化趨勢和SVM預測值與實際值之間的關系,本文將所得數據分3個模型進行研究。模型一:以昨天的開盤價、最低價、最高價、收盤價和成交量作為自變量,當天的收盤價作為因變量;模型二:以前2天的開盤、收盤價作為自變量,當天的收盤價作為因變量;模型三:以前4天的收盤價作為自變量,當天收盤價作為因變量。通過上述3個模型尋找影響上證指數變化的因素,并建立下一個上證指數預測模型。不失一般性,設所得的上證指數原始數據為 {yi,i=1,2,…,N。N=1 000},并利用xi=yi-1N∑Ni=1yiymax-ymin(其中:ymax=max{yi,i=1,2,…,1 000}, ymin=min{yi,i=1,2,…,1 000}。)對其進行歸一化化簡,把上證指數全部數據化簡在[0,1]的數,得到上證指數的時間序列為{xi,i=1,2,…,N。N=1 000}endprint

2.2 最佳回歸參數選取

為了避免出現無解的情況,本文選取適當的懲罰參數γ及核函數ψ(,)對式(1)-式(4)進行求解,得到最優參數值。本文利用Matlab編程來實現程序運行,在求解過程中,主要借用Matlab中libsvm工具箱中的 SVMcg For-Regress()函數來求解,其中懲罰參數γ及核函數ψ(,)的取值范圍均設置為[-7,7],步進均取0.9,得到最佳回歸參數γ=0.48、ψ(,)=5.357。

2.3 數據預測與分析

在上述得到最優參數的支持向量機模型基礎上,選取 2014年6月11日-2016年6月24日共500條數據作為預測數據,得到3種模型對應的預測值與實際值之間的對比如圖1-圖9所示。本文選取相對誤差(MAPE)和均方誤差(RMS)作誤差對比分析,具體如下:AE=y′i-yi(i=1,2,…,N);MAPE=AEyi(i=1,2,…,N);RMS=1N∑Ni=1(y′i-yiyi)2(i=1,2,…,N)其中:y′i為預測值,yi為原始值。利用這些誤差進行對比分析,主要是對比用支持向量機預測上證指數的效果,同時,也可以尋找最佳的預測方案。

2.4 三種模型的預測結果與分析

(1)模型一以昨天的開盤價、最低價、最高價、收盤價和成交量作為自變量,當天的收盤價作為因變量,得到如圖1-圖3所示結果。

實驗結果表明,利用昨天的開盤價、最低價、最高價、收盤價和成交量作為自變量,當天的收盤價作為因變量,得到了下一個開盤日上證指數的預測值與實際值,進行誤差分析得到均方誤差為0.051 5,平均相對誤差為0.034 8。

(2)模型二以前2天的開盤、收盤價作為自變量,當天的收盤價作為因變量,得到如圖4-圖6所示結果。

實驗結果表明,利用前2天的開盤、收盤價作為自變量,當天的收盤價作為因變量,得到了下一個開盤日上證指數的預測值與實際值,進行誤差分析得到均方誤差為0.025 2,平均相對誤差為0.018 3。

(3)模型三以前4天的收盤價作為自變量,當天的收盤價作為因變量,得到如圖7-圖9所示結果。

實驗結果表明,利用前4天的收盤價作為自變量,當天的收盤價作為因變量,得到了下一個開盤日上證指數的預測值與實際值,進行誤差分析得到均方誤差為0.026 1,平均相對誤差為0.018 6。

綜上發現,采用昨天的開盤價、最低價、最高價、收盤價作為自變量時,得到的預測值與實際值的誤差是最大的,而用前4天或者前3天作為自變量進行預測,兩者所得的結果與實際的均方誤差和平均相對誤差相差不大。因此,當要預測后天的上證指數變化時,只需要前3天作為自變量輸入即可,從而降低維數,便于編程計算。

本文利用支持向量機對下一個開盤日上證指數進行預測,得到良好結果,為投資者和持股票者提供了一定參考,可指導投資者適當調整投資,把握投資的盈利關系。同時,市場也可以根據上證指數之間的變化關系,提前對某些股票與投資作出預警,促使投資者合理投資,防止投資風險。但是股票市場變幻莫測,主要是受國家政策、國家事件以及人為等不確定因素所影響,進而影響到預測的準確度,因此對上證指數的變化預測還有待深入研究。

3 結語

本文借助支持向量機方法,對網絡數據挖掘的上證指數進行分析,首先利用支持向量機有限樣本的特性對所得上證指數數據進行分類,然后對所得上證指數分類集進一步預測下一個開盤日上證指數數值。本文用3種模型對下一個開盤日上證指數進行預測,實驗結果表明,借助支持向量機方法,發現采用昨天的開盤價、最低價、最高價、收盤價作為自變量時,得到的預測值與實際值的誤差最大,而用昨天、前天、大前天和大大前天或者昨天、前天、大前天作為自變量進行預測,兩者所得的結果與實際的均方誤差和平均相對誤差相差不大,因此當要預測后天的上證指數變化時,只需要昨天、前天、大前天作為自變量輸入即可,從而降低維數,便于編程計算。通過本文方法,預測到下一個開盤日上證指數的數值且所得數值與實際相差不大,為進一步尋找上證指數變化規律提供了一定的理論依據,由此可見,本文研究具有一定的實用價值。

參考文獻:

[1] 楊毓,蒙肖蓮.用支持向量機(SVM)構建企業破產預測模型[J].金融研究,2006(10):65-75.

[2] 邱玉蓮,朱琴.基于支持向量機的財務預警方法[J].統計與決策,2006(8):153-155.

[3] 劉道文,樊明智.基于支持向量機股票價格指數建模及預測[J].統計與決策,2013(2):76-78.

[4] 張晨希, 張燕平,張迎春,等。基于支持向量機的股票預測[J].計算機技術與發展,2006(6):35-27.

[5] 楊一文,楊朝軍.基于支持向量機的金融時間序列預測[J].系統工程理論方法應用,2005(2):176-181.

[6] 吳超鵬,吳世農.基于價值創造和公司治理的財務狀態分析與預測模型研究[J].經濟研究,2005(11):99-110.

[7] 楊成,程曉玲,殷旅江.基于人工神經網絡方法的上市公司股價預測[J].統計與決策,2005(12):106-108.

[8] 蔣艷霞,徐程興.基于集成支持向量機的企業財務業績分類模型研究[J].中國管理科學,2009,17(2):42-51.

[9] 李云飛,惠曉峰.基于支持向量機的股票投資價值分類模型研究[J].中國軟科學,2008(1):135-140.

[10] LAM M.Neural network techniques for financial performance prediction:integrating fundamental and techqical analysis[J].Decision support systems,2004,37(4):567-581.

[11] KUAR P R,RAVI V. Bankruptcy prediction in banks and firms via statistical and intelligent techniques——a review[J]. Expert Systems with Applications,2007,180(1):1-28.

[12] WU C H,TZENG G H,GOO Y J,et al.A real-valued genetic algorithm to optimize the parameters of support vector machine for predicting bankruptcy[J].Expert systems with applications,2005,32(2):397-408.

[13] HUA Z,WANG Y,XU X,et al.Predicting corporate financial distress based on integration of support vector machine and logistic regression[M].Expert systems with applications,2006,33(2):434-440.

[14] KIM K.Financial time series forecasting using support vector machines[J]. Neurocomputing,2003,55(1-2):307-319.

[15] TAY F E H, CAO L J.Application of support vector machines in financial time series forecasting[J].International Journal of Management Science,2001,29(4):309-317.endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产麻豆精品在线观看| 黄色网页在线观看| 国产精品视频系列专区| 欧美国产日产一区二区| 国产成在线观看免费视频| 久久久久久高潮白浆| AV无码一区二区三区四区| 18禁黄无遮挡免费动漫网站| 亚洲熟妇AV日韩熟妇在线| 久久久久亚洲精品成人网| 超清人妻系列无码专区| 亚洲一区二区日韩欧美gif| 99久久无色码中文字幕| 91 九色视频丝袜| 亚洲狼网站狼狼鲁亚洲下载| 五月天福利视频| 精品少妇人妻av无码久久 | 亚洲综合精品第一页| 欧美综合在线观看| 一本综合久久| 亚洲午夜综合网| 久久综合丝袜日本网| 99视频全部免费| 99视频国产精品| 精品黑人一区二区三区| 一级毛片网| 国产午夜看片| 熟妇丰满人妻| 欧美日韩高清| 国产精品高清国产三级囯产AV| 97se亚洲| 美女无遮挡被啪啪到高潮免费| 亚洲一级毛片在线观| 日韩高清成人| 女人一级毛片| 欧美黄网站免费观看| 国产精品黄色片| 超清无码一区二区三区| 色婷婷色丁香| 女人毛片a级大学毛片免费| 欧美成在线视频| 国产精品私拍在线爆乳| 国产乱子伦一区二区=| 久久亚洲综合伊人| 91一级片| 国产主播在线一区| 亚洲国产精品一区二区高清无码久久| 91成人精品视频| 午夜啪啪网| 99re精彩视频| 香蕉久久国产超碰青草| 亚洲日韩精品欧美中文字幕 | 久久亚洲国产视频| 国产屁屁影院| 71pao成人国产永久免费视频 | 日韩欧美国产中文| 亚洲精品国产综合99久久夜夜嗨| 中文字幕无码av专区久久| 欧美在线精品一区二区三区| 国产免费一级精品视频 | 久久青青草原亚洲av无码| 亚洲Av综合日韩精品久久久| 久久久久亚洲Av片无码观看| 欧美丝袜高跟鞋一区二区 | 老熟妇喷水一区二区三区| 草逼视频国产| 国产福利在线免费| 三级国产在线观看| 青青青亚洲精品国产| 2021最新国产精品网站| 欧美亚洲欧美| 性欧美久久| 色综合天天操| 欧美成人区| 久久中文字幕2021精品| 国产Av无码精品色午夜| 亚洲精品亚洲人成在线| 国产va免费精品观看| 伊人久久福利中文字幕| 国内精品自在欧美一区| 国产特级毛片aaaaaaa高清| 国产精品播放|