潘越穎
循環神經網絡(Recurrent NeuralNetwork, RNN)是一種用于處理序列數據的神經網絡。相比一般的神經網絡來說,RNN模型能夠處理序列變化的數據。比如某個單詞的意思會因為上文提到的內容不同而有不同的含義,RNN模型就能夠很好地解決這類問題。而量化擇時是通過進行買入擇時因子的編寫、分解模式一步一步對策略進行回測、賣出擇時因子的實現對股票的買入和拋出時間進行評估分析,從而達到持股人利益最大化的策略。
有效市場假說認為:假如市場是有效的,那么市場中價格總是能夠及時、準確且充分地反映所有相關的信息。根據不同的資本市場所處的信息環境下,有效市場可以分為弱式有效、半強式有效和強式有效三種形式。在有效市場的假說下,投資者不能依據歷史信息來獲得超額收益,因為歷史信息已經全部體現在當前標的的價格上。學術界有很多對我國金融市場有效性的研究,普遍認為國內金融市場滿足弱式有效,但也存在一定的爭議。本文基于股指期貨中具有代表性的滬深300期貨歷史交易數據信息,對其進行量化擇時投資,通過不斷訓練模型,進而推演到商品期貨中具有典型代表的期貨,最終通過金融期貨與商品期貨的組合,從而降低風險,使利潤最大化。最后相比不同時期的投資組合收益差與成本差來證明通過該擇時方法選定的期貨投資組合可以獲得一定的超額收益。
一、研究內容
期貨市場是一個充滿了不確定性的市場,屬于高風險高回報的市場,期貨價格時間序列具有非線性及高噪聲的數據特征,對其精確預測依舊十分困難。交易者要想做到穩定盈利還是需要一套完整的交易系統的。沒有一個好的交易系統不僅不能盈利,還可能造成長期虧損的危險。一套好的交易系統是要在交易中不斷進行一步步完善的。
期貨市場,隨著時間的推移,會產生具有順序的一系列數字,這些數字是具有序列特性的,由于時間的動態變化,使得自變量和因變量二者之間的關系也會隨之發生變動,本次研究主要著眼于排除隨機擾動項、現貨市場對期貨價格影響后,滯后1到5階的歷史數據對期貨價格未來走勢的影響,從而對買入或賣出期貨的時機進行大致選擇,使其機會成本最小。神經網絡能夠發現并刻畫數據自身復雜的內部結構特征,也能自適應地學習和構建數據非線性的復雜關系,不會對輸入變量施加限制,也具備更好的遷移學習性質,因此非常適合處理如期貨價格這樣的金融數據。RNN對具有序列特性的數據非常有效,它能挖掘數據中的時序信息以及語義信息,利用RNN的這種能力,使深度學習模型在解決時序分析等問題時有所突破。
我們希望建立一個基于循環神經網絡(RNN)的非線性預測模型,研究期貨市場量化擇時交易策略。
二、研究方法
(一)定量分析法
我將使用定量分析法使人們對期貨市場的認識進一步精確化,對市場變動的認識更加理性,以便更加科學地參與期貨市場,把握本質,理清關系,預測期貨市場金融期貨及大宗商品期貨的變動情況,來確定不同時間段股指期貨與商品期貨的投資組合,從而使預期收益率最大化。
(二)文獻資料調研法
在研究之初,我深入學習了《深度學習》一書中與循環神經網絡相關的部分,對于一些難以理解的部分采取了在線查閱資料以及組內討論的形式,在數據獲取階段主要通過知網中的參考文獻部分,去尋找滬深300期貨價格變動的歷史數據,同時閱讀了大量關于期貨市場的相關資料,幫助我們明晰整體思路,并做下一步規劃,去探求單個大宗商品的價格規律。
三、研究結果
通過RNN這種神經網絡來預測某種商品的定價,而影響期貨市場價格變動的因素又有很多,因此,我們要在諸多不確定性中找到確定性,通過交易方向、入市點、持倉方法的選擇以及資金管理,使期貨市場的高收益在不同交易次數之間發生偏移。
通過收集大量資料,對期貨市場上不同種類的商品有大致的了解;然后根據市場現狀,來確定我們具體需要構建的RNN模型種類;之后,利用組內人員專業優勢,嘗試建模;建模完成后,套入某具有代表性的期貨產品在過去某一個時間步的數據,通過觀察信息在某個時間步向前的計算輸出和損失,以及先后計算梯度,通過契合度測試模型的可行性,并不斷修改、不斷驗證,從而訓練一個成功的RNN模型,并將訓練好的模型運用于不同種類的期貨產品中,預測其未來走勢,大體思路為從金融期貨推演到不同種類的商品期貨,最終在不同的時間選取有效的投資組合,力求在相同投機需求下分散風險,盡可能地提高收益率。
我們運用建立的模型預測該期貨未來一段時間的價格走勢。然后收集了三種典型的金融期貨——滬深300、中證500、中證1000,四類商品期貨中的典型期貨——農產品中的美豆粕2301、基本金屬中的COMEX銅、能源化工WTI原油、貴金屬中的COMEX黃金等數據,以期對模型的正確性進行檢驗。但該模型對于不同種類的期貨預測準確性和適用性有差異。該模型用于數據集較少的期貨時,模型擬合程度較低,數據可信度差;該模型用于數據集較多的期貨價格預測時,擬合程度高,數據可信度好。因此可以得出該模型可用于長期期貨價格預測的特點。
四、創 新 點
(一)引入量化擇時
量化擇時的優勢主要體現在:其一,量化擇時擁有客觀性。在交易過程中,量化擇時任何操作均不是人為進行的,全部都是運用計算機系統開展預算與測試。因此,這樣便成功地避免了投資人員心理因素和主觀情緒等方面的因素對投資過程中帶來的負面影響。在量化擇時過程中,借助計算機來構建量化擇時模型,并對市場大數據開展分析,只需確保使用的模型符合投入市場的應用要求。其二,量化擇時具有可控性。跟傳統投資項目相比,量化擇時擁有可控性。相比傳統的投資項目,量化擇時的投資范圍更廣, 并且通過應用技術能夠將風險降至最低水平,把風險控制在可以接受的范圍中。正因為量化擇時擁有這一優勢,能夠讓投資者在承擔最小風險的基礎上獲得較大的收益。其三,量化擇時具有高效性。量化擇時是將計算機、金融、數學等包含在內的多種學科融合形成的一類高效投資模型,將各個學科的作用發揮出來,再經信息處理后借助大數據來幫助投資者作出科學的投資。換而言之,量化擇時的數據是經計算機處理后的,因此投資決策更科學,極大地減少了人員的工作負擔,提升了投資決策的高效性。
(二)引入RNN
運用Python建立了基于RNN的期貨市場預測模型,并使用滬深300股指期貨數據進行了檢驗,訓練集準確率與測試集準確率都較為滿意。
利用建立好的模型預測具有代表性的四類大宗商品期貨價格走勢,經過不斷調整模型,來獲得近3個月的預測值與真實值的走勢圖,使R^2等于95%,最終確定近3個月使收益率最大的最優投資組合。
(三)引入Origin
Origin是一個具有電子數據表前端的圖形化用戶界面軟件。Origin支持各種各樣的2D/3D圖形。Origin中的數據分析功能包括統計、信號處理、曲線擬合以及峰值分析。Origin中的曲線擬合是采用基于Levernberg-Marquardt算法(LMA)的非線性最小二乘法擬合。Origin強大的數據導入功能,支持多種格式的數據,包括ASCII、Excel、NI TDM、DIADem、NetCDF、SPC等等。圖形輸出格式多樣,例如JPEG、GIF、EPS、TIFF等。內置的查詢工具可通過ADO訪問數據庫數據。
總的來講,Origin在數據分析方面功能更強大,從操作上來講,Origin更容易上手;此外,Origin還能滿足數據擬合的功能,內嵌了非常豐富的函數庫,相較于其他平臺,數據擬合變得更加容易操作,更加靈活。