999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習下量化選股的分析

2018-05-31 02:49:24楊亞東
商情 2018年14期
關鍵詞:機器學習

楊亞東

【摘要】股票市場屬于非線性系統,復雜性高而信噪比低。目前,多個領域中已經證實,機器學習是一種能夠針對模糊非線性數據建模的工具,所以機器學習具有天然的應用到量化投資領域的優勢。從本質上看,選股是排序問題,投資者希望在眾多的股票中選擇出具有更好未來表現的股票。基于此,本文分析了利用機器學習量化選股的方法。

【關鍵詞】機器學習 量化投資 選股

相對于國外來說,我國屬于剛剛開始發展量化投資,存在的不足之處仍比較多,但從實際情況看,A股市場具有較短的發展歷程,與已經發展的比較成熟的海外市場相比,市場有效程度比較弱,錯誤定價的股票數量比較多,普遍存在非理性人投資行為,也正是因為此種不成熟特征的存在,為我國量化投資的發展提供了巨大的空間。因此,在現階段A股市場中,更適合的量化投資方式為公正、理性、客觀的。由此看來,本文研究量化選股的方法具有十分重要的現實意義。

一、短線選股策略

本節構建樣本集時,特征選擇為20個交易日內個股的收盤價走勢,訓練樣本方法采用兩種,分別為機器學習算法GBDT、GBRank,模式識別有機器學習自動進行。

(一)數據準備

需準備的數據包含2部分,一部分為樣本內數據,屬于訓l練集,另一部分為樣本外數據,屬于測試集。本文數據均來源于Wind資訊,時間段為2006年1月1日2016年11月30日,均為A股收盤價。之后分割該時問段的數據,使其變為不存在交集的兩部分,訓練樣本使用2006年1月1日2012年11月5日數據,測試樣本使用剩余時間段的數據。訓l練樣本和測試樣本生產時,如果股票上市后的交易日未滿21個,做剔除處理,最后,生產約240萬訓練樣本。

(二)提取特征

構建策略時,關鍵性的一步為特征提取,因本章短線選股策略是在模式識別基礎上進行的,因此,關注K線形態特,征過程中僅選擇20個交易日的。首先,通過指數移動平均線,過濾到收盤價的噪聲,隨后進行價格走勢形態特征向量的描述,描述序列為收益率序列,最后,完成特征提取。

(三)模型訓練

排序模型訓練時,利用兩種算法進行。第一種為GBDT,訓練中,股票問相對順序不做考慮,僅擬合其絕對得分,訓練樣本構建過程中,3個交易日后,若樣本漲幅≥1%,則得分=1,否則樣本得分=O,根據此種方式,訓練樣本集即可獲得,接著以訓練樣本集作為GBDT的輸入樣本集,訓練排序模型,此過程中,由于GBDT存在較多的參數,如果調參采用交叉驗證方式,將會耗費大量的時間,因此,本文按照知識和經驗,調優逐步的進行,完整訓練后,排出函數h輸出,通過h,即可開展打分操作,依據分數由高到低,排序未來3天內漲幅會超過1%的股票,供投資者選擇。第二種為GBRank,這是一種pairwise方法,僅對同一時段內股票的相對漲跌幅做出考慮,保證訓練樣本不會受到系統性風險的影響,訓練樣本集獲取后,輸入到GBRank中,訓練排序模型,參數直接選擇相同于GBDT的,最終,排除函數h獲得,排序未來3天內股票的表現。

二、長線選股策略

因短線選股策略僅能排序3天以內的,時間較短,本節提出的長線選股策略可排序未來20個交易日內的股票。

(一)數據準備

本節中,數據來源、選取時間段、劃分訓練樣本和測試樣本的方法均相同于1.1,不過,訓練樣本和測試樣本生成時,要將股票上市時間不足3個月的剔除,以能與44維的要求相符合。最后,生成約160萬的訓練樣本。

(二)特征提取

因要構建長線選股策略,因此要對個股在過去20個交易內、2個月交易日內、3個月交易日內的動量因子做出關注。首先。動量、反轉效應特征向量描述時,采用的序列為個股動量因子序列,z-score標準化處理每一維度的特征向量;其次,以元素所處維度為依據,將每個元素的分位數計算出來;最后,組合上述兩步處理后的特征向量,使特征向量達到44維,此種特征向量能夠輸入到機器學習中。

(三)模型訓練

模型訓練時,同樣采用1.3中的兩種方法。利用GBDT訓練過程中,訓練方式采用pointwise,無需對股票問相對順序做出考慮,僅需擬合其絕對分數,20個交易日后,與股票漲幅均值相比,樣本股價漲幅更大時,得分=1,樣本股價漲幅更小時,得分=O,此處劃分樣本參照的標準為漲幅均指,以能保證排序的客觀性、準確性,隨后,獲得訓練樣本集,并輸入到GBDT中,訓練排序模型,由于本節特征向量維度要顯著高于1.3節的,因此設置參數時會不同于1.3,要增加回歸樹最大深度、并增加葉子結點數上限,完成訓練后,排序函數h獲得,通過h,即可完成未來20個交易日內的股票排序工作。利用GBRank訓練過程中,訓練方法相同于1.3此種方法,獲得訓練樣本集后,輸入到GBRank中,接著訓練排序模型,設定的參數完全相同于本節的GBDT方法,最終,排序函數h獲得,完成排序。

三、結論

機器學習基礎上,本文構建了短線和長線量化選股策略,能夠排序未來3個交易日及未來20個交易日內的股票,利于投資者實現量化選股,從而提高投資者投資的理性程度,促進我國A股市場的良好發展。不過,本文構建選股策略后,并未進行實際的實驗,因而還需要進一步的開展驗證研究。

參考文獻:

[1]馮楠,陳有為.基于量化趨勢跟蹤的計算機自動化選股模型的設計與實現[J].自動化與儀器儀表,2016,(08).

[2]李姝錦,胡曉旭,王聰.淺析基于大數據的多因子量化選股策略[J].經濟研究導刊,2016,(17).

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 免费高清毛片| 国产99视频在线| 欧美a级完整在线观看| 国产三级韩国三级理| 成人国产小视频| 在线精品亚洲国产| 天堂va亚洲va欧美va国产 | 国产区人妖精品人妖精品视频| 欧美日韩一区二区在线播放| 亚洲最新网址| 色香蕉网站| 国产一二三区视频| 成人免费黄色小视频| 韩日免费小视频| 亚洲欧美日韩色图| 91免费片| 欧洲精品视频在线观看| 热久久这里是精品6免费观看| 亚洲天堂首页| 日本人又色又爽的视频| 亚洲无码视频图片| 欧美不卡视频在线观看| 亚洲精品国产自在现线最新| 亚洲成人网在线播放| 国产日韩欧美在线视频免费观看| 毛片最新网址| 99久久精品视香蕉蕉| 国产福利一区视频| 亚洲国产日韩在线成人蜜芽| 伊人久久青草青青综合| 精品国产乱码久久久久久一区二区| 亚洲中字无码AV电影在线观看| 国产毛片高清一级国语 | 日韩资源站| 狂欢视频在线观看不卡| 啪啪永久免费av| 国产黑人在线| 97在线观看视频免费| 免费A∨中文乱码专区| 大香伊人久久| 久久午夜夜伦鲁鲁片不卡| 亚洲一区二区日韩欧美gif| 午夜无码一区二区三区| 欧美成人精品欧美一级乱黄| 亚洲成人黄色网址| 一区二区在线视频免费观看| 国产精品免费电影| 亚洲国产亚综合在线区| 国产精品亚洲一区二区三区在线观看| 91色在线观看| a级毛片毛片免费观看久潮| 免费一看一级毛片| 老色鬼久久亚洲AV综合| 青青操国产视频| a级高清毛片| 久久人搡人人玩人妻精品| 午夜日韩久久影院| AV无码国产在线看岛国岛| 国产欧美日韩综合一区在线播放| 国产一级无码不卡视频| 国内精品视频| 日韩无码真实干出血视频| 日韩高清一区 | 国产成人高清精品免费软件| 2020国产免费久久精品99| 国产爽歪歪免费视频在线观看 | 精品无码日韩国产不卡av | 19国产精品麻豆免费观看| 久久频这里精品99香蕉久网址| 四虎永久免费地址| 国产农村1级毛片| 亚洲综合精品香蕉久久网| 午夜a级毛片| 国产激情无码一区二区免费 | 日韩成人在线视频| 小13箩利洗澡无码视频免费网站| 久久伊人色| 尤物午夜福利视频| 欧洲精品视频在线观看| 国产精品视屏| 国产在线98福利播放视频免费| 99这里只有精品6|