999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習下量化選股的分析

2018-05-31 02:49:24楊亞東
商情 2018年14期
關鍵詞:機器學習

楊亞東

【摘要】股票市場屬于非線性系統,復雜性高而信噪比低。目前,多個領域中已經證實,機器學習是一種能夠針對模糊非線性數據建模的工具,所以機器學習具有天然的應用到量化投資領域的優勢。從本質上看,選股是排序問題,投資者希望在眾多的股票中選擇出具有更好未來表現的股票。基于此,本文分析了利用機器學習量化選股的方法。

【關鍵詞】機器學習 量化投資 選股

相對于國外來說,我國屬于剛剛開始發展量化投資,存在的不足之處仍比較多,但從實際情況看,A股市場具有較短的發展歷程,與已經發展的比較成熟的海外市場相比,市場有效程度比較弱,錯誤定價的股票數量比較多,普遍存在非理性人投資行為,也正是因為此種不成熟特征的存在,為我國量化投資的發展提供了巨大的空間。因此,在現階段A股市場中,更適合的量化投資方式為公正、理性、客觀的。由此看來,本文研究量化選股的方法具有十分重要的現實意義。

一、短線選股策略

本節構建樣本集時,特征選擇為20個交易日內個股的收盤價走勢,訓練樣本方法采用兩種,分別為機器學習算法GBDT、GBRank,模式識別有機器學習自動進行。

(一)數據準備

需準備的數據包含2部分,一部分為樣本內數據,屬于訓l練集,另一部分為樣本外數據,屬于測試集。本文數據均來源于Wind資訊,時間段為2006年1月1日2016年11月30日,均為A股收盤價。之后分割該時問段的數據,使其變為不存在交集的兩部分,訓練樣本使用2006年1月1日2012年11月5日數據,測試樣本使用剩余時間段的數據。訓l練樣本和測試樣本生產時,如果股票上市后的交易日未滿21個,做剔除處理,最后,生產約240萬訓練樣本。

(二)提取特征

構建策略時,關鍵性的一步為特征提取,因本章短線選股策略是在模式識別基礎上進行的,因此,關注K線形態特,征過程中僅選擇20個交易日的。首先,通過指數移動平均線,過濾到收盤價的噪聲,隨后進行價格走勢形態特征向量的描述,描述序列為收益率序列,最后,完成特征提取。

(三)模型訓練

排序模型訓練時,利用兩種算法進行。第一種為GBDT,訓練中,股票問相對順序不做考慮,僅擬合其絕對得分,訓練樣本構建過程中,3個交易日后,若樣本漲幅≥1%,則得分=1,否則樣本得分=O,根據此種方式,訓練樣本集即可獲得,接著以訓練樣本集作為GBDT的輸入樣本集,訓練排序模型,此過程中,由于GBDT存在較多的參數,如果調參采用交叉驗證方式,將會耗費大量的時間,因此,本文按照知識和經驗,調優逐步的進行,完整訓練后,排出函數h輸出,通過h,即可開展打分操作,依據分數由高到低,排序未來3天內漲幅會超過1%的股票,供投資者選擇。第二種為GBRank,這是一種pairwise方法,僅對同一時段內股票的相對漲跌幅做出考慮,保證訓練樣本不會受到系統性風險的影響,訓練樣本集獲取后,輸入到GBRank中,訓練排序模型,參數直接選擇相同于GBDT的,最終,排除函數h獲得,排序未來3天內股票的表現。

二、長線選股策略

因短線選股策略僅能排序3天以內的,時間較短,本節提出的長線選股策略可排序未來20個交易日內的股票。

(一)數據準備

本節中,數據來源、選取時間段、劃分訓練樣本和測試樣本的方法均相同于1.1,不過,訓練樣本和測試樣本生成時,要將股票上市時間不足3個月的剔除,以能與44維的要求相符合。最后,生成約160萬的訓練樣本。

(二)特征提取

因要構建長線選股策略,因此要對個股在過去20個交易內、2個月交易日內、3個月交易日內的動量因子做出關注。首先。動量、反轉效應特征向量描述時,采用的序列為個股動量因子序列,z-score標準化處理每一維度的特征向量;其次,以元素所處維度為依據,將每個元素的分位數計算出來;最后,組合上述兩步處理后的特征向量,使特征向量達到44維,此種特征向量能夠輸入到機器學習中。

(三)模型訓練

模型訓練時,同樣采用1.3中的兩種方法。利用GBDT訓練過程中,訓練方式采用pointwise,無需對股票問相對順序做出考慮,僅需擬合其絕對分數,20個交易日后,與股票漲幅均值相比,樣本股價漲幅更大時,得分=1,樣本股價漲幅更小時,得分=O,此處劃分樣本參照的標準為漲幅均指,以能保證排序的客觀性、準確性,隨后,獲得訓練樣本集,并輸入到GBDT中,訓練排序模型,由于本節特征向量維度要顯著高于1.3節的,因此設置參數時會不同于1.3,要增加回歸樹最大深度、并增加葉子結點數上限,完成訓練后,排序函數h獲得,通過h,即可完成未來20個交易日內的股票排序工作。利用GBRank訓練過程中,訓練方法相同于1.3此種方法,獲得訓練樣本集后,輸入到GBRank中,接著訓練排序模型,設定的參數完全相同于本節的GBDT方法,最終,排序函數h獲得,完成排序。

三、結論

機器學習基礎上,本文構建了短線和長線量化選股策略,能夠排序未來3個交易日及未來20個交易日內的股票,利于投資者實現量化選股,從而提高投資者投資的理性程度,促進我國A股市場的良好發展。不過,本文構建選股策略后,并未進行實際的實驗,因而還需要進一步的開展驗證研究。

參考文獻:

[1]馮楠,陳有為.基于量化趨勢跟蹤的計算機自動化選股模型的設計與實現[J].自動化與儀器儀表,2016,(08).

[2]李姝錦,胡曉旭,王聰.淺析基于大數據的多因子量化選股策略[J].經濟研究導刊,2016,(17).

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲一区二区在线无码| 久久无码免费束人妻| 国产精品七七在线播放| 国产成人午夜福利免费无码r| 欧美另类精品一区二区三区| 亚洲成人www| jizz国产视频| A级毛片高清免费视频就| 国产尤物在线播放| 天天综合色网| 久久性妇女精品免费| 久久黄色小视频| 综合色天天| 国产欧美高清| 久久国产乱子伦视频无卡顿| 国产精品亚洲片在线va| 一级毛片免费高清视频| 国产尤物视频在线| 国产精品一区在线观看你懂的| 欧美激情福利| 日韩高清无码免费| 国产午夜看片| 亚洲午夜天堂| 三上悠亚一区二区| 欧美在线综合视频| 欧美日韩在线成人| 成人精品区| 国产成人免费高清AⅤ| 国产精品手机在线观看你懂的| 扒开粉嫩的小缝隙喷白浆视频| 久久人人97超碰人人澡爱香蕉| 极品国产在线| 黄色免费在线网址| 欧美视频免费一区二区三区| 亚洲成a人片在线观看88| 国产亚洲精品yxsp| 2020久久国产综合精品swag| 91在线丝袜| 色成人综合| 亚洲欧美日韩精品专区| 国产精品极品美女自在线看免费一区二区 | 亚洲欧美日本国产综合在线| 狠狠v日韩v欧美v| 欧美一级高清片欧美国产欧美| 精品1区2区3区| 亚洲一区二区黄色| 国产精品jizz在线观看软件| 99视频全部免费| 亚洲综合极品香蕉久久网| 精品免费在线视频| 亚洲人成日本在线观看| 成人午夜视频网站| 在线国产毛片| 精品综合久久久久久97超人该| 亚洲品质国产精品无码| 国产日韩欧美视频| 国产不卡网| 亚洲天堂.com| 天堂在线www网亚洲| 91偷拍一区| 色婷婷成人网| 狼友av永久网站免费观看| 国产在线98福利播放视频免费| 午夜国产在线观看| 中国精品自拍| 欧美在线精品怡红院| a级毛片视频免费观看| 国产亚洲一区二区三区在线| 青草国产在线视频| 国产成人一区二区| 国产福利不卡视频| 91最新精品视频发布页| 日韩一级二级三级| 久久亚洲日本不卡一区二区| 亚洲国产成熟视频在线多多| 毛片卡一卡二| 青青草国产一区二区三区| 欧美国产成人在线| 一级香蕉视频在线观看| 好吊妞欧美视频免费| 激情视频综合网| 中国成人在线视频|