999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于強化學習的資產組合配置優化

2021-07-17 16:13:06羅曉牧
錦繡·中旬刊 2021年7期
關鍵詞:智能環境實驗

本文主要使用強化學習對三支股票進行資產組合,并與傳統的投資組合理論進行比較。實驗結果表明,基于強化學習的方法,可以對資產進行有效的配置,在特定的情況下優于傳統的投資組合理論。

1.背景

強化學習是人工智能中最有趣的分支之一,在眾多的問題中已經顯示出其力量,震驚世界,包括擊敗世界象棋冠軍,圍棋冠軍,甚至在游戲 DotA 2中勝出 [1]。使用強化學習進行股票交易,一直被數據科學家認為是一個“圣杯”。

使用機器學習進行股票交易有多種方式。一種方法是使用預測模型對股價的波動進行建模,然后使用基于啟發式的機器人根據預測值進行操作。另外一種方法是建造一個機器人,這個機器人可以直接根據股票的波動進行操作,包括買、賣、不操作。這是一種十分適合強化學習的環境,因為我們只有當交易結束的時候才知道我們操作的累積結果。

2.問題描述

我們可以將問題描述為:給定三支不同的股票的歷史數據,我們應該如何將固定總量的資金分配到這些股票上,使得最終收益最大。隨著時間的改變,策略需要根據最新的信息重新構建投資組合,做出最優的分配。

我們的解決方案就是構造出一個強化學習模型,然后智能體在每一個時刻根據每個股票的指標值進行資金分配。我們將基于強化學習的策略與馬科維茨 (Markowitz) 的有效邊界理論作對比——對于大部分的基金經理都是使用馬科維茨的理論以及各種直覺做出資產配置的 [2]。

3.強化學習

強化學習的主要任務是設計出一個“智能體”,然后這個“智能體”不斷地與“環境”交互,通過系統性地試錯,得出最終的“行動方案”?!碍h境”可以是游戲,如象棋或者圍棋,也可以是更加具體的任務,如走出迷宮,或者拿到一個物品?!爸悄荏w”就是執行動作的機器人。

通過與環境交互,“智能體”將得到“獎勵”。智能體不斷學習各種“行動”,期望能從環境中得到更多的“獎勵”。如果智能體得到的累積獎勵超過一定的閾值,則我們認為它已經很好地適應了環境。

我們將設計出一個智能體,使用某種策略與交易環境進行交互,以達到最大的投資組合收益。對于我們的問題,就是要決定投資組合的維持比例,如:30%股票A,40%股票B,20%股票C,10%現金,然后智能體就會得到一個正的或者負的反饋。通過反復的嘗試,智能體將不斷迭代策略,直到得出在給定的環境狀態下的最佳行動方案。

4.環境設置

為了模擬真實的交易環境,智能體可以與環境進行以下的交互:

步驟 1:環境提供三支股票的當前狀態的指標;

步驟 2: 智能體對環境做出一個動作。這個動作就是資產組合的分配。例如:10%現金,40%股票 1,35%股票 2,15%股票

步驟 3:環境狀態更改,前進一個時刻點,返回新的狀態,并且得到之前資產組合的獎勵。

步驟 1 到步驟 3 不斷重復直到一次實驗的結束。每一步驟得到的獎勵累積起來就是總的獎勵。我們的目標就是要最大化每次實驗的總的獎勵。

每次環境重置都會從全體數據庫中抽取出不同的片段。每次的環境都不相同,這能夠避免智能體記住了環境。更進一步,智能體的訓練和評價,都是在不同的環境下進行的。因此,智能體從數據中的一部分中學習策略,從另一部分數據中進行評估。我們評價強化學習模型和馬科維茨模型都是使用相同的步驟。

5.馬科維茨有效邊界模型

馬科維茨的有效邊界模型是評價資產組合的風險與收益的框架模型。投資組合的收益是投資組合每一個時間點的收益的均值。風險是每日收益的標準差,用于評價股票的波動率。基金經理根據每一種投資組合的風險與收益,畫出有效邊界然后做出決策。有效邊界上的每一個點都顯示了在給定風險組合的情況下得到的最高收益。在我們的實驗中,我們設計了一種智能體,能根據之前 30 個時刻的投資組合表現,構造出一個中等風險高收益的組合。

6.實驗結果比較

對于強化學習,我們使用了未經調優的 Actor Critic 模型,運行了 100 次的環境實驗,平均收益為 +20%。對于馬科維茨模型,其實驗結果為-1%。有效邊界模型的表現并不好,也許是因為我們所挑選股票的高波動性。當所有的股票價格下降時,基于強化學習的模型會賣出股票增加手里的現金。并且,強化學習模型可以捉住每一次價格的波動并利用起來。因此,基于強化學習的資產組合配置,其表現優于傳統的馬科維茨模型。

參考文獻

[1] https://www.geeksforgeeks.org/what-is-reinforcement-learning/

[2] https://zhuanlan.zhihu.com/p/166163706

作者簡介:羅曉牧(出生年月1980-),性別:男,廣東省廣州市(籍貫),現職稱:副教授,學歷:工科博士研究生畢業,研究方向:機器學習,無線傳感器網絡,生物信息獲取.廣州中醫藥大學醫學信息工程學院.

猜你喜歡
智能環境實驗
記一次有趣的實驗
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
孕期遠離容易致畸的環境
做個怪怪長實驗
環境
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 真实国产乱子伦视频| 99热这里只有精品在线播放| a级毛片毛片免费观看久潮| 亚洲中文久久精品无玛| 亚洲手机在线| a级毛片免费看| 日韩A级毛片一区二区三区| 午夜精品久久久久久久无码软件| 色婷婷亚洲综合五月| 婷婷伊人久久| 毛片a级毛片免费观看免下载| 在线国产欧美| 亚洲一区精品视频在线| 亚洲男人天堂2020| 一区二区理伦视频| 色网站免费在线观看| 国产性生大片免费观看性欧美| 91久久青青草原精品国产| 五月激情婷婷综合| 国产精品尹人在线观看| 国产高颜值露脸在线观看| 亚洲三级色| 色老二精品视频在线观看| 欧美自慰一级看片免费| 欧美精品色视频| 波多野结衣无码AV在线| 欧美国产综合色视频| 久久永久免费人妻精品| 免费在线色| 人妻精品久久久无码区色视| 欧美天堂在线| 欧美一级色视频| a天堂视频| 一级片一区| 午夜视频免费一区二区在线看| 伊人色天堂| 欧美一区二区丝袜高跟鞋| 亚洲无码精品在线播放| 亚洲中文字幕国产av| 国产成人高精品免费视频| 日韩精品免费一线在线观看| 五月丁香伊人啪啪手机免费观看| 亚洲AⅤ永久无码精品毛片| 亚洲精品色AV无码看| 色婷婷狠狠干| 国产精品999在线| 国产精选小视频在线观看| a级毛片免费播放| 久久先锋资源| 一本大道视频精品人妻| 伊人中文网| 日韩一区二区三免费高清| 99ri精品视频在线观看播放| 国产成人免费| 秘书高跟黑色丝袜国产91在线 | 999国内精品久久免费视频| AV在线麻免费观看网站| av天堂最新版在线| 曰韩免费无码AV一区二区| 六月婷婷激情综合| 亚洲无码A视频在线| 久久久久久久97| 日韩亚洲综合在线| 国产激情在线视频| 九九久久精品免费观看| 久久久久免费精品国产| 国产专区综合另类日韩一区 | 国内精品视频区在线2021| 国产成人无码Av在线播放无广告| 欧美精品亚洲二区| av手机版在线播放| 国产自在线拍| 免费播放毛片| 国产永久在线视频| 无码网站免费观看| 四虎AV麻豆| 亚洲国产精品成人久久综合影院 | 人妻少妇久久久久久97人妻| 亚洲无码视频图片| 97国产精品视频自在拍| 丰满人妻被猛烈进入无码| 真实国产精品vr专区|