999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結合纏論和深度學習的股價拐點預測研究

2022-08-19 08:34:00田紅麗楊瑩瑩閆會強
計算機工程與應用 2022年16期
關鍵詞:模型

田紅麗,楊瑩瑩,閆會強

1.河北工業大學 人工智能與數據科學學院,天津 300401

2.河北工業大學 經濟管理學院,天津 300401

國民經濟發展迅速,金融投資重要性凸顯,股票預測既是研究熱點,亦是研究難點。人工智能在股票市場的應用主要集中于股價預測與拐點預測,股票價格受多方面因素影響,預測具體的價格存在困難[1]。股價拐點是反映股票價格趨勢變化的“信號”,可以使投資者快速發覺股票的變化趨勢。由于交易成本的存在,日內交易基本無法獲利,對于將股票作為長線投資的股民來說,找到股票的買賣點,高拋低吸,以獲得最大收益至關重要。股市拐點預測可以為投資者提供一定的買賣信號,因此股價拐點預測在股票投資之中存在重要意義[2]。

在證券市場之中,大數據成為信息的主要存儲方式,海量數據中蘊含著常規方法無法提取的特征。從線性模型到非線性模型,研究者們嘗試了多種方式對股票市場進行挖掘與預測,如支持向量機[3]、卷積神經網絡[4-5]、灰色模型[6]和長短期記憶網絡[7-8]等。鄭興等將加權支持向量機應用于股票反轉點的預測[9]。程一梅將SMOTE 過采樣算法與支持向量機相結合,平衡數據集中不同類別樣本的差異,以提升拐點預測的準確率[10]。Chen等將主成分分析算法與加權支持向量機相結合對股市拐點進行預測[11]。Luo等結合分段線性化和加權支持向量機對股票市場的交易信號進行預測[12]。藺曉運用卷積神經網絡,與全連接的多層感知器相結合對股市拐點進行預測[13]。石陸魁等將最小方差算法與支持向量機相結合,對股市拐點進行預測[14]。對于上述模型,均未將股票的長短期趨勢進行充分利用,在拐點標注的過程中未考慮無法為投資者帶來收益的偽分型,未從投資者所獲收益的角度出發,對預測結果的實際收益率進行探討,模型的實際收益模糊。

本文結合纏論和深度學習對股票價格的拐點進行預測。為提升模型的實際收益率,拐點標注過程中基于纏論刪除股市中存在的偽分型,并與股市的長短期趨勢相結合作為拐點預測模型的輸入特征。由于拐點數據集是典型的不平衡數據集,提出一種結合SMOTE 過采樣算法[15]、引入焦點損失函數的卷積神經網絡(convolutional neural network with focal loss,FLCN)與加權支持向量機(weight support vector machine,WSVM)的混合模型,以緩解數據類別不平衡帶來的分類困難問題,提升模型性能,為投資者提供投資信號,提高收益率。

1 股票數據集處理

1.1 技術指標

技術指標是股票市場中判斷股價漲跌趨勢的有力武器。近年來,諸多學者將技術指標與股票基本數據相結合對股票價格進行預測,技術指標的選擇主要集中于MACD、KDJ、OBV、RSI 等。眾多技術指標在股票市場具有不同的功能:MACD 利用快、慢速移動平均線之間的聚合與分離的狀況,對買賣的時機進行判斷;KDJ 適用于分辨個股超買超賣的情況;BIAS 對移動平均線的使用功能進行具體量化。由此可見,不同的技術指標從不同角度對股票進行解析。本文對股票市場進行綜合考慮,采用MACD、OBV、KDJ、BIAS、MA5 等技術指標作為輸入特征。其中MACD與MA5指標代表股票的趨勢特征;KDJ、BIAS 與RSI 代表股票的震蕩特征;OBV代表股票的能量特征。

1.2 基于纏論的拐點標注

纏論作為一種原理型的技術分析理論,試圖采用數理學與完全分類的方式來解析股票價格與走勢的變化規律。K 線圖將股票在特定周期內的開盤價、收盤價、最高價和最低價等漲跌變化狀況以圖形的方式表現出來。在K線圖中,該理論對走勢采用完全分類的畫線分析方式,并提出交易市場“走勢終完美”的哲學思想。本文根據纏論對周K線與日K線的拐點進行標注。

1.2.1 分型

拐點蘊含在分型之中,若要獲取拐點,首先需要提取出股票K線中存在的分型。

頂分型:相鄰三根K 線之中,中間一根K 線的最高價,是三根K 線中最高價的最大值,并且其最低價是三根K線中最低價的最大值,此三根K線的組成則構成頂分型,如圖1(a)所示。

底分型:相鄰三根K 線之中,中間一根K 線的最高價,是三根K 線中最高價的最小值,并且其最低價是三根K線中最低價的最小值,此三根K線的組成則構成底分型,如圖1(b)所示。

圖1 頂分型與底分型示意圖Fig.1 Schematic diagram of top typing and bottom typing

1.2.2 包含關系

分型判斷過程中,可通過K線信息直接獲取的分型稱為直接型分型;而隱藏在K線信息之中的分型稱為猶豫型分型。若需要獲取猶豫型分型,需要先對其進行包含關系處理。包含關系是股價K 線圖中一種常見的存在形式,若不對其進行處理,將極有可能錯失蘊含著重要拐點的分型,影響實驗結果。相鄰兩根K 線用K1與K2表示,open_1、open_2、close_1、close_2、high_1、high_2、low_1、low_2 分別代表兩根K 線的開盤價、收盤價、最高價與最低價。包含關系處理如下。

上升趨勢中:

(1)若high_1<high_2且low_1>low_2,則將low_1的值賦給low_2,使low_2=low_1,其他數據不改變。

(2)若high_1>high_2且low_1<low_2,則將high_1的值賦給high_2,使high_2=high_1,其他數據不改變。

下降趨勢中:

(1)若high_1>high_2且low_1<low_2,則將low_1的值賦給low_2,使low_2=low_1,其他數據不改變。

(2)若high_1<high_2且low_1>low_2,則將high_1的值賦給high_2,使high_2=high_1,其他數據不改變。

1.2.3 筆

兩個相鄰的頂底分型可以構成一筆。纏論理論下的一筆至少包括7根K線。筆的組成包括頂分型、底分型與至少一根既不屬于頂分型也不屬于底分型的K線。如圖2(a)所示,由頂分型與底分型構成的筆稱為向下筆;反之,如圖2(b)所示,由底分型與頂分型構成的筆稱為向上筆。

圖2 向下筆與向上筆示意圖Fig.2 Schematic diagram of pen down and pen up

1.2.4 偽分型處理

纏論理論要求:相鄰分型間不可共用同一根K 線;股票的頂分型與底分型交替存在;一筆由至少7根K線組成;頂分型的頂應高于相鄰底分型的底。若不符合任意一項要求,則表示存在偽分型。偽分型即其K線結構符合分型特征,卻蘊含著無法為投資者帶來收益的假拐點。在所有分型中,頂分型包含著向下拐點;底分型包含著向上拐點;而偽分型并不包含拐點。因此,在進行拐點標注的過程中,去除不包含拐點的偽分型。

1.3 長短期趨勢的結合

對于股票市場,長周期波動大,作為買賣點不夠精確,需要短周期進行配合。本文的長短期趨勢信息通過不同頻率的K 線信息進行獲取。高低頻K 線信息分別選擇股票價格的日K 線信息與周K 線信息。以短周期為基準,將長周期趨勢信號融入短周期之中。根據纏論理論對分型與筆的概念要求,可以得出前一個分型出現后,下一分型與前一分型相反,且距離下一個分型出現至少存在一根K線,即距離下一個拐點出現至少兩根K線。如圖3 所示,對周K 線進行解析,陰影K 線代表不可能形成拐點的區域,則前一個分型出現后的二周內不會出現大周期上的趨勢反轉;虛線框部分的K線表示可能形成拐點的區域。長短期趨勢結合即將周趨勢以信號的方式加入到短周期數據集之中。如周K 線的向下筆,頂分型出現后的兩周間,K線將呈現下降趨勢,不構成拐點,因此在該區間的日數據集中以(-1,-1)的信號進行標注。兩周之后的每一周均存在構成向上拐點的可能性,即以(1,0)的信號標于日數據集之中,直至下一個底分型出現;向上筆,即底分型出現后的兩周,周趨勢以信號(1,1)標注于日數據集,兩周之后,以(1,0)標注于日數據集,直至下一頂分型出現。

圖3 趨勢結合信號圖Fig.3 Trends combined with signal graphs

2 SMOTE-FLCN-WSVM拐點預測模型

SMOTE-FLCN-WSVM 股價拐點預測模型由合成少數類過采樣技術(synthetic minority oversampling technique,SMOTE)、引入Focal Loss 的卷積神經網絡(FLCN)與加權支持向量機(WSVM)三部分組成。拐點預測模型如圖4所示。

圖4 拐點預測模型Fig.4 Turning point prediction model

2.1 SMOTE過采樣算法

股票拐點數據集是典型的不平衡數據集,其拐點樣本在所有數據中占比不足20%,因此在神經網絡的學習中,容易對拐點樣本造成特征學習不足的現象,分類結果則偏向于多數類別。SMOTE算法[10]的基本思想是對少數類樣本進行分析和模擬,通過KNN 近鄰算法對每一個少數類樣本x隨機選取一個少數類樣本y,通過式(1)產生新樣本[16]。

其中,x代表原始數據集的一個少數類樣本;rand( 0,1)代表0到1之間的隨機數;y代表以x為中心附近隨機選取的K近鄰少數類樣本。

2.2 FLCN特征提取模型

FLCN 模型為引入Focal Loss 的卷積神經網絡模型。FLCN網絡結構如圖5。

圖5 FLCN網絡結構Fig.5 FLCN network structure

卷積神經網絡具有特征提取能力。基本結構包括輸入層、卷積層(convolutional layer)、池化層(pooling layer,也稱為取樣層)、全連接層和輸出層。網絡中卷積層的作用是對輸入數據進行特征提取,如式(2)所示;數據經過卷積層的特征提取后進入池化層,池化層的作用是數據特征降維。全連接層整合卷積層或者池化層中具有類別區分性的局部信息。該層神經元的激勵函數一般采用ReLU激活函數。

其中,x代表輸入特征向量;w代表卷積核;k代表卷積核尺寸;*代表卷積運算;b為偏置項;f()· 代表激活函數;ci代表經過卷積層的輸出特征向量。

在平衡數據集的多分類任務中,交叉熵損失函數(Cross Entropy Loss)為最常用的損失計算函數,它的表達式:

其中,p代表模型輸出的類別概率;y代表類別標簽。

焦點損失函數(Facal Loss)[17]于2017 年被Kaiming提出,首次提出被應用于解決one-stage 目標檢測中正負樣本比例嚴重失衡問題。在不平衡數據集分類中,Focal Loss 函數通過對少數類樣本內部加權以緩解類別不平衡問題。Focal Loss 函數在Cross Entropy Loss函數的基礎上增加兩個參數αt和γ。其中αt為平衡因子,用來處理類別數量的不均衡問題,若某一個類別的樣本數量占總數量的比值較高,則適當降低該類別α值的大小;反之,適當增大。γ為懲罰項,使損失函數專注于難分類的樣本。Focal Loss函數的表達式:

其中,p代表模型輸出的類別概率;α為平衡因子;γ代表難易樣本權重;y為樣本類別標簽。

2.3 加權支持向量機

支持向量機(support vector machine,SVM)的基本思想為在特征空間中尋找可以將不同類別樣本分開的超平面,并使得不同樣本間距離最大。假設樣本數據集,則支持向量機的初始目標函數表達式:

其中,C代表懲罰參數;ξi代表松弛變量;w代表超平面w·xi+b=0 的法向量;b代表超平面的偏置項;xi與yi代表數據集樣本。對上式進行拉格朗日求解,可得其對偶公式:

相應的高維空間的決策函數公式:

對于不平衡數據集,少數樣本類別對分類貢獻較小,普通的支持向量機并不適用于該類問題。為平衡各類別的貢獻率,引入類別權重參數(class weight)增大少數類樣本權重,同時減小多數類樣本權重,則初始目標函數的改變公式:

其中,σi代表類別權重,其余與式(5)相同。則該公式的對偶公式:

相應的分類決策函數公式:

支持向量機將線性不可分數據映射到高維特征空間的工具為核函數,本研究選擇徑向基核函數作為樣本數據向高維的映射工具。RBF核函數公式:

其中,(x,y)代表樣本數據;K(x,y)代表映射后的高維樣本數據。

支持向量機運算過程中存在兩個重要的參數C和γ,實驗采用網格尋優方法對兩參數進行調整,尋求最優參數。懲罰因子C的范圍大小設置為(1,3),以0.2為步長進行尋優;γ的范圍設置為(1,2),同樣以0.2 為步長進行參數尋優。

2.4 SMOTE-FLCN-WSVM拐點預測模型

為提升拐點預測模型的性能,提出了SMOTE-FLCNWSVM混合模型。近年的研究中,SMOTE算法被廣泛應用于不平衡數據集的處理,但該算法合成的數據為模擬數據,無法完全替代真實數據,因此本文在特征提取模塊引入Focal Loss 函數,并與SMOTE 算法結合以解決不平衡數據集特征提取困難的問題。數據集進行拐點標注后,對非拐點樣本、向上拐點樣本和向下拐點樣本以{x1:x2:x3} (x1>x2=x3)的比例進行SMOTE 運算,一定程度上緩解拐點與非拐點比例嚴重失衡的問題。經過SMOTE 算法的拐點數據集依然存在不平衡,特征提取過程使用FLCN模型,以{x3:x2:x1} 的比例調節不同類別損失函數的權重系數,增大少數類別對損失函數的貢獻率。該方式不僅改善了單獨使用SMOTE算法造成合成數據過多致使數據集缺乏真實性的問題,也緩解了數據樣本極度不平衡造成預測結果偏斜嚴重的問題。FLCN模型提取的的特征作為輸入進入WSVM模型。

3 實驗結果與分析

3.1 實驗環境

本文在Windows10操作系統的計算機上進行,仿真平臺選取Pycharm,模型搭建框架為Keras,編程語言為Python,編程所用數據包包括tushare、sklearn、pandas、numpy、talib、matplotlib等。

3.2 實驗設定

本文選取的數據集輸入特征包含開盤價(open)、收盤價(close)、最高價(high)、最低價(low)、成交量(volume)、MACD、KDJ 等。不同數據間存在量級差異,因此本文對數據進行歸一化處理。為驗證該研究模型的有效性,在實驗對象的選擇中,對所選對象的交易數據有一定的要求,選擇每日的成交額均大于一億的股票,若股票的成交額小于一億,則在投資者進行投資的過程中,投資金額在當日成交額中所占比例無法忽略不計,投資者投入金額將推動股價以相對其價值以上的價格進行估值,造成該支股票短期急速增長,市盈利攀升,價格與其價值背離,而產生股市泡沫現象。相對而言,模型適用于對交易額影響較小的中小型投資者。為驗證模型的實用價值,且可與基金業績形成對比,實驗數據選取股票1(滬深300綜合指數)、股票2(中證500指數)以及股票3(上證50指數)三支股指作為實驗對象。

3.3 結果分析

首先,依據纏論思想對股價拐點信息進行標注。三支股指的原始K 線數據與拐點標注如圖6~圖8 所示。由于篇幅原因,拐點標注圖示僅展示2017年1月至2019年12月3年的數據。

圖6 滬深300指數拐點標注示意圖Fig.6 Shanghai and Shenzhen 300 index turning point

圖8 上證50指數拐點標注示意圖Fig.8 Shanghai 50 index turning point

依據圖6、圖7可以看出,依據纏論理論可以較準確地提取出股指價格的拐點,因此基于纏論理論對股價的拐點進行標注是有效的。

圖7 中證500指數拐點標注示意圖Fig.7 CSI 500 index turning point

依據本文提出的拐點預測模型,將預測出的向上拐點與向下拐點分別作為股票市場的買點與賣點,進行一年期與三年期的模擬交易。從實用性角度,以收益率作為評價標準,對模型的實用性進行評判,股票收益率(R)的計算公式如下:

本文選取三支股指2006年1月4日至2019年12月31日共13年的歷史數據作為實驗數據。集合的劃分過程中,短期收益選取2019 年1 月4 日至2019 年12 月31日共1 年數據作為驗證集;長期收益選取2017 年1 月4日至2019年12月31日共3年數據作為驗證集。從絕對收益率與相對收益率兩個角度對收益結果進行討論。絕對收益率指的是其凈值的增長率,相對收益率為其絕對收益率與同時期基金業績漲跌幅的差值。基金即集中眾多中小型投資者的資金,委托專業投資人進行量化選股投資。本文的相對收益的基準選擇各范圍基金業績的中位數,原因是中位數代表整個基金業績的平均水平。若個人投資者可通過模型獲取基金業績平均水平的收益且可免除基金手續費,代表該模型具有實用價值。其中,相對收益率1代表與同類基金業績的中位數相比較;相對收益率2為與全部股票型基金業績的中位數相比較;相對收益率3為與全部基金業績的中位數相比較。

根據表1 結果可以得到,無論短期交易或長期交易,三支股指的絕對收益均為正,代表依據該模型進行投資,均可獲利。以基金業績為基準,僅股票3 的相對收益率2為負,其余均為正,表示在絕大多數的情況下,該模型的收益率高于基金業績平均水平。證明了本文模型的實際應用價值。

表1 股票收益率Table 1 Stock return

為驗證本文模型的性能,按一年期模擬交易的數據進行數據集劃分。選取WSVM[9]、SMOTE-SVM[10]與結合主成分分析的加權支持向量機(PCA-WSVM)[11]三類模型與本文模型進行對比實驗。選取準確率(Accuracy)和收益率對模型性能進行評估。準確率計算公式如下:

其中,TP代表正確的劃分為正例的個數;FP代表正確的劃分為負例的個數;P代表被劃分為正例的個數;N代表被劃分為負例的個數。

根據表2可知,本文模型的準確率與收益率優于對比實驗模型,再次證明了本文模型的有效性與實用性。

表2 模型效果比較Table 2 Model effect comparison

4 結束語

本文基于纏論理論,將卷積神經網絡與支持向量機進行改進與結合,提出一種結合纏論和深度學習的SMOTE-FLCN-WSVM股價拐點預測模型。首先,利用纏論對股價拐點進行標注,并將股價的長短期趨勢進行融合。針對類別樣本失衡問題,利用SMOTE 過采樣算法對數據集進行預處理。之后,采用引入Focal Loss的卷積神經網絡(FLCN)進行特征提取,并使用加入類別權重參數的支持向量機進行分類。對三支股指進行預測,實驗結果從絕對收益與相對收益兩個角度,證明了模型可為投資者帶來收益,具有實際應用價值。經過對比實驗,再次證明了模型的有效性與實用性。此模型針對中小投資者,股票選擇也局限于日營業額高于一億的股票。下一步的工作,希望通過增加多方面信息以使模型適用于更廣泛類型的股票。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产无人区一区二区三区| 中文字幕天无码久久精品视频免费| 99资源在线| 国产一区二区免费播放| 成人在线观看不卡| 伊人查蕉在线观看国产精品| 播五月综合| 欧美日韩亚洲国产| 欧美成人国产| 99在线视频网站| 亚洲无码精品在线播放 | 国产一级在线观看www色 | 国产免费久久精品99re丫丫一| 白丝美女办公室高潮喷水视频| 国产精品自在在线午夜| 国产簧片免费在线播放| 国产肉感大码AV无码| 亚洲无码91视频| 九九热这里只有国产精品| 手机在线看片不卡中文字幕| 色婷婷综合在线| 国产精品太粉嫩高中在线观看| 真人高潮娇喘嗯啊在线观看| 毛片网站在线看| 亚洲永久免费网站| 97国产一区二区精品久久呦| 久久中文字幕不卡一二区| 日本免费精品| 一级毛片免费高清视频| 亚洲人成色在线观看| 久久精品无码国产一区二区三区| a欧美在线| 亚洲综合婷婷激情| 国产成人免费视频精品一区二区| 久久综合一个色综合网| 国产免费a级片| 亚洲欧美在线综合一区二区三区| 欧美天堂在线| 亚洲精品波多野结衣| 国产一线在线| 人妻无码中文字幕第一区| 狼友视频国产精品首页| 亚洲不卡无码av中文字幕| 亚洲毛片一级带毛片基地| 欧美五月婷婷| 国产高清免费午夜在线视频| 91久久偷偷做嫩草影院电| 沈阳少妇高潮在线| 亚洲人成网7777777国产| 亚洲成人免费在线| 亚洲高清国产拍精品26u| 伊人久久大香线蕉成人综合网| 国产精品一线天| 亚亚洲乱码一二三四区| 欧美成人午夜视频免看| 久久精品嫩草研究院| 亚洲首页在线观看| 欧美综合一区二区三区| 99精品伊人久久久大香线蕉| 伊在人亞洲香蕉精品區| 欧美日本二区| 爱做久久久久久| 91福利国产成人精品导航| 免费黄色国产视频| 国产亚洲精品自在线| 欧洲高清无码在线| 99免费视频观看| 国产日韩久久久久无码精品| 欧美日韩精品一区二区在线线 | 婷婷色中文网| 97久久超碰极品视觉盛宴| 国产在线91在线电影| 国产女人18水真多毛片18精品 | 一级片免费网站| 亚洲色大成网站www国产| 欧美精品亚洲二区| 天天综合网亚洲网站| 欧美亚洲欧美区| 国产精品香蕉在线观看不卡| 欧美三級片黃色三級片黃色1| 欧美日韩免费在线视频| 四虎国产成人免费观看|