初探深度學習模型在國債ETF中的預測應用

2025-03-31 00:00:00王鈞弘

債券 2025年3期

摘要：本研究運用多源數據，借助CNN-LSTM-Attention的混合模型，對國債ETF價格漲跌的二分類問題進行預測，并通過系統的數據處理與特征工程，深入比較該混合模型與其他主流神經網絡模型的性能表現。研究表明，混合模型在國債ETF預測精度方面有一定的優勢，為后續AI賦能債券投資提供了參考依據。

關鍵詞：國債ETF 深度學習多源數據模型對比

引言

在金融科技蓬勃發展的浪潮中，以深度求索（DeepSeek）、ChatGPT為代表的大語言模型正迅速滲透到金融市場的各個角落，給傳統的金融證券投資領域帶來了前所未有的變革。這些模型憑借強大的自然語言處理能力和海量數據的學習能力，在投資策略制定、風險評估等方面展現出巨大的潛力。

當前，中國國債市場正處于一個特殊的發展階段，國債利率水平相對較低，靜態票息難以滿足投資者日益增長的收益需求。在此背景下，機構投資者們不得不將目光轉向債券的波段交易，期望通過精準把握國債等利率債品種價格的短期波動來實現收益的增厚。

隨著人工智能（AI）技術的飛速發展，深度學習模型在金融領域的應用日益廣泛。卷積神經網絡模型（CNN）、長短期記憶網絡模型（LSTM）、變換器模型（Transformer）等深度學習模型，以其強大的非線性擬合能力和對時間序列數據的處理能力，為國債 ETF 價格預測提供了全新的思路和方法。

本研究聚焦國債交易型開放式指數基金1（ETF），通過整合宏觀經濟數據、市場交易數據等多源信息，基于CNN-LSTM-Attention機制的混合模型，展開對國債ETF價格漲跌的預測研究，并將該混合模型與傳統的神經網絡三大模型的預測性能進行深入細致的對比分析。本研究旨在為債券投資者提供具有實操性的科學指導。

數據處理與特征工程

（一）數據來源

1.國債ETF行情數據

筆者通過萬得（Wind）收集了2015年1月1日至2024年 12月31日期間國債ETF的每日行情數據，包括開盤價、收盤價、最高價、最低價以及成交量等基礎信息。基于這些原始數據，進一步衍生計算出如 OBV（能量潮指標）、MA5（5日移動平均線）、WR（威廉指標）等關鍵技術指標，以全面反映國債ETF的市場交易特征。

2.宏觀基本面數據以及資金指標數據

筆者通過Wind收集了宏觀經濟和資金指標方面的數據，如國內生產總值（GDP）、工業品出廠價格指數（PPI）、居民消費價格指數（CPI）、工業增加值同比增速、固定資產累計同比增速、出口同比增速、社會消費品零售總額同比增速、工業增加值累計同比增速、R007（銀行間市場7天回購利率）、DR007（存款類機構間7天回購利率）等。考慮到部分宏觀指標為季度或月度數據，為與日度的國債ETF行情數據在時間維度上匹配，采用線性插值法將部分宏觀數據轉化為日度數據，確保數據的一致性和可用性。

（二）數據預處理與特征

工程

1.特征變量構建

基于收集到的國債ETF行情數據、資金面指標數據以及宏觀基本面數據，初步構建了備選特征向量集合。為了篩選出最具代表性、對預測結果貢獻最大的特征變量，運用數據可視化技術繪制了各特征變量間的相關系數熱力圖，直觀展示變量之間的線性相關性。相關系數熱力圖通過顏色深淺表示相關性的強弱，以快速識別出高度相關的特征變量。同時，通過隨機森林中的特征重要性分析算法生成特征變量重要性展示圖，量化評估每個特征的重要程度。綜合這兩種分析方法，我們能夠更全面地評估每個特征變量的相關性和重要性。最終確定了用于模型訓練的核心特征變量，即 features= ['Volume'， 'Cpi'， 'Ppi'， 'Export_rate'， 'RetailSale'， 'M2'， 'R007'， 'WR'， 'OBV']。這些特征變量在相關系數熱力圖中表現出較低的多重共線性，同時在特征重要性展示圖中有較高的重要性得分，從而確保了模型的穩定性和預測性能。各備選特征變量之間的相關系數及重要程度見圖1、圖2。

2.標簽設置背景與處理

鑒于實際投資過程中，預測國債ETF是為進一步構建證券量化投資策略提供決策依據，因此預測漲跌的二分類問題要比預測具體數值更具有實操意義。當國債ETF下一日的收盤價較當日上漲時，標簽賦值1；否則，賦值0。

3.金融時間序列非平穩性處理

鑒于金融時間序列普遍存在的非平穩性，直接使用原始數據可能導致模型訓練效果不佳。為了消除數據中的趨勢和季節性因素，使數據滿足平穩性假設，對選定的特征變量進行了差分處理。通過差分操作，有效提取了數據的動態變化特征，為后續的模型訓練提供了更優質的數據基礎。

模型構建與訓練

（一）一維CNN

一維CNN（1D-CNN）在處理時間序列數據時，能夠通過卷積核在時間維度上的滑動，高效提取數據的局部特征。

該模型包含多個卷積層和池化層。卷積層通過不同大小的卷積核進行卷積操作，提取數據的局部模式和特征；池化層則對卷積層的輸出進行降維處理，減少計算量，同時保留關鍵特征。本研究中，模型輸入時間步長為20的9個特征變量數據，經過多個卷積層和池化層的特征提取后，通過全連接層進行分類預測，最終輸出預測結果。訓練過程中，使用Adam優化器和交叉熵損失函數，以優化模型參數，提高預測準確性。

（二）LSTM

LSTM作為一種特殊的循環神經網絡，具備強大的處理時間序列數據中長期依賴關系的能力，其核心思想是通過門控機制和記憶單元控制信息流動，既能捕捉短期特征，又能保留長期依賴關系。本研究中，構建的LSTM模型每個樣本包含過去20個時間步的9個特征變量數據。模型結構包括LSTM層、隱藏層和全連接輸出層。LSTM層及隱藏層通過門控機制，選擇性地保留時間序列中的關鍵信息；全連接層則將LSTM隱藏層的輸出映射到預測結果空間。模型訓練采用Adam優化器，該優化器能夠自適應調整學習率，加快模型收斂速度；損失函數選用交叉熵損失函數，用于衡量模型預測結果與真實標簽之間的差異。

（三）Transformer

Transformer基于自身注意力機制，打破了傳統循環神經網絡和卷積神經網絡在處理長序列數據時的局限性，能夠更有效地捕捉序列數據中的全局依賴關系。在本研究中，構建的Transformer包含多個多頭注意力層和前饋神經網絡層。通過多個注意力頭并行計算，從不同角度捕捉數據的依賴關系；最后經過前饋神經網絡層進行特征變換和映射，通過全連接層輸出預測結果。模型訓練采用Adam優化器和交叉熵損失函數，確保模型在訓練過程中不斷優化，提升預測性能。

（四）基于CNN-LSTM-Attention的混合模型

本研究借鑒了Transformer中極具創新性的Attention機制，該機制依據時間步重要性動態分配權重，提升對重要信息的關注度與預測準確性。基于CNN-LSTM-Attention的混合模型，融合多種神經網絡優勢，處理復雜時間序列數據時優勢顯著。CNN利用局部感受野和權值共享，能自動提取國債ETF數據中的價格短期波動、成交量變化等局部特征，為后續分析筑牢根基；LSTM憑借門控機制，既能銘記長期經濟因素影響下的價格走勢，又能對短期波動迅速作出反應，精準把握價格長期趨勢與動態變化。三者結合賦予模型靈活性與適應性，面對復雜的市場環境，能有效處理各類關鍵信息，維持良好性能。

（五）模型訓練與評估

將經過處理的數據按照80%、20%的比例劃分為訓練集、驗證集。訓練集用于模型參數的學習和優化，加入丟棄層（Dropout）防止過擬合現象的發生；測試集則用于評估模型的最終性能。在訓練過程中，通過調整模型的超參數，如學習率、隱藏層節點數等，觀察測試集上的性能指標變化，選擇性能最優的模型參數配置。訓練完成后，使用測試集對3個模型進行全面評估，主要評估指標包括受試者工作特征曲線（ROC曲線）、精度和損失等。ROC 曲線則從分類閾值的角度，綜合評估模型的分類性能；精度和損失分別衡量模型預測的準確性和誤差程度。

實驗結果與分析

（一）模型性能對比

通過在測試集上的實驗，得到了4個模型的ROC 曲線以及精度和損失等關鍵指標。本文中，模型的損失函數采用的是交叉熵損失，用于衡量模型預測值與真實標簽之間的差異。交叉熵損失函數是一種常用于分類任務的損失函數，特別是在二分類問題中。其衡量的是模型預測值（概率分布）與真實標簽（概率分布）之間的差異。交叉熵損失越小，表示模型的預測值越接近真實值。精度定義為模型預測正確的樣本數占總樣本數的比例，測試集精度則是模型在測試集上的預測精度，用于評估模型的泛化能力。實驗結果表明，基于CNN-LSTM-Attention的混合模型在精度和測試集精度方面均顯著優于1D-CNN、LSTM以及Transformer，損失相對較低（見表1）。

（二）ROC 曲線分析

ROC曲線是一種用于評估二分類模型性能的工具，其以真正率（True Positive Rate，TPR，即實際正例中被正確預測為正例的比例）為縱軸，假正率（False Positive Rate，FPR，即實際負例中被錯誤預測為正例的比例）為橫軸。通過繪制不同分類閾值下的TPR和FPR，可以直觀地展示模型在不同判斷標準下區分正例和負例的能力。從4種模型的ROC曲線來看，曲線下面積值（AUC）均位于0.5～0.56，較為接近；ROC 曲線和AUC是評估二分類模型性能的重要工具，AUC 越接近 1，模型性能越好。結合表1數據來看，混合模型在測試集精度（0.7758）和整體精度（0.7667）上顯著優于其他模型，但 AUC最小（0.54），這主要是因為測試集樣本（1類和0類）分布不均衡。雖然混合模型的AUC值相對較低，但其在測試集精度和整體精度上顯著優于其他模型。這表明混合模型在特定分類閾值下具有較高的預測準確性，但在整體分類閾值范圍內表現不夠穩定。未來的研究可以進一步優化模型的分類閾值選擇，以提高AUC值。4種模型的ROC曲線如圖3—圖6所示。

結論與改進建議

（一）結論

在利用多源數據進行國債ETF漲跌預測的任務中，基于CNN-LSTM-Attention的混合模型憑借其獨特的結構和強大的時間序列處理能力，在精度、損失和驗證集精度等關鍵性能指標上均表現出色，顯著優于1D-CNN模型、LSTM模型和Transformer模型，展現出更為卓越的預測性能。

本研究充分凸顯了人工智能技術在債券投資領域的巨大潛力，為債券投資實踐提供了全新的視角和方法。未來的研究可以在現有基礎上，進一步拓展數據來源，優化模型結構，探索更有效的特征工程方法，以不斷提升國債ETF漲跌預測的準確性和穩定性。

（二）改進建議

數據方面：在金融市場環境日益復雜且動態變化的背景下，準確預測國債ETF的走勢成為極具價值與挑戰的研究課題。盡管本研究已使用國債ETF行情數據與宏觀基本面數據，但目前的研究尚未充分考量貨幣政策等非結構化數據，而這類數據在國債ETF市場中扮演著舉足輕重的角色。未來可進一步通過自然語言處理（NLP）算法處理貨幣政策執行報告與貨幣政策會議紀要得到貨幣態度指數等指標。同時，在數據處理環節，進一步優化對缺失數據的處理方法，后續將嘗試基于機器學習的缺失值預測算法，如 K 近鄰算法、決策樹算法等，利用數據之間的內在關系和模式，更準確地預測缺失值，提升數據質量。另外，針對測試集樣本（1類和0類）分布不均衡的問題，后續會進一步研究重采樣的處理方法。

模型方面：深度學習模型本質上是通過對歷史數據進行近似的非線性映射來實現預測。然而，金融市場中諸如政策發布、突發事件沖擊等動態變化因素，極易導致預測結果出現偏差。因此，為確保模型的預測精度，需定期對模型重新進行訓練，并及時更新模型參數。

特征工程方面：在現有特征選擇基礎上，運用更復雜、更先進的特征選擇算法，如基于樹模型的特征選擇方法、XGBoost的特征得分等，這些方法能夠更精準地篩選出對模型預測結果貢獻最大的關鍵特征，減少冗余特征對模型性能的干擾。同時，嘗試生成新的特征，結合技術分析與基本面分析，創造如宏觀指標與技術指標的交叉特征，如將GDP增速與OBV指標進行組合，構建新的特征變量，增強模型對國債ETF漲跌規律的捕捉能力。

參考文獻

[1] Bengio Y， Simard P， Frasconi P. Learning long-term dependencies with gradient descent is difficult[J]. IEEE Transactions on Neural Networks， 1994， 5（2）.

[2] Box G E P， Jenkins G M， Reinsel G C， et al. Time Series Analysis： Forecasting and Control[M]. Hoboken， NJ： John Wiley amp; Sons， 2015.

[3] Chen T， Guestrin C. XGBoost： A Scalable Tree Boosting System[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining （KDD）. New York， NY： ACM， 2016.

[4] Chen X， Hu W. Attention-based LSTM-CNN for Stock Market Prediction[C]//Proceedings of the 2018 IEEE International Conference on Data Mining （ICDM）. Piscataway， NJ： IEEE， 2018.

[5] Fawcett T. An Introduction to ROC Analysis[J]. Pattern Recognition Letters， 2006， 27（8）.

[6] Hochreiter S， Schmidhuber J. Long Short-Term Memory[J]. Neural Computation， 1997， 9（8）.

[7] LeCun Y， Bengio Y， Haffner P. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE， 1998， 86（11）.

[8] Rumelhart D E， Hinton G E， Williams R J. Learning Representations by Back-propagating Errors[J]. Nature， 1986， 323（6088）.

[9] Wang Z， Oates T. Imaging Time-Series to Improve Classification and Imputation[EB/OL]. arXiv preprint arXiv： 1506.00321， 2015.