張賀鵬 周偉(通訊作者)
(蘭州交通大學數理學院 甘肅蘭州 730070)
在金融市場的形成過程中,金融衍生品所擁有的風險轉移或套期保值功能,使其逐漸出現在人們的視野中。而期權以其特有的高杠桿特性,以及其具有非線性損益結構、尖峰厚尾等結構特征,更因其發揮了風險投資、價值發現、套期保值等功能,受到投資者們的推崇。
直至今天,期權市場仍在飛速發展,學者們對于期權理論的相關研究也愈加深入。在期權價值確定方面,對于期權定價相關研究,1973年,Fischer Black和Myron Scholes基于市場有效等一系列假設,提出了第一個完整的Black-Scholes期權定價模型[1],但由于實際的期權交易市場無法滿足其一系列理想化的假設條件,因此在實際應用中一般會產生較大誤差。
隨著大數據時代的到來,學者們著眼于研究以歷史數據為驅動而構建的深度學習理論。在尋求誤差最小化的過程中,機器學習及神經網絡的出現,可以借助現實市場中的實際數據對神經網絡模型進行訓練與測試,最終達到規避理想化的模型假設及數據不兼容問題的目的。
本文以期權作為研究對象,基于B-S期權定價公式,結合深度學習相關理論構建出符合預期的期權價格預測模型。
首先,在對B-S期權定價模型進行充分研究后借助深度學習理論的優勢,在文中結合B-S公式,應用深度學習理論中的神經網絡方法構建期權價格預測模型,以期根據現存期權相關數據對未來的期權價格進行精度較高的預測與分析。
其次,對比分析利用BP神經網絡及LSTM神經網絡構建出的模型所預測出的期權價格,同時運用多種評價指標對預測值與真實值之間的誤差進行分析對比,并評價模型擬合程度。
1.3.1 期權定價模型
有關期權定價理論的研究最早在1900年被提出,Louis Bachelier以“投機交易理論”為基礎,首次提出了用隨機游動思想給出股票價格運行的隨機模型,它被公認為現代金融學的里程碑[2]。
1973年,Fischer Black和Myron Scholes在對期權市場做出嚴格假設的情況下,提出了第一個完整的期權定價模型,即B-S期權定價模型,這篇文章的發表為后來學者研究期權定價理論提供了根本框架。同年,Merton在其基礎上進行修改,使之更加接近現實情況,發展出了Black-Scholes-Merton模型[3-5]。
在具有期權性質的各種實物定價方面,龍海明(2007)等將B-S期權定價模型應用于消費貸款定價,指出對貸款抵押物處置靈活度較高的銀行可以用期權定價法代替傳統成本加成定價法來確定消費貸款利率,理論依據是抵押物價值的不確定性將給貸款帶來風險,銀行可以持有以抵押物為標的物的歐式看跌期權來對沖風險,進而基于這個樞紐將B-S期權定價模型應用于貸款價格的確定上[6]。馮芬玲等(2012)將二叉樹定價法應用于鐵路貨運價格制定,使得傳統固定協議定價所導致雙方都不能從鐵路貨運現價波動中獲利的弊端得到克服[7]。
1.3.2 基于深度學習的期權價格預測模型構建
Hutchinson等人首先將深度學習中的神經網絡方法應用于期權價格預測,他們以標準普爾500指數期貨期權為實證對象,建立神經網絡模型,通過對比四種模型估計方法,經過反復訓練后得出神經網絡模型,其精度較B-S期權定價模型有所提高[8]。Anders等人比較了神經網絡模型和B-S期權定價模型在DAX30期權定價過程中的表現,發現神經網絡模型的定價準確度高于B-S期權定價模型[9]。國內的一些研究如2021年,Liu等人在基于自注意力機制(Self-Attention Mechanism)的神經網絡中引入了特殊的期權定價形式,在如歐式和亞式期權等的情景下,比之前的方法更準確地捕獲了期權時間價值的特征[10]。
B-S期權定價模型,主要用于為歐式期權定價。B-S對市場做出了以下假設:
(1)市場無摩擦,即不存在交易成本與稅收;
(2)市場是完全的,可以無限制賣空,不存在無風險套利機會;
(3)標的資產的價格運動遵循幾何布朗運動,即標的股票(以下均假設標的資產為股票)的收益率和波動率均為常數;
(4)標的資產收益為0,即在到期日內標的股票無現金收益;
(5)標的資產可以任何數量在任何連續時間交易;
(6)在期權的到期日內,無風險連續復利利率是一個常數,且任何期限內的借貸利率均相等。
基于以上假設,可以得出歐式看漲期權的表達式:
式(1)中:C表示歐式看漲期權的市場價格,S表示期權交割價格,N表示正態分布的累積概率函數,X表示期權的行權價格,r表示無風險利率,
根據歐式看漲期權與看跌期權之間的關系,即C+Xe-r(T-t)=P+S,可以得出歐式看跌期權的定價公式為:
2.2.1 BP神經網絡
BP神經網絡算法可分為以下六個步驟:
(1)對網絡中所有權值與閾值進行隨機初始化,得到初始化連接權重;
(2)輸入訓練集,從前向后依次計算;
(3)基于各層輸出結果,計算各輸出層的誤差;
(4)對于神經網絡中的每一個隱含層單元k,計算其誤差項;
(5)通過得到的各層的誤差項,對權重進行調整訓練;
(6)對神經網絡訓練設置訓練終止條件。若神經網絡訓練結果達到訓練終止條件,則停止訓練,若未達到,則返回第二步,直至滿足終止條件后結束訓練。
2.2.2 長短期記憶神經網絡
LSTM神經網絡通過門機制,使其可以有選擇性地記憶或遺忘長短距離的信息,以防止信息過載。
(1)遺忘門
遺忘門的輸入由上一時刻隱藏狀態和當前時刻的輸入共同決定。
(2)輸入門
輸入門決定t-1時刻輸入保留至t時刻單元狀態的多少;t時刻記憶單元的單元狀態更新值由t-1時刻隱含層的輸出與t時刻的輸入共同決定;當前單元狀態由t-1時刻狀態和t時刻輸入單元的狀態共同決定。
(3)輸出門
輸出代表單元狀態保留至輸出時的剩余量;t時刻的輸出門狀態和單元狀態共同決定t時刻的輸出。
3.1.1 樣本產品描述
基于上證50ETF的良好特性,本文實證研究所選取的樣本主體是上證50ETF認購期權。該期權的標的資產為上證50ETF,即由上證50指數的50只樣本股票組成的上市交易基金。
3.1.2 樣本數據范圍
本文樣本數據的時間跨度為2022年1月1日至2022年12月31日,剔除因節假日等市場休市情形導致的缺失數據后,共得到13771組數據,數據均來自wind數據庫。其中,選取2022年1月1日至2022年9月30日,共11657組數據作為訓練集;選取2022年10月10日至2022年12月31日,共2114組數據作為測試集。
3.2.1 輸入輸出變量確定
在確定輸入變量指標的過程中,通過對B-S期權定價模型的理論研究,本文選取公式中的5個已知變量,包括期權從當前距離到期日剩余時間T、標的資產的市場價格S、期權的行權價格X、無風險利率r、標的資產價格的歷史波動率σ(本文在數據中用HV表示,以示區分)。此外,本文還選擇了影響期權市場價格的開盤價open、結算價SP、成交量deal、持倉量host這四個變量,共計9個指標作為輸入變量,輸出變量為當前收盤價格P。
3.2.2 數據預處理
(1)期權從當前距離到期日剩余時間T
將剩余時間T以年為單位進行轉化。本文選取交易市場的實際天數,即交易日天數作為基數對距到期日剩余時間T進行轉化,公式為
(2)數據歸一化
本文采取離差標準化的方法對原始數據進行歸一化,而且未對無風險利率r及歷史波動率HV進行歸一化。
本文使用python構建神經網絡模型,使用版本為3.8.0。
3.3.1 基于BP神經網絡的期權價格預測模型構建
(1)網絡結構設計及參數選擇
本文構建三層BP神經網絡,并選取tansig和purlin作為激活函數,選取traingdm函數作為訓練函數,選取均方誤差(MSE)作為損失函數。
本文在訓練時,根據經驗法則,首先設置最大允許誤差為0.01;其次,利用訓練樣本對迭代次數進行訓練并調整;最后,將迭代次數確定為100,學習率設為0.01。
(2)預測結果分析
采用BP神經網絡所預測的期權價格如圖1所示:

圖1 BP神經網絡模型期權價格預測結果
部分預測數據如表1所示:

表1 部分預測數據(歸一化后)
3.3.2 基于LSTM神經網絡的期權價格預測模型構建
具體結構設計及參數選擇如下:
(1)結構設計及參數選擇
本文在模型劃分數據集時,選擇通過日期對其進行劃分。其中訓練集日期劃分為2022年1月1日至2022年9月30日,共計11657組數據;測試集日期劃分為2022年10月10日至2022年12月31日,共計2114組數據。
本文選擇sigmoid函數作為三個門的激活函數,使用tanh作為隱含狀態和輸出狀態的激活函數。
在LSTM模型層級結構設定方面,本文將LSTM層數設置為單層。選取均方誤差(MSE)作為損失函數,優化器設置為RMSProp優化器。同時將fit函數中的epoch項定為30,batch_size項定為512。
(2)預測結果分析
采用LSTM神經網絡所預測的期權價格如圖2所示:

圖2 LSTM模型期權價格預測結果
部分預測數據如表2所示:

表2 部分預測數據(歸一化后)
在上述期權價格預測模型的構建及預測過程中,本文通過計算各個模型的誤差及擬合情況對各個模型的預測結果進行對比分析。這里選取三個評價指標作為模型評價指標,分別為均方誤差、平均絕對誤差及決定系數,綜合使用多因素對模型優劣性進行評價,可以得出更為客觀的結論。
(1)均方誤差(MSE,Mean Squared Error)
MSE是指模型預測值與真實值之間差額的期望值。其表達式如下:
(2)平均絕對誤差(MAE,Mean Absolute Error)
MAE是指模型預測值與真實值之間距離絕對值的平均值。其表達式如下:
(3)R2(決定系數)
R2是指回歸平方和占總平方和的比例。R2越接近1,表明回歸平方和占總平方和的比例越大,模型真實值與預測值越接近,神經網絡模型的擬合程度就越好。其表達式如下:
使用MSE、MAE、R2三類誤差評價指標對兩個模型結果進行對比分析,如表3所示:

表3 神經網絡模型預測結果對比
由表3可知,LSTM模型預測的精確度高于BP神經網絡模型。
結合前述分析我們可以得出以下結論:相較于BP神經網絡模型,LSTM神經網絡模型具有更高水平的非線性組合運算能力,對于上證50ETF期權這一實證對象,顯示出更好的擬合高維性金融數據的能力,其模型預測結果的精度較高。
本文分別利用BP神經網絡和LSTM神經網絡理論,選取上證50ETF指數的期權作為研究樣本,建立期權價格預測模型,得出以下結論:
作為基于數據驅動的期權價格預測模型,LSTM神經網絡預測的期權價格的精度高于BP神經網絡。在三種模型評價指標下,LSTM神經網絡在價格預測誤差方面明顯優于BP神經網絡。LSTM神經網絡具有獨特的結構和較高的非線性計算能力,這使得它在有大量數據時能夠更準確地預測期權價格。
本文對基于深度學習的期權價格預測進行探索,并取得了一些成果。但仍有一些地方存在不足之處,今后需要進一步改進:
(1)除本文選取的9個輸入變量外,依舊存在諸多其他可能影響期權價格的因素,在后續的研究中可以進一步探索,從而使得期權價格預測模型的普遍性有所提升。
(2)文中選取的9個指標中,各個指標之間的相關性并未解決,這種相關性對于期權價格預測模型的影響也未可知。
(3)本文基于Black-Scholes期權所確定的輸入變量之一選取了歷史波動率,在相關文獻中顯示,若選擇隱含波動率代替歷史波動率,作為輸入變量對期權價格預測模型進行訓練,模型誤差可能會減小。