葛一冬 劉得潭 張志杭
【摘 要】金融投資是一個商品經濟的概念,它是隨著投資概念的不斷發展,在實物投資的基礎上形成的,并逐步成為比實物投資更受人們關注的投資行為。我們建立了兩種模型來求解金融投資問題,模型一是正態分布模型,我們通過非參數檢驗證明了該模型的合理性和正確性,并通過參數估計求出了符合該問題的正態分布參數:均值為7.4863,方差為97.0618。在該模型下,我們估計出在下一個周期 (如1天)內的損失的數額超過10萬元的可能性為0.0380;95%的置信度保證損失的數額不會超過8.72萬元;一個周期內的損失超過10萬元的可能性不大于 5%的情況下初始投資額最多為1146.9萬元。模型二為概率函數擬合模型, 該模型是基于頻率直方圖的,對頻率直方圖中每個頻率長方形上部中點數據進行擬合,得到總體的近似概率分布圖和擬合函數,然后利用該 擬合函數求解問題在該模型下,我們求出下一個周期(如1天)內的損失的數額超過10萬元的可能性為0.03888;95%的置信度保證損失的數額為8萬元; 在一個周期內的 損失超過10萬元的可能性不大于5%,那么初始投資額最多為1250萬元。
【關鍵詞】正態分布;概率函數擬合;MATLAB
1.問題重述
(1)某公司在金融投資中,需要考慮如下兩個問題:問題一:準備用數額為1000萬元的資金投資某種金融資產(如股票,外匯等)。它必須根據 歷史數據估計在下一個周期(如1天)內的損失的數額超過 10萬元的可能性有多大, 以及能以95%的置信度保證損失的數額不會超過多少。問題二:如果要求在一個周期內的損失超過10萬元的可能性不大于5%,那么初始投資額最多應為多少。
(2)解決該問題時,須考慮以下3點要求1)參考數據,建立兩種模型來解決前述的兩個問題,并對這兩個模型加以比較;2)討論二周期情形(如今后兩天內)上述兩個問題的答案;3)陳述上述兩個問題的一般形式。
2.問題分析
2.1對收益額的理解
由于每天在市場上的投資額保持為1000萬元,所以每一交易周期的收益額之間沒有必然聯系,即每個周期收益額X是相互獨立的, 在后續計算中這一點也成立。
2.2對金融投資的理解
本題討論的是一種理想情況,預計投資的收益額僅是由歷史數據估計而得來的,不受其他因素的影響。又由于所獲得的統計數據僅為總體的一部分樣本,且單個數據可能出現偏離總體分布的情況。所以預計的收益額僅為理論的可能性,與實際情況相比有一定的誤差。對于后者,考慮先對數據進行預處理,并注意控制統計的數據與估計的總體分布之間的誤差。
2.3對要求一的理解
對于本題中所給的統計數據,考慮兩種模型。模型一是根據所給的數據,推測總體分布為正態分布;再根據樣本觀察,證明假設;最后根據樣本的均值和方差,對總體的均值、方差進行參數檢驗,進而求得問題的解。模型二是基于頻率直方圖,對頻率長方 形上部頂點進行三次樣條插值,得到總體的概率分布圖;然后利用三次樣條插值函數求解問題。
3.模型建立
3.1非參數檢驗
接著我們利用MATLAB對總體分布進行非參數分析, 即使命令顯示數 據矩陣x的正態概率圖。如果數據來自正態分布,則圖形顯示出直線形態,而其他概率分布函數顯示出曲線形態。圖形為直線形態,可以證明總體服從正態分布。
3.1.1參數估計
證明總體服從正態分布后,可以使用MATLAB對正態分布的參數進行估計,即調用MATLAB中的命令。得到結果即該數據均值為7.4863,方差為97.0618,0.95 的置信區間為[6.2713,8.7013],所以綜上所述 X~N(7.4863,97.0618)。
3.1.2問題解決
基于前面三小問,可以得到總體服從參數已知的正態分布,所以后續的問題可以用概率論和數理統計的相關知識解決。
3.1.3問題解決
基于前面三小問,可以得到總體服從參數已知的正態分布,所以后續的問題可以用概率論和數理統計的相關知識解同上,95%的置信度保證損失的數額。此時是0.95,又因為可調用MATLAB統計箱中的數據,所以95%的置信度保證損失的數額不會超過8.72萬元。
問題二:令初始投資額為M,收益率為v,收益額為y,則 y=M×v,由上知,X服從正態分布,故其收益率ν也服從正態分布,則對于初始投資額為M的情況,其收益額y也服從正態分布,由概率論知識可知。可解得1146.9萬元。即一個周期內初始投資額最多為1146.9萬元。
3.2概率函數擬合模型
該模型是基于頻率直方圖的, 對頻率直方圖中每個頻率長方形上部中點數據進行擬合,得到總體的近似概率分布圖和擬合函數,然后利用該擬合函數求解問題。
3.3兩周期情形
(以正態分布模型為例)由正態分布模型可知,所統計的255個交易額數據近似正態分布。又由2.1可知:每個周期收益額X是相互獨立的。
3.3.1兩周期情形下的問題一求解
調用相關程序,用 MATLAB 統計箱中的命令得到z=-7.9090萬元。即兩個周期內能以95%的置信度保證損失的數額不會超過 7.9090萬元。
3.3.2兩周期情形下的問題二求解
仍令初始投資額為M,收益率為V,收益額為y,則 y=M×V,由上知,X服從正態分布,故其收益率ν也服從正態分布,則對于初始投資額為M的情況,其收益額y也服從正態分布,均值為兩周期內損失超過10萬元的可能性不大于5%可以表示為如下。使用MATLAB實現 M=1264.4萬元 即初始投資額最多為1264.4 萬元。綜上,兩個周期內損失超過10萬元的概率為3.63%,以95%的置信度保證損失的 數額不會超過7.90萬元;兩個周期內的損失超過10萬元的可能性不大于5%,那么初始投資額1264.4萬元。
4.模型分析
第一種正態分布模型通過為歷史數據的正態分布驗證,再用 MALTLAB 工具箱得到正態分布函數及相關參數,方法較為通用。且該模型結合數理統計與概率論的知識,能很好的求解風險投資問題,并容易推廣到兩個周期甚至T個周期。第二種概率函數擬合模型,通過擬合分別建立了概率密度函數和分布函數,由 Matlab 擬合圖像可知,概率密度函數由于散點亂,擬合效果差,對問題的求解與實際預期的效果不太相符。概率分布函數除個別點外,擬合效果還是非常好的,一個周期的問題能得到較好的解決,但將其推廣到兩個周期以及一般形式還是有一定困難的。
5.模型推廣
第一種正態分布模型、 第二種概率函數擬合模型均可以應用到風險投資和決策問題中, 運用數理統計的方法對歷史交易日收益額數據的處理,得出極限風險損失值及風險概率。 其中概率函數擬合模型對于非正態分布模型也可以預測出最大的損失。正態分布模型通過檢驗證實屬于正態分布,但是實際投資中很多學者考慮各種資產的關聯以及大量數據的研究表示,收益額并不屬于正態分布,這樣就降低了模型的實用性。盡管如此,上述模型對于投資者的投資行為起到參考和指導作用。 [科]