鐘政達 華東政法大學附屬中學
概率統計是數學的一個重要分支,它主要研究隨機現象和隨機事件的發生規律。在一些隨機事件發生之前,人們無法確定事件的結果,但是事件發生的結果只可能是幾種可能結果中的一種。可以應用概率統計知識對這些隨機事件的結果進行分析,預測可能出現的情況。事實上,在城市交通管理、企業戰略制定、金融產品設計等常見場景中,概率統計都有著廣泛的應用。在進行經濟學或金融學研究時,研究者常常需要以概率統計為工具分析收集到的數據,減輕隨機因素對結論的影響。在分析市場中顧客的行為特征或預測某些商品的時,企業的經營者也需要應用概率統計知識。
在日常生活中,概率一詞有多種含義。在數學中,概率指的是特定事件發生的相對頻率的統計學數值。從數學的角度看,擲骰子、拋硬幣等簡單的游戲其實都是隨機事件,都涉及一定的概率知識。在機會博弈中,隨機事件的特征是,盡管大量試驗的結果具有一定的規律性,但是人們無法準確地預測給定試驗的結果。拋硬幣便是機會博弈的一個很典型的例子。在拋硬幣時,正面向上的概率等于二分之一。這意味著,在大量拋硬幣時,正面向上的結果約為總拋擲次數的一半,但是如果一個人只拋一次硬幣,那么這次拋擲的結果是不確定的。類似地,在進行遺傳咨詢時,醫生會根據患有遺傳性疾病的家族的譜系,推測生出患病個體的概率,但是醫生并不能準確地預測某對夫妻的第一個孩子是否患病。也就是說,概率是對許多相似的場景中某一事件發生的相對頻率的描述,而不是關于給定事件或給定個體的預測。
統計理論和統計模型是分析群體特征的重要工具。在對較為龐大的群體進行調查時,人們需要運用統計學知識,才能更充分地認識群體的特點,避免各種類型的偏倚。統計學知識可以幫助人們根據歷史數據,對某一變量或指標的未來變化趨勢進行高效的預測,其在企業決策、金融管理、生態環境保護中有著廣泛的應用[1]。
在現代經濟金融體系中,不確定性事件是非常多的,應用概率統計知識,研究者、經營者、投資者可以更高效地預測某些經濟金融指標的變化,從而高效地做出決策。在分析股票價格的波動規律時,在預測原料價格走勢時,人們都需要應用概率統計的知識。深入研究概率統計中的一些關鍵概念,探究其在不同的經濟場景或金融場景中的應用,有助于人們更高效地解決遇到的問題,提高預測的準確性。
在應用概率統計知識解決實際問題時,實際問題應當具備一些基本的特征:在相同的條件下,試驗的重復性是較高的,在不同的單次試驗中,人們會得到幾種不同的結果。
試驗的所有可能結果的集合稱為“樣本空間”。如果人們進行一次拋硬幣的試驗,就會產生兩種不同的結果,即“正面向上”和“反面向上”,這兩種結果構成了一個樣本空間[2]。如果人們投擲兩個骰子,那么記錄得到的結果的樣本空間中包含36種可能的點數組合,每個結果都可以用有序對(i,j)標識,其中i和j的取值為1、2、3、4、5、6。
“事件”是定義明確的樣本空間的子集。例如,事件“兩個骰子上顯示的點數之和等于6”包含五個結果(1,5),(2,4),(3,3),(4,2)和(5,1)。事件的發生概率是事件中包含的結果數與總結果數之比,在上述例子中,事件“兩個骰子上顯示的點數之和等于6”的發生概率為5/36。這種計算概率的方法是簡單而原始的,但是,它是幾乎一切概率統計理論的基礎。
正態分布是統計學中最重要的分布。在分析一些受到多個因素影響的變量的變化規律時,人們通常需要根據現實情況,確定這些變量的分布規律。由于影響這些變量的因素很多,研究者很難建立能夠納入所有影響因素的、精確的模型。正態分布為解決這類問題提供了很好的分析方法。研究者只需要確定平均值和方差,即可基本確定變量的主要變化范圍,評估某一數據是否來自于特定的總體[3]。
1.正態分布的簡介
正態分布(也稱為高斯分布)是一種非常常見的變量分布形式。服從正態分布的變量通常關于均值對稱,接近均值的數據比遠離均值的數據更頻繁地出現。如果研究者以待研究的變量為橫坐標,以變量的概率為縱坐標,并根據統計結果畫出相應的曲線,那么這條曲線將會是一條鐘形曲線。但需要注意的是,并非所有對稱分布都是正態的。實際上,生活中遇到的大多數分布都不是完全正態的。根據正態分布的模型得到的數據通常和實際情況有一定的出入,不過,正態分布仍然是無可置疑的最實用的概率分布模型之一。深入研究正態分布的特征,有助于人們更好地把握變量的變化規律,更準確地對異常狀況進行判斷,找到更有效的解決方法。
在應用正態分布解決實際問題時,人們首先需要判斷某一變量是否服從正態分布。如果變量是服從正態分布的,那么可以在抽樣后分析樣本的特征,確定相關變量的平均值μ和標準差σ,樣本的概率密度函數為。根據概率密度函數,研究者可以高效地推斷總體的特征[4]。
2.正態分布在經濟金融領域的應用
經濟金融領域中的一些變量會受到人為因素的影響,這些變量通常不服從正態分布。不過,當經濟變量或金融變量同時受到多個個體的行為的影響,或者同時受到多個互不相關的因素影響時,這些變量通常近似地服從正態分布。
一些金融學家提出,股票的價格變化幅度是服從正態分布的。假設一位金融分析師在收集股市的歷史數據后,發現每年1月某只股票的跌幅平均值為1%,其標準差為0.1%。由于在不發生重大經濟金融事件時,股票的漲幅和跌幅是基本服從正態分布的,該分析師可以據此推測該股票的漲跌情況:股票的跌幅與跌幅平均值相差一個標準差的概率是68.3%,即股票在1月下跌0.9%至1.1%的概率為68.3%;股票的跌幅與跌幅平均值相差兩個標準差的概率是95.5%,即股票在1月下跌0.8%至1.2%的概率為95.5%。該分析師可以據此決策是否買入或賣出該股票。
1.泊松過程
泊松過程是關于一系列離散事件的模型,其中,發生兩個事件的平均時間間隔是已知的,但發生事件的確切時間是隨機的。事件的發生時間與之前的事件無關(事件之間的時間間隔是獨立隨機變量)。例如,假設某人擁有一個網站,內容發布網絡(CDN)告訴他,該網站平均每60天出現一次故障,但發生一個故障后,人們并不知道下一次故障將會何時發生,只知道兩次故障之間的平均時間間隔。這是一個典型的泊松過程。其中的一個關鍵參數是:事件之間的平均時間為60天。不過,由于故障是隨機發生的,相鄰的兩次故障之間的間隔時間是獨立隨機變量,其間隔時間可能是幾天,也可能是幾年。
泊松過程通常滿足以下條件:事件是彼此獨立的;一個事件的發生不會影響另一個事件發生的可能性;發生事件的平均速率是恒定的,也就是事件在一定長度的時間內的平均發生次數是確定的;兩個事件不能同時發生。由于事件不是同時發生的,我們可以將泊松過程的每個子間隔視為伯努利試驗,即在該時間間隔中,事件是否發生相當于伯努利試驗的結果是成功還是失敗。在上述例子中,總時間間隔可能是600天,但我們需要將其分為比平均發生間隔的更短的一個個子間隔(如“一天”或“一小時”),我們需要判斷事件在這些子間隔中是否發生,并統計總發生次數。實際上,在生活中,許多借助泊松分布解決的問題并不完全符合這些條件,但是我們仍可以用泊松分布模型近似地描述這些問題,通過求解數學模型解決這些問題。
在生活中,泊松過程是非常常見的。一段時間內客戶呼叫幫助中心的次數,訪問網站的訪客數,發生放射性衰變的原子數,到達太空望遠鏡的光子數以及股價的波動次數,都可以用泊松過程描述。泊松過程通常與時間有關,但是在一些例子中,泊松過程可能與長度、面積等變量相關[5]。如果人們知道某塊林地上每英畝樹木的數量的平均值,那么他們可以近似地預測林地上的樹木分布情況,也就是說,在分析面積較大的區域中發生某事件的次數時,可以先求出單位面積的區域中發生的事件的平均次數,然后借助與泊松過程的知識解決問題。
此外,在分析公交車到達某一站的規律時,人們也常常應用泊松分布的知識。但是,這種過程并不是真正的泊松過程,因為不同的公交車的到站時間有一定的聯系。即使是未按時運行的公交系統,一輛公交車的“晚點”也會影響下一輛公交車的到達時間。
2.泊松分布
泊松過程是人們用來描述隨機發生的事件的模型,它本身并沒有特別高的實用價值。我們需要定量的數學模型—泊松分布來分析某個時間段內發生某事件的概率或次數。
泊松分布概率密度函數讓研究者可以在給定時間段的長度和每個時間段內的平均事件數的情況下,分析在一個時間段內觀察到k個事件的概率:,其中,λ是單位時間,它是描述事件發生的速率的參數[6]。
3.泊松分布在經濟金融領域的應用
如果某商場的經理想要估算工作日的某一時段內進入商場的顧客的數量,那么他可以應用泊松分布的知識,建立數學模型,解決這一問題。假設在工作日,路過商場的每個人進入商場的概率為p=0.01,某工作日上午有100個人路過商場,求此段時間內進入商場的人數大于等于2的概率。
由于λ=np=100*0.01=1,進入商場的人數為0的概率為,進入商場的人數為1 的概率為。求此段時間內進入商場的人數大于等于2的概率為1-0.368-0.368=0.264。
應用概率統計知識,人們可以高效地分析實際問題中的不確定性問題。在經濟金融領域中,許多問題與隨機因素有關。應用正態分布、泊松分布等經典概率模型的知識,人們可以高效地分析經濟金融問題,預測特定指標的變化趨勢。研究者應當建立更貼合實際的模型,才能提高通過概率統計模型得到的結論的可靠性,更高效地決策。