【摘要】本文用幾何觀點解釋本科生概率論教學中數學期望、相關系數和條件數學期望這幾個概念,旨在幫助學生去理解對這些概念。
【關鍵詞】數學期望 相關系數 條件數學期望
【中圖分類號】O211【文獻標識碼】A 【文章編號】2095-3089(2013)12-0164-01
1.引言
在本科生的概率統計相關課程的教學中,數學期望、相關系數和條件數學期望,是非常重要的概念,具有重要的數學函數,蘊含豐富的數學思想。例如:數學期望描述一種平均,相關系數刻畫隨機變量間線性程度的大小,條件數學期望可以看作是在某些限制條件下的數學期望。但對于初次接觸的學生來說,較難理解,通常的教材[1],[2]一般沒有這些的概念的幾何解釋。基于大多數本科生在學習概率統計時已有線性代數和高數的基礎,為此我們用幾何的語言來解釋數學期望、相關系數和條件數學期望,希望這種方式能讓同學們更容易接受。
該文是這樣安排的:第二節介紹基本概念的定義;第三節是主要內容,給出前面所述概念的幾何性質;簡短的證明在第四節給出。
2.基本概念
為方便起見,我們記隨機變量X的分布為FX(x)。
定義1:設X為一隨機變量,如果積分
注1:在上述定義中FX(x)可以用來統一表達連續、離散或奇異隨機變量的分布,對于初學的讀者可以分布看作連續型隨機變量對應的積分
其中f(x)為連續型隨機變量的密度函數,和離散型隨機變量對應的和式
其中a1,a2,…,an,…為離散型隨機變量的所有可能取值。
定義2:設X和Y為兩隨機變量,如果二者的方差Var(X)和Var(Y)存在,稱
為隨機變量X和Y的相關系數,其中
為隨機變量X和Y的協方差。
注2:上述定義中方差存在與二階矩存在是等價的,即上述的式子只對二階矩存在的隨機變量有定義。
定義3:設X和Y為兩隨機變量,稱E(X|Y)為隨機變量X在隨機變量Y下的條件數學期望,如果:
1)E(X|Y)∈K(Y);
2)對任意的f(Y)∈K(Y),有E(f(Y)E(X|Y))=E(f(Y)X)。
注3:見命題3,上述的定義條件數學期望在幾乎處處意義下是唯一的。
3.幾何性質
命題1:記全體的隨機變量全體為K,對X,Y∈K,定義二者之間的距離:
則
注4:該結論具有直觀的幾何意義,它表明數學期望在度量(1)下為從隨機變量X到實數空間最短距離所對應的實數,如圖1。
命題2:記全體二階矩存在隨機變量構成的向量空間為L2,對X,Y∈L2,定義內積為:
(X,Y)=E(XY)-E(X)E(Y)
如果記θ為向量X和向量Y的夾角,則二者之間的相關系數為cosθ。
注5:該結論表明,相關系數可以看作是向量X,Y的夾角的余弦值,見圖2。如果夾角為銳角,二者正相關,相關系數為正;如果夾角為90度,二者線性無關,相關系數為0;如果夾角為鈍角,二者負相關,相關系數為負。
命題3:K如命題1中所定義的,對X,Y∈K,記E(X|Y)為給定隨機變量Y下隨機變量X的條件隨機變量,則:
其中K(Y)={f(Y):f為任意的實可測函數}。
注6:與注1類似,該結論也具有直觀的幾何意義,見圖1。
4.結論的證明
命題2的證明:由向量空間的知識,我們有
命題1和命題3的證明:我們首先證明命題1,我們只需證明數學期望E(X)是實數里面離X最近的點。為此,令b∈R,且b≠E(X),則
這樣命題1得證。
下面我們證明命題3:我們只需證明數學期望E(X|Y)是K(Y)里面離X最近的點。為此,令Z∈K(Y),且Z≠E(X|Y)(幾乎處處意義下),則
參考文獻:
[1]盛驟,謝式千, 潘承毅.《概率論與數理統計》(第四版).高等教育出版社,2010.
[2]梁之舜等.《概率論與數理統計》(上下)(第三版).高等教育出版社,2007.