李生彪


摘 要 本文對相關系數兩個性質的三種證明方法進行了討論,比較了其優劣,并將相關系數性質應用于線性回歸分析之中。
關鍵詞 相關系數 證明 線性回歸分析
中圖分類號:O211 文獻標識碼:ADOI:10.16400/j.cnki.kjdkx.2015.02.017
Discussion on the Correlation Coefficient Prove
LI Shengbiao
(Lanzhou University of Arts and Science, Lanzhou, Gansu 730000)
Abstract In this paper, three methods proved the correlation coefficient of the two natures are discussed and compared their advantages and disadvantages. And applied nature of the correlation coefficient of linear regression analysis.
Key words the correlation coefficient; prove; linear regression analysis
在大學的概率論與數理統計課程中,相關系數是學生必學的數字特征之一,它描述的是兩個隨機變量和之間的線性相關程度,在一元線性回歸分析中也有著重要的應用。與數學期望和方差相比,學生學對相關系數理解起來也是相對比較困難,尤其是在講到相關系數的性質證明時,學生理解起來更是困難,而相關系數的性質又恰好揭示了相關系數的本質及其意義,是重要的一部分內容。因此,本文就相關系數的三種證明方法進行了討論和比較,指出了各自的優劣,并將相關系數性質應用于線性回歸分析之中。
1 線性相關系數及其性質
下文中用()表示隨機變量的方差,()表示兩個隨機變量和的協方差。
定義1.1 ?設()是一個二維隨機變量,且()>0,()>0,則稱為和的相關系數。
具有以下兩條性質:
性質1.1:≤≤1。
性質1.2:∣∣= 1的充要條件是存在常數和,使得{ = ?+ } = 1。
對相關系數作以下四點說明:
(i)相關系數反映的是兩個隨機變量和之間的線性相關程度的強弱,因此,也被稱為線性相關系數。
(ii)若 = 0,則稱與不相關。不相關是指與之間不存在線性關系,但與之間可能存在著其他的函數關系,譬如指數關系、平方關系等。
(iii) 若 = ?,則稱與完全相關。若 = 1,則稱與完全正相關;若 = ,則稱與完全負相關。
(iv) 若0<∣∣<1,則稱與有“一定程度”的線性相關。∣∣的值越接近于1,與線性相關程度越高;∣∣的值越接近于0,與線性相關程度越低。
2 相關系數性質的證明
這里我們將主要討論相關系數性質的三種證明方法。
2.1 證法一
先利用切比雪夫不等式證明引理1。
引理1 隨機變量的方差() = 0的充要條件是:{ = ()} = 1。
再運用一元二次方程實數根的判別方法得到引理2。
引理2 (柯西-許瓦茲不等式)設()是一個二維隨機變量,()<,()<,則有
≤()·()。
性質1.1的證明: 記,由引理2有:
即≤≤1。
性質1.2的證明:由引理2可知:∣∣= 1的充要條件是存在常數,使得,又因為,所以∣∣= 1的充要條件是,由引理1可知, ∣∣= 1的充要條件是存在常數使得。我們記 = , = ()(),即有{ = ?+ } = 1。
2.2 證法二
性質1.1的證明:記,構造輔助函數。
由 = () + () = 0,得 = 。記 ?= ,
由于所以≥0,即≤≤1。
性質1.2的證明:由上面的證明過程可知,∣∣= 1的充要條件是,考慮到,由證法一中的引理1即有∣∣= 1的充要條件是,其中 ?= ?= ,則有:
{ = ?+ ()()} = 1
我們記 = ,則 = ()() = ()(),性質1.2得證。
在證明二中不僅證明了的存在性,并且給出了的具體表達式。由于 = ,且()>0,()>0,因此,當∣∣= 1時,≠0。故性質1.2的更準確地表述為:∣∣= 1的充要條件是存在常數和,且≠0使得{ = ?+ } = 1。
那么要問,在證法一中能不能也得到≠0呢?答案是肯定的。在證法一中已證明了∣∣= 1的充要條件是存在常數,使得。此時若 = 0,則,即有() = 0,這與()>0矛盾,故 ≠ 0,而 = ,即≠0。
2.3 證法三
性質1.1的證明:記易知,
() = () = 0, () = () = 1, ?= ?= ()
( ?) = () + () ?2()
= 1 + 1 ?2 = 2 (1 ?)
由于( ?)≥0,所以(1 ?)≥0,即≤≤1。
性質1.2的證明: = ?= 1的充要條件是() = 0。由引理1知() = 0的充要條件是( = ) = 0。又因為
故 = 1的充要條件是{ = ?+ ()()} = 1,同理 = 1的充要條件是{ = ?+ ()+()} = 1,我們記 = ,則 = ()() = ()(),性質1.2得證。
3 相關系數在線性回歸中的應用
在上面三種證法中,證法二和證法三得到的結果更為深刻,給出了和的值:
= , ?= ()()。
這一結果在解釋一元線性回歸分析是有用的。設有()的觀察值( , ), = 1,2,…。則樣本相關系數是:
樣本相關系數可作為的估計。當≈1時,可近似認為≈1。這時根據性質1.2,自然可考慮線性回歸函數 = ?+ ,其中 = , ?= ()()。由矩估計法,可建立(), (), (), ()的估計分別為:
由此得到和的估計值:
這與最小二乘估計法得到的結果是一致的。
參考文獻
[1] 盛驟,謝式千,潘承毅.概率論與數理統計(第四版)[M].北京:高等教育出版社,2001.
[2] 魏宗舒,等.概率論與數理統計教程[M].北京:高等教育出版社,1983.
[3] 錢偉民,楊筱菡.關于相關系數性質的三種證明方法[J].大學數學,2009.25(1):176-178.
[4] 張世強,呂杰能等.關于相關系數的探討[J].數學的實踐與認識,2009.39(19):102-107.