


一、問題的提出
從小學起,學生就開始接觸統計.小學用豐富的案例,讓學生體會統計,但仍處于“基于圖像的直觀判斷”階段,要求學生學會畫簡單的統計圖.初中在小學圖像的基礎上,開始嘗試利用“數字特征”進行統計分析,處于“基于圖像與數據處理相結合的局部推斷”階段,要求學生從“直觀描述”到“定量刻畫”,初步體會數據分析的方法.到了高中,一個案例貫穿始終,讓學生通過不同的統計視角,層層深入,反復對比,得出不同的結論,明確統計的結論是對各個統計量綜合考察的結果.
學段教材位置學習內容
小學
四年級上第七章條形統計圖
四年級下第八章平均數與復式條形圖
五年級下第七章折線統計圖
六年級下第七章扇形統計圖
初中
七年級下第六章數據的收集與整理、條形、折線、扇形統計圖、頻率與頻數、頻數直方圖、
八年級下第八章平均數、中位數、眾數、方差、標準差
高中
必修第二冊第九章隨機抽樣、用樣本估計總體
選擇性必修第三冊第八章成對數據統計相關性、一元線性回歸模型、列聯表與獨立性檢驗
“成對數據的統計相關性”這一節是在此基礎上,從單變量遷移到雙變量,學生已掌握數據分析處理的方法,且在信息時代的今天,即使是龐大的數據,也可利用統計軟件進行計算處理,因此本節課的重點應該是理解樣本相關系數的推導過程,培養學生邏輯推理能力,體會統計學的基本思路與方法,而不是簡單的計算.這也是統計教學要凸顯合理性的教學需求.因此,本節課的教學目標可設定為:(1)會通過相關系數比較多組成對數據的相關性.(2)會計算樣本相關系數,培養數學運算能力.(3)經歷樣本相關系數的推導過程,培養邏輯推理能力,體會統計的合理性.(4)通過經歷“問題提出—公式推導—模型建構—模型應用”的過程,讓學生經歷數學建模的過程,體會到數學知識的邏輯性和嚴密性.(5)理解數據統計的基本原則是從直觀描述到定量刻畫.
統計學通過收集數據和分析數據來認識未知現象的一門科學,因此,統計學具有“不確定性”.正是這種“不確定性”使得很多人覺得統計學具有偶然性,尤其是抽樣調查得到的結果,這與數學的“嚴謹性”、“科學性”不符.而統計的“合理性”則是要引導學生理解統計的意義和基本思想, 結合具體案例,體會知識、 方法背后蘊含的統計思想, 掌握研究統計問題的思維方法,做到真懂會用,實現關鍵能力的突破,核心素養的落地生根.
二、“成對數據的統計相關性”的合理性解釋
1.為什么要學習樣本相關系數
研究統計問題的基本路徑是直觀描述——定量刻畫.上節課我們已經學習了用散點圖直觀判斷成對樣本數據之間是否具有相關性,今天我們將以定量刻畫的方式來學習成對數據的統計相關性.
問題1" 我們回到上節課的案例(人體的脂肪的含量和年齡之間關系),從中可以發現什么?
師生活動:讓學生通過觀察表格,繪制散點圖,從而發現年齡和脂肪含量正相關.
設計意圖" 讓學生動手操作,繪制散點圖,有利于培養學生作圖能力.新高考下,對學生作圖能力的考察逐漸增加,我們應該在平時的課堂上多給學生練習的機會.而從上節課的案例引出新課,除了溫故知新外,更是因為與小學、初中的統計案例豐富不同,高中的統計更講究一個案例反復應用,讓學生通過不同的統計視角,層層深入,反復對比,得出不同的結論,明確統計的結論是對各個統計量綜合考察的結果.
追問:我們從散點圖中可以看出年齡和脂肪含量正相關,那么,他們的相關程度是多少呢?
師:散點圖可以說明變量間有無線性相關關系,但不能精確地說明成對樣本數據之間關系的密切程度,更不能精確地說明成對樣本數據之間關系的密切程度.因此,我們思考能否尋找一個合適的量來對樣本數據的相關程度進行定量分析?這也是我們這節課的任務.
設計意圖" 散點圖的不足是我們學習樣本相關系數的必要性,也是學生的學習動力.這也體現了“研究統計問題的基本路徑是從直觀描述到定量刻畫”.
2.協作方差公式推導的合理性
而統計量應不受問題情境、樣本容量、單位的影響,應具有穩定性.因此,學生首先想到的應該是方差,考慮到雙變量,可以變形得到1n∑ni=1[(xi-)2+(yi-)2]這個公式,但以此表述是否合理呢?首先,方差可以體現離散程度,但無法描述成對數據到底是“正相關”還是“負相關”.其次,這個公式的幾何意義是到點(,)的距離的平方,其圖形軌跡是圓,不適合描述“線性”相關.正是因為方差的這兩點不合理,引導學生用直線、矩形近似逼近直線.將公式優化為協作方差1n∑ni=1[(xi-)(yi-)].而(xi-)(yi-)在忽略負號的前提下表示的是兩條垂直線段長度之積,其圖形指向的是分別以(,)和(xi,yi)為兩個對頂點的矩形的面積,更容易逼近直線.
而這部分的推導,教材并未涉及,使得學生覺得協作方差公式給的很突兀,不理解更記不住,從而產生畏難心理.教師在教學中應該強調原因,讓公式出來的比較流暢,這也體現了統計的合理性.
3.樣本相關系數取值范圍的合理性
協作方差公式雖然可以體現樣本的相關性,也可以判斷正、負相關性,但可以根據具體案例,發現其受單位的影響,所以不能直接用它度量成對樣本數據相關程度的大小.從而想到將其標準化得到樣本相關系數r=Σni=1(xi-x)(yi-y)Σni=1(xi-x)2Σni=1(yi-y)2.
之后考慮樣本相關系數的范圍.設“標準化”處理后的成對數據的(x1′,y1′),(x2′,y2′),…,(xn ′,yn ′)的第一分量構成n維向量′(x′1,x′2,…,x′n),第二分量構成n維向量′(y′1,y′2,…,y′n),則有r=1n′′=1n′′cosθ,因為′=′=n,所以樣本相關系數r=cosθ.其中θ為向量x′和向量y′的夾角,由-1≤cosθ≤1可知-1≤r≤1.
這種構造向量確定范圍的雖然結果明顯,但是思維跨度較大,從一個代數公式直接想到n維向量,學生難以理解.
因此,在教學過程中,可以添加這部分的解釋.
問題1" 觀察樣本相關系數的公式,能否化簡?
r=Σni=1(xi-x)(yi-y)Σni=1(xi-x)2Σni=1(yi-y)2 = Σni=1xi yi" - Σni=1xi" - Σni=1yi" + Σni=1xyΣni=1xi 2 - 2Σni=1xi" + Σni=12Σni=1yi 2 - 2Σni=1yi" + Σni=12 = Σni=1xi yi" - n - n + nΣni=1xi 2 - 2n + n2Σni=1yi 2 - 2n + n2 = Σni=1xi yi" - nΣni=1xi 2 - n2Σni=1yi 2 - n2.
問題2" 觀察樣本相關系數的公式,從形式上看有何特征?
分子中n是具體的數,一旦樣本確定了,值也就唯一確定了.Σni=1xiyi表示的是對應坐標乘積的和,和之前學習的向量的數量積很類似.分母n2也是具體的數,Σni=1xi 2Σni=1yi 2和向量的模很類似,所以,樣本相關系數的公式和n維向量的夾角θ = Σni=1xi yi Σni=1xi 2Σni=1yi 2很相似.從而得到結論-1≤r≤1.當rgt;0時,成對樣本數據正相關;當r<0時,成對樣本數據負相關.當r越接近1,成對樣本數據的線性相關程度越強;當r越接近0,成對樣本數據的線性相關程度越弱.
問題3" 觀察下面散點圖,能得到什么結論?
從圖像看,這些點不成線性相關,但它們的相關系數r的值卻接近0.9.
結論" 線性相關可以得到相關系數r的絕對值越接近與1,但反過來卻未必成立.
判斷兩個樣本相關程度的步驟:
設計意圖" 從具體的實例出發,讓學生找到矛盾,從而得到判斷兩個樣本相關程度的步驟.另外有具體的反例,學生會記憶深刻.
三、結語
通過小學到高中的學習,學生已經初步建立了樣本估計總體的思想,為學生理解用樣本相關系數推斷變量間的相關性奠定認知基礎.統計中刻畫數據特征(均值、方差)的一般方法,為構建樣本相關系數提供了可資借鑒的思想方法.因此,本節課可以類比單變量,以問題串的形式引導學生推導樣本相關系數.讓學生體會從“直觀描述”到“定量刻畫”的過程,將重點放是公式的推導過程,而不是計算,要讓學生明白公式如何來?為什么要這樣優化?同時,教材對于樣本相關系數的推導過程描述的很詳細,但為什么優化,沒有明確講,這會讓學生覺得這個公式很高端,很難以理解,從而不容易理解.所以,在教學中應該強調原因,讓公式出來的比較流暢,這也體現了統計的合理性.