欒長偉
《義務教育數學課程標準(2022年版)》(以下簡稱“新課標”)中“統計與概率”部分內容相對于《義務教育數學課程標準(2011年版)》(以下簡稱“2011年版課標”)有了較大變化,新增了四分位數、百分位數、組內離差平方和等新知識的同時,也對簡單隨機抽樣等知識的能力要求層次進一步提高,這種變化對教師是一種挑戰。筆者對新課標與“2011年版課標”中“統計與概率”部分內容進行對比,對新增加的內容如何在教學中進行實施提出了建議。
“統計與概率”的核心是培養學生的數據觀念。新課標中關于數據觀念的描述如下:數據觀念主要是指對數據的意義和隨機性有比較清晰的認識。知道數據蘊含著信息,需要根據問題的背景和所要研究的問題確定數據收集、整理和分析的方法;知道可以用定量的方法描述隨機現象的變化趨勢及隨機事件發生的可能性大小。形成數據觀念有助于理解和表達生活中隨機現象發生的規律,感知大數據時代數據分析的重要性,養成重證據、 講道理的科學態度。
自2001年以來,課程標準中“統計與概率”部分在不斷調整,《義務教育數學課程標準(實驗稿)》第一次將統計與概率作為與代數、幾何平行的獨立學習領域設置,第一次在小學設置概率內容,且在第一學段就要求學習概率內容。
在2011年版課標中,概率內容后移一個學段,在小學第二學段學習概率,只要求定性描述隨機現象發生可能性大小。主要原因是對于第一學段的學生來說,他們很難理解“隨機現象發生的可能性大小”。有學者曾對第一學段的學生進行過調查,“若不透明袋子中有大小相同的2個白色乒乓球、1個黃色乒乓球,隨機摸出一個,摸出哪個顏色乒乓球的可能性大?”,學生回答“黃色”。糾其原因,學生說:“我喜歡黃色。”這說明第一學段的學生還不具備區分可能性大小的能力。同時,在2011年版課標中,統計的一些內容也后移一個學段,小學第一學段平均數移到第二學段,第二學段中中位數、眾數移到第三學段。同樣,在新課標中,“統計與概率”部分也發生了較大的變化。
一、新課標中“統計與概率”的主要變化
(一)內容結構的變化
如下頁表1,與2011年版課標相比較,新課標將以前的三個學段分為小學部分、初中部分共四個學段,即第一學段(1~2年級),第二學段(3~4年級),第三學段(5~6年級),第四學段(第7~9年級);“統計與概率”的內容螺旋上升,尤其是統計部分,分為數據的分類,數據的收集、整理與表達,隨機事件發生的可能性,抽樣與數據分析,隨機事件的概率五個主題組成。
(二)內容呈現方式的變化
“統計與概率”內容的設計思路有所變化,2011年版課標中的課程內容按照“學段+領域”的思路設計,即“統計與概率”領域的內容分散在三個學段呈現。新課標中的課程內容按照“階段+領域+學段”的思路設計,即小學與初中部分,“統計與概率”領域集中呈現各學段內容要求。其更加體現了同一領域下不同學段的縱向要求,更加體現了各學段之間的關聯性。
(三)內容表述形式的變化
新課標中各領域最大的變化就是內容表述形式的變化,其主要分為內容要求、學業要求、教學提示三個方面,不僅說明了學什么,同時說明了學到什么程度,怎樣學。
例如,“概率”部分的內容要求為“知道通過大量重復試驗,可以用頻率估計概率。”
學業要求為:知道經歷大量重復試驗,隨機事件發生的頻率具有穩定性,能用頻率估計概率;體會數據的隨機性以及概率與統計的關系;能綜合運用統計與概率的思維方法解決簡單的實際問題。
教學提示為:引導學生通過大量重復試驗,發現隨機事件發生頻率的穩定性,感悟用頻率估計概率的道理,會用頻率估計概率。
在這樣的過程中,引導學生會從統計與概率的角度認識、理解和表達現實世界中大量存在的隨機現象;這樣的教學實踐活動會涉及大量的數據計算(樣例84和樣例85),建議與信息科技教師合作,設計跨學科的項目式學習課程,引導學生會使用計算機處理數據,養成利用信息技術開展研究的習慣。
(四)內容要求的變化
新課標以下內容發生變化:通過實例認識簡單隨機抽樣(內容要求從了解層次提升到理解層次);理解中位數、眾數的意義(增加);經歷數據分類的活動,知道按照組內離差平方和最小的原則對數據進行分類的方法(增加);會計算四分位數,了解四分位數與箱線圖的關系,感悟百分位數的意義(增加);分布式計算平均數和百分數(樣例86)(增加)。
二、新課標中“統計與概率”的內容分析
新課標指出,數學課程要培養的學生核心素養,主要包括“會用數學的眼光觀察現實世界”“會用數學的思維思考現實世界”“會用數學的語言表達現實世界”三個方面。其中,“統計與概率”在整個義務教育階段分為五個主題,即第一學段的數據分類,第二、三學段的數據收集、整理與表達,第三學段的隨機事件發生的可能性,第四學段的抽樣與數據和概率。
第一學段的“數據分類”是其他四個主題的基礎,包括對具有共同特征的“事物”的分類和對調查等取得的“數據”進行分類,旨在培養學生的數據意識和應用意識,后期的第二、三、四學段我們都要用統計圖整理與表達數據,以及新增加的利用組內離差平方和最小的原則進行數據分類,都是第一學段“數據分類”的具體方法。如條形統計圖是直觀呈現不同類別數據的數量情況;折線統計圖不僅呈現不同類別數據的數量情況,還反應出增減變化;扇形統計圖直觀呈現不同類別數據數量在整體中的占比情況;頻數分布直方圖是直觀呈現不同類別數據出現的頻數分布情況。
第二、三學段數據的收集、整理與表達旨在培養學生的幾何直觀、運算能力、模型觀念、數據觀念和應用意識。同時,引進了統計量,設置了如平均數、百分數等內容,對統計圖進一步進行了強化和應用。
第三學段中的隨機事件發生的可能性旨在培養學生的推理能力、數據觀念和應用意識,通過實例幫助學生認識到生活中有些事情發生是不確定的,而不確定事件中可能發生的不同結果的可能性是有大小的,引導學生初步學會根據所有可能發生的情況正確判斷某種結果發生的可能性大小,但是僅僅限于定性描述。
第四學段中的抽樣與數據分析旨在培養學生的抽象能力、幾何直觀、創新意識、運算能力、推理能力、模型觀念、數據觀念和應用意識;使學生經歷收集(即簡單隨機抽樣),利用統計圖表對數據進行整理與描述,再借助統計量(平均數、眾數、中位數)反應數據的集中趨勢,借助方差、組內離差平方和反應數據的離散程度以及新課標中新增加的四分位數、百分位數來反應數據的分布位置。教學內容圍繞數據分析的整個過程展開,以推斷性統計分析為主。
第四學段中的隨機事件的概率旨在培養學生的抽象能力、創新意識、運算能力、推理能力、模型觀念、數據觀念和應用意識。主要包括兩方面:一是用古典概型刻畫概率,需要滿足簡單隨機抽樣的特征——簡單隨機抽樣要求被抽取的樣本的總體個數N是有限的;簡單隨機樣本數n小于等于樣本總體的個數N;簡單隨機抽樣的每個個體發生的可能性均為n/N(概率相同);樣本的每個單位(個體)完全獨立,彼此間無一定的關聯性和排斥性。二是用頻率刻畫概率。主要分為全樣本抽取法,即制作N個簽(標號為1到N),將總體的單元分別編上1到N的號碼,然后均勻混合制作的N個簽,從中抽取n個簽,則這n個簽上的號碼對應的單元組成的樣本即為隨機樣本。全樣本抽取是一種自然抽取方法。但對于較大的N,這種方法操作起來不方便,通常用逐個抽取法代替,即在總體的N個單元中,等概率抽取1個單元,然后在剩余的(N-1)個單元中等概率抽取1個單元;接著,在剩余的(N-2)個單元中等概率抽取1個單元,依次繼續抽取,每次都在尚未抽取的單元中等概率抽取1個單元且不放回,直到抽取n個單元為止。
三、新課標中“統計與概率”的實施策略
(一)理解“分布式計算”
“分布式計算”是一種計算方法,它和“集中式計算”是相對的。隨著計算技術的發展,有些應用需要巨大的計算能力才能完成,如果采用“集中式計算”,需要耗費相當長的時間才能完成。“分布式計算”將該應用分解成許多小的部分,分配給多臺計算機進行處理。這樣可以節約整體計算時間,大大提高計算效率。
例題:(1)已知若干網站的用戶日人均上網時間,估計這些網站所有用戶的日人均上網時間;(2)已知若干網站的用戶對某個熱點話題的關注度,估計網民對這個熱點話題的關注度。
【說明】以兩家網站為例進行分析,設這兩家網站分別為A網站和B網站。
教師要啟發學生思考這樣的現實情境:知道兩家網站的用戶日人均上網時間分別為a和b,希望知道這兩家網站所有用戶的日人均上網時間。顯然,基于這些信息不可能得到結論,教師要通過啟發最終使學生理解,如果還知道兩家網站平均每天的上網用戶人數分別為n和m,那么就可以得到兩家網站所有用戶的日人均上網時間,即[na+mbn+m]=[nn+ma]+[mn+mb]。這是兩家網站的用戶日人均上網時間a和b的加權平均數。
教師還要啟發學生:對于某一個熱點話題,知道兩家網站認為“這個話題重要”的用戶所占百分比分別為 75%和62%,希望知道這兩家網站所有用戶中認為“這個話題重要” 的用戶所占比例。與上一個問題類似,基于這些信息不可能得到結論,教師要通過啟發最終使學生理解,如果還知道兩家網站參與評價的用戶人數分別為n和m,那么可以得到兩家網站所有用戶中認為 “這個話題重要”的用戶比例為[0.75n+0.62mn+m]=[nn+m]×0.75+[mn+m]×0.62。這也是兩家網站認為“這個話題重要”的用戶所占百分比75%和62%的加權平均數。最后,只需要把這個結果化成百分數就可以了。
通過上面例子可以看到,如果按照定義,無論是平均數還是百分數的計算,都需要用數量總數除以參與計算的個數。如平均數的問題,需要用兩家網站用戶上網的總時間除以用戶總人數;百分數的問題,需要用兩家網站認為熱點話題重要的用戶總人數除以參與評價的用戶總人數。而現在利用已經計算出的兩家網站各自的平均數或者百分數,可以非常方便地通過加權直接計算得到兩家網站的所有用戶日人均上網時間或對某個熱點話題的關注度。這樣的計算,在形式上是加權平均,在程式上是分別計算,是分布式計算的最簡單形式,是大數據計算的熱門算法。
(二)理解“四分位數”
如果把一組數據從小到大排序,用m50表示中位數,稱為第50百分位數,那么中位數把這組數據分為兩部分,分別記為S和T;進一步,用m25和m75分別表示S和T的中位數,那么,所有數據中小于或等于m25的占25%、小于或等于m75的占75%。這樣,m25,m50,m75這三個數值把所有數據分為個數相等的四個部分,因此稱為“四分位數”。
例如,共有12個數據,從小到大排列為2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44。用m50表示這組數據的中位數(第50百分位數或50%分位數),則m50是第6個和第7個數據的平均數,m50=(3.85+3.98)/2=3.915;中位數m50把這組數據分成兩部分;用m25表示S的中位數(第25百分位數或25%分位數或第一四分位數),則m25是第3個和第4個數據的平均數,m25=(3.18+3.21)/2=3.195;意義是:所有數據小于或等于3.195的占25%(12 × 25%=3);用m75表示T的中位數(第75百分位數或75%分位數或第三四分位數),則m75是第9個和第10個數據的平均數,m75=(4.11+4.77)/2=4.44;意義是:所有數據小于或等于4.44的占75%。(12 × 75%=9)
(三)理解“組內離差平方和”
新課標要求“會計算一組簡單數據的離差平方和,經歷數據分類的活動,知道按照組內離差平方和最小的原則對數據進行分類的方法”。在大數據分析中,數據的分組是重要的方法之一。雖然可以有多種方法對數據進行分組,但是,使得“組內離差平方和最小”的方法是最傳統的,也是非常合理的。下面來說明理由。
假設有n個數據,不失一般性,假設這些數據都不相等,表示為x1,x2,……,xn,如果把這些數據分成兩組,如前m個數據為一組(稱為第一組),后(n-m)個數據為一組(稱為第二組)即x1,x2,x3,x4,……,xm ,xm+1,xm+2,……,xn。假設前m個數據平均數為[x1=1m](x1+x2+…+xm),后(n-m)個數據的平均數為[x2]=[1n-m](xm+1+xm+2+……+xn),這n個數據的平均數為[xn=1n](x1+x2+……+xn),則組內離差平方和為:S12=(x1-[x])2+(x2-[x])2+……+(xm-[x]1)2+(xm+1-[x]2)2+(xm+2-[x]2)2+……+(xn-[x]2)2;組間離差平方和為:S22=m(x1-[x])2+(n-m)([x]2-[x])2;
總體離差平方和為:S2=(x1-[x])2+(x2-[x])2+……+(xn-x)2;S2=S12+S22;補充兩數和的平方為零。
[S12]為組內離差平方和,它表達了兩個組內數據的離散程度;[S22]為組間離差平方和,它表達了兩個組間的差異。一個合理的分組原則是使[S12]達到最小,[S22]達到最大。由于總體離差平方和[S2]不變,只需考慮使組內離差平方和達到最小即可。
例題,下頁表2中記錄了我國10個省份2020年人均地區生產總值(人均 GDP)的數據,數據表明,這10個省份的人均GDP是有區別的。如果要把這10個省份依據人均GDP的多少分為兩個組,你認為應當如何劃分?請說出你劃分的道理。
若第1組5個數據,第2組5個數據:[x1]= [6.24+7.16+7.18+7.37+8.855] =7.36,
[x2]=[10.07+10.11+12.13+15.68+16.425=]12.882,S1,52=(6.24-7.36)2+(7.16-7.36)2+(7.18-7.36)2+(7.37-7.36)2+(8.85-7.36)2+(10.07-12.882)2+(10.11-12.882)2+(12.13-12.882)2+(15.68-12.882)2+(16.42-12.882)2=(1.2544+0.04+0.0324+0.0001+2.2201)+(7.907344+7.683984+0.565504+7.828804+12.517444)=3.547+40.05008=40.05008≈40.050
計算結果表明,將排序后的前7個數據分為一組、后3個數據分為另一組,可以使組內離差平方和達到最小值。最后,依據數據對應的省份,分出的兩組是:{省份2,省份3,省份4,省份7,省份8,省份9,省份10};{省份1,省份5,省份6}。
通過數據也可以看到,這樣的分組是合理的。
四、關于“統計與概率”的教學建議
(一)制訂指向核心素養的教學目標
1.教學目標要體現核心素養的主要表現
“統計與概率”部分的內容,其核心素養的表示如表3所示。
2.處理好核心素養與“四基”“四能”的關系
教師要引導學生關注統計的全過程,從對“事物”的分類到對“數據”的分類,從簡單隨機抽樣到數據的整理與描述,使學生經歷從生活中的實際問題抽象數學問題,在發現問題、提出問題的同時,會用數學的眼光觀察現實世界;在對數據處理過程中,培養學生分析問題、解決問題的同時,學會用數學的思維思考現實世界;在用數據的分析結果解決現實問題過程中,會用數學語言表達現實世界。
3.教學目標的設定要體現整體性和階段性
教師要依據核心素養的內涵和在不同學段的表現,結合“統計與概率”的具體教學內容,全面分析主題、單元和課時特征,基于主題、單元整體設計教學目標,圍繞單元目標細化具體課時的教學目標。
(二)整體把握教學內容
教學內容是落實教學目標、發展學生核心素養的載體。教師要重視對教學內容的整體分析,幫助學生建立能體現數學學科本質、 對未來學習有支撐意義的、結構化的數學知識體系。
新課標各領域均有一定變化,教師要理解變化意圖,明確設計理念,將數學核心素養落實到課堂中,為了學生的終身發展全力以赴。
(責任編輯:楊強)