■江蘇省揚州寶應中學 王志民
2020年高考對概率統計的考查主要圍繞“抽樣、頻率分布直方圖、樣本的數字特征、獨立性檢驗、古典概型、隨機變量的分布列和期望的計算”等核心考點展開,重在考查同學們應用概率統計知識解決實際問題的能力。
例 1(2020年高考全國Ⅲ卷文)設一組樣本數據x1,x2,…,xn的方差為0.01,則數據10x1,10x2,…,10xn的方差為( )。
A.0.01 B.0.1 C.1 D.10
解析:因為數據axi(i=1,2,…,n)的方差是數據xi(i=1,2,…,n)的方差的a2倍,所以所求數據的方差為102×0.01=1。故選C。
素養:平均數、中位數、眾數描述其集中趨勢,方差和標準差描述其波動大小。當平均數相同時,再考查方差進行決策。
例 2(2020年高考天津卷)從一批零件中抽取80個,測量其直徑(單位:mm),將所得數據分為9組:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到圖1所示的頻率分布直方圖,則在被抽取的零件中,直徑落在區間[5.43,5.47)內的個數為( )。

圖1
A.10 B.18 C.20 D.36
解析:根據直方圖,直徑落在區間[5.43,5.47)內的頻率為(6.25+5.00)×0.02=0.225,則直徑落在區間[5.43,5.47)內的零件個數為80×0.225=18。故選B。
素養:在頻率分布直方圖中,每一個小矩形的面積就是相應的頻率或概率,所有小矩形的面積之和為1,利用頻率分布直方圖估計總體的分布情況:(1)最高的小長方形底邊中點的橫坐標即是眾數;(2)中位數左邊和右邊的小長方形的面積和是相等的;(3)平均數等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和。
例 3(2020年高考全國Ⅰ卷文)設O為正方形ABCD的中心,在O,A,B,C,D中任取3點,則取到的3點共線的概率為( )。

解析:如圖2,從O,A,B,C,D中任取3個點,有{O,A,B},{O,A,C},{O,A,D},{O,B,C},{O,B,D},{O,C,D},{A,B,C},{A,B,D},{A,C,D},{B,C,D},共10種不同取法,3點共線只有{A,O,C}與{B,O,D},共2種情況,由古典概型的概率計算公式知,取到3點共線的概率為故選A。

素養:古典概型中基本事件數的探求方法:(1)列舉法。(2)樹狀圖法:適合于較為復雜的問題中的基本事件的探求。(3)列表法:適用于多元素基本事件的求解問題,通過列表把復雜的題目簡單化、抽象的題目具體化。(4)排列組合法:適用于限制條件較多且元素數目較多的題目。
例 4(2020年高考北京卷)某校為舉辦甲、乙兩項不同活動,分別設計了相應的活動方案:方案一、方案二。為了解該校學生對活動方案是否支持,對學生進行簡單隨機抽樣,獲得數據如表1:

表1
假設所有學生對活動方案是否支持相互獨立。
(1)分別估計該校男生支持方案一的概率,該校女生支持方案一的概率;
(2)從該校全體男生中隨機抽取2人,全體女生中隨機抽取1人,估計這3人中恰有2人支持方案一的概率;
(3)將該校學生支持方案二的概率估計值記為p0,假設該校一年級有500名男生和300名女生,除一年級外其他年級學生支持方案二的概率估計值記為p1。試比較p0與p1的大小。(結論不要求證明)
解析:(1)該校男生支持方案一的概率為該校女生支持方案一的概率為。
(2)這3人中恰有2人支持方案一有以下兩種情況:①一名男生和一名女生支持方案一,一名男生支持方案二,概率為×兩名男生支持方案一,一名女生支持方案二,概率為所以這3人中恰有2人支持方案一的概率是。
(3)p1<p0。
理由:估計該校男生、女生人數的整體比例為600:400=3:2,男生對方案二的支持率高于女生。而一年級男生、女生人數的比例為500:300=5:3,高于整體比值,一年級對方案二的支持率高于平均值,所以除一年級外其他年級學生支持方案二的概率估計值p1小于該校學生支持方案二的概率估計值p0。
素養:有關隨機變量的分布列與數學期望問題,互斥事件和相互獨立事件的概率計算公式等是基礎,有時合理構建獨立重復試驗,利用二項分布模型可簡化計算概率。
例 5(2020年高考全國Ⅲ卷理)在一組樣本數據中,1,2,3,4出現的頻率分別為p1,p2,p3,p4,且則下面四種情形中,對應樣本的標準差最大的一組是( )。
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
解析:借助期望和方差的意義對選擇支逐一驗證,對于A選項,該組數據的平均數為=(1+4)×0.1+(2+3)×0.4=2.5,方差為=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;
因此,B選項這一組標準差最大。故選B。
素養:E(X)=x1p1+x2p2+…+xnpn,D(X)=[x1-E(X)]2·p1+[x2-E(X)]2·p2+…+[xn-E(X)]2·pn,當隨機變量含參數或某一個概率為參數時,可構建期望或方差是關于某參數的二次函數,從而研究參數的變化趨勢。