湖南 羅禮明
“收集數據、整理數據、分析數據,從大量數據中抽取對研究問題有用的信息,并做出判斷”,這是統計的主要任務,而“用樣本估計總體”是統計的基本思想.由于概率、統計與實際問題的聯系非常緊密,概率與統計的實際應用題在歷年高考中備受命題者的青睞,成為考查學生數學抽象、邏輯推理、數學建模、直觀想象、數學運算和數據分析等核心素養的“常態”題型.近兩年高考試題特別注重考查學生整理、分析數據、處理數據的能力及統計與概率知識的整合,概率與統計方面的高考題與以往的高考題比較更新了,更廣了,更活了,成為高考的一大“亮點”.本文結合2018年高考題中的概率與統計應用題解讀這方面的知識.
例1.(2018·全國卷Ⅰ理·3)某地區經過一年的新農村建設,農村的經濟收入增加了一倍,實現翻番.為更好地了解該地區農村的經濟收入變化情況,統計了該地區新農村建設前后農村的經濟收入構成比例,得到如下餅圖:

建設前經濟收入構成比例

建設后經濟收入構成比例
則下面結論中不正確的是
( )
A.新農村建設后,種植收入減少
B.新農村建設后,其他收入增加了一倍以上
C.新農村建設后,養殖收入增加了一倍
D.新農村建設后,養殖收入與第三產業收入的總和超過了經濟收入的一半
【答案】A.
【點評】本題以實際生活與統計圖為背景,考查考生的化歸與轉化、識圖與用圖的能力.考查的核心素養是數學運算、數據分析.審題時若沒有注意到“新農村建設后經濟收入增加了一倍”而直接觀察餅圖進行比較,就會得出錯誤的選項.
例2.(2018·全國卷Ⅱ理·18)下圖是某地區2000年至2016年環境基礎設施投資額y(單位:億元)的折線圖.


(Ⅰ)分別利用這兩個模型,求該地區2018年的環境基礎設施投資額的預測值;
(Ⅱ)你認為用哪個模型得到的預測值更可靠?并說明理由.

(Ⅱ)利用模型②得到的預測值更可靠.理由略.
【點評】本題以現實生活中的實際問題為背景,綜合考查折線統計圖、線性回歸分析的基本思想與初步應用,意在考查數據處理、運算求解、圖形的識別等能力.考查的核心素養是數據分析、數學建模、數學運算.(Ⅰ)對變量值的預測主要是由給出的變量的值預測與其有相關關系的變量的值,一般方法是:若已知回歸方程,則直接將數值代入求得預測值;若回歸方程未知則先要畫出散點圖并根據散點圖選擇恰當的回歸方程建立回歸模型.(Ⅱ)回歸模型的擬合效果主要有兩種途徑判斷:一是利用數據的散點圖,觀察數據對應的點與回歸圖象的位置關系進行分析;二是利用殘差進行分析,最簡單的做法是選擇數據中具有代表性的點進行預報,比較預報值與真實值的差距進行分析.
例3.(2018·北京卷理·17)電影公司隨機收集了電影的有關數據,經分類整理得到下表:

電影類型第一類第二類第三類第四類第五類第六類電影部數14050300200800510好評率0.40.20.150.250.20.1
好評率是指:一類電影中獲得好評的部數與該類電影的部數的比值.假設所有電影是否獲得好評相互獨立.
(Ⅰ)從電影公司收集的電影中隨機選取1部,求這部電影是獲得好評的第四類電影的概率;
(Ⅱ)從第四類電影和第五類電影中各隨機選取1部,估計恰有1部獲得好評的概率;
(Ⅲ)假設每類電影得到人們喜歡的概率與表格中該類電影的好評率相等.用“ξk=1”表示第k類電影得到人們喜歡,“ξk=0”表示第k類電影沒有得到人們喜歡(k=1,2,3,4,5,6).寫出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小關系.
【分析】(Ⅰ)讀表,可得出是在2 000部電影中隨機抽取1部,而第四類電影中獲得好評的有50部,結合古典概型,可求得概率.
(Ⅱ)從第四類和第五類電影中各隨機選出1部,恰好有1部獲得好評包含第四類獲得好評的同時第五類沒有獲得好評和第五類獲得好評的同時第四類沒有獲得好評兩種情況,由互斥事件的概率加法公式可求得.
(Ⅲ)兩點分布,隨機變量的期望Eξ=p,方差Dξ=p(1-p),很容易求得它們的方差并比較出大小.
【答案】(Ⅰ)0.025.
(Ⅱ)0.35.
(Ⅲ)Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.
【點評】本題將電影好評率和概率與統計知識相結合,考查了古典概率的計算、互斥事件、兩點分布、期望等相關知識,問題源自生活又高于生活,突出了數學的應用價值.考查了學生分析問題、解決問題的能力及數據處理能力和應用意識.考查的核心素養是邏輯推理、數學運算與數據分析.
例4.(2018·全國卷Ⅰ文·19)某家庭記錄了未使用節水龍頭50天的日用水量數據(單位:m3)和使用了節水龍頭50天的日用水量數據,得到頻數分布表如下:

未使用節水龍頭50天的日用水量頻數分布表

使用了節水龍頭50天的日用水量頻數分布表
(Ⅰ)作出使用了節水龍頭50天的日用水量數據的頻率分布直方圖:

(Ⅱ)估計該家庭使用節水龍頭后,日用水量小于0.35 m3的概率;
(Ⅲ)估計該家庭使用節水龍頭后,一年能節省多少水?(一年按365天計算,同一組中的數據以這組數據所在區間中點的值作代表)
【答案】(Ⅰ)

(Ⅱ)0.48.
(Ⅲ)47.45 m3.
【點評】本題考查頻數、頻率、頻率分布直方圖及運用統計知識解決簡單實際問題的能力、數據處理能力和應用意識. 考查的核心素養是數學運算與數據分析.在頻率分布表中,頻數的和等于樣本容量,頻率的和等于1,每一小組的頻率等于這一組的頻數除以樣本容量.頻率分布直方圖中,小長方形的高等于每一組的頻率除以組距,它們與頻數成正比,小長方形的面積等于這一組的頻率.頻率分布直方圖中的平均數等于頻率分布直方圖中每個小長方形的面積乘以底邊中點的橫坐標之和.
例5.(2018·全國卷Ⅲ理·18)某工廠為提高生產效率,開展技術創新活動,提出了完成某項生產任務的兩種新的生產方式.為比較兩種生產方式的效率,選取40名工人,將他們隨機分成兩組,每組20人.第一組工人用第一種生產方式,第二組工人用第二種生產方式.根據工人完成生產任務的工作時間(單位:min)繪制了如下莖葉圖:

第一種生產方式第二種生產方式86556899762701223456689877654332814452110090
(Ⅰ)根據莖葉圖判斷哪種生產方式的效率更高?并說明理由;
(Ⅱ)求40名工人完成生產任務所需時間的中位數m,并將完成生產任務所需時間超過m和不超過m的工人數填入下面的列聯表:

超過m不超過m第一種生產方式第二種生產方式
(Ⅲ)根據(Ⅱ)中的列聯表,能否有99%的把握認為兩種生產方式的效率有差異?

【答案】(Ⅰ)第二種生產方式的效率更高.理由略.
列聯表如下:

超過m不超過m第一種生產方式155第二種生產方式515

【點評】本題以社會生活中的生產效率為背景,融入莖葉圖、統計案例等知識,主要考查莖葉圖中數據的讀取與分類匯總、中位數的計算、卡方的觀測值的計算與應用等及分析問題、解決問題的能力.考查的核心素養是數學運算與數據分析.獨立性檢驗可檢驗“兩個分類變量X和Y是否有關系”,而且能較為精確地給出這種判斷可靠程度的一種統計方法.計算出的K2的觀測值越大,表示兩個分類變量之間的關系越強.
例6.(2018·全國卷Ⅰ理·20)某工廠的某種產品成箱包裝,每箱200件,每一箱產品在交付用戶之前要對產品作檢驗,如檢驗出不合格品,則更換為合格品.檢驗時,先從這箱產品中任取20件作檢驗,再根據檢驗結果決定是否對余下的所有產品作檢驗,設每件產品為不合格品的概率都為p(0
(Ⅰ)記20件產品中恰有2件不合格品的概率為f(p),求f(p)的最大值點p0;
(Ⅱ)現對一箱產品檢驗了20件,結果恰有2件不合格品,以(Ⅰ)中確定的p0作為p的值.已知每件產品的檢驗費用為2元,若有不合格品進入用戶手中,則工廠要對每件不合格品支付25元的賠償費用.
(ⅰ)若不對該箱余下的產品作檢驗,這一箱產品的檢驗費用與賠償費用的和記為X,求EX;
(ⅱ)以檢驗費用與賠償費用和的期望值為決策依據,是否該對這箱余下的所有產品作檢驗?
【分析】(Ⅰ)由每件產品不合格的概率為p,結合獨立重復試驗,即可求出20件產品中恰有2件不合格品的概率f(p),對f(p)求導,利用導數的知識可求得f(p)的最大值點p0,但要注意p的取值范圍;
(Ⅱ)(ⅰ)利用(Ⅰ)的結論,設余下的產品中不合格品的件數為Y,則Y服從二項分布,利用二項分布的期望公式和Y與X的關系式求出EX;(ⅱ)求出檢驗余下所有產品的總費用,再與EX比較,即可得出結論.
【答案】(Ⅰ)0.1.
(Ⅱ)(ⅰ)490.
(ⅱ)如果對余下的產品作檢驗,則這一箱產品所需要的檢驗費為400元.由于EX>400,故應該對余下的產品作檢驗.
【點評】本題主要考查相互獨立事件的概率、離散型隨機變量的期望、導數的應用、二項分布、決策性問題等.考查的核心素養是邏輯推理、數學建模、數學運算與數據分析.破解此題的關鍵:一是認真讀題,讀懂題意;二是會利用導數求最值;三是會利用公式求服從特殊分布的離散型隨機變量的期望值;四是會利用期望值,解決決策型問題.
