涂天明



“江南可采蓮,蓮葉何田田,魚戲蓮葉間.”描述變量隨機性,“過盡千帆皆不是,斜暉脈脈水悠悠.”相當于此刻前事件不發生,條件概率等于無條件概率.“用數學的符號書寫世界”對應數學建模、數據處理,而數據處理關聯概率與統計,是繼代數、幾何后第三重要數學板塊.然而多年的備考實踐告訴我們,代數、幾何建立在概念與定義上,而統計學建立在數據與分析上,這部分難度大,考生普遍能掌握到位,無需花大力氣攻堅.相比之下,概率的計算考生較為棘手,往往結果與期望值大相徑庭.所以務實備考顯得尤為關鍵,要科學規劃、運籌帷幄,才能出奇制勝、決勝千里.回顧2022年高考新課標卷數學試題,概率與統計內容相對穩定,有難度的調整和形式的改變,但萬變不離其宗,創新很重要,此外新教材新增內容尤為重要,值得關注.
提出問題前先剖析兩個簡單的案例:
例1.外形相同的1串鑰匙共5把,只有1把能打開抽屜,現依次一把一把的試,求第3次打開抽屜的概率.
解析:方法1(古典概型):每次取鑰匙都是隨機的,第幾次取得能開抽屜的鑰匙是等可能的,一共有5把鑰匙,所以第3次打開抽屜的概率是15(事實上每次打開抽屜的可能性都相等,所以每次打開抽屜的概率均相等,均為15).
方法2(條件概率與事件的相互獨立事件性):記第i(i=1,2,3,4,5)打開抽屜為事件Ai(i=1,2,3,4,5),所以PA3=PA1PA2A1PA3A1A2=45×34×13=15.
點評:本題中事件A3發生即有相互獨立的三個事件同時發生,第一次沒打開且在第一次沒打開的條件下第二次也沒打開且在前兩次都沒打開的條件下第三次打開了抽屜,與此同時后兩個事件用的還是條件概率.老教材中相互獨立事件定義為事件A與事件B的發生沒有相互影響,然而新教材中相互獨立事件定義為事件A與事件B滿足PAB=PAPB,也就是定量刻畫.2021年高考新課標I卷數學第8題就是最典型的案例,怎么說明事件A與事件B的發生沒有相互影響,只能進行定量刻畫.
例2.箱中有大小形狀相同的4個小球,其中白球2個,黑球2個.
(1)從中有放回地摸球,每次摸1球.求第2次摸到白球的概率;
(2)從中無放回地摸球,每次摸1球.求第2次摸到白球的概率.
解析:(1)(古典概型):如果有放回地摸球,每次去摸球箱中都有大小形狀相同的4個小球,且白球、黑球各兩個,是等可能的,所以第2次摸到白球的概率是12(事實上每次摸球摸到白球或黑球都是等可能的,所以無論哪次摸到白球的概率都是12).
(2)方法1(古典概型):如果無放回地摸球,無論怎么排序,箱中都是黑球白球各2個,樣本空間里黑白各半,所以第2次摸到白球的概率為12.
方法2(全概率公式):記第i(i=1,2,3,4)摸到白球為事件Ai(i=1,2,3,4),則摸到黑球為事件Ai(i=1,2,3,4),所以PA2=PA1PA2A1+PA1PA2A1=12×13+12×23=12.
點評:本題中無放回地摸球與有放回地摸球,憑直覺是不一樣的,比如上一例感覺上第1次打開抽屜與第3次打開抽屜是不一樣的,然而通過計算發現,它們的的確確是一樣的,無論是無放回地摸球還是有放回地摸球第2次摸到白球的概率都是12.憑感覺也是學數學的一忌,僅憑直覺有時會犯致命錯誤,這個問題最可靠的解釋還只有用全概率公式.
從以上兩個簡單的案例可以看出,直覺上完全不同的問題,結果計算出來讓我們有點不敢相信.說明數學是嚴謹的,有時不能完全相信直覺,你看到的未必真實,沒有經過嚴格證明的結論都不一定可靠.
例3.已知PM>0,PN>0,PNM=PN,求證:PMN=PM.
證明:∵PNM=PN,∴PMNPM=PN,即PMN=PMPN,所以事件M與事件N 是相互獨立事件,∴PMN=PMNPN=PMPNPN=PM.故原題得證.
點評:在舊版教材中,事件A與事件B互斥時PA∪B=PA+PB,互斥事件(不可能同時發生的事件)還好理解,新版教材引進了交事件與并事件的概念,事件A與事件B不互斥時,PA∪B=PA+PB-PAB.在舊版教材中,事件A與事件B相互獨立時,PAB=PAPB.問題就來了,事件的相互獨立性在舊版教材中定義為,事件A的發生與事件B的發生不相互影響,怎么界定呢?很難!新版教材引進乘法公式PAB=PAPBA,事件A生與事件B不相互獨立時,用乘法公式,為了更好地理解條件概率的意義,需要建立樣本空間,明確隨機事件并用樣本空間的子集表示,這就是全概率公式與Bayes公式的思想的最初萌芽.
二、全概率公式與Bayes公式
全概率公式能更深刻地理解條件概率公式,全概率公式與Bayes公式是大學教材概率論中的重要公式,也是高中新教材重要新增內容.實際上就是直接利用條件概率公式推導而成的,當事件分割只有兩個時,就是條件概率公式的簡單情形,從2022年新高考情況看,條件概率難度加大,命題者在其中滲透全概率公式與Bayes公式的思想應引起足夠重視.
1.全概率公式
若Aii=1,2,…n是一組兩兩互斥的事件,A1∪A2∪…∪An=Ω,且PAi>0i=1,2,…n,對任意BΩ,有PB=Σni=1PAiPBAi.
例4.某手機企業有兩條流水線生產相同批號的智能手機,流水線甲的合格率為09,流水線乙的合格率為095,兩條流水線生產的成品手機檢驗前都混放在倉庫,假設這兩條流水線生產的成品比例為2:3,現從成品倉庫中任意提一臺智能手機檢測,求該智能手機合格的概率.
解析:設A=“從倉庫中隨機提出的一臺智能手機是合格品”
B=“提的一臺智能手機是流水線甲生產的”,
C=“提的一臺智能手機是流水線乙生產的”,
由題意,得PB=04,PC=06,,PAB=09,PAC=095,
由全概率公式PA=PBPAB+PCPAC=04×09+06×095=093.
從成品倉庫中任意提一臺智能手機檢測合格的概率是093.
例5.箱子中有大小形狀相同的6個小球其中白球和黑球各3個,現隨機從中摸球一個,看其顏色后放回,并加上同色球2個,再從中第二次摸球一個,求第二次摸到的是黑球的概率.
解析:設A=“第一次抽出的是黑球”,B=“第二次抽出的是黑球”,依題意PA=12,P=12,PBA=58,PB=38.
由全概率公式PB=PAPBA+PPB=12×58+12×38=12,即為所求.
例6.某5A景區內有牡丹,月季,海棠三家餐廳,景區員工小劉第1天午餐時隨機選擇其中一家餐廳就餐,如果他第1天去牡丹廳,那么第2天他再去牡丹廳就餐的概率是35.如果他第1天去月季廳或海棠廳,那么他第2天去牡丹廳就餐的概率是25.求小劉第2天中午去牡丹廳就餐的概率.
解析:(1)設A1=“第1天去牡丹廳”,B1=“第2天去牡丹廳”,依題意,PA1=13,PA1=1-13=23.且A1,A1是對立事件,∴PB1A1=35,PB1A1=25.
由全概率公式得PB1=PA1PB1A1+PA1PB1A1=13×35+23×25=715.
點評:全概率公式應用時如果是分成互斥的兩個子事件,比較容易理解,當子事件有三個或三個以上時,難度就加大了,所以依據教材應多訓練兩個子事件的情況,適當拓展為多個子事件的情況.
2.Bayes公式
若Aii=1,2,…n是一組兩兩互斥的事件,A1∪A2∪…∪An=Ω,且PAi>0i=1,2,…n,對任意BΩ,有PAiB=PAiPBAiPB=PAiPBAiΣni=1PAiPBAi,i=1,2,…n.
例7.某市民主,建國,新城三個社區突發奧密克戎毒株疫情,這三個社區感染的比例分別為01%,01%,02%.假設這三個社區人口占比為2:3:5,現從這三個社區中任取一人.
(1)求此人感染奧密克戎毒株的概率 ;
(2)已知一個人已經感染了奧密克戎毒株, 求此人是來自新城社區的概率.
解析:(1)設B=“這個人感染了奧密克戎毒株”,A1=“這個人來自民主社區”,A2=“這個人來自建國社區”,A3=“這個人來自新城社區”,所以根據全概率公式:PB=PA1PBA1+PA2PBA2+PA3PBA3=210×11000+310×11000+510×21000=1510000.即此人感染力奧密克戎毒株的概率00015.
(2)根據Bayes公式PA3B=PA3BPB+PA3PBA3PB+510×210001510000=23.
點評:本題第(2)小題用到Bayes公式,但Bayes公式是選學內容,不在高考要求范圍內,Bayes公式中本身就包括了全概率公式.深刻理解條件概率公式離不開全概率公式與Bayes公式的思想,學習時要把握一個度,做到恰到好處.
二、2023高考前瞻
結合2022年新課標Ⅰ卷高考情況以及近期各地的模擬試題綜合分析,注意各個核心考點的縱橫聯系,對于來年高考進行展望.“突破難點,順勢而為.”方能順風順水,出奇制勝.注意幾個備考關鍵詞.
1.頻率分布直方圖
例8.某臺風在我國東南沿海登陸,給某鎮造成房屋倒塌和大量農田被淹,直接經濟損失1299億元.民政部門隨機調查了災區200戶居民因臺風造成的經濟損失,將收集的數據分成 [0,2000],(2000,4000],(4000,6000],(6000,8000],(8000,10000] 五組,并作出如下頻率分布直方圖(如圖):
(1)求這次臺風給每戶造成損失的均值;
(2)求這次臺風給每戶造成損失的中位數.
解析:
(1)X=Σ5i=1PiXi=2000(1×015+3×02+5×009+7×003+9×003)=3360(元).
(2)先確定中位數在2000到4000之間,設為x,則2000×000015+00002x-2000=05,解得x=3000.
點評:本題主要考查頻率分布直方圖的意義,考生會看圖即可,均值的計算為后續離散性隨機變量的數學期望公式打基礎.中位數是特殊的百分位數,除中位數外,用類似的方法還可求某個百分位數.百分位數是新增內容, 應該足夠重視.
2.概率綜合計算
相對而言,概率綜合計算是這部分的難點,古典概型應注意對等可能性的理解,互斥事件對立事件要注意交事件是否為不可能事件,用乘法公式定量界定事件的相互獨立性,用全概率公式Bayes公式提升對條件概率的理解.
例9.“登丹霞,觀日出.”一直是人們丹霞之旅的必備項目.每天有來自四面八方的游客登頂丹霞山觀日出,登頂游客中韶關本土游客和外地游客各半,外地游客中有四成乘觀光車登頂,韶關本地游客中近有兩成乘觀光車登頂,乘觀光車登頂的票價為50元.若某天有1500人登頂,則觀光車營運公司這天的登頂觀日出項目的收入是元.
解析:22500.登頂觀日出的游客中任選一人,記A=“游客中任選一人是韶關本地游客”;B=“游客是乘坐觀光車登頂”,
由全概率公式可知游客中任選一人登頂的概率PB=PAPBA+PPB=12×210+12×410=310,
則觀光車營運公司這天的登頂觀日出項目的營運票價收入是1500×310×50=22500(元).
例10.某車站售票廳有5組燈具供照明使用,每組批號相同,據以往調查得知,該批號燈具壽命1年以上概率為09,壽命2年以上概率為06.自啟用日算起,滿1年更換1次,只換已壞燈具(平時不換).求:
(1)第1次更換燈具工作中,恰好2組需更換的概率;
(2)第2次更換燈具工作中,就某一組燈具而言需要更換的概率.
(3)第2次更換燈具工作中,至少需要更換4組的概率.
解析:(1)就1組燈具而言,設A=“壽命1年以上”,B=“壽命2年以上”,
依題意PA=09,PB=06,設C=“第1次更換燈具工作中,恰好2組需更換”,
則PC=C25·1-PA2·PA3=101-092·093=00729.即為所求.
(3)設D=“燈具壽命1年以上且2年以內”,則事件A包括互斥的兩事件B和D,∴PA=PD+PB,∴PD=PA-PB=09-06=03.
(4)故第2次更換燈具工作中,就某一組燈具而言需要更換的概率為P=P2+PD=1-092+03=031.
(3)第2次更換燈具工作中,至少需要更換4組包括換5組和換4組兩種情況,即第2次更換燈具工作中,至少需要更換4組的概率P′=P5+C45P41-P=0315+5×03141-031≈0026.
點評:本題主要考查概率的概念與計算,要正確區別兩個公式互斥事件有一個發生的概率PA+B=PA+PB和相互獨立事件同時發生的概率PAB=PAPB,考查基本運算能力難度適中.其中第2次更換燈具工作中,就某一組燈具而言需要更換的概率很容易錯誤為P=1-092+091-06=037.第2次更換燈具工作中,至少需要更換4組的概率容易錯誤為P′=P5+C45P41-P=0375+5×03741-037≈0066.因為事件A與事件并不是相互獨立事件.
3.離散性隨機變量的均值與條件概率綜合
離散性隨機變量的數學期望、方差,超幾何分布、二項分布以及連續性隨機變量的正態分布都是概率與統計的重要內容,素材比較豐富,復習備考時注意分辨,一旦確定類型可走捷徑.
例11.進入高三后,為了減輕同學們的學習壓力,班上決定進行一次減壓游戲.班主任把除顏色不同外,其余均相同的8個小球放入一個紙箱子,其中白色球與黃色球各3個,紅色球與綠色球各1個.現甲、乙兩位同學進行摸球得分比賽,摸到白球每個記1分,黃球每個記2 分、紅球每個記3分,綠球每個記4 分,規定摸球人得分不低于8分獲勝.比賽規則如下:①只能一個人摸球;②摸出的球不放回;③摸球的人先從袋中摸出1球;若摸出的是綠色球,則再從袋子里摸出2 個球;若摸出的不是綠色球,則再從袋子里摸出3個球,他的得分為兩次摸出的球的記分之和;④剩下的球歸對方,得分為剩下的球的記分之和.
(1) 若甲第一次摸出了綠色球,求甲獲勝的概率;
(2) 如果乙先摸出了紅色球,求乙得分X的分布列和數學期望 EX;
(3) 第一輪比賽結束,有同學提出比賽不公平,請提出你的看法,并說明理由.
解析:(1)記“甲第一次摸出了綠色球,甲獲勝”為事件A,
因為球的總分為1×3+2×3+3+4=16,事件A 指的是甲的得分大于等于8,
則甲再從袋子中摸出2 個球,摸出了1個白球1個紅球,或1個黃球1個紅球,或2 個黃球,
故PA=C13C11+C13C11+C23C27=921=37.
(2)如果乙先摸出了紅色球,則他可以再從袋子中摸出3個球,
若他摸出了3個白球,則X=3+1×3=6分,
若他摸出了2個白球1個黃球,則X=3+1×2+2=7分,
若他摸出了2個白球 1個綠球,則X=3+1×2+4=9分,
若他摸出了1個白球2個黃球,則X=3+1+2×2=8分,
若他摸出了1個白球1個黃球1個綠球,則X=3+1+2+4=10分,
若他摸出了2個黃球1個綠球,則X=3+2×2+4=11分,
若他摸出了3個黃球,則X=3+2×3=9 分,
故X 的所有可能的取值為6 ,7 ,8,9,10,11.
所以PX=6=C33C03C37=135,PX=7=C23C13C37=935,PX=8=C13C23C37=935, PX=9=C23C11+C33C37=435,PX=10=C23C13C11C37=935,PX=11=C23C13C37=335,
故X 的分布列為:
X67891011
P135935935435935335
所以X的數學期望EX=6×135+7×935+8×935+9×435+10×935+11×335=607.
(3)由(1)可知,若第一次摸出綠球,則摸球人獲勝的概率為P1=37,
由(2)可知,若第一次摸出紅球,則摸球人獲勝的概率為P2=9+4+9+335=57,
若第一次摸出黃球,則摸球人獲勝的概率為P3=C26+C22+C12C13C37=2235,
若第一次摸出白球,則摸球人獲勝的概率為P4=C26-1+C23C37=1735,
則摸球人獲勝的概率為P=18×37+18×57+38×2235+38×1735=157280>12,故比賽不公平.
例12.某公司準備處理部分批號的保健用品,這些保健用品每箱200件,以箱為單位進行售賣.已知這批保健用品中每箱出現的廢品率只有01或02兩種可能,且兩種可能對應的概率都是05.若該保健用品正品市場價格為200元每件,廢品不值錢.現決定處理價為33600元每箱,若遇廢品則不給更換.以一箱保健用品中正品的期望價為依據.
(1)在不開箱檢驗的情況下,判斷是否可以購買;
(2)現允許開箱,有放回地隨機從一箱中抽取2件產品進行檢驗.
(i)若此箱出現的廢品率為20%,記抽到的廢品數為X,求X的分布列和數學期望;
(ii)若已發現在抽取檢驗的2件產品中,其中恰有一件是廢品,判斷是否可以購買.
解析:(1)在不開箱檢驗的情況下,一箱保健用品中正品的期望價為:
Eξ=200×1-02×200×05+200×1-01×200×05=34000>33600.
∴在不開箱檢驗的情況下,可以購買.
(2)(i) X的可能取值為0,1,2,
PX=0=C02·020·082=064;
PX=0=C12·021·081=032;
PX=2=C22·022·080=004,
∴X的分布列為:
X012
P064032004
∴EX=0×064+1×032+2×004=04.或∵X服從二項分布B202,∴EX=2×04=04.
(ii)設事件A :發現在抽取檢驗的 2 件保健用品中恰有一件是廢品,
則 PA=C12·02·08×05+C12·01·09×05=025,
一箱保健用品中,設正品的價格期望值為Y,則Y =32000 ,36000,
事件 B1:抽取廢品率為20% 的一箱,事件 B2:抽取廢品率為10% 的一箱,則:
PY=32000=PB1A=PAB1PA=C12·02·08×05025=064,
PY=36000=PB2A=PAB2PA=C12·01·09×05025=
036,∴EX=32000×064+3600×036=33440<33600,
∴在抽取檢驗的 2 件產品中,其中恰有一件是廢品, 不可以購買.
點評:概率計算是重點,也是難點,是考生能否完成一道綜合題的關鍵.這兩例題主要考查條件概率,離散性隨機變量的分布列、均值,屬基本題題,難點處用到條件概率公式需要細心.
4.統計案例與其它
新教材加強了統計案例,在必修統計內容的基礎上,通過對成對數據研究兩個隨機變量之間的關系,使考生能掌握成對樣本數據的直觀表示以及線性相關統計特征的刻畫方法.
例13.某工廠為了提高生產效率,對生產設備進行了技術改造,為了對比技術改造后的效果,采集了技術改造前后各20次連續正常運行的時間長度(單位:天)數據,整理如下:
改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21;改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36.
(1)完成下面的列聯表,并依據小概率值α=0010的獨立性檢驗分析判斷技術改造前后的連續正常運行時間是否有差異?
技術改造
設備連續正常運行天數
超過30不超過30
合計
改造前
改造后
合計
(2)工廠的生產設備的運行需要進行維護,工廠對生產設備的生產維護費用包括正常維護費和保障維護費兩種,對生產設備設定維護周期為T天(即從開工運行到第kT天,k∈N*)進行維護,生產設備在一個生產周期內設置幾個維護周期,每個維護周期相互獨立,在一個維護周期內,若生產設備能連續運行,則只產生一次正常維護費,而不會產生保障維護費;若生產設備不能連續運行,則除產生一次正常維護費外,還產生保障維護費.經測算,正常維護費為05萬元/次,保障維護費第一次為02萬元/周期,此后每增加一次則保障維護費增加02萬元.
現制定生產設備一個生產周期(以120天計)內的維護方案:T=30,k=1,2,3,4 以生產設備在技術改造后一個維護周期內能連續正常運行的頻率作為概率,求一個生產周期內生產維護費的分布列及均值.
附:
α0150100. 050025001000050. 001
xα20722706384150246635787910828
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),(其中n=a+b+c+d).
解析:(1)列聯表為:
技術改造
設備連續正常運行天數
超過30不超過30
合計
改造前51520
改造后15520
合計202040
零假設為:H0:技術改造前后的連續正常運行時間無差異.
∴χ2=40(5×5-15×15)220×20×20×20=10>6635,
∴依據小概率值α=0010的獨立性檢驗分析判斷H0不成立,即技術改造前后的連續正常運行時間有差異.
(2)由題知,生產周期內有4個維護周期,一個維護周期為30天,一個維護周期內,生產線需保障維護的概率為P=14.
設一個生產周期內需保障維護的次數為ξ,則ξ~B(4, 14);一個生產周期內的正常維護費為05×4=2萬元,保障維護費為02ξ×(ξ+1)2=(01ξ2+01ξ)萬元.
∴一個生產周期內需保障維護ξ次時的生產維護費為(01ξ2+01ξ+2)萬元.
設一個生產周期內的生產維護費為X,則X的所有取值為2,22,26,32,4.
P(X=2)=1-144=81256,
P(X=22)=C141-14314=2764,
P(X=26)=C241-142142=27128,
P(X=32)=C341-14143=364,
P(X=4)=144=1256 .
所以,X的分布列為:
X22226324
P812562764271283641256
∴E(X)=2×81256+22×2764+26×27128+32×364+4×1256=162+2376+1404+384+4256=5824256=2275,
∴一個生產周期內生產維護費的均值為2275萬元.
例14.已知PA=12,PA=13,P=34,則()
A.PA=23
B.P=14
C.P=23
D.PB=37
解析:∵PA=PAPA=1312=23,故A對.
又∵P=PP=P12=34,
所以P=38.
又∵PB=1-P=1-34=14,PB=PB=PA+P=13+38=1724.
PB=1-P=1-1724=724,∴PB=PBPB=PPBPB=12×14724=37.
故D對,選AD.
點評:這種考法值得關注,承上啟下,概念也好,公式也罷,能理解其本質很重要.概率與統計承載中學核心教學內容,另一方面為大學理工科相關專業的考生繼續學習奠定基礎.
概率論是研究隨機現象規律的科學,是統計學的理論基礎.概率是用來度量隨機事件發生的可能性大小,概率與統計同代數、幾何一樣,也應從考生的認知規律出發,因材施教,以發展學生數學科核心素養為目標.作為考生,更要了解自己,了解高考.統計學雖然放在數學課程中,但它與數學是有差別的,數學是建立在概念和定義的基礎上通過公理化方法來構建的,而統計學的研究是建立在數據的基礎上,通過對數據分析進行推斷的.高考備考不但要開啟數學之門窗,而且要毅然決然進去遨游神奇的數學世界.
責任編輯 徐國堅