四川省綿陽(yáng)實(shí)驗(yàn)高級(jí)中學(xué) 劉林強(qiáng)
通過(guò)對(duì)近幾年的高考概率統(tǒng)計(jì)解答題進(jìn)行分析,其命題不斷強(qiáng)化應(yīng)用意識(shí)的考查,這也是新高考改革的必然趨勢(shì)。概率與統(tǒng)計(jì)作為高考的熱點(diǎn)之一,其往往以實(shí)際問(wèn)題為背景,考查統(tǒng)計(jì)或概率的相關(guān)計(jì)算。復(fù)習(xí)時(shí),我們應(yīng)多關(guān)注其命題新動(dòng)向。
統(tǒng)計(jì)案例分析問(wèn)題通常是給出解題所需的公式,此類問(wèn)題考查同學(xué)們的數(shù)據(jù)處理能力和運(yùn)算求解能力。要求同學(xué)們能正確使用公式進(jìn)行運(yùn)算、變形和數(shù)據(jù)處理,能根據(jù)題意尋找合理、簡(jiǎn)捷的運(yùn)算途徑,并會(huì)對(duì)數(shù)據(jù)進(jìn)行近似和估計(jì)計(jì)算。
例1(2022年安徽蚌埠一模)文旅部門統(tǒng)計(jì)了某網(wǎng)紅景點(diǎn)在2022年3月至7月的旅游收入y(單位:萬(wàn)),得到表1中的數(shù)據(jù):

表1
(1)根據(jù)表中所給數(shù)據(jù),用相關(guān)系數(shù)r加以判斷,是否可用線性回歸模型擬合y與x的關(guān)系? 若可以,求出y關(guān)于x之間的線性回歸方程;若不可以,請(qǐng)說(shuō)明理由。
(2)為調(diào)查游客對(duì)該景點(diǎn)的評(píng)價(jià)情況,隨機(jī)抽查了200 名游客,得到如表2 所示的列聯(lián)表,請(qǐng)?zhí)顚懕?,依據(jù)α=0.001 的獨(dú)立性檢驗(yàn),能否認(rèn)為“游客是否喜歡該網(wǎng)紅景點(diǎn)與性別有關(guān)聯(lián)”。
附參考公式、參考數(shù)據(jù)及表3:相關(guān)系數(shù)

表2

表3 (臨界值)
(2)2×2列聯(lián)表如表4所示:

表4
假設(shè)H0:游客是否喜歡該網(wǎng)紅景點(diǎn)與性別無(wú)關(guān)聯(lián),根據(jù)表4 中的數(shù)據(jù)可得,χ2==x0.001,依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即游客是否喜歡該網(wǎng)紅景點(diǎn)與性別有關(guān)聯(lián)。
評(píng)注:高考中的線性回歸問(wèn)題,主要考查同學(xué)們的數(shù)據(jù)處理能力,線性回歸和相關(guān)系數(shù)的公式一般會(huì)在考題中給出,但需要同學(xué)們能對(duì)公式進(jìn)行準(zhǔn)確的變形,靈活處理相關(guān)數(shù)據(jù)。對(duì)于分類變量的關(guān)系,也就是獨(dú)立性檢驗(yàn)問(wèn)題,若利用公式計(jì)算出的K2越大,則說(shuō)明兩個(gè)分類變量的關(guān)系越強(qiáng);反之,關(guān)系越弱。
為了考查總體的分布情況,通常是從總體中抽取一個(gè)樣本,用樣本的分布情況去估計(jì)總體的分布情況。這種估計(jì)大體分為兩類:用樣本的頻率分布估計(jì)總體的分布;用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征。
例2(2022年黑龍江哈爾濱模擬)我國(guó)發(fā)表的《人類減貧的中國(guó)實(shí)踐》白皮書提到占世界人口近五分之一的中國(guó)全面消除絕對(duì)貧困,提前10 年實(shí)現(xiàn)減貧目標(biāo),為了鞏固脫貧成果,哈爾濱市某地區(qū)積極引導(dǎo)人們種植一種名貴中藥材,并成立藥材加工廠對(duì)該藥材進(jìn)行切片加工,包裝成袋出售,已知這種袋裝中藥的質(zhì)量以某項(xiàng)指標(biāo)值k(40≤k≤100)為衡量標(biāo)準(zhǔn),k值越大,質(zhì)量越好,該質(zhì)量指標(biāo)值的等級(jí)及出廠價(jià)如表5所示:

表5
該藥材加工廠為了解生產(chǎn)這種袋裝中藥的經(jīng)濟(jì)效益,從所生產(chǎn)的這種袋裝中藥中隨機(jī)抽取了1 000袋,測(cè)量了每袋中藥成品的k值,得到如圖1所示的頻率分布直方圖。
(1)視頻率為概率,求該藥材加工廠所生產(chǎn)的袋裝中藥成品的質(zhì)量指標(biāo)值k的平均數(shù)(同一組中的數(shù)據(jù)用該組區(qū)間中點(diǎn)值作代表)。

圖1
(2)現(xiàn)從質(zhì)量指標(biāo)值為[60,80)中分層抽取6袋,某人在6袋中抽取2袋,已知其中一袋的質(zhì)量指標(biāo)值在[60,70)內(nèi)的條件下,求另一袋的質(zhì)量指標(biāo)值在[70,80)內(nèi)的概率。
(3)假定該中藥加工廠一年的袋裝中藥的產(chǎn)量為10 萬(wàn)袋,且全部都能銷售出去,若每袋袋裝中藥的成本為90元,工廠的設(shè)備投資為200萬(wàn)元,試問(wèn):該中藥加工廠是否有可能在一年內(nèi)通過(guò)加工該袋裝中藥收回投資?并說(shuō)明理由。
解析:(1)由題意可得平均數(shù)為ˉk=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,所以可以估計(jì)該中藥加工廠生產(chǎn)的袋裝中藥的指量指標(biāo)值的平均數(shù)為71。
(2)從質(zhì)量指標(biāo)值為[60,80)中分層抽取6袋,則在質(zhì)量指標(biāo)值為[60,70)內(nèi)抽取6×(袋),設(shè)為a,b;在質(zhì)量指標(biāo)值為[70,80)內(nèi)抽取(袋),設(shè)為C,D,E,F。某人在6袋中抽取2袋,已知其中一袋的質(zhì)量指標(biāo)值在[60,70)內(nèi),基本事件有(a,b),(a,C),(a,D),(a,E),(a,F),(b,C),(b,D),(b,E),(b,F),共9個(gè),其中一袋的質(zhì)量指標(biāo)值在[60,70)內(nèi)的條件下,另一袋的質(zhì)量指標(biāo)值在[70,80)內(nèi)包含的基本事件有(a,C),(a,D),(a,E),(a,F),(b,C),(b,D),(b,E),(b,F),共8個(gè),所以其中一袋的質(zhì)量指標(biāo)值在[60,70)內(nèi)的條件下,另一袋的質(zhì)量指標(biāo)值在[70,80)內(nèi)的概率為
(3)設(shè)每袋袋裝中藥的銷售利潤(rùn)為z元,則樣本中每袋的平均利潤(rùn)為z=10×0.25+30×0.45+60×0.25+100×0.05=36(元/袋),利用樣本平均數(shù)估計(jì)總體平均數(shù)可得該廠一年內(nèi)生產(chǎn)該袋裝中藥的盈利約為36×100 000=3 600 000(元)=360 (萬(wàn)元)。
因?yàn)?60 萬(wàn)元>200 萬(wàn)元,所以該中藥加工廠有可能在一年內(nèi)通過(guò)加工該袋裝中藥收回投資。
評(píng)注:利用頻率分布直方圖來(lái)估計(jì)總體是用樣本的頻率分布去估計(jì)總體分布的重要方法,在頻率分布直方圖中,各小長(zhǎng)方形的面積表示相應(yīng)各組的頻率,所以所有小長(zhǎng)方形的面積的和等于1。
概率問(wèn)題的復(fù)習(xí)中應(yīng)注意弄清題意,找出關(guān)鍵詞和破題點(diǎn),區(qū)分清楚各種概率模型及適用范圍。教材中有兩個(gè)重要概率分布:超幾何分布和二項(xiàng)分布,要注意二項(xiàng)分布與超幾何分布的區(qū)別:二項(xiàng)分布是有放回的抽樣,超幾何分布是不放回的抽樣。
例3(2022年廣東廣州高三一模)某從事智能教育技術(shù)研發(fā)的科技公司開發(fā)了一個(gè)“AI作業(yè)”項(xiàng)目,并且在甲、乙兩個(gè)學(xué)校的高一學(xué)生中做用戶測(cè)試。經(jīng)過(guò)一個(gè)階段的試用,為了解“AI作業(yè)”對(duì)學(xué)生學(xué)習(xí)的促進(jìn)情況,該公司隨機(jī)抽取了200名學(xué)生,對(duì)他們的“向量數(shù)量積”知識(shí)點(diǎn)掌握的情況進(jìn)行調(diào)查,樣本調(diào)查結(jié)果如6表所示:

表6
假設(shè)每位學(xué)生是否掌握“向量數(shù)量積”知識(shí)點(diǎn)相互獨(dú)立。
(1)從樣本中隨機(jī)抽取2 名學(xué)生沒(méi)有掌握“向量數(shù)量積”知識(shí)點(diǎn)的學(xué)生,用ξ表示抽取的2名學(xué)生中使用“AI作業(yè)”的人數(shù),求ξ的分布列和數(shù)學(xué)期望;
(2)用樣本頻率估計(jì)概率,從甲校高一學(xué)生中抽取1 名使用“AI作業(yè)”的學(xué)生和1 名不使用“AI作業(yè)”的學(xué)生,用“X=1”表示該名使用“AI作業(yè)”的學(xué)生基本掌握了“向量數(shù)量積”,用“X=0”表示該名使用“AI作業(yè)”的學(xué)生沒(méi)有掌握“向量數(shù)量積”,用“Y=1”表示該名不使用“AI作業(yè)”的學(xué)生基本掌握了“向量數(shù)量積”,用“Y=0”表示該名不使用“AI作業(yè)”的學(xué)生沒(méi)有掌握“向量數(shù)量積”。比較方差D(X)和D(Y)的大小關(guān)系。
解析:(1)依題意,沒(méi)有掌握“向量數(shù)量積”知識(shí)點(diǎn)的學(xué)生有60人,其中,使用“AI作業(yè)”的人數(shù)為20人,不使用“AI作業(yè)”的人數(shù)為40,所以ξ的所有可能取值為0,1,2,且
所以ξ的分布列為表7:

表7
評(píng)注:本題主要考查超幾何分布和二項(xiàng)分布。超幾何分布描述的是不放回抽樣問(wèn)題,隨機(jī)變量為抽到的某類個(gè)體的個(gè)數(shù)。在根據(jù)獨(dú)立重復(fù)試驗(yàn)求二項(xiàng)分布的有關(guān)問(wèn)題時(shí),關(guān)鍵是確定二項(xiàng)分布的試驗(yàn)次數(shù)n和變量的概率。
統(tǒng)計(jì)與概率在高考中既考查核心知識(shí),也考查知識(shí)點(diǎn)的覆蓋面。在近幾年的高考中就出現(xiàn)了條件概率和正態(tài)分布的問(wèn)題,因此,在復(fù)習(xí)中不能忽視對(duì)所謂的“冷門知識(shí)”的復(fù)習(xí),如正態(tài)分布、條件概率、相關(guān)系數(shù)、殘差圖、擬合效果等。
例4(2022年山東濰坊高三模擬)冬奧會(huì)的成功舉辦極大鼓舞了人們體育強(qiáng)國(guó)的熱情,掀起了青少年鍛煉身體的熱潮。某校為了解全校學(xué)生“體能達(dá)標(biāo)”的情況,從高三年級(jí)1 000 名學(xué)生中隨機(jī)選出40 名學(xué)生參加“體能達(dá)標(biāo)”測(cè)試,并且規(guī)定“體能達(dá)標(biāo)”預(yù)測(cè)成績(jī)小于60 分的為“不合格”,否則為合格。若高三年級(jí)“不合格”的人數(shù)不超過(guò)總?cè)藬?shù)的5%,則該年級(jí)體能達(dá)標(biāo)為“合格”;否則該年級(jí)體能達(dá)標(biāo)為“不合格”,需要重新對(duì)高三年級(jí)學(xué)生加強(qiáng)訓(xùn)練。現(xiàn)將這40 名學(xué)生隨機(jī)分成甲、乙兩個(gè)組,其中甲組有24名學(xué)生,乙組有16名學(xué)生。經(jīng)過(guò)預(yù)測(cè)后,兩組各自將預(yù)測(cè)成績(jī)統(tǒng)計(jì)分析如下:甲組的平均成績(jī)?yōu)?0,標(biāo)準(zhǔn)差為4;乙組的平均成績(jī)?yōu)?0,標(biāo)準(zhǔn)差為6。(數(shù)據(jù)的最后結(jié)果都精確到整數(shù))
(1)求這40名學(xué)生測(cè)試成績(jī)的平均分和標(biāo)準(zhǔn)差s。
(2)假設(shè)高三學(xué)生的體能達(dá)標(biāo)預(yù)測(cè)成績(jī)服從正態(tài)分布N(μ,σ2),用樣本平均數(shù)作為μ的估計(jì)值,用樣本標(biāo)準(zhǔn)差s作為σ的估計(jì)值。請(qǐng)利用估計(jì)值估計(jì),高二學(xué)生體能達(dá)標(biāo)預(yù)測(cè)是否“合格”。
(3)為增強(qiáng)趣味性,在體能達(dá)標(biāo)的跳繩測(cè)試項(xiàng)目中,同學(xué)們可以向體育特長(zhǎng)班的強(qiáng)手發(fā)起挑戰(zhàn)。每場(chǎng)挑戰(zhàn)賽都采取七局四勝制,積分規(guī)則如下:以4∶0或4∶1獲勝隊(duì)員積4分,落敗隊(duì)員積0分;以4∶2或4∶3獲勝隊(duì)員積3分,落敗隊(duì)員積1 分。假設(shè)體育生王強(qiáng)每局比賽獲勝的概率均為,求王強(qiáng)在這輪比賽中所得積分為3 分的條件下,他前3局比賽都獲勝的概率。
附:①n個(gè)數(shù)的方差②若隨機(jī)變量Z~N(μ,σ2),則P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4。
(2)由=74,s≈7,得μ的估計(jì)值μ=74,σ的估計(jì)值
因?yàn)镻(μ-2σ<X<μ+2σ)=P(60<X<88)=0.954 4,所以P(X<60)=P(X
所以高三年級(jí)1 000 名學(xué)生中,不合格的有1 000×0.022 8≈23(人),又,所以高三年級(jí)學(xué)生體能達(dá)標(biāo)為“合格”。
評(píng)注:正態(tài)分布是一種重要的分布,尤其是正態(tài)分布的3σ原則在復(fù)習(xí)時(shí)要注意。在解決條件概率問(wèn)題時(shí)要分析幾個(gè)事件間的先后順序,以及先發(fā)生事件的概率對(duì)后發(fā)生事件的概率產(chǎn)生如何的影響(即后發(fā)生的事件算的是條件概率),同時(shí)根據(jù)隨機(jī)變量的不同取值,事件發(fā)生的過(guò)程會(huì)有所不同,要注意區(qū)別。
概率與統(tǒng)計(jì)解答題的文字閱讀量通常比較大,這是高考命題的主要方向。復(fù)習(xí)時(shí)應(yīng)注意把握命題動(dòng)向,逐步形成解題四大步驟:讀題提取關(guān)鍵信息、析題形成解題思路、解題示范規(guī)范表達(dá)、反思積淀解題方法,同時(shí)書寫要規(guī)范,這樣在解決概率統(tǒng)計(jì)問(wèn)題時(shí)才能得心應(yīng)手。