


總體百分位數的估計是新教材增加的內容,直觀上比較容易理解,它把一組按大小排列的數據分成相應百分比的兩部分,一組數據的第p 百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(1-p)%的數據大于或等于這個值。幾種常用的百分位數:第25百分位數(又稱下四分位數或第一四分位數),第50百分位數(又稱中位數或第二四分位數),第75百分位數(又稱上四分位數或第三四分位數),第1百分位數,第5百分位數,第95百分位數,第99百分位數。
題型一:由原始數據求百分位數
計算一組原始數據(n 個數據)的第p 百分位數的一般步驟:第1步,從小到大排列原始數據;第2步,計算i=n×p%;第3步,若i 不是整數,大于i 的比鄰整數為j,則第p百分位數為第j 項數據,若i 是整數,則第p百分位數為第i 項和第(i+1)項的數據的平均數。
例 1 “幸福指數”是指某個人主觀地評價他對自己目前生活狀態的滿意程度的指標,常用區間[0,10]內的一個數來表示,該數越接近10表示滿意程度越高。現隨機抽取6位小區居民,他們的“幸福指數”分別為5,6,7,8,9,5,則這組數據的50%分位數是( )。
A.7 B.7.5
C.8 D.6.5
解:該組數據從小到大排列為5,5,6,7,8,9。因為6×50%=3,所以這組數據的第50百分位數是第三位數與第四位數的平均值,即6+7/2 =6.5。應選D。
評注:本題主要考查百分位數的概念與應用。
例 2 數據2.2,3.6,3.7,4.1,4.4,4.5,x,6.1的第65百分位數是4.5,則實數x 的取值范圍是( )。
A.[4.5,+∞) B.[4.5,6.1)
C.(4.5,+∞) D .[4.5,6.1]
解:因為8×65% =5.2,所以這組數據的第65 百分位數是第6 項數據4.5,所以x≥4.5。應選A。
評注:本題容易受思維定式的影響,誤認為x 在4.5與6.1之間,從而錯選B或D。
例3 (多選題)某班級體溫檢測員對一周內甲、乙兩名同學的體溫進行了統計,其結果如圖1所示,則下列說法正確的是( )。
A.乙同學體溫的極差為0.4℃
B.乙同學的體溫比甲同學的體溫穩定
C.乙同學體溫的眾數為36.4℃,50%分位數與平均數相等
D.甲同學體溫的第70百分位數為36.5℃
解:由圖可知,乙同學體溫的極差為36.5-36.3=0.2 ℃,A 錯誤。從折線圖可以看出,乙同學的體溫比甲同學的體溫穩定,B 正確。乙同學的體溫從低到高依次為36.3℃,36.3℃,36.4℃,36.4℃,36.4℃,36.5℃,36.5℃,可得眾數為36.4℃,平均數為36.4℃,而50%分位數即中位數是第4項36.4℃,所以數據的平均數和中位數相等,C 正確。甲同學的體溫從低到高依次為36.2℃,36.2℃,36.4℃,36.4℃,36.5℃,36.5℃,36.6℃,由70%×7=4.9,可知數據的第70 百分位數為第5 項數據36.5℃,D正確。應選BCD。
評注:從折線圖中找出原始數據,可得數據的眾數、中位數、平均數、百分位數。
題型二:根據頻率分布直方圖、頻率分布表估計樣本數據的第p 百分位數
根據頻率分布表、頻率分布直方圖估算百分位數的一般步驟:第1步,確定第p 百分位數所在區間[a,b),即確定小于a 和小于b的數據所占的百分比分別為fa %,fb%,且滿足fa %
例4 某商場為了制定合理的停車收費政策,需要了解顧客的停車時長(單位:min)。現隨機抽取了到訪該商場顧客的100輛車進行調查,將數據分成6組,即(0,100],(100,200],(200,300],(300,400],(400,500],(500,600],整理得到頻率分布直方圖,如圖2所示。
(1)求樣本中停車時長在區間(400,500]上的頻率。
(2)為了吸引顧客,該商場準備給停車時長較短的車輛提供免費停車服務。若使該服務能夠惠及20%到訪顧客的車輛,請你根據頻率分布直方圖,給出確定免費停車時長標準的建議。
解:(1)設(400,500]上的頻率為x,由頻率分布直方圖中所有頻率之和為1,可得(0.0002+0.0014+0.0016+0.0031+0.0034)×100+x=1,所以x=0.03,所以樣本中停車時長在區間(400,500]上的頻率為0.03。
(2)確定免費停車標準能夠惠及20%到訪顧客的車輛,即求該數據的20% 分位數。因為(0,100]的頻率為0.14lt;20%,且(0,200]的頻率為0.45gt;20%,所以20%分位數位于(100,200]之間,所以100+ (0.2-0.14/0.45-0.14)×100≈119.4,即該組數據的20%分位數約為119.4。
若要能夠惠及20%到訪顧客的車輛,可確定免費停車時長為2h。
評注:由于頻率分布表和頻率分布直方圖中不能體現原始數據,在估算第p 百分位數時,根據累計頻率先確定第p 百分位數所在的區間,再把區間內的數據看成均勻分布,根據公式計算得出第p 百分位數的估計值。
例5 從某地區抽取100戶居民進行月用電量調查,發現用電量都在50 至350kW·h之間,將數據分組后得到的頻率分布表,如表1所示,估計此地區月均用電量的第80百分位數是( )。
A.230 B.235
C.240 D.245
解:設該組數據的第80百分位數為x。
因為0.12+0.18+0.3lt;0.8,0.12+0.18+0.3+0.25gt;0.8,所以該組數據的第80百分位數位于區間[200,250)內,則0.12+0.18+0.3+(x-200/50) ×0.25=0.8,解得x=240。
應選C。
評注:本題考查百分位數的應用。解題時,先確定第80百分位數所在的區間,再從累計頻率角度建立等量關系,此解法與例4中的估算第p 百分位數的原理相同。
作者單位:1.河南省鄢陵縣第一高級中學
2.河南省光山二高
(責任編輯 郭正華)