甘志國 (正高級教師 特級教師) 白 琨
(1.北京豐臺二中 2.湖北省十堰市張灣區(qū)柏林鎮(zhèn)中心小學)
由方差的計算公式可知,一組數(shù)據(jù)的方差與這組數(shù)據(jù)的每個數(shù)都有關(guān)系.因而,比較兩組數(shù)據(jù)方差的大小要慎之又慎,不可妄下結(jié)論,比如,不能說“若極差大,則方差大”.本文給出比較方差大小的幾個結(jié)論,用它們可迅速解決一些比較兩組數(shù)據(jù)方差大小的問題.
令h=0,可得兩組數(shù)據(jù)4,4的方差0 小于數(shù)據(jù)0,2的方差1;但數(shù)據(jù)4,4,1的方差2大于數(shù)據(jù)0,2,1的方差
推論2(1)若a≤b≤c≤d,則數(shù)據(jù)a,d的方差不小于數(shù)據(jù)b,c的方差(當且僅當“a=b且c=d”時兩者相等);
(2)若a≤b≤c≤d≤e≤f,則數(shù)據(jù)a,e,f的方差不小于數(shù)據(jù)b,c,d的方差(當且僅當“a=b且c=d=e=f”時兩者相等).
證明可用推論1中的(2)來證,下面只證(1).
當a<b≤d時,數(shù)據(jù)a,d的方差大于數(shù)據(jù)b,d的方差,所以當a≤b≤d時,數(shù)據(jù)a,d的方差大于等于數(shù)據(jù)b,d的方差(當且僅當a=b時取等號).同理,當b≤c≤d時,數(shù)據(jù)b,d的方差大于等于數(shù)據(jù)b,c的方差(當且僅當c=d時取等號),所以欲證結(jié)論成立.
定理3設(shè)a,α,n是已知的實數(shù),α>na,n≥2,n∈N,且則當且僅當時,數(shù)據(jù)x1,x2,…,xn的方差取最小值且最小值是0;當且僅當x1=α-(n-1)a,xi=a(i=2,3,…,n)時,數(shù)據(jù)x1,x2,…,xn的方差取最大值.
證明下面只證關(guān)于“最大值”的結(jié)論.設(shè)數(shù)據(jù)x1,x2,…,xn的方差為.先證當n=2 時成立.由x1>a,x2≥a,x1+x2=α,可得a≤x2<α-a.又因為
從而可得當且僅當x1=α-a,x2=a時,取最大值.
再證當n≥3時成立.由引理,可得
在平面直角坐標系x2Oy中,拋物線
即證得了結(jié)論:設(shè)a,α,n是已知的實數(shù),α>na,n≥2,n∈N,且
若數(shù)據(jù)x1,x2,…,xn的方差取最大值,則x2=a.
同理,可得結(jié)論:設(shè)a,α,n是已知的實數(shù),α>na,n≥2,n∈N,且
若數(shù)據(jù)x1,x2,…,xn的方差取最大值,則xi=a(i=2,3,…,n),進而可得欲證結(jié)論成立.
定理4設(shè)x1,x2,…,xn均是給定的實數(shù)(且其平均數(shù)是a),x1,x2,…,xn,t(變量t取實數(shù))的方差是f(t),則
(2)當t<(或>)a時,f(t)是減(或增)函數(shù);當且僅當t=a時,f(t)取到最小值,且最小值是
定理5設(shè)x1,x2,…,xn,c均是給定的實數(shù),則x1,x2,…,xn,a,b(a,b是變化的實數(shù),但a+b=c)的方差隨|a-b|的增加而增加.
證明由引理,可得x1,x2,…,xn,a,b的方差為
進而可得欲證結(jié)論成立.
例1(2020年全國Ⅲ卷理3)在一組樣本數(shù)據(jù)中,1,2,3,4 出現(xiàn)的頻率分別為p1,p2,p3,p4,且,則下面四種情形中,對應樣本的標準差最大的一組是( ).
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
由“對稱性”,可得這4組數(shù)據(jù)的平均數(shù)均是2.5.
把數(shù)據(jù)b與數(shù)據(jù)d中都去掉3個1、1個2、1個3、3個4后,剩下的數(shù)據(jù)分別是1,4與2,3,由推論2中的(1)可得前者方差大;再由定理1 中的(2)可得
例2甲、乙兩名射擊運動員參加某大型運動會的預選賽,他們各射擊了5次,成績(單位:環(huán))如表1所示.

表1
易知數(shù)據(jù)8,9的方差小于數(shù)據(jù)10,7的方差,再由定理1中的(2)可得
例3甲、乙、丙三名射箭運動員在某次測試中各射箭20次,三人的測試成績分別如表2、表3、表4所示.

表2 甲的成績

表3 乙的成績

表4 丙的成績
若用s1,s2,s3分別表示甲、乙、丙三名運動員在這次測試成績的標準差,則( ).
A.s3>s1>s2B.s2>s1>s3
C.s1>s2>s3D.s2>s3>s1
把甲、丙的成績都去掉4個7、5個8、5個9、4個10后,甲、丙剩下的成績分別為7,10與8,9,可得它們的平均數(shù)相等且前者的方差大于后者的方差,所以由定理1中的(2)知s1>s3.
綜上,s2>s1>s3,故選B.
例4設(shè)兩組數(shù)據(jù)A:-1,0,1,-1,0,1,-1,0,1,0與B:a,0,1,-1,0,1,-1,0,1,-1的方差分別為,求實數(shù)a的取值范圍.
若a>0,由題設(shè)結(jié)合定理2可得,也即a<0,前后矛盾,舍去該情形.
若a<0,可得題設(shè)即“設(shè)兩組數(shù)據(jù)B:-1,0,1,-1,0,1,-1,0,1,a與A:-1,0,1,-1,0,1,-1,0,1,0的方差分別為即a>0,前后矛盾,也舍去該情形.
綜上,實數(shù)a的取值范圍是?.
例5已知實數(shù)x1,x2,…,x10滿足x1>1,xi≥,求數(shù)據(jù)x1,x2,…,x10的方差s2的取值范圍.
由定理3及引理,可得當且僅當x1=11,xi=1(i=2,3,…,10)時,有
再由題設(shè)中的方差s2是連續(xù)變化的,可得所求s2的取值范圍是[0,9].
例6某廠商調(diào)查甲、乙兩種不同型號電視機在10個賣場的銷售量(單位:臺),并根據(jù)這10個賣場的銷售情況,得到如圖1所示的莖葉圖.

圖1
為了鼓勵賣場,在同型號電視機的銷售中,該廠商將銷售量高于數(shù)據(jù)平均數(shù)的賣場命名為該型號電視機的“星級賣場”.
若a=1,記乙型號電視機銷售量的方差為s2,根據(jù)圖1推斷當b為何值時,s2達到最小值(只需寫出結(jié)論).
但這種解法是不嚴密的:因為當b=0時,30+b與平均數(shù)
最近,但當b增加時,其他的數(shù)(比如43)與平均數(shù)的距離可能會近一些,這樣就有可能使方差變小,所以以上解法并沒有說清道理.
但由定理4可知,這種解法是“貌似無理,實則正確”.
例7(2012年北京卷文、理17,節(jié)選)近年來,某市為促進生活垃圾的分類處理,將生活垃圾分為廚余垃圾、可回收物和其他垃圾三類,并分別設(shè)置了相應的垃圾箱.為調(diào)查居民生活垃圾分類投放情況,現(xiàn)隨機抽取了該市三類垃圾箱中總計1000t生活垃圾,數(shù)據(jù)統(tǒng)計如表5所示(單位:t).
假設(shè)廚余垃圾在“廚余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分別為a,b,c,其中a>0,a+b+c=600.當數(shù)據(jù)a,b,c的方差s2最大時,分別寫出a,b,c的值(結(jié)論不要求證明),并求此時s2的值.
下面再看0,600-a,a(0<a≤600)的方差s2何時最大.
由定理5知,當且僅當|(600-a)-a|即2|a-300|取最大值,也即a=600時,方差s2最大,所以當數(shù)據(jù)a,b,c的方差s2最大時,a=600,b=c=0;還可求得此時s2的值是80000.
例8(2013年北京卷文、理16,節(jié)選)圖2是某市3月1日至14日的空氣質(zhì)量指數(shù)趨勢圖.空氣質(zhì)量指數(shù)小于100表示空氣質(zhì)量優(yōu)良,空氣質(zhì)量指數(shù)大于200表示空氣重度污染.某人隨機選擇3 月1 日至3月13日中的某一天到達該市,并停留2天.
由圖2判斷從哪天開始連續(xù)三天的空氣質(zhì)量指數(shù)方差最大? (結(jié)論不要求證明)

圖2
s分別是兩組數(shù)據(jù)57,143,220;40,160,220的方差.注意到這兩組數(shù)據(jù)的平均數(shù)均是140,可得兩組新數(shù)據(jù)57,143;40,160的平均數(shù)也相等,由推論2中的(1)知,前者的方差小于后者的方差,再由定理1中的(2)可得
s分別是兩組數(shù)據(jù)220,160,40;158,86,79的方差,由40≤79≤86≤158≤160≤220及推論2中的(2)可得
注可能有讀者用錯誤的結(jié)論“極差越大?方差越大”(反例:數(shù)據(jù)0,6,12的極差比數(shù)據(jù)0,10,11 的極差大,但前者方差小;數(shù)據(jù)20,3,12,15比數(shù)據(jù)0,3,12,15的極差大,但兩者方差相等)迅速得到了正確答案,這當然是不嚴謹?shù)?解答該題要進行必要的計算(包括估算)和推理.
可能有的讀者會想,當兩組數(shù)據(jù)的平均數(shù)相等時,結(jié)論“極差越大?方差越大”是否普遍成立呢? 答案也是否定的.若這兩組數(shù)據(jù)的平均數(shù)相差正數(shù)ε,則可把平均數(shù)小的那組數(shù)據(jù)的各數(shù)均加上ε,得到的新數(shù)據(jù)的極差及方差均不變.
一組數(shù)據(jù)的方差反映的是這組數(shù)據(jù)的波動情況,但波動情況不僅僅是由極差決定的.由方差公式知,它與每個數(shù)據(jù)都有關(guān).
(完)