摘要:眾數是平均數中的一種位置平均數,它可以用來表明社會經濟現象的一般水平,在實際工作中被廣泛運用。眾數的確定,在實際運用中可分為分組資料及未分組資料兩種情況確定,而在分組資料中又可分為對單項式變量數列和組距式變量數列來確定。對組距式變量數列中眾數的確定一直是個學習的難點,因而需要采用簡單的方法先掌握插值法的基本原理,以便更好地掌握知識及學習的方法,最終達到持續學習、持續發展的目的。
關鍵詞:掌握;平均數;眾數;確定
中圖分類號:G642.4 文獻標志碼:A文章編號:1673-291X(2010)17-0263-02
眾數在統計學中是一種位置平均數,是指總體中出現次數最多的標志值,或者說是總體中最普遍的標志值,通常用M0來表示。
眾數可以用來表明社會經濟現象的一般水平,在實際工作中被廣泛應用。如在鞋、帽、衣服的生產廠家,可以運用眾數在不同的地區來合理地配置各種尺碼的生產量及均碼號衣服的生產,以便更好地形成大批量生產,達到更好地降低成本、獲取最大利潤的目的;銷售商還可以根據眾數來合理安排不同商品的不同尺碼的進貨量,以達到能夠盡可能使所有商品均實現正常、及時銷售,以此獲取最大利潤的目的。
那么,眾數應該如何確定呢?在多年的《統計學基礎》的教學過程中,發現大部分學生由于《統計學基礎》教材中大量的公式和計算而對統計學基礎的學習抱排斥的態度。因而,如何讓學生在理解的基礎上去掌握《統計學基礎》的知識,從而達到能運用統計學的知識解決實際問題的目的就顯得尤為重要。對眾數的確定,可以按以下思路進行。
一、未分組資料眾數的確定
對未分組資料的眾數的確定比較簡單,只需要通過大量觀察法找出出現次數最多的數,那就是眾數。例如:a有10名學生年齡分別為17歲、22歲、18歲、19歲、18歲、19歲、19歲、19歲、20歲、21歲,通過觀察可以知道19歲出現的次數最多,則這10名同學年齡的眾數為19歲。當然,在確定的過程中為防止出錯,還可將未分組資料按照升序或降序排列再來最終確定,在此不再贅述。
二、分組資料眾數的確定
對分組資料眾數的確定又可以分為以下兩種情況。
(一)單項式變量數列眾數的確定
根據單項式變量數列確定眾數也比較簡單,只要找出次數最多的組,該組的變量值就是眾數。例如:已知某商店2009年女式羊毛衫銷售量資料如下表,要求計算該商店羊毛衫銷售的眾數。
從上表中很明顯地看出,銷售量出現次數最多的是100公分的組,它在一年內共出現300次,因而該商店女式羊毛衫銷售量的眾數即為100公分。這也就是在日常生活中為何在商品銷售時總是出現一些常見尺碼斷貨的原因。為了盡量不出現斷碼降價給商家帶來的損失,商家可以在對歷史銷售資料分析及自身實際情況分析的基礎上,適當調整不同年份女式羊毛衫尺碼的搭配。值得一提的是,我們常見尺碼的眾數會隨著不同時代、不同年齡人群的變化而發生動態變化。
(二)組距式變量數列眾數的確定
如果根據組距式變量數列確定眾數,則需確定眾數的近似值。組距式變量數列眾數的確定是眾數的確定中的難點。對組距式變量數列的確定,一般的教材上均只是給出了計算的公式和計算的實際的例子,學生一般難以理解,也很難記住這眾多的公式,因而給組距式變量數列眾數的確定的學習帶來了困難。那么,如何讓學生更好地在理解的基礎上掌握這部分知識呢?筆者認為,在教學過程中可以這樣做:
先選取實例,如某地區農民家庭戶按人均純收入額分組資料如下,求農戶人均純收入的眾數:
然后,對此,先舉一個簡單的例子,如下圖所示:
已知x在10—20之間,又已知這個x在從10開始的10—20整條線段(這個間距即這條線段的長度可以用字母d表示)的1/4處,又假定在這區間數據是均勻分布的,則該數的具體數值為多少?
很顯然:x=10+1/4*d即x=10+1/4*(20-10)=10+2.5=12.5
或者:x=20-3/4*d即x=20-3/4*(20-10)=20-7.5=12.5
那么這個數字的具體位置是如何確定的呢?
如上圖所示,如果從10開始算,這個數字的具體位置就是:
如果從20開始起算,這個數字的具體位置就是:,也就是說該具體數值的確定是根據其所處的在一個特定區間(即知道上限和下限,也就確定了該從何處起算和中間距離的問題)及其所處的位置來確定的。
由此,對于上邊的例題,對組距式變量數列要確定眾數,可以先根據眾數的概念找到出現次數最多的組即6 000—8 000這一組,這雖然不是一個確定的值,但可知眾數在6 000—8 000之間,又假定在這區間數據是均勻分布的,接下來,就可以通過眾數所在的區間和眾數的位置進行眾數的近似計算,由此可引導學生根據對前邊簡單例題的理解自己寫出計算眾數的公式,即:
下限公式:M0=L+#8226;d
下限公式用來根據眾數所在組的下限來確定眾數,其中:
L——眾數所在組的下限
△1=fm-fm-1
fm——眾數所在組的次數
fm-1——眾數所在前一組的次數
△2——fm-fm+1
fm+1——眾數所在后一組的次數
d——眾數所在組的組距
對于上例根據下限公式可計算出:
M0=6 000+*(8 000-6 000)=6 714.29
即某地區農民家庭農戶人均純收入的眾數為6 714.29
也可根據上述基本原理寫出上限公式即:
M0=U-#8226;d
其中U——眾數所在組的上限
其他符號代表的含義和前文相同。
上限公式用來根據眾數所在組的上限來確定眾數
則上述例子根據上限公式可得:
M0=8 000-*(8 000-6 000)=6 714.29
從上述計算結果可以看出,對于同樣的問題,采用上限公式和下限公式算出的結果完全一樣,在實際運用的過程中可根據實際情況具體選擇使用。
由此,通過一個簡單的例子講述了組距式變量數列眾數計算中的插值法,不僅能有效地讓學生擺脫死記公式的煩惱,并達到教學從簡單的知識傳授到重點強調讓學生掌握方法的重大轉變,從而達到“授人以魚不如授人以漁”的教學效果。不僅讓學生掌握本部分知識,而且為以后對插值法的實際運用及將來的持續學習打下良好的基礎。
當然,眾數雖然在實際工作中用途廣泛,并且針對不同的資料我們介紹了確定眾數的不同的方法,但在實際應用中還應注意,只有總體單位數比較多,而且又有明顯的集中趨勢時才存在眾數;在單位數很少,或單位數雖多但無明顯集中趨勢時,計算眾數是沒有意義的。另外,眾數隨著內外部環境的變化也會發生動態變化,因而在實際運用的過程中應根據實際情況做出相應的調整。
參考文獻:
[1] 栗方忠.統計學原理[M].大連:東北財經大學出版社,2002.
[2] 歐庚生,陳杏生.統計學原理:第二版[M].武漢:中南大學出版社,2004.
[3] 史書良.統計學原理[M].北京:清華大學出版社,北京交通大學出版社,2007.
[4] 遲艷芹.統計學原理與應用[M].北京:清華大學出版社,2005.