袁勝波
【中圖分類(lèi)號(hào)】G633.6 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2016)34-0167-02
平均分析的方法在整個(gè)統(tǒng)計(jì)方法體系中占有十分重要的地位,很多統(tǒng)計(jì)分析方法都以平均分析為依托。譬如動(dòng)態(tài)分析,指數(shù)分析,抽樣估計(jì),回歸分析等等,無(wú)一不與平均分析相關(guān)聯(lián),具有基礎(chǔ)性作用。而算術(shù)平均數(shù)又是所有平均數(shù)里面最為基本最為重要的一種平均數(shù)。但一直以來(lái),在統(tǒng)計(jì)學(xué)教科書(shū)的編寫(xiě)上,對(duì)于算術(shù)平均數(shù)計(jì)算方法的闡述,卻存在較大的弊端,以至于對(duì)教學(xué)產(chǎn)生了不利影響。
一、算術(shù)平均數(shù)是否存在“基本公式”?
幾乎所有的統(tǒng)計(jì)教材都會(huì)在具體介紹算術(shù)平均數(shù)的計(jì)算方法之前,先給出一個(gè)算術(shù)平均數(shù)的基本公式,即:算術(shù)平均數(shù)=標(biāo)志總量/總體總量。可以舉出許多例子,說(shuō)明算術(shù)平均數(shù)的計(jì)算符合這個(gè)基本公式。譬如,三個(gè)學(xué)生的身高分別為1.7m,1.6m,1.5m,身高的算術(shù)平均數(shù)=總身高/總?cè)藬?shù)=Σx/n=(1.7+1.6+1.5)/3=1.6m。符合“基本公式”。如果在已分組(變量數(shù)列)條件下,譬如有30名學(xué)生的身高資料:
身高(m.) 人數(shù)(人)f. 組中值x. 總身高xf
1.5~1.6 10 1.55 15.5
1.6~1.7 18 1.65 29.7
1.7~1.8 2 1.75 3.5
Σ 30 — 48.7
30名學(xué)生身高的算術(shù)平均數(shù)=Σxf/Σf=48.7/30=1.62m。不管是未分組或是已分組,不管是簡(jiǎn)單算術(shù)平均數(shù)或是加權(quán)算術(shù)平均數(shù),都是用總身高比總?cè)藬?shù),符合“標(biāo)志總量/總體總量”這一“基本公式”的算法。
但只要稍加推廣,這個(gè)“基本公式”并不“基本”,并不具備任何普遍意義,計(jì)算上存在很大的局限性,實(shí)際上只適用于對(duì)絕對(duì)數(shù)計(jì)算平均數(shù)。比如上面學(xué)生身高就是絕對(duì)數(shù),平均身高的算法就符合所謂基本公式的算法。如果平均的對(duì)象即各單位變量值是對(duì)相對(duì)數(shù)或平均數(shù),這個(gè)基本公式就不適用了。譬如,三個(gè)班的學(xué)生考同一科的及格率分別為90%,85%,80%,求平均及格率。這是對(duì)3個(gè)單位的3個(gè)相對(duì)數(shù)計(jì)算平均數(shù),這個(gè)時(shí)候能不能用“標(biāo)志總量/總體總量”?回答顯然是否定的。首先,不能計(jì)算標(biāo)志總量。因?yàn)槿齻€(gè)單位的變量值是相對(duì)量,不是絕對(duì)量,不具有可加性;其次,總體總量為3,這個(gè)3也不能加入計(jì)算。即不能把3個(gè)百分比相加除以3得到3個(gè)班的平均及格率。再譬如,3個(gè)班考同一科的平均成績(jī)分別為90分,85分,80分,求總平均成績(jī)。這是對(duì)3個(gè)單位的3個(gè)平均數(shù)計(jì)算平均數(shù)。同樣,不能將3個(gè)平均成績(jī)相加除以3得到總平均成績(jī)。3個(gè)單位的變量值是平均量,不是絕對(duì)量,不能相加得到標(biāo)志總量。總體總量3也不能加入計(jì)算。所以,這個(gè)所謂基本公式,原本就沒(méi)有廣泛的適用性。
二、統(tǒng)計(jì)教材未能就算術(shù)平均數(shù)的計(jì)算方法闡述清楚
闡述方法先從概念入手。一般教材都把平均數(shù)的概念表述為變量值的一般水平。這固然是正確的。但這還不夠,還應(yīng)當(dāng)進(jìn)一步指出,變量值的數(shù)值形式是多種多樣的,可以是絕對(duì)數(shù),也可以是相對(duì)數(shù),還可是平均數(shù)本身。平均數(shù)不是基本的統(tǒng)計(jì)指標(biāo),它是各種各樣的統(tǒng)計(jì)指標(biāo)的代表值。它可以是絕對(duì)數(shù)的代表值,如此3個(gè)學(xué)生的平均身高,也可以是相對(duì)數(shù)的代表值,比如3個(gè)班的平均及格率,還可以是平均數(shù)的代表值,比如3個(gè)班的總平均成績(jī)。這正是統(tǒng)計(jì)教材闡述算術(shù)平均數(shù)時(shí)所缺失的內(nèi)容,從而導(dǎo)致了理解和掌握算術(shù)平均數(shù)的困難。
在統(tǒng)計(jì)教材里面,一般都先使用對(duì)絕對(duì)數(shù)計(jì)算平均數(shù)的例子引出簡(jiǎn)單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)的計(jì)算公式,然后再舉一個(gè)已分組(變量數(shù)列)條件下對(duì)相對(duì)數(shù)計(jì)算平均數(shù)的例子。以下就是最常見(jiàn)的例子:
計(jì)劃完成 企業(yè)數(shù) 計(jì)劃數(shù). 組中值. 實(shí)際數(shù)
(%) (家) (萬(wàn)元)f. (%)x (萬(wàn)元)xf
80~90 5 1000 85 850
90~100 15 10000 95 9500
100~110 10 8000 105 8400
Σ. 30 19000 - 18750
30個(gè)企業(yè)的平均計(jì)劃完成程度=總實(shí)際數(shù)/總計(jì)劃數(shù)=Σxf/Σf=18750/19000=98.7%。每當(dāng)編寫(xiě)到此,編者都要給讀者指出一個(gè)“重要問(wèn)題”,即:“此處存在一個(gè)權(quán)數(shù)選擇問(wèn)題,似乎企業(yè)數(shù)可以作權(quán)數(shù),實(shí)際上不能作權(quán)數(shù),只能將計(jì)劃數(shù)作權(quán)數(shù)”等等。編者似乎忘記了或者回避了前面已經(jīng)交代過(guò)的算術(shù)平均數(shù)的“基本公式”。但到底是什么原因不能用“基本公式”去計(jì)算這30個(gè)企業(yè)的平均計(jì)劃完成程度?為什么這里的企業(yè)數(shù)不能作權(quán)數(shù)加入計(jì)算,而要用計(jì)劃數(shù)作權(quán)數(shù)加入計(jì)算?從來(lái)都沒(méi)有一個(gè)使人信服的說(shuō)法。這就使讀者產(chǎn)生很大的疑惑,甚至是一頭霧水:到底按不按“基本公式”計(jì)算?“基本公式”還有沒(méi)有用?這就無(wú)形中加大了統(tǒng)計(jì)學(xué)的教學(xué)難度。
縱觀林林總總的統(tǒng)計(jì)教材,在闡述算術(shù)平均數(shù)的部分,幾乎都普遍存在幾個(gè)奇怪的現(xiàn)象:其一,幾乎所有編者都一成不變的這樣寫(xiě),從來(lái)沒(méi)有花樣翻新;其二,幾乎所有編者都去舉例說(shuō)明在已分組條件下對(duì)相對(duì)數(shù)計(jì)算平均數(shù),都不去舉例說(shuō)明在已分組條件下對(duì)平均數(shù)計(jì)算平均數(shù);其三,幾乎所有編者都不涉及在未分組條件下對(duì)相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù),比如上面所舉3個(gè)班的及格率的平均數(shù),3個(gè)班的平均成績(jī)的平均數(shù)。似乎原本就不存在這樣的問(wèn)題,這是很讓人匪夷所思的事情。
三、在統(tǒng)計(jì)學(xué)中,應(yīng)當(dāng)如何闡述算術(shù)平均數(shù)的計(jì)算方法?
(一)應(yīng)當(dāng)徹底擯棄算術(shù)平均數(shù)的“基本公式”。正是這個(gè)所謂基本公式的存在和一直沿襲,產(chǎn)生了嚴(yán)重的誤導(dǎo)作用,導(dǎo)致了算術(shù)平均數(shù)計(jì)算方法的教學(xué)困惑和迷茫。
(二)應(yīng)當(dāng)按平均對(duì)象的數(shù)值形式(絕對(duì)數(shù),相對(duì)數(shù),平均數(shù))分別介紹算術(shù)平均數(shù)的計(jì)算方法。
先闡述對(duì)絕對(duì)數(shù)計(jì)算平均數(shù)。闡明兩點(diǎn):其一,對(duì)絕對(duì)數(shù)計(jì)算平均數(shù)的確存在一個(gè)統(tǒng)一的計(jì)算公式,即:標(biāo)志總量/總體總量。其二,在未分組條件下使用簡(jiǎn)單算術(shù)平均數(shù)的方法,在已分組條件下使用加權(quán)算術(shù)平均的方法,各組次數(shù)(頻數(shù)或頻率)就是權(quán)數(shù)。顯然,開(kāi)始就用對(duì)絕對(duì)數(shù)計(jì)算平均數(shù)的例子引出簡(jiǎn)單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)的公式,比較淺顯易懂。
再闡述對(duì)相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù)。闡明兩點(diǎn):其一,對(duì)相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù),無(wú)論是否已分組,都不能采用簡(jiǎn)單算術(shù)平均法,要采用加權(quán)算術(shù)平均法。比如,對(duì)前面3個(gè)班及格率計(jì)算平均數(shù),不能簡(jiǎn)單相加除以3,要用3個(gè)班的參考人數(shù)作權(quán)數(shù)加權(quán)平均。因?yàn)榧案衤实挠?jì)算,無(wú)論是各個(gè)班計(jì)算,或是將3個(gè)班合起來(lái)計(jì)算,都是用及格人數(shù)比參考人數(shù)。同理,3個(gè)班的總平均成績(jī)的計(jì)算,同樣要用3個(gè)班的參考人數(shù)作權(quán)數(shù)加權(quán)計(jì)算。沒(méi)有權(quán)數(shù),就不能計(jì)算平均數(shù)。其二,對(duì)相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù),不存在統(tǒng)一的計(jì)算公式。由于相對(duì)數(shù)和平均數(shù)都是派生指標(biāo),要根據(jù)具體的相對(duì)數(shù)和平均數(shù)本身的算法去計(jì)算。因?yàn)槠骄鶖?shù)是平均對(duì)象的代表值,平均的結(jié)果不能擺脫平均對(duì)象的本來(lái)屬性。比如上面計(jì)算的平均計(jì)劃完成程度98.7%,其本身仍然是一個(gè)計(jì)劃完成相對(duì)數(shù),只不過(guò)是30個(gè)企業(yè)的計(jì)劃完成程度的代表值。各個(gè)企業(yè)的計(jì)劃完成程度是用實(shí)際數(shù)比計(jì)劃數(shù),把30個(gè)企業(yè)合起來(lái)計(jì)算一個(gè)計(jì)劃完成程度,也同樣是用總實(shí)際數(shù)比總計(jì)劃數(shù)。因而,在已分組條件下,必然要用各組計(jì)劃數(shù)作權(quán)數(shù)加權(quán)平均。假如給出的是未分組資料,即給出30個(gè)企業(yè)的計(jì)劃完成百分比,也不能采用簡(jiǎn)單算術(shù)平均的方法,把30個(gè)百分比相加除以30。所以,作為總體總量的30個(gè)企業(yè),原本就不能加入計(jì)算。因此,就不存在權(quán)數(shù)的“選擇問(wèn)題”。再譬如,有30個(gè)企業(yè)生產(chǎn)同一種產(chǎn)品,給出的是按單位成本分組的資料,要計(jì)算30個(gè)企業(yè)的平均單位成本。這是在已分組條件下對(duì)平均數(shù)計(jì)算平均數(shù)。各組的產(chǎn)量自然是權(quán)數(shù)。因?yàn)閱挝怀杀镜挠?jì)算,無(wú)論是各個(gè)企業(yè)計(jì)算,或是30個(gè)企業(yè)合起來(lái)計(jì)算,都是總成本比總產(chǎn)量。作為總體總量的30個(gè)企業(yè)不能加入計(jì)算,同樣不存在“權(quán)數(shù)的選擇問(wèn)題”。
以這樣的思路去闡述算術(shù)平均數(shù)的計(jì)算方法,或許更為合理更為準(zhǔn)確,對(duì)教學(xué)更為方便。
隨著經(jīng)濟(jì)快速發(fā)展和社會(huì)全面進(jìn)步,統(tǒng)計(jì)學(xué)的運(yùn)用越來(lái)越廣泛,尤其是即將到來(lái)的大數(shù)據(jù)時(shí)代,更需要人們掌握和運(yùn)用各種各樣的統(tǒng)計(jì)方法和技能,以適應(yīng)時(shí)代的要求。同時(shí),統(tǒng)計(jì)學(xué)也必然迎來(lái)前所未有的發(fā)展機(jī)遇,統(tǒng)計(jì)方法的研究和創(chuàng)新有著更為廣闊的空間,對(duì)于統(tǒng)計(jì)學(xué)里面一些帶基礎(chǔ)性的方法問(wèn)題更有必要澄清和理順,這正是本文的初衷。