陳壽雨
【摘要】統計術語是統計學語言的基礎,正確理解基本的統計術語對學生學好統計課程來說非常重要。本文將從統計術語教學的角度,對三組統計術語的教學進行設計,希望有助于統計術語的教與學。在統計學課程中,基本的統計術語一般包括個體、總體和樣本;變量和數據;參數和統計量等三組共7個統計學術語。這些術語構成了統計學這門學科的語言,將伴隨統計學教學與學習的始終。
【關鍵詞】統計學? 統計術語? 教學設計
一、個體、總體和樣本
在統計學中,個體是指搜集數據的單個對象,可以是一個人、一個項目、一家企業、一個地區,或者是一個國家。總體是在研究范圍之內的所有相關的個體組成。一個總體里面個體的數量,叫做總體容量,通常用大寫的N表示。總體容量有多大,取決于你的研究范圍。比如,你的研究范圍只局限在一所高校里的大學生,那么這所高校的所有大學生數量就是總體容量,如果你的研究范圍是一座城市里所有高校的在校大學生,那么總體的容量就會大很多。樣本來自于總體,是由總體中的部分個體所組成。組成樣本的個體一般都是從總體中隨機抽樣產生,這樣的樣本叫做隨機樣本,能夠在一定程度上代表總體。樣本是我們進行調查和收集數據的范圍。在一個樣本中,個體的數量叫做樣本容量,通常用小寫的n表示。樣本容量一般比總體容量小很多(圖1)。
我們可以再來看一幅圖,理解個體、總體和樣本的關系。在圖中,每個人就是一個個體。正方形方框代表研究的范圍,在方框內全部的個體構成了總體,總共有16人,即總體容量N=14。從總體中,我們隨機抽取了4個人,并用圓圈包圍,那么這4個人就組成了一個隨機樣本,樣本容量n=4。
再舉一個更加具體的例子來說明。例如要對某高校所有10000名學生每月生活費數量進行研究,那么該校的每一名學生就是一個個體。全校所有在校生構成了總體,總體容量N為10000。如果對其中的100名學生進行調查,收集他們每月生活費的數據,那么這100名學生就組成了一個樣本,樣本容量n為100。
二、變量和數據
第二組統計學術語,變量和數據。變量是指我們對個體所感興趣的某些特征。比如為了了解青少年的身體發育情況,我們對個體的年齡、性別、身高、體重等特征就比較感興趣。這里的年齡、性別、身高和體重就是變量。再比如我們想了解某個地區中小企業的經營現狀,就會對中小企業的產值、銷售額、利潤、員工數量等特征感興趣,所有這些特征就是一個個變量。數據是與變量相對應的,是變量的取值。變量的所有取值組成了一個數據集。比如我們對100名青少年的年齡、性別、身高和體重進行調查,會得到有關年齡、性別、身高和體重的各100個數據,共400個數據,這些數據共同組成了一個數據集。數據集通常存儲在電子表格軟件中,如存放在EXCEL工作表中,這樣可以方便地對數據進行統計分析。在EXCEL工作表格中,通常每一列代表一個變量,每一行代表某個個體的觀測值。如在 “青少年發育特征數據集”的EXCEL工作表(表1)中,除第1列是個體編號之外,其他每列分別代表一個變量,分別是年齡、性別、身高和體重;除了第1行是變量名稱之外,從第2行開始,每一行代表一個個體相應變量的數據,如編號為1的個體,年齡是13周歲,性別為男,身高為160厘米,體重為50千克等。
三、參數和統計量
在統計學中,參數是與總體相關的,又叫總體參數,它是對總體特征的概括性度量,其中總體特征是指我們關心的某個變量,因此,總體參數也就是有關總體某個變量的概括性度量。例如在我們研究范圍內有1萬名大學生,這1萬名大學生構成了一個總體,我們對這些大學生的每月生活費是多少這一特征感興趣,那么每月生活費就是研究中所涉及的一個變量。由于1萬名大學生就有1萬個數據,因此,我們需要用一些度量來概括這些數據的特征。比如用平均數,來了解所有學生每月生活費的總體情況,也可以用標準差,來了解所有學生之間每月生活費差異的大小。這里的平均數和標準差都是對某個變量所有數據的概括性度量,并且是基于總體的數據計算得出的,我們把它們叫做總體均值和總體標準差。它們都是屬于總體參數。除了總體均值和總體標準差之外,總體方差和總體比率也是總體參數。因為計算總體參數需要總體中所有個體的數據,而獲得全部個體的數據通常很困難,所以我們很難通過直接計算得到相關參數的值。因此,參數的取值一般是未知的,但參數的取值代表總體的某一重要信息,了解總體的信息是我們研究的目的所在,所以我們通常使用統計推斷的方法,來獲得未知參數的取值。
統計量是與樣本相關的,又叫樣本統計量,它是樣本特征的概括性度量,是用來推斷相應的總體參數的。比如在1萬名大學生組成的總體中,我們隨機抽取100名學生組成一個隨機樣本,樣本容量為100。用這100名學生的每月生活費數據計算出來的平均數和標準差,分別叫做樣本均值和樣本標準差。它們都屬于樣本統計量。除了樣本均值和樣本標準差之外,樣本方差和樣本比率也是樣本統計量。一般來說,樣本容量遠遠小于總體容量,對樣本中的個體進行調查和收集數據比較容易,因此可以直接計算得出樣本統計量的值。但是要注意,我們研究問題的目的是要了解總體參數的信息,而不是樣本統計量的信息。但樣本統計量可以作為一個有效的工具或手段,用來推斷相應總體參數的取值,從而達到我們的研究目的(圖3)。
四、統計學基本術語教學的一個例子
根據統計學基本術語之間的邏輯關系(圖4),以及研究的背景——研究本市四所高校共計45000名在校大學生每天玩手機游戲的時長問題,研究者對隨機抽取的200名學生進行問卷調查。調查發現,這些學生平均每天玩手機游戲的時長是30分鐘,要求學生回答在這項研究中,個體、總體、樣本、變量、數據、參數和統計量等術語所指的具體內容。
參考文獻:
[1]安德森.商務與經濟統計[M].北京:機械工業出版社,?2018.
[2]萊文.商務統計學[M].北京:中國人民大學出版社,2017.
[3]林德.商務與經濟統計方法[M].北京:機械工業出版社,2015.