陳嘉璐
摘要: 樣本估計總體是高中數學統計學中的研究分析相關數據的有效手段和方法,由于人們的時間和精力是都有限的,無法采取到所有的數據,因此可以采用典型樣本數據獲得總體信息的方法來獲取有效信息。樣本估計總體基于隨機分布的數學概念,即在樣本容量足夠大的前提下,數據具有隨機性,換句話說,只要數據足夠多,那么選取大數據中的其中一小部分,這一小部分中的數據也能夠反映大數據的信息,因此樣本常用來估計總體。文章基于高中生視角,以全面化客觀化的角度分析思考問題,對高中數學統計學樣本估計總體作一個總結。
關鍵詞: 高中數學;樣本估計總體;高中生視角;學習體會
基于樣本容量足夠大的前提,數據的分布均有隨機性與平均性,因此樣本可以估算總體數據,但也是需要方法和技巧的,不能無憑無據地估算總體數據,只能運用數學思維科學計算來估算。在估算時候需要嚴謹與細心,具體條件具體分析,樣本估算整體有多種方法,因此要根據實際情況選擇有效方法。
一、樣本頻率估計整體
只要數據足夠多,那么數據的排列會變得沒有順序,因此樣本中的頻率適用于估算整體的頻率,而樣本頻率的判斷方式有許多種,一般用圖表將樣本頻率直觀清晰地表示,如頻率分布表、頻率直方圖、總體密度曲線、莖葉圖三個角度等等,根本實際需要作出符合要求的圖形從而獲得有代表性的數據。樣本頻率估算整體的圖形選擇有很多種,因此要根據題目所給信息具體選用圖形,以下將這些圖形曲線一一闡述:
1.頻率分布表與頻率直方圖的應用 頻率分布表與直方圖需要重點把握頻數和頻率,頻數是指在某個范圍內數據出現的次數,頻率某一數據在某個范圍出現頻率計算方法是頻數除以數據的總數(即樣本容量)。例如在一個樣本中,數據分別為1,3,3,4,5,6,6,6,6,7,選取6作為參考數據,那么6的頻數為4,樣本容量為10,那么6的頻率為頻數4除以樣本容量10結果為百分之四十,如果選取7為參考數據,7的頻數為1,樣本容量為10,那么7的頻率為1除以10等于百分之十。頻率分布表與直觀圖主要對具體某個數據進行分析研究,因此在強調數據的題型,較多的運用這種方法估算數據,通過這種方式,高中生能夠直觀并清晰地從樣本了解到整體。
2.總體密度曲線反映數據趨勢 基于樣本容量無限增大,分組間的組距不斷減小,就能夠得到一種總體密度曲線,這反映了總體的變化趨勢,通過這條曲線,就能夠清晰的得知各種數據占總體的百分比。需要注意的是,總體密度曲線的獲得需要數值區間與頻數,通過區間的中點將其一點點連接,就能夠得到一條光滑的曲線,在這種樣本中的曲線能夠有效估算整體數據,最后得到有效地結論。這種樣本估算總體的方式不適用于個別數據或是分組的求解,而是適用于整體數據的分布情況,通過整體數據反映出數據的趨勢。
3.莖葉圖保留原始數據,并讓數據直觀有效 莖葉圖沒有原始數據的缺失,卻難以直觀地判斷樣本的頻率,也無法直觀得出數據的頻率,但它的好處在于方便記錄,可隨時添加。莖葉圖不僅適用于兩位數的數據,三位數四位數也可以適用,通過高位數與低位數的不同排布,人們可以通過對所有的數據進行全面與直觀的了解,這多用于統計種各數據或是直觀了解所有數據的題型中。在很多種情況下,莖葉圖的應用是判斷樣本整體信息的最好方式,但估算總體偏差較之前者慧更大。
二、樣本數據特征估算總體
樣本數據特征估算總體是另一種方法,也是基于總體容量足夠大,數據的分布具有隨機性和無序性的大前提,樣本數據特征能夠有效反映總體數據,在很多情況下都比樣本頻率與頻數分布要準確地多。高中數學統計學通過樣本數據特征估算總體的特征有很多,選取三個主要方面進行分析闡述:
1.眾數、中位數、平均數的應用
當需要反應總體的特征時,通過以樣本的數據特征來估算總體特征,如眾數,中位數,與平均數,眾數是樣本數據中頻數最多的數,根據正態分布以及隨機數分布的規律,眾數是密度曲線的分水嶺或是臨界點,越靠近眾數的數據頻率分布越高,越遠離眾數的數據頻率越低,因此眾數常作為衡量的標準(但也沒有絕對)。中位數是樣本數據中最中間的數,通常在穩定的數據分布中與眾數接近(同樣無絕對),這里需要注意的是,當所有的數據個數為奇數時,可以選取最中間的數,當所有數據個數為偶數時,則要將最中間的兩個數據相加再除以二,得出的值才為中位數。平均數是整體數據相加除以數據個數得到的數值,一般來說,平均數是最能夠反映整體數據的信息的,但無法反映數據的趨勢與變化規律。在用樣本數據來判斷分析總體數據時,要眾數,中位數,平均數三個數值結合判斷,不能夠光從單個數值出發計算,否則得到的信息同樣是不準確的。
2.標準差、方差的應用
標準差與方差反映了數據分布的離散性和趨中性,通過將樣本中所有的數據加權平均得到,標準差是方差的平方,將所有數據加權平均的意義在于使答案恒為正數。標準差與方差適用于反映數據的集中趨勢,當標準差與方差過大時,反映了數據無法均勻排布,隨機性較大,當標準差與方差過小時,反映了數據均勻排布,區中性較大,因此通過標準差與方差的應用,人們能夠得知數據的穩定性與整體變化趨勢,因此適用于整體數據的有效信息求解。
綜上所述,樣本估算整體是高中數學統計學里為了減少時間與人力成本而使用的通過以偏求全的一種高效獲得信息的方式,然而真正掌握這樣的方法并不容易,首先要知道各種圖表與數據的意義和被賦予的數學概念,還要清晰的知道具體求解的是什么,是整體數據的趨勢還是具體的值,通過一系列的分析,正確的計算后,就能夠獲得相關有效信息。
參考文獻:
[1]孫建平,呂效國,陸利平.概率論與數理統計學習策略的統計分析[J].高師理科學刊.2011-09-30
(作者單位:江西育華學校高三(3)班 330027)