阮征 孔德飛


【摘 要】本文基于P值在統計學中的特殊意義,從假設檢驗、正態分布、P值的含義、統計顯著性四個維度出發,結合某個披薩店平均配送時間是否會大于30分鐘的具體案例,對P值的統計學意義進行分析闡述,最后指出P值還在SPSS軟件分析問卷數據等方面發揮著的不可替代的作用,它所蘊含的重要價值值得廣大研究者對其進行更多角度的深度挖掘。
【關鍵詞】假設檢驗;正態分布;P值;統計顯著性
【中圖分類號】G633.6? 【文獻標識碼】A? 【文章編號】1671-8437(2019)34-0021-02
在統計學P中,P值具有特殊的意義,在解析幾何乃至某些實驗中,P值同樣成為決策工具的一部分,如當超過的閾值時,意味著P值為0.0000003才能確認發現了希格斯玻色子。下面將分別從假設檢驗、正態分布、P值的含義、統計顯著性這四個方面解釋P值的意義以及如何在統計學中使用P值。
1? 假設檢驗
在假設檢驗中,通常采用P值來確定結果的統計顯著性[1]。由于最終目標是確定結果的統計顯著性,統計顯著性需要建立在假設檢驗、正態分布、P值這三個簡單概念之上。所以,假設檢驗是通過一組數據檢驗零假設的有效性,倘若零假設不成立,此時就會相信備擇假設。換句話說,就是需要提出零假設,并用樣本數據來檢驗聲明是否有效。倘若零假設無效,則選擇備擇假設。而要想確定零假設是否有效,就要運用P值來衡量證據的強度,從而了解它是否有統計顯著性。如果證據支持備擇假設,那么就會拒絕零假設并接受備擇假設。
舉個典型的例子:假設某個披薩店聲稱他們的平均配送時間小于或等于30分鐘,但這里認為他們的配送時間不止30分鐘,所以做了假設檢驗,對配送時間采用隨機采樣來檢驗這一說法:零假設——平均配送時間小于等于30分鐘;備擇假設——平均配送時間大于30分鐘。這里的目標是確定樣本數據中的證據能更好地支持哪種假設(零假設還是備擇假設)。本例中使用的是單尾檢驗,這里只想知道平均配送時間是否多于30分鐘,因為配送時間小于或等于30分鐘都是可以接受的,因此可忽略另一個方向的可能性,換句話說就是想弄清楚披薩店是否在某種角度上欺騙了消費者。
2? 正態分布
正態分布是一種用來觀察數據分布的概率密度函數,它包含兩個參數——平均值μ和標準差σ。其中,平均值代表著數據分布的集中趨勢,決定了正態分布峰值的位置;標準差則是衡量可變性的標準,決定了均值的下降幅度。正態分布通常68-95-99.7和規則相關:68%的數據在平均值μ±1個標準差σ內;95%的數據在平均值μ±2個標準差σ內;99.7%的數據在平均值μ±3個標準差σ內。
Z分數越高,結果就越不可能偶然發生;Z分數越低,結果就越可能有意義。但多高或多低才足以說明結果是有意義的呢?這就是解決這個難題的最后一片拼圖——P值,需要根據實驗開始前設定的顯著水平檢驗結果是否具有統計學意義。
3? ?P值的含義
對披薩配送時間隨機采樣的目的是檢查平均配送時間是否大于30分鐘,如果最終的結果支持披薩店的說法,即平均配送時間小于或等于30分鐘,那就表示接受零假設,否則就是拒絕零假設。假如生活在披薩配送時間小于或等于30分鐘,即零假設成立的世界中,那在真實世界中得到的證據有多令人驚訝?P值用數字(概率)回答了這一問題:P值越低,證據越令人驚訝、零假設越荒謬。當零假設很荒謬的時候還能做什么?可以拒絕零假設并選擇備擇假設,如果P值低于之前定義的顯著水平,那么它屬于荒謬閾值,可以拒絕零假設。
如現在已經抽樣得到了一些配送時間,計算后發現平均配送時間要多10分鐘,P值為0.03,這意味著在比薩配送時間小于或等于30分鐘的世界中,由于隨機噪聲的影響,有3%的概率會看到比薩配送時間延長了至少10分鐘。由于P值越低,結果越有意義,所以它不太可能是由噪聲引起的。很多人對P值存在誤解:P值為0.03意味著有3%的概率是偶然決定的——這是錯誤的,因為P值不能證明任何事,它只是一種根據驚訝程度做出合理決策的基礎方法。那么利用0.03的P值來做出合理決策則需要以下幾步:①想象生活在平均配送時間小于或等于30分鐘的世界。②分析收集的配送時間樣本后,P值為0.03,低于0.05的置信水平,因此可以說結果是具有統計顯著性的。③因為一直相信比薩店可以在30分鐘內配送比薩,現在需要考慮的是這一信念是否仍然有意義,因為結果說明了比薩店沒能兌現承諾,而且結果是具有統計學意義的。④這時先試著用各種方法使初始信念成立,但由于比薩店的口碑越來越差,因此決定拒絕零假設。⑤最終做出不再從這家比薩店買比薩的合理決定。
不難發現在上面的例子中,P值不能證明或決定任何事。當結果有統計學意義時,P值可以作為挑戰初始信念的工具。假設P值表明結果具有統計顯著性,在認為信念荒謬的那一刻就放棄了自己的初始信念,即拒絕零假設,并做出了更合理的決定。
4? ?統計顯著性
通過對上述假設檢驗、正態分布、P值含義、統計顯著性四個維度的分析可知P值在統計學中具有非凡的意義,更是SPSS軟件分析問卷數據時的重要指標,值得廣大研究者對其進行深入探究。
【參考文獻】
[1]阮征.影響初中生數學運算能力提升的因素調查研究[D].合肥:合肥師范學院,2018.
[2]衛德彬,阮征,陳方勇,等.智慧學校環境下習題課教學與初中生數學成績關聯性實驗研究[J].中小學電教,2019(6).
【作者簡介】
阮征(1992~),女,漢族,學歷:碩士研究生,研究方向:數學課程與教學論。
孔德飛(1977~),男,漢族,中學一級教師,研究方向:初中數學教學。