陳清華,郭金忠,袁 強
(1.北京師范大學 系統(tǒng)科學學院,北京 100875;2.新疆大學 經(jīng)濟與管理學院,新疆 烏魯木齊,830046;3.北京師范大學 經(jīng)濟與工商管理學院,北京 100875)
(上為任意分布情況,下為標準正態(tài)分布情況)
如何理解計量經(jīng)濟學中的假設檢驗
陳清華1,郭金忠2,袁 強3
(1.北京師范大學 系統(tǒng)科學學院,北京 100875;2.新疆大學 經(jīng)濟與管理學院,新疆 烏魯木齊,830046;3.北京師范大學 經(jīng)濟與工商管理學院,北京 100875)
假設檢驗是整個計量經(jīng)濟學中的主要內(nèi)容,也是數(shù)理統(tǒng)計中的重要部分。但目前在計量經(jīng)濟學相關教科書中和教師的教學過程中,往往容易側(cè)重于參數(shù)估計方法的介紹,而在假設檢驗方面的分析不夠深入,相關的背景和邏輯交待不充分,使得同學們不能真正理解假設檢驗,最后造成對整個計量經(jīng)濟學學習和應用的障礙。論文聯(lián)系其他背景材料,重新整理有關假設檢驗的邏輯體系,擴大知識面,剖析、展示假設檢驗相關各個知識點的邏輯和聯(lián)系,旨在促進學生們對計量經(jīng)濟學中假設檢驗思想的真正理解,促進真正的計量經(jīng)濟學教學改革。
計量經(jīng)濟學;假設檢驗;教學改革
自20世紀70年代末80年代初,計量經(jīng)濟學開始進入中國。經(jīng)過30多年的發(fā)展,計量經(jīng)濟學模型已經(jīng)成為經(jīng)濟理論研究和實際經(jīng)濟分析的一種主流實證方法[1-3]。據(jù)統(tǒng)計,2007年《經(jīng)濟研究》發(fā)表的文章中以計量經(jīng)濟學模型方法作為主要分析方法的論文占53%,2009年《管理科學》發(fā)表的文章中此類文章占比達到55%[1]。這個成就與我國在教學方面對計量經(jīng)濟學的重視是分不開的。1998年7月,教育部高等學校經(jīng)濟類學科專業(yè)教學指導委員會討論并確定了高等學校經(jīng)濟學門類各專業(yè)的8門共同核心課程,其中就包括“計量經(jīng)濟學”。根據(jù)李子奈等人的調(diào)查,早在2006年,設置經(jīng)濟類和管理類本科專業(yè)的高校中分別有98%及60%以上的學校開設了該課程[2]。目前,一些相關的教育改革在全國范圍內(nèi)不斷進行[4-6]。
與計量經(jīng)濟學的應用蓬勃發(fā)展相對應,我國的計量經(jīng)濟學應用研究中,問題和錯誤也大量存在[1]。其中一個非常典型的表現(xiàn)就是一些作者在回歸得到參數(shù)的估計之后就進入結(jié)論部分,缺乏必要的假設檢驗過程,甚至連估計量的方差估計都沒有給出。究其原因,實際上反映了作者對于假設檢驗理解的欠缺。這個與教學中同學們的反映是一致的。在筆者的教學過程中,學生們對于參數(shù)估計的計算沒有什么問題,最大的障礙在于假設檢驗部分的理解,他們認為假設檢驗部分比較抽象,難以理解t檢驗是怎么來的,不能明白為什么估計真實參數(shù)的置信區(qū)間和點估計的置信區(qū)間形式上是如此一致。為此,本文就計量經(jīng)濟學的基本知識[7-8],結(jié)合其他背景,對假設檢驗的重點部分進行梳理闡釋,讓它更加清晰而有條理。
什么是科學的標準,長期以來并沒有統(tǒng)一的說法,直到波普爾科學哲學思想的提出。波普爾(Karl Popper)提出的對科學的判斷標準即使目前仍然存在反對的聲音,但它無疑已成為一種經(jīng)典之論。在波普爾的詞典里,“科學”不是“有意義”或“有價值”的同義詞,更不是“正確”或“真理”的同義詞。他強調(diào),科學理論都只是暫時的、尚未被證偽的假設[9],更是否定了將科學等同于真理的迷信。科學必須留下破綻,讓別人有反對它、說它錯誤的機會。從這個角度來看,哲學、神學往往都不是科學的。
自然科學中,特別是物理,充滿了可證偽性。以牛頓(Isaac Newton)力學為例,牛頓第一運動定律中有表述:任何物體在不受任何外力的時候,總保持勻速直線運動狀態(tài)或靜止狀態(tài),直到有作用在它上面的外力迫使它改變這種狀態(tài)為止。不管我們現(xiàn)在是否能做到一個物體不受力的情況,但是我們總是有機會在有更高超的手段的時候去檢驗它是否說錯了。再有一個例子,就是愛因斯坦廣義相對論指出重力會造成時空彎曲,1911年,愛因斯坦(Albert Einstein)首次計算了光線在引力場中的偏折,并于1915年進行了完善,他預測了遠處恒星的光線經(jīng)過太陽附近時的偏折量。如果在某次實驗觀測沒有發(fā)現(xiàn)光線被偏折的情況下,顯然這個理論很容易被證明錯誤。但1919年5月29日日食時在巴西的索布拉爾的觀測和理論預測符合得較好[10]。從此,廣義相對論為更多的人所接受。
理論提出后來進行實驗驗證的過程本質(zhì)上就是一個假設檢驗過程,科學的理論必須讓觀測者有機會去反對原來的假設。我們在計量經(jīng)濟學中也是如此做的:在一次觀測獲得原假設情況下非常罕見的事情時候,觀測者有權(quán)利質(zhì)疑原假設的正確性。毫不夸大的說,假設檢驗因為具有這樣的科學性而被廣泛應用于各個學科,包括社會統(tǒng)計學等。假設檢驗是計量經(jīng)濟學中具有可證偽性的部分,從而讓計量經(jīng)濟學在整個經(jīng)濟學體系中表現(xiàn)出科學性,最終使得這個學科具有無法替代的地位。朱家祥教授也曾指出:“我同意計量經(jīng)濟學是證偽而不是證實的觀點。”。雖然有其他學者認為,在方法論上計量經(jīng)濟學既不是完全的證偽主義,也不是完全的實證主義,而是兩者的綜合。但假設檢驗的可證偽性是普遍承認的[1]。
假設檢驗和數(shù)學上反證法的思想也是一致的,即先做出假設,然后在假設的基礎上得到矛盾的結(jié)果,從而最終有可能去推翻原假設。大家知道,數(shù)學上的反證法是非常有說服力的。
假設檢驗是聯(lián)系總體和樣本紐帶。假設檢驗的過程是這樣:首先對于總體的性質(zhì)有個原假設(其對應的為備擇假設),然后從總體中獲得一些樣本,對這些樣本進行觀測,根據(jù)觀測結(jié)果來決定在一定程度上是否拒絕原假設。檢驗的結(jié)果有兩個:拒絕原假設或者不能拒絕原假設。要注意,檢驗的結(jié)果不能認定原假設為真,最多是不能拒絕。檢驗結(jié)果也是針對總體的。
樣本來源于總體。一般而言,我們會更加關注的總體的性質(zhì),而不是樣本的性質(zhì)。對于總體的把握要比對樣本的把握有意義得多。因為總體的性質(zhì)是最根本的,它決定已經(jīng)抽出的樣本乃至將來可能抽出的樣本的特征。總體才具有穩(wěn)定不變的特性,樣本的個體性質(zhì)是千變?nèi)f化的,總體的穩(wěn)定性質(zhì)往往被個體的一些隨機特性所掩蓋。認清一個人的本質(zhì)比糾結(jié)于他做的一件瑣事要有意義得多。
正因為如此,假設檢驗比參數(shù)估計要重要。但在教材上我們很容易發(fā)現(xiàn)參數(shù)估計部分寫得要多一些,而假設檢驗部分倒寫得少。其原因我想可能是假設檢驗的思想比較簡單,不需要用長篇幅的學術(shù)語言來表達,而估計部分有一些不同的估計方法:包括普通最小二乘法,矩估計法和極大似然估計方法,這些方法都有豐富的思想和技術(shù)細節(jié)需要展示。
參數(shù)估計只是樣本數(shù)值的一個計算結(jié)果,總體的性質(zhì)才是最重要需要最終把握的。參數(shù)估計只是為了后面的假設檢驗為基礎。應該清楚,參數(shù)估計的大小是沒有意義的,因為真實的參數(shù)可能離開它很遠,必須通過假設檢驗的手段來對真實參數(shù)的進行判斷。
我們所有討論的東西都是在概率意義的進行的。通過樣本的性質(zhì)得到的總體情況也是在一定概率意義上的,體現(xiàn)在假設檢驗上就是顯著性水平,或者由樣本計算得到總體某個參數(shù)的置信區(qū)間。
在假設檢驗中會涉及到兩類錯誤:第一類錯誤和第二類錯誤。第一類錯誤也稱為α錯誤,是指當原假設(H0)正確時,而拒絕H0所犯的錯誤。第二類錯誤也稱為β錯誤,是指原假設錯誤時,反而做出結(jié)論不能拒絕原假設的情況。
例如這個命題是正確的:犯罪分子有95%以上的概率都是金黃色頭發(fā)。這個命題等價于如果某個人X是犯罪分子,則X有金黃色頭發(fā)的概率大于95%。
這時候,我們有原假設H0: X是犯罪分子,我們通過對他頭發(fā)顏色的觀測來決定是否拒絕原假設。則不管我們觀察到X的頭發(fā)顏色而做出是否拒絕原假設的決定都有可能犯錯誤。
第一類錯誤:X是犯罪分子,但頭發(fā)不金黃,我們拒絕了原假設。
第二類錯誤:X不是犯罪分子,但頭發(fā)金黃,我們沒有拒絕原假設。
此時,我們對于犯第二類錯誤的概率是不清楚的,因為普通人的頭發(fā)顏色如何并沒有交代。但犯第一類錯誤的概率是知道的,因為犯罪分子有95%以上的概率都是金黃色頭發(fā),也就是只有5%以下的概率頭發(fā)不是金黃的,所以我們發(fā)現(xiàn)X頭發(fā)不是金黃的而拒絕原假設時,可能犯錯誤,但這個犯錯的概率是5%以下。
假設檢驗中的顯著性水平就對應著對犯第一類錯誤的概率控制。如果我們要求犯第一類錯誤的概率更低,則對應著更小的顯著性水平。而大的顯著性水平意味著更不嚴格的要求。
契比雪夫(Chebyshev)不等式體現(xiàn)了期望和方差的聯(lián)合作用效果,表明方差可以在概率意義上控制樣本點偏離總體期望的距離。具體表達式如下:

(1)

這個定理的證明也很簡單,可以直接寫在下面:
(2)
其中f(x)為該分布的概率密度函數(shù)。
要明確地是,有了契比雪夫不等式,即使不知道具體的分布函數(shù),只要知道準確的方差,我們就可以對期望進行初步的假設檢驗。
例如,已知一個分布的方差為1,問一次抽樣取值在什么范圍的時候能在0.05的顯著性水平下拒絕總體期望為0的原假設。
解:寫出原價設和備擇假設,H0∶μ=0;H1∶μ≠0。

契比雪夫不等式實際上給出了一個最寬泛的情況,就是不管什么分布肯定都存在這樣的方差和期望之間的關系。實際上是給出了偏離期望的概率值的一個上確界。

在知道總體分布的時候,我們可以獲得更加精確的概率值去進行假設檢驗,就可以做更加嚴格的假設檢驗,可以在更不極端的情況拒絕原假設。如果我們已知總體的方差為1,并且知道總體是一個正態(tài)分布,我們就可以通過標準的正態(tài)分布表來獲得檢驗期望為0對應的臨界值。如果總體是某個自由度條件下的t分布,我們可以查相應的t分布表。如果總體是某些自由度參量下的F分布,我們也有表可查。
如果我們所要討論的問題沒有現(xiàn)成的概率表可以查,我們可以通過概率統(tǒng)計知識進行變換成合適的形式,然后進行查表操作。
這個情況下我們不僅能做精確的雙邊檢驗還能做精確的單邊檢驗。
例,已知一個方差為9的正態(tài)分布,問取值在什么范圍的時候能在0.05的顯著性水平下拒絕如下問題中的原假設。
a)H0∶μ=0 H1∶μ≠2
b)H0∶μ≤2 H1∶μ>2


圖1 在0.05顯著性水平下拒絕期望為0的臨界值
(上為任意分布情況,下為標準正態(tài)分布情況)
在計量經(jīng)濟學問題中,我們的樣本往往有很多,這容易迷惑大家,造成一個誤解,就是以為假設檢驗是多次來進行的。實際上并不是這樣,這些數(shù)據(jù)將被計算成一個值,然后進行假設檢驗環(huán)節(jié),也就是所有的假設檢驗最終本質(zhì)上只是通過一次邏輯抽樣進行的。
例如,我們已經(jīng)在不知道分布形式也不知道方差的情況下,我們不能做假設檢驗。但如果我們多次抽樣,我們就可以得到樣本方差來近似代替總體方差得到進行近似的假設檢驗。即:
(3)

(4)
(5)


所以計量經(jīng)濟學中所廣泛使用的單參數(shù)t檢驗的原因是因為總體誤差項的方差未知,誤差項方差已知的情況下是可以使用標準正態(tài)分布檢驗的,而不知道的時候我們用平均自由度下的殘差平方和替代,從而使用的是t檢驗。
t檢驗中,我們只是構(gòu)造出符合t分布的統(tǒng)計量,然后通過樣本值計算了這個統(tǒng)計量的值,相當于做了一次這個統(tǒng)計量的抽樣,然后根據(jù)統(tǒng)計量的特性進行假設檢驗。其他的F檢驗也是如此,是在原假設的基礎上構(gòu)造出來合適的統(tǒng)計量,然后通過樣本數(shù)據(jù)計算了一個值。在原假設正確的情況下,這個值就是對服從某一個分布的統(tǒng)計量的一次抽樣。
在計量經(jīng)濟學的假設檢驗中,經(jīng)常有三種表現(xiàn)形式:(1)統(tǒng)計量的值,一般為單參數(shù)檢驗的t值和線性約束條件下的F值;(2)p值為統(tǒng)計量的值在相應的分布中對應的更遠端的概率值;(3)置信區(qū)間是指一定置信度水平下某個值所處的區(qū)間,或者處于這個區(qū)間有一個相應的概率。
t值的計算已經(jīng)考慮到需要檢測的期望,所以得到t值后只能針對同樣的原假設進行假設檢驗,但是可以在不同的顯著性水平下做。具體做法是,根據(jù)不同的顯著性水平從相應的統(tǒng)計分布表中查出相應的臨界值。然后將得到的t值與臨界值進行比較。



但如果通過t查表得到p值,不需要針對每個顯著性水平查表,而是直接判斷是否要拒絕原假設。如自由度為20的情況下,得到t統(tǒng)計量的值為2.08,該點相應的p值略小于0.05。就可以在0.05的顯著性水平下通過雙邊檢驗不拒絕原假設,更可以在0.1的顯著性水平下通過雙邊檢驗不能拒絕原假設,或者在0.025的顯著性水平下通過單邊檢驗拒絕原假設。同樣,獲得F值后也可以通過查表得到對應的p值,然后檢查是否可以在一定的顯著性水平下拒絕原假設。
以上通過統(tǒng)計量的值或者對應的p值都可以在不同的顯著性水平下進行假設檢驗,但原假設不能變。如果我們在一定的置信度水平下得到真實值的對應的置信區(qū)間,則可以非常方便地對更多可能的原假設進行假設檢驗。
顯著性水平和置信度水平是對應的。顯著性水平0.05,對應概率95%置信區(qū)間。顯著性水平0.01,對應的置信區(qū)間的概率為99%。
計量經(jīng)濟學中,單參數(shù)顯著性的t檢驗和預測部分(條件期望預測和個值預測)是分開的,但是可以發(fā)現(xiàn)很多形式上是一樣的,確實如此。只是在做條件期望預測或者點預測的時候是往往直接計算置信度區(qū)間,而不是計算統(tǒng)計量的值和p值,雖然實際上也可以那么做。
例如在多元回歸中,我們對于實際可能發(fā)生的Y0|X0的討論是如下進行的。
首先在滿足經(jīng)典假設的條件下,Y0|X0是一個正態(tài)分布隨機變量,其期望是E(Y0|X0,X,Y),方差是σ2。



我們上面總結(jié)的有關計量經(jīng)濟學中的假設檢驗邏輯框架只是一部分知識,里面談到了很多自己的理解,很多內(nèi)容可能并不是計量經(jīng)濟學所涉及的,但了解這些背景有助于對假設檢驗的全盤理解,有助于我們對于計量經(jīng)濟學的掌握和應用能力的提升,不管是從計量經(jīng)濟學的現(xiàn)代觀點來看還是從更加經(jīng)典的觀點來看。
實際上,假設檢驗有更加深刻廣泛的基礎,它不僅限于計量經(jīng)濟學,社會統(tǒng)計學以及概率論和數(shù)理統(tǒng)計課程中都有大量內(nèi)容與此相關。事實上,它更廣泛存在于人類的社會的各個環(huán)節(jié),我們認識事物的基本方式實際就是按下面的過程進行的。從這個角度來看,對于假設檢驗的理解具有更大的意義和價值。
〔1〕 李子奈,齊良書.關于計量經(jīng)濟學模型方法的思考[J].中國社會科學,2010(2):69-83.
〔2〕 李子奈.關于計量經(jīng)濟學課程教學內(nèi)容的創(chuàng)新與思考[J].中國大學教學,2010(1):18-22.
〔3〕 王美今,林建浩.計量經(jīng)濟學應用研究的可信性革命[J].經(jīng)濟研究,2012(2):120-132.
〔4〕 李曉寧,石紅溶,徐梅.本科計量經(jīng)濟學教學模式改革的探索與比較[J].高等財經(jīng)教育研究,2012(2):11-15.
〔5〕 余妙志,蔣燁.案例教學在計量經(jīng)濟學課程教學中的應用[J].課程教育研究,2014(5):245-246.
〔6〕 姚壽福,劉澤仁,袁春梅.本科計量經(jīng)濟學課程教學改革探討[J].高等教育研究,2010(2):45-48.
〔7〕 李子奈,潘文卿.計量經(jīng)濟學[M].北京:高等教育出版社,2010.
〔8〕 杰弗里·M·伍德里奇.計量經(jīng)濟學導論——現(xiàn)代觀點[M].北京:清華大學出版社,2014.
〔9〕 卡爾·波普爾.科學發(fā)現(xiàn)的邏輯[M].查汝強,邱仁宗,譯.北京:中國美術(shù)學院出版社,2008.
〔10〕 李醒民.激動人心的年代:世紀之交物理學革命的歷史考察和哲學探討[M].北京:中國人民大學出版社,2009.
(責任編輯 周吉光)
How to Understand the Hypothesis Test in Econometrics
CHEN Qing-hua1, GUO Jin-zhong2, YUAN Qiang1
(1. Beijing Normal University, Beijing, 100875; 2. Xinjiang University, Urumqi, Xinjiang, 830047)
Hypothesis testing is the most important content in Econometrics and Mathematical statistics. But in relevant textbooks and teaching process, the authors and teachers often focus on the parameter estimation method, and the part of hypothesis testing is not deep enough, relevant knowledge background and logic process are not clear. Since that, the students do not really understand hypothesis testing, the last obstacle to the entire learning and application of econometrics. This article links to other background materials related to hypothesis testing refresh logic system, broaden their knowledge, analysis, hypothesis testing demonstrate knowledge related to various logical and contacts aimed at promoting students were econometrics hypothesis testing ideas really understand, promote real education reform in econometrics.
Econometrics; hypothesis testing; teaching reform
10.13937/j.cnki.sjzjjxyxb.2016.06.002
2016-05-23
http://www.cnki.net/kcms/doi/10.13937/j.cnki.sjzjjxyxb.2016.06.002.html < class="emphasis_bold">網(wǎng)絡出版時間
時間:2016-12-20 15:30
北京師范大學教學建設與改革項目 (11-06-01-10);新疆大學博士畢業(yè)生科研啟動基金項目“新疆企業(yè)規(guī)模分布及其變化規(guī)律”(BS150110)。
陳清華(1976—),男,湖北當陽人,博士,副教授,研究方向為復雜性理論及其在社會經(jīng)濟系統(tǒng)上的應用。
G642.0
A
1007-6875(2016)06-0007-06