張浩然
(廣東財經(jīng)大學(xué) 經(jīng)濟學(xué)院,廣東 廣州)
回歸分析是《計量經(jīng)濟學(xué)》《統(tǒng)計學(xué)》《社會調(diào)查(研究)方法》《醫(yī)學(xué)統(tǒng)計學(xué)》等課程的核心內(nèi)容,它在自然科學(xué)、經(jīng)濟學(xué)、管理學(xué)等領(lǐng)域的定量分析中有著廣泛的應(yīng)用[1]。同時,經(jīng)濟學(xué)、管理學(xué)、法學(xué)、理學(xué)、工學(xué)、醫(yī)學(xué)等多個學(xué)科門類的課程也應(yīng)用到回歸分析。例如,國內(nèi)權(quán)威的城市規(guī)劃教材,同濟大學(xué)吳志強主編的《城市規(guī)劃原理(第四版)》專門介紹了回歸分析,用于預(yù)測規(guī)劃期末城市人口規(guī)模,作為規(guī)劃城市建設(shè)用地的依據(jù)。在社會科學(xué)領(lǐng)域中,經(jīng)濟學(xué)、管理學(xué)、社會學(xué)和心理學(xué)都是基于數(shù)據(jù)的學(xué)科,回歸分析無疑是最重要的分析工具之一。在循證醫(yī)學(xué)(Evidence-Based Medicine)方面,作為國際公認的腫瘤治療規(guī)范標準NCCN 指南(National Comprehensive Cancer Network,美國國立綜合癌癥網(wǎng)絡(luò))參考了很多基于隨機對照試驗和回歸分析的文獻。讀懂醫(yī)學(xué)領(lǐng)域四大頂刊:新英格蘭醫(yī)學(xué)雜志(NEJM)、美國醫(yī)學(xué)會雜志(JAMA)、柳葉刀(Lancet)、英國醫(yī)學(xué)期刊(BMJ)也需要必要的回歸分析方法,由此可見回歸分析在教學(xué)和研究中的重要性。
就回歸分析的教學(xué)而言,最好采用計量經(jīng)濟學(xué)的教學(xué)體系。計量經(jīng)濟學(xué)是數(shù)學(xué)、統(tǒng)計學(xué)和經(jīng)濟學(xué)三者結(jié)合[2]的一門文理滲透的方法論課程,也被一些數(shù)學(xué)出身的學(xué)者稱為經(jīng)濟計量學(xué)。如果采用合適的教學(xué)手段,本科的計量經(jīng)濟學(xué)教學(xué)可以使學(xué)生讀懂《美國社會學(xué)評論》等權(quán)威期刊多數(shù)論文的回歸分析部分,而社會學(xué)普遍使用的教材艾爾巴比的《社會研究方法》則無法實現(xiàn)這一目的[3]。 鑒于此,本文從回歸分析教學(xué)中存在的實際問題出發(fā),進一步提出相應(yīng)的對策,為回歸分析的教學(xué)實踐提供參考。
現(xiàn)有回歸分析教學(xué)和經(jīng)驗研究存在較大的距離[4]。比如,在社會科學(xué)和醫(yī)學(xué)的經(jīng)驗研究中,因果關(guān)系的識別處于核心地位,但傳統(tǒng)的回歸分析教學(xué)并沒有將因果推斷作為核心,對于魯賓因果模型和各種識別方法關(guān)注較少,基本沒有涉及倍差法、斷點回歸等現(xiàn)代專題。現(xiàn)有教學(xué)內(nèi)容花費了很多篇幅介紹異方差、自相關(guān)的檢驗與修正,卻沒有介紹大樣本條件下普遍采用的異方差、聚類穩(wěn)健標準誤,不利于學(xué)生掌握實用的統(tǒng)計方法。實際上,現(xiàn)代經(jīng)濟學(xué)中的因果推斷方法對于學(xué)生理解經(jīng)濟學(xué)、社會學(xué)、教育心理學(xué)、管理學(xué)和醫(yī)學(xué)等方面的教材和論文有很大幫助。比如,格里格和津巴多主編的本科層次普通心理學(xué)經(jīng)典教科書《心理學(xué)與生活(第19 版)》第3 章的案例就基于雙重差分方法探討了后葉催產(chǎn)激素與信任的關(guān)系。
在本科教學(xué)階段,學(xué)生花費了大量時間進行給定假設(shè)條件下的數(shù)學(xué)證明,但對于假設(shè)的含義及其與因果識別的關(guān)系缺乏直觀的理解。財經(jīng)類專業(yè)的本科生學(xué)習(xí)了統(tǒng)計學(xué)和計量經(jīng)濟學(xué)課程,雖然掌握了一定的矩陣推導(dǎo)技巧,卻不能夠基于理論的指導(dǎo)建立合適的回歸模型,缺乏實際應(yīng)用能力。
國內(nèi)教材選擇的一些案例大多基于宏觀或自編數(shù)據(jù),缺少生動有趣的案例,難以把機制說清楚,不利于激發(fā)學(xué)生的學(xué)習(xí)興趣。國外較為流行的《基本無害的計量經(jīng)濟學(xué)》在探討選擇性偏誤時選擇的案例是否曾因病在醫(yī)院過夜與自評健康水平的關(guān)系,雖然不是狹義的經(jīng)濟學(xué)問題,但非常直觀,有助于培養(yǎng)社會科學(xué)直覺,加深對問題的理解。
財經(jīng)類專業(yè)本科層次的回歸分析課程應(yīng)在正確理解現(xiàn)代統(tǒng)計學(xué)和經(jīng)濟計量學(xué)分析框架和方法的前提下,合理設(shè)計教學(xué)體系和教學(xué)內(nèi)容,基于大城市的生產(chǎn)率優(yōu)勢、婚前同居與離婚率、大氣污染與預(yù)期壽命等典型案例,盡可能避免(或緩解)由內(nèi)生性問題所產(chǎn)生的估計偏誤,結(jié)合Stata 等統(tǒng)計軟件的使用,系統(tǒng)介紹和探討社會科學(xué)研究方法,展現(xiàn)社會科學(xué)的定量研究邏輯體系,引導(dǎo)學(xué)生以科學(xué)思維思考社會問題。具體來說,應(yīng)該在以下幾個方面有所突破:
在教材方面,最好結(jié)合中國的實際情況,選擇經(jīng)典教材。通過教學(xué)實踐,斯托克和沃森、伍德里奇以及安格里斯特的經(jīng)典教材被國內(nèi)外高校普遍采用。哥倫比亞大學(xué)經(jīng)濟系本科生的計量經(jīng)濟學(xué)教材選擇的是斯托克(Stock)和沃森(Watson)的Introduction to Econometrics,該教材結(jié)構(gòu)較為完整,國內(nèi)已有漢語翻譯版,是合適的選擇。同時,2021 年諾貝爾經(jīng)濟學(xué)獎獲得者安格里斯特(Angrist)的《精通計量:從原因到結(jié)果的探尋之旅》體系新穎,但不夠全面,該教材將因果推斷作為本科計量經(jīng)濟學(xué)教學(xué)的核心重新構(gòu)建了本科計量經(jīng)濟學(xué)的教學(xué)體系,可以與其他經(jīng)典教材互為補充。在國內(nèi)教材方面,葉阿忠的《計量經(jīng)濟學(xué)》(中國人民大學(xué)出版社,2021 年出版)由于是初版,有一些小錯誤,但結(jié)構(gòu)相對新穎,也有較為豐富的案例。在課外讀物方面,邱嘉平的《因果推斷實用計量方法》縮短了計量經(jīng)濟學(xué)理論學(xué)習(xí)與經(jīng)驗研究的距離,為學(xué)生畢業(yè)論文的撰寫提供了有益的指導(dǎo);李井奎著的《大偵探經(jīng)濟學(xué)》則提供了豐富有趣的教學(xué)案例。
就回歸分析的教學(xué)內(nèi)容而言,應(yīng)在第一節(jié)課就介紹隨機對照試驗和因果推斷,并貫穿教學(xué)過程始終。教學(xué)應(yīng)以實驗和準實驗作為基準,將與因果效應(yīng)密切相關(guān)的內(nèi)生性問題的處理作為教學(xué)的核心。課程內(nèi)容側(cè)重于對微觀尺度的信息建模,利用現(xiàn)代統(tǒng)計和計量方法識別變量之間的因果關(guān)系。為了保證統(tǒng)計推斷的有效性,課程應(yīng)考慮引入異方差穩(wěn)健標準誤和聚類穩(wěn)健標準誤,刪減異方差檢驗等相關(guān)內(nèi)容,即不再將異方差作為一種需要解決的問題,而是在模型設(shè)定時就允許異方差存在,并采用異方差穩(wěn)健標準誤。
課程體系可以依次包括以下內(nèi)容:(1)隨機實驗;(2)多元線性回歸模型;(3)多元回歸專題(介紹對數(shù)模型、交互項模型等本質(zhì)線性回歸模型);(4)實踐中的工具變量;(5)斷點回歸設(shè)計;(6)面板數(shù)據(jù)、固定效應(yīng)和雙重差分方法;(7)非標準的標準誤問題;(8)數(shù)據(jù)來源與預(yù)處理;(9)Stata 或R 軟件操作與案例。與傳統(tǒng)教學(xué)內(nèi)容不同,課程將工具變量、斷點回歸和雙重差分等現(xiàn)代計量方法納入教學(xué)體系。
在回歸模型的應(yīng)用中,無論是總體回歸模型的設(shè)定、內(nèi)生性處理還是結(jié)果的解釋都需要經(jīng)濟學(xué)、政治學(xué)、社會學(xué)和管理學(xué)等相關(guān)理論的指導(dǎo)。專業(yè)學(xué)術(shù)論文不僅需要干凈的識別,還要闡述內(nèi)在影響機制,這些都需要理論的指導(dǎo)。因而在進行課堂教學(xué)時需要對涉及的理論進行適度的回顧和討論。在課堂教學(xué)中,還應(yīng)該結(jié)合學(xué)術(shù)論文引導(dǎo)學(xué)生掌握回歸分析結(jié)果的呈現(xiàn)方式,能夠根據(jù)表格信息對影響程度和顯著性水平進行解讀。對于跨學(xué)科問題,回歸分析的教學(xué)不僅僅需要統(tǒng)計學(xué)和經(jīng)濟計量學(xué)的支撐,而且需要經(jīng)濟學(xué)、政治學(xué)、社會學(xué)、心理學(xué)、管理學(xué)、人文地理學(xué)等學(xué)科基礎(chǔ)的支持,因而需要教師根據(jù)學(xué)生所在專業(yè)進行自主學(xué)習(xí),拓寬知識面。
教學(xué)過程應(yīng)該注重理論與應(yīng)用相結(jié)合,全面系統(tǒng)地對回歸分析的理論和方法進行介紹,不僅涵蓋多元回歸分析等基本的回歸方法,而且也應(yīng)將面板數(shù)據(jù)回歸方法納入教學(xué)體系。在授課過程中應(yīng)重點討論經(jīng)驗研究中面臨的內(nèi)部有效應(yīng)和外部有效問題,如遺漏變量、雙向因果關(guān)系、函數(shù)形式誤設(shè)、變量測量誤差、選擇偏誤等。由于本科生數(shù)學(xué)基礎(chǔ)參差不齊,因此在回歸分析教學(xué)過程中除了必要的數(shù)學(xué)推導(dǎo),還應(yīng)對統(tǒng)計思想進行直觀的講授[5]。
回歸分析是應(yīng)用性課程,為了引導(dǎo)學(xué)生基于社會經(jīng)濟現(xiàn)象構(gòu)建合適的回歸模型,需要學(xué)生熟練使用統(tǒng)計軟件[6]。目前,國內(nèi)高校普遍采用的Eviews 軟件更擅長時間序列模型,擴展性不足。哥倫比亞大學(xué)經(jīng)濟系、中大嶺南學(xué)院等國內(nèi)外知名院系普遍采用Stata 或R。考慮到Stata 功能全面[7],在社會科學(xué)和醫(yī)學(xué)領(lǐng)域普遍應(yīng)用,較R 更容易掌握,筆者推薦采用Stata 進行實驗教學(xué)。為了彌補Stata 在大數(shù)據(jù)處理和數(shù)據(jù)抓取方面的不足,網(wǎng)絡(luò)爬蟲部分內(nèi)容可以采用Python 進行教學(xué),為學(xué)生未來的深造和就業(yè)打下更堅實基礎(chǔ)。
近年來,回歸分析方法在政治學(xué)、社會學(xué)等其他社會科學(xué)和醫(yī)學(xué)領(lǐng)域得到了廣泛的應(yīng)用。因而在教學(xué)過程中,案例可以不完全來源于狹義的經(jīng)濟學(xué)。比如在因果推斷方面,可以舉一些有趣的現(xiàn)實案例:婚前同居與離婚率;離婚與子女發(fā)展;父母入獄與子女發(fā)展;讀書與賺錢;學(xué)區(qū)房溢價;就業(yè)的性別歧視等等。通過以上案例的分析增強學(xué)生對內(nèi)生性問題的理解,取得更好的教學(xué)效果。
教學(xué)案例的選擇最好來源于重要的學(xué)術(shù)刊物或領(lǐng)域杰出學(xué)者的工作論文,并根據(jù)學(xué)生所在學(xué)校和專業(yè)進行適當(dāng)取舍。例如,對于地理科學(xué)學(xué)院的學(xué)生,斷點回歸部分的案例可以采用2020 年克拉克獎獲得者哈佛大學(xué)經(jīng)濟系Dell教授基于地理斷點回歸(spatial regression discontinuity)的系列研究,如非法交易網(wǎng)絡(luò)與墨西哥毒品戰(zhàn)爭[8]等。自然地理與資源環(huán)境、人文地理與城鄉(xiāng)規(guī)劃、地理信息科學(xué)等專業(yè)的學(xué)生先期學(xué)習(xí)過地理信息系統(tǒng)理論和軟件等相關(guān)課程,熟悉Arcgis 空間分析功能,能夠從專業(yè)的角度更好地理解回歸方法。
對于二本財經(jīng)院校的財經(jīng)類專業(yè)學(xué)生,斷點回歸的案例可以選擇賈瑞雪和李宏彬的工作論文“The Value of Elite Education in China”,該文章利用了高考一本線提供的自然實驗,發(fā)現(xiàn)一流大學(xué)教育可以使工資提升30%-40%。二本財經(jīng)院校財經(jīng)類專業(yè)學(xué)生高考時的分數(shù)線有些達到了一本線,但是最終進入二本院校,對與自身經(jīng)歷息息相關(guān)的研究主題感興趣。從高考錄取分數(shù)線切入講授斷點回歸,更加清晰易懂,又能夠兼顧對工具變量排他性約束的討論,能夠獲得較好的教學(xué)效果。對于非洲留學(xué)生的教學(xué),Nunn 關(guān)于非洲奴隸貿(mào)易的長期影響的系列文章以及Acemoglu 關(guān)于《發(fā)展差異的殖民地起源》的經(jīng)典文獻都是較好的選擇。筆者在教學(xué)的過程中發(fā)現(xiàn)所在學(xué)校非洲留學(xué)生學(xué)習(xí)意愿普遍不足,漢語水平無法滿足學(xué)習(xí)需要,但英文水平較佳,采用非洲主題的經(jīng)典英文文獻能夠便于學(xué)生理解教學(xué)內(nèi)容,取得較好的教學(xué)效果。對于社會學(xué)和社會心理學(xué)專業(yè)的學(xué)生,文章可以取材于較新的社會學(xué)權(quán)威刊物,如《American Sociological Review》以及《社會學(xué)研究》。二本院校社會學(xué)相關(guān)專業(yè)本科生對于以費孝通為代表的人類學(xué)民族學(xué)研究范式較為熟悉,但統(tǒng)計訓(xùn)練普遍不足。一個學(xué)期的回歸分析課程應(yīng)該可以使本科生較好地理解多數(shù)采用回歸分析方法的社會學(xué)學(xué)術(shù)論文。
倍差法的案例選擇可以來自“雙重差分小公主”錢楠筠(Nancy Qian)關(guān)于消失的女性與茶葉價格等相關(guān)研究,能夠兼顧嚴謹性和趣味性,并加深學(xué)生對發(fā)展中國家男女性別失衡問題的理解。另外一些研究,如發(fā)表在《經(jīng)濟研究》上的《香煙、美酒和收入》采用微觀入戶調(diào)查數(shù)據(jù)發(fā)現(xiàn)飲酒對收入具有顯著的提升作用,使個體收入提升7%,且飲酒對女性收入的影響大于男性。而吸煙對收入的影響較小,且在統(tǒng)計上不顯著[9]。該研究采用家庭成員吸煙和飲酒比例作為工具變量,可能無法滿足工具變量的外生性假設(shè),從而無法干凈地識別吸煙、飲酒對收入的因果效應(yīng),在嚴謹性方面有不足之處,但其研究主題具有重要的現(xiàn)實意義和一定的趣味性,也可以作為案例來源,需在授課過程中適當(dāng)討論工具變量的識別假設(shè)是否得到滿足,如果不滿足將對估計結(jié)果產(chǎn)生怎樣的影響等問題。
在數(shù)據(jù)選擇方面,應(yīng)根據(jù)學(xué)生所學(xué)專業(yè)進行篩選。比如,對會計學(xué)和金融學(xué)專業(yè)的學(xué)生,應(yīng)多采用工業(yè)企業(yè)數(shù)據(jù)庫、上市公司等企業(yè)數(shù)據(jù),關(guān)注公司金融等領(lǐng)域的研究主題,對人力資源、勞動和社會保障專業(yè)的學(xué)生,應(yīng)多采用中國家庭追蹤調(diào)查(CFPS)、中國勞動力動態(tài)調(diào)查(CLDS)等微觀調(diào)查數(shù)據(jù),對經(jīng)濟學(xué)專業(yè)的學(xué)生,應(yīng)多采用統(tǒng)計和普查數(shù)據(jù),對數(shù)學(xué)和計算機專業(yè)的學(xué)生,應(yīng)引導(dǎo)學(xué)生多通過網(wǎng)絡(luò)爬蟲方法獲取數(shù)據(jù)。
就非社會科學(xué)專業(yè)的學(xué)生而言,可以加強回歸預(yù)測方面的教學(xué),應(yīng)該盡可能獲取來自真實產(chǎn)業(yè)環(huán)境的數(shù)據(jù)[10],如二手房掛牌價格、五星級酒店掛牌價格、電影票房數(shù)據(jù)等,在回歸分析的教學(xué)過程中適當(dāng)融入機器學(xué)習(xí)方法。在教學(xué)內(nèi)容和案例的選擇方面,不應(yīng)將視角局限于傳統(tǒng)的經(jīng)濟學(xué)領(lǐng)域,而應(yīng)適當(dāng)補充一點有趣的醫(yī)學(xué)、心理學(xué)、政治學(xué)、社會學(xué)和管理學(xué)高質(zhì)量期刊的案例以及真實的商業(yè)數(shù)據(jù),加深學(xué)生對于回歸分析基本方法的理解,提高學(xué)生的學(xué)習(xí)興趣和社會科學(xué)的分析能力,拓展學(xué)生的就業(yè)渠道。