999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

因果推斷、科學證據與教育研究 *
——兼論2021 年諾貝爾經濟學獎得主的教育研究

2022-03-30 07:12:24
關鍵詞:學校研究教育

黃 斌 李 波

(1. 南京大學教育研究院,南京 210023;2. 南京財經大學公共管理學院,南京 210023)

一、引言

2021 年10 月11 日,瑞典皇家科學院將諾貝爾經濟學獎授予加利福尼亞大學伯克利分校教授戴維·卡德(David Card)、麻省理工學院教授喬舒亞·D 安格里斯特(Joshua D. Angrist)和斯坦福大學教授吉多·W·因本斯(Guido W. Imbens)。在頒獎典禮致辭中,諾貝爾經濟學獎評委會主席彼得·弗雷德里克森(Peter Fredriksson)如此評價三位獲獎者的學術貢獻 “你們的研究表明社會核心問題完全可以通過自然實驗得以回答。······你們徹底改變了經濟科學中的經驗研究。得益于你們的研究,我們回答關鍵因果問題的能力得到了極大的提升”(Fredriksson,2021)。事實上,這并不是因果方法第一次登上諾獎舞臺。2019 年,阿比吉特·班納吉(Abhijit Banerjee)、埃絲特·迪弗洛(Esther Duflo)和邁克爾·克雷默(Michael Kremer)三位學者就因運用隨機對照實驗方法為全球脫貧做出的學術貢獻而獲得諾貝爾經濟學獎。社會科學研究實現因果推斷有兩種方法:隨機對照實驗(Randomized Controlled Trial,RCT)與自然實驗(Nature Experiment)或準實驗(Quasi-experiment)。隨機對照實驗是實現因果分析的“黃金法則”,它通過隨機分組形成處理組和控制組之間的數據平衡,由此實現對干預的因果效應的正確識別。隨機對照實驗源自農業科學,普遍應用于醫學與藥物研究,班納吉、迪弗洛和克雷默的學術貢獻在于將隨機對照實驗大規模地應用于社會政策項目與改革成效評估;自然實驗或準實驗也是以隨機對照實驗原理為理論基礎,但它采用的是非實驗性的研究設計,對非實驗的觀測數據進行“改造”,使之具有與實驗數據相類似的平衡特征,并由此獲得與隨機實驗具有同等或相近的因果推斷效力的結論??ǖ?、安格里斯特和因本斯的學術貢獻在于他們突破原有的實驗研究局限,創新性地發展出基于觀測數據的因果推斷方法,使因果推斷方法在社會科學領域擁有了更廣闊的應用空間。

近三十年來,因果推斷方法在推動社會科學經驗研究發展方面取得了巨大的成功。正如哈佛大學教授加里·金(Gary King)等人指出(King et al., 2021):“在過去幾十年里,人們對因果關系的了解比以往的總和還要多。”雖然卡德、安格里斯特和因本斯的主要研究領域是勞動經濟學與計量經濟學,但鑒于教育對個人勞動參與和收入所具有的重要影響,他們的許多重要研究都與現實教育問題及教育制度變革密切相關,包括教育收益率估計、小班化教學效果、學校投入對學生認知能力發展的影響等。他們在這些方面做出了許多極富創新性的工作,并取得了豐碩的成果,這是教育研究者無法回避,且必須回應的。

探尋事件之間的因果關系是人類不斷追求真理的前進動力,決定論與因果律一直是西方哲學研究最重要的內容之一。亞里士多德在其論著《物理學》中便就掌握因果律對于了解自然變化的重要作用進行了充分的闡釋:“既然我們的目的是要得到認識,又,我們在明白了每一個事物的‘為什么’(就是說把握了它們的基本原因)之前是不會認為自己已經認識一個事物的,所以很明顯,在生與滅的問題以及每一種自然變化的問題上去把握它們的基本原因,以便我們可以用它們來解決我們的每一個問題?!保▉喞锸慷嗟?,1982,p. 37)秉承這一傳統,大衛·休謨從經驗主義立場出發對因果關系進行考察,他主張“事物的知識應當以因果關系為基礎,只有因果關系才能使我們超出感覺和記憶的范圍。對于因果關系并不能有先驗的認知,只可能借助于經驗,而要得出超過經驗的任何知識又必須假設因果關系”(休謨,1957,p. 61)。

因果知識很重要,卻不易獲得?,F代人類正身處信息大爆炸的時代,手握各種信息技術利器,可輕易地獲取巨量的數據。數據可以告訴我們很多知識,比如它可以告訴我們目前國人的平均收入水平有多高,與之前相比是增加還是減少了,與其他國家相比處于何種水平。這些屬于描述性知識。再比如,它還可以告訴我們國人的收入水平會隨著個人性別、教育水平、居住地域發生怎樣的變化。這屬于相關性知識。描述性知識和相關性知識都是非常有益的信息,它們能幫助我們快速了解我們所生活世界的整體狀況,但還不夠!因為我們不僅希望了解自身所處的物質世界和精神世界是怎樣的,更希望了解它為什么會是這樣。描述性知識和相關性知識只能回答“是什么”的問題,回答不了“為什么”的因果問題。因果知識對于指導人類社會正常和健康發展是極為必要和重要的,唯有因果知識方可解答“為什么”的問題,為人類下一步的行動提供可信的指引。

“對于因果關系方面的知識來說,數據沒有任何發言權” (珀爾和麥肯齊,2019,導言, 第XXIII頁)。因果解釋只存在于數據之外的人類的想象和邏輯推理之中。事實上,因果推斷的思維早已存在于人類意識之中,人們腦中儲存了大量的因果知識,正如遠古人早就明白在狩獵時團結協作要比單槍匹馬能收獲更多的獵物,現代人只要早上出門上班發現下雨,就會立刻意識到今天早高峰會大堵車。雖然人類早已掌握并習慣于運用因果思維進行行為決策,隨機實驗法在100 年前就已經被提出(Fisher & Mackenzie,1923),但人類的因果思維一直未被正式的模型化和數學化,因果推斷方法得不到系統的發展,這極大阻礙和限制了因果知識在改善我們人類生活方面的作用的發揮(珀爾和麥肯齊,2019)。

值得慶幸的是,自20 世紀七八十年代以來,經過唐納德·魯賓(Donald B. Rubin)、朱迪亞·珀爾(Judea Pearl)、吉多·W·因本斯、喬舒亞·D·安格里斯特等一批學者的努力,包括潛在結果框架(Potential Outcome Framework)與有向無環圖(Directed Acyclic Graphs)在內的專門用于因果識別的數學語言和分析框架被系統地建立起來。目前,因果推斷方法已被大量地應用到經濟學、人工智能、醫學、心理學等領域研究中,并正快速向教育學、社會學、政治學等領域滲透。教育學科正處于因果推斷方法由經濟學向其他社會科學領域擴張的“最前線”,教育科學研究正醞釀著一場因果推斷“方法革命”。在以下篇幅中,我們將先從教育研究的人文與科學屬性入手,闡明獲取因果證據對推動教育科學研究發展的重要意義,再重點介紹2021 年諾貝爾經濟學獎得主在教育領域的一些重要研究與發現,最后對當前我國教育因果研究所存在的問題及未來改進方向進行討論。

二、教育研究的科學屬性與因果證據

(一)教育學科的科學屬性

關于“教育學是否是科學”一直頗有爭議。在日常生活和教育實踐中,教育總是給人一種與科學無涉的印象。“人人都是教育家”,對教育問題進行研究、對教育現象進行剖析似乎不需要深奧的專業知識,即便是徹頭徹尾的外行人,都能對教育問題、現象或觀點評頭論足一番(中室牧子,2017)。之所以有此現象,一方面可能是因為教育與我們離得太近,參與教育活動是人類日常生活的一部分,絕大多數人都曾經或正身處于接受教育或施行教育的情境之中;另一方面,教育研究給人一種沒有門檻的錯覺,它似乎不像討論其他學科問題那樣需要具備高深的知識,只憑借一般經驗或觀察便可以獲得足夠的知識用于指導教育實踐。教育研究似乎只需描述現象或做價值判斷,不需要科學理性,不存在“為什么”的問題,只有“是什么”和“怎么做”的問題。人們習慣于關注教育現象并發表見解,卻較少關心教育現象發生的原因,似乎只要把當前所存在的教育問題“痛罵一通”,便完成自己對所有教育本源問題的解構。

公眾通常相信自然變化有一般規律,對自然變化規律的研究可訴諸理性與科學,而人的教育行為及結果無規律可循,研究教育只存在倫理與道德上的應然問題,無因果實然研究之必要,因此無須理性與科學。然而,事實并非如此,不是只有自然之物才具有規律性,人類行為及互動以個體的生理為基礎,并受制于社會制度、群體行為與道德規范,因此在群體層面上亦會呈現出一定的規律性。

早在18 世紀40 年代至19 世紀中葉歐洲啟蒙運動時期,孟德斯鳩、盧梭、亞當·斯密、康德等一批思想家在采用理性精神與科學方法破除傳統宗教對人類思想的操控與束縛的同時,便已嘗試運用相同的方法建立起“人的科學”,用以形成對人類自身情感與行為的普遍性與規律性的理解和認識(平克,2019, p. 10)。教育研究“天然”具有科學屬性:一方面雖然不同個體的主觀意識存在差異,生理卻存在共性。個體的發展符合生理規律,掌握了這種規律可極大程度地提高教育效率。另一方面,人作為獨立的個體雖具有一定的主觀能動性,但其生活必須遵從既有的文化、生物演進和社會客觀事實,并最終形成規律進而約束著人類的生存與發展活動。因此,社會個體有其獨特性和異質性,但作為群體其一定存在著共性和規律(袁振國,2019,2020)。

(二)因果證據與教育科學研究

當前,有不少教育及其他社會科學研究依然延續傳統政策研究的風格,偏重于描述教育現象及“說理性”分析,雖然近年來教育量化研究數量與成果不斷增多,但研究方法還停留于描述性和相關性階段,缺乏因果解釋力,這極大限制了我們運用經驗證據指導教育政策制定的能力(陳云松和范曉光,2010)。因果必定相關,而相關未必因果。正如我們運用爬蟲技術可以輕易地從網絡獲得白菜價格與汽油價格的日常變化數據,并通過相關分析發現二者存在顯著的正相關關系,但我們永遠不會想到用改變白菜價格的方法來調控汽油價格的走向。相比之下,因果分析能夠提供變量間可靠的因果關系信息,決策者利用這一信息可以制定出有效的政策干預工具,改變人群的行為走向及其結果,使其未來的發展與政策預期目標相一致(黃斌等,2017)。因果性是科學證據最重要的特質,大衛·休謨甚至將科學的唯一功用定義為因果性,在他看來,“科學唯一且直接的功用是告訴我們如何從原因來控制和調整未來發生的事件”(Hume,2007, Section VII, Part II, p. 56)。從這一角度看,科學證據即等同于因果證據。

除相關概念外,政策制定者、學者和公眾還常將“常識(Common Sense)”與科學或因果證據混為一談,誤將基于個體經驗所形成的“常識”等同于科學證據。所謂“常識”是指大多數人普遍認可的觀點或知識,但目前在教育領域有多少觀點或知識是被多數學者所認可的呢?在筆者所在的教育經濟學界,數十年來形成的共識可以說是寥寥無幾,學者們在許多重要的具體研究議題上始終存在著巨大的分歧。以增加學校投入能否提高學校教學質量這個看似簡單的命題為例,該議題從20 世紀60 年代美國學者科爾曼發布《科爾曼報告》以來,便一直存在爭議。有大量研究發現公立學校的絕大多數投入都是無效的,尤其是我們之前認為十分重要的一些物力或貨幣投入(如基建投入)與教師特征(如教師學歷、教齡與性別),對學生學業成績都不具有顯著的影響或只具有微小的影響。這一現象不僅存在于發達國家,發展中國家亦是如此(Glewwe et al.,2011)。

在人類行為互動形成的社會場域中,事件與事件之間的因果關系是復雜的,并且經常隨時空和人群發生變化,很難憑借個體的經驗或常識就能觀察清楚。僅憑借未加科學驗證的所謂“常識”進行教育政策決策,面臨著極高的犯錯風險。常識不能作為科學證據,相反,常識往往是需要進行科學驗證的對象。曾經的異端(如日心說),在當下可能是常識;而曾經的常識(如地心說),在當下可能是異端。此外,基于個體經驗所形成的常識缺乏客觀的價值評判標準,每個個體的教育背景不同,所身處的社會經濟環境亦不同,這使得個體經驗存在較大差別,你有你的常識,我有我的常識,憑借常識說理常導致“公說公有理,婆說婆有理”的局面。

教育政策的制定需以富含因果關系信息的科學證據作為決策依據。當前,教育因果研究主要集中在教育政策評價領域。對教育政策進行科學評價需要判定政策實施與現實教育結果之間的關系,并量化這種關系的正負方向與大小(袁振國,2017)。然而,除政策外,現實教育結果還受其他許多因素的影響。我們要形成特定政策與現實教育結果之間一一對應的因果關系,就需要通過一定的因果研究設計剝離教育現象之間復雜的干擾因素,揭示特定政策與現實教育結果的因果關系,從而為我們制定對策、改良社會提供依據(辛濤和姜宇,2013;胡詠梅和唐一鵬,2018)。在以往文獻中,由于缺少對因果關系的準確定義與判定條件界定,不少政策研究常將只具有相關含義的結論表述為因果結論,這使得不同研究對同一教育政策的量化評價結果不具有可比性。因果推斷方法的發展帶來了新的量化技術標準,使得不同教育政策研究的質量至少在“相關—因果”這一維度上高下立判。在統一的因果關系分析框架下探求過往不同教育政策的成敗原因與得失經驗,可幫助我們積累更多有關人類教育行為的有效知識,在科學的客觀標準之上取得更多經驗證據與社會共識,以減少未來政策重蹈覆轍的可能性。

(三)教育的人文屬性與因果研究的兼容

誠然,教育學又不完全只是科學的,它是兼具人文與科學雙重屬性、集價值和規律為一體的社會科學。教育事關人的終身發展,是人的基本權利,每個個體都有權利接受恰當的教育,這是人類社會在數千年演化過程中形成的“公理”,不證自明!人文關懷理應成為我們制定并實施教育政策、開展教育活動的哲學和倫理基礎。然而,人類教育活動帶有的主觀價值傾向與其客觀規律之間關系并不是對立的而是統一的,教育的人文研究與因果科學研究二者并不矛盾,教育研究側重價值判斷未見得就偏離科學,強調科學理性分析亦非無法兼容價值判斷。

一方面,教育人文關懷功能的實現需要科學研究與因果證據的支持。人文關懷由單一家庭、群體、民族、階層與國家向外延展,不僅需要人類基于同情心與同理心形成統一的道德認識,更需要獲得這一具有超越性的統一道德認識的能力。正如阿馬蒂亞·森在其論著《以自由看待發展》中所闡述的“(自由)應該是一個人選擇有理由珍視的生活的實質自由—即可行能力”(森,2002,第62 頁)。個人實現其應有權利在很大程度上取決于他功能性活動的質量,而其功能性活動本身就在生理與心理層面上具有一定的自然和社會規律性。掌握含有關人類教育活動規律內容的因果知識對于提升人類在教育方面的“實質性自由”是極為重要的。另一方面,教育研究的人文屬性要求研究者需對一些教育“應然”問題抱有強烈的價值傾向與價值判斷,而這一傾向與評判的發生本身也內含因果邏輯。尤其是當我們基于效率或公平的價值標準對多種可能的教育政策選項進行取舍時,我們必然要尋求一定的科學因果證據的支持。我們身處在一個資源稀缺的世界,公共教育與其他公共支出之間、公共教育中不同類型投入之間都存在著極為激烈的預算競爭,教育的生產與分配活動始終面臨著效率與公平的兩難抉擇。通過科學的手段探尋人類教育行為的因果規律,可幫助我們在資源有限的條件下以最小的投入獲得更多的教育產出并實現更加均衡的教育分配,實現教育效率與公平的共進。

三、諾貝爾經濟學獎得主在教育領域的重要研究發現

2021 年諾貝爾經濟學獎三位得主中,因本斯的研究偏因果計量技術研發與推廣,其與著名統計學家唐納德·魯賓(Donald B. Rubin)合著的Casual Inference for Statistics, Social, and Biomedical Sciences被譽為因果方法最經典的教材(Imbens,2015)。相比之下,安格里斯特和卡德的研究偏方法應用,發表文章中有許多涉及教育,尤其是安格里斯特,他絕大部分代表作都與教育有關。以下,我們將對安格里斯特和卡德在教育領域的重要研究與發現進行詳細介紹。

(一)教育收益率的因果推斷

估計教育收益率是勞動與教育經濟學最重要的研究議題。接受更多教育的人擁有更高的工資收入,這幾乎是眾人皆知的“常識”。然而,接受教育與工資收入之間是否存在因果關系,在學界長期存在爭議。個體擁有更高的工資收入,究竟是由于他相較常人接受了更多教育,還是由于他原本就擁有高于常人的天賦能力?也就是說,我們日常觀測到的“高教育擁有高收入”現象可能反映的只是二者之間的相關關系而非因果關系。

如以下明瑟方程(Mincer,1974):

其中,lnYi表示個體i收入的對數值;edui表 示個體i的 受教育年限,估計系數 β即為教育收益率,表示個體受教育年限每增加1 年,其收入增加百分之幾;expi和exp2i分別表示個體i的工作經驗及其平方項,εi是隨機誤差項。

可以想象,一個人所受教育會受其天賦能力與家庭背景的影響,而天賦能力與家庭背景又對個人收入具有重要影響,能否有效控制天賦能力與家庭背景的混淆作用對于精確估計教育收益率至關重要。然而,在研究者掌握的數據資料中,天賦能力與家庭背景變量常常因不易測量而被遺漏,如上述明瑟方程(1)就未控制這兩個變量,此時個人受教育年限變量由個人天賦能力與家庭背景內生決定,估計系數 β有可能偏估了教育收益率。在遺漏重要變量的條件下,估計系數 β可能只反映個人教育與收入的相關關系,而非因果關系。①解決這一偏估問題的辦法主要有以下三種:

一是將個人的智力或認知能力的測驗分數作為天賦能力的代理變量,同時控制家庭社會經濟背景變量。該方法采用直接控制的方式,其優勢在于簡明,問題在于智力或認知能力得分可能并不能完全反映個人的真實能力。

二是采用雙胞胎樣本消去不可觀測因素的混淆作用。(同卵)雙胞胎繼承了相同的父母基因并在同一家庭背景中成長,若他們的收入和教育水平都存在差異,那么收入差異就很可能是由于他們擁有不同的教育水平引起的。該方法存在兩方面問題:(1)雙胞胎樣本過于特殊,其估計結果的代表性存疑;(2)它無法解釋為何具有相同基因和家庭背景的雙胞胎卻在教育與收入水平上存在著差異。在雙胞胎樣本中,我們常觀測到不少擁有相同教育水平的同卵雙胞胎在收入上也存在差異,這意味著即便是同卵雙胞胎,也未見得是完全同質的,他們可能在偏好、態度、能力和健康等方面存在著差異,遺漏這些變量也會導致教育收益率偏估(Bound & Solon,1999)。

三是采用工具變量法從個人受教育年限變異中剝離出一部分與個人能力、家庭背景及其他異質特征都無關的外生變異,將其用于教育收益率估計。誠然,有效的工具變量需滿足一定條件,不是所有變量都適合做工具變量。例如,以往研究常以父母或配偶教育水平作為工具變量,但它可能不是一個好的工具變量,因為有不少有關收入代際流動和婚姻匹配的研究表明,個人收入水平與其父母或配偶的受教育水平顯著相關(Becker,1973;Buss,1986)。一種更高明的做法是利用一定的政策沖擊構建一個具有隨機外生特質的工具變量,安格里斯特就是最早提出并采用這一工具變量設計思路的學者之一。

1991 年,安格里斯特與艾倫·克魯格(Alan B. Krueger)在Quarterly Journal of Economics合作發表文章Does Compulsory Attendance Affect Schooling of Earnings?。該文巧妙利用義務教育法形成自然實驗設計,以出生季度作為工具變量實現對教育收益率的一致估計,堪稱教育收益率和工具變量法研究的經典之作。關于義務教育的入學年齡,許多國家都有法律規定。美國各州一般規定到當年12 月31 日前年滿6 歲的孩子可以在當年9 月份入學接受義務教育,這一限制會使個體入學年齡產生差異。第四季度出生的孩子入學時年齡較小,而第一季度出生的孩子入學時年齡較大,出生季度不同導致入學年齡的最大差異可以達到近一歲。此外,美國各州對學生結束義務教育的年齡也有嚴格規定,大部分州要求兒童結束義務教育不得早于16 周歲。學生入學和退學時間的法律限制使得個人出生季節對其受教育年限具有影響。

利用美國1980 年全國普查數據,安格里斯特和克魯格繪制出人口平均受教育年限隨出生年份與季度變化的折線。如圖1 所示,折線標識的1、2、3、4 數字分別表示同一年份的第一、二、三、四季度。從該圖可以看出,美國人口平均受教育年限隨年份總體呈上升趨勢,但在同一年內不同季節出生人口的平均受教育年限呈現出一種有規律的起伏變化。在同一年中第三、四季度出生人口的平均受教育年限總是比第一、二季度出生人口的平均受教育年限長,前一年第四季度出生人口的平均受教育年限也總比后一年第一季度出生人口長。

圖1 美國人口的出生季度與受教育年限

通常情況下,在哪一季度出生是隨機外生的,它與個人家庭背景和天賦能力無關,而圖1 表明出生季度對個人受教育年限具有影響。這意味著我們可以利用個人出生季度這個工具變量,從個人受教育年限變異中分離出一部分與個人家庭背景和天賦能力無關的外生變異,并將該變異用于對個人收入的回歸估計,形成對教育收益率的一致估計。采用這一思路,安格里斯特和克魯格估計出1920—1929 年出生的美國男子的教育收益率為10.07%。相比之下,傳統的OLS 估計結果為7.01%。工具變量估計結果高于OLS,但二者相差不顯著。

這一結果是出乎意料的,因為當模型遺漏重要變量時,教育收益率的OLS 估計值應該是被高估的,采用工具變量法糾偏后的估計結果應當顯著不同于OLS 的估計結果。然而,安格里斯特和克魯格的估計結果卻顯示二者相差無幾。工具變量法估計量的局部特質能解釋這一“異常”現象。安格里斯特和克魯格是利用義務教育法自然實驗形成出生季度工具變量,他們所估計得到的教育收益率只代表了那些教育決策會受到義務教育法影響的人群,或者說,只代表了那些教育水平偏低人群的教育收益率,這部分人群學習能力較差且大都來自弱勢家庭,屬于易受義務教育法影響的“邊緣易感”群體。根據邊際收益遞減原理,這部分人群的教育收益率一般要高于整體勞動力的平均水平,采用出生季度工具變量估計得到的教育收益率高于或接近于OLS 估計結果,就不足為奇了。

(二)班級規模與學業表現的因果推斷

小班教學是近年來發達國家推進公立學校教學改革最重要的政策工具之一。小班教學改革既是一個“該如何教學生”的教育問題,更是一個“該不該投入及應如何投入”的財政問題。從財政的角度看,小班教學意味著學校需雇傭更多的教師,由此負擔更多的教學和非教學成本,耗資巨大,成本極高,因此研究小班教學,首先要回答小班教學值不值得投入的問題。如果小班教學并不能提升學生的學業成績,或對學生學業成績只具有極為有限的影響,那么小班教學就不值得投入了。然而,想精確識別班級規模對學生學業成績的因果效應是十分困難的,需采用特別的研究設計來解決因果識別過程中的一系列技術性問題(Card & Krueger,1996;李波和黃斌,2020)。

首先,學生的能力可能和其就讀班級的規模相關。如果學生就讀的學校奉行補償式教育,將能力較差的學生優先分配到小班進行教學,此時學生能力就與班級規模正相關;相反,如果學校奉行精英教育,學生能力就會與班級規模負相關。其次,學生的家庭背景也可能與其就讀班級的規模相關。條件優越的家庭傾向于將孩子送至教學質量更好的學校就讀,由此導致學生家庭背景與其就讀班級規模呈一定的相關關系。最后,學生就讀學校的其他投入也有可能與其就讀班級的規模相關。如果學校經費充足,教學條件優良,教師薪資待遇好而師資水平高,并有多余財力支持小班化教學,此時班級規模就與學校其他投入負相關;相反,學校財力原本就不富足,再擠出經費投入小班化教學,這勢必會壓縮學校其他財力投入,此時班級規模就與學校其他投入正相關。

如何解決以上小班化教學效果的因果識別難題?1999 年,安格里斯特和維克托里·拉維(Victor Lavy)在Quarterly Journal of Economics合作發表論文Using Maimonides’ rule to estimate the effect of class size on scholastic achievement,他們利用以色列政府對中小學班級最大規模的政策限制形成(模糊)斷點回歸設計,完成對小班化教學效果的一致估計(Angrist & Lavy,1999)。

有關班級規模與教學效果的討論已有上千年的歷史。早在6 世紀,猶太律法經典《塔木德經(Talmud)》就對集體學習圣經的人數規則有過討論。12 世紀猶太哲學家邁蒙尼提斯(Maimonides)提出研習圣經的師生配比應達到一定標準,如果學生人數達到40 人,就應該增派助教。1969 年,以色列政府直接采用邁蒙尼提斯設立的規則,規定所有公立中小學校最大班額上限為40 人,如果同一年級在校生人數超過40 人,就要拆分為兩個班授課。在該規則下,學生接受的是大班教學還是小班教學取決于同年級在校生人數。假定有兩所學校A 和B,A 校某一年級在校生為40 人,B 校同一年級在校生為41 人。根據邁蒙尼提斯規則,A 校只開一個班授課,班額為40 人,為大班教學,而B 校要拆分為兩個班授課,平均每班學生為20.5 人,為小班教學。也就是說,在校生人數由40 人變化為41 人,僅變化1 人,卻使得學校平均班額由40 人下降為20.5 人。在校生人數變化1 人,這只是一種微小的變化,可視為隨機的,由此所帶來的班額劇烈變化也可視為隨機的,它不受前述學生個體特征、家庭背景與學校投入的影響。因此,如果我們從數據中觀測到隨班級規模發生劇烈變化,學生成績也發生了較大變化,便可認定班級規模對于學生成績具有因果效應。

如圖2,安格里斯特和拉維運用以色列公辦小學數據繪制出年級在校生人數與班級規模、學生平均成績變化關系圖。如圖2(a),橫坐標是公立小學五年級與四年級在校生人數,縱坐標是各學校班級規模,實線表示根據邁蒙尼提斯規則繪制的班級規模隨年級入學人數變化的理論預測線,虛線表示樣本中各公立小學班級規模隨年級入學人數變化的實際變化線,可以看出這兩條線起伏變化高度吻合。圖2(b)的橫坐標依然是在校生人數,縱坐標變為各校學生的平均閱讀成績,安格里斯特和拉維“驚奇地”發現各校學生平均成績的變化線同樣呈折線變化,并且其變化方向與根據邁蒙尼提斯規則繪制的班級規模理論預測線正好相反,即當年級在校生人數未達到40、80 和120······人這些班級拆分點時,學校班級規模大都呈上升趨勢,而此時學生的閱讀成績大都呈下降趨勢。相反,一旦年級在校生人數超過這些班級拆分點時,學校班級規模大都呈下降趨勢,而此時學生的閱讀成績卻大都呈上升趨勢。學生成績與班級規模呈同時且反向的折線跳躍變化,由此可初步判定班級規模應對學生成績具有一定的因果效應。基于這一研究設計,安格里斯特和拉維運用模糊斷點回歸估計出縮減班級規模對五年級學生閱讀和數學成績有顯著的正效應,對四年級學生閱讀成績有微弱的正效應。

圖2 以色列公立小學在校生人數、班級規模與學生成績

(三)學校投入與學生學業成績的因果推斷

如前所述,在有關增加學校投入能否提高教學質量這一問題上,教育經濟學界長期存在著爭議?!犊茽柭鼒蟾妗钒l現美國公立學校投入在提升兒童學業成績方面起到的作用極為有限(Coleman et al.,1966)。該報告一經發布,便在美國社會與知識界引發激烈的討論。經濟學家埃里克·漢納謝克(Eric Hanushek)支持《科爾曼報告》的觀點,他的系列研究顯示學校投入與學生學業成績確不存在一致性與系統性關系(Hanushek,1986,1989,1997,2003),而以拉里·赫奇斯(Larry V. Hedges)為首的另一批學者同樣運用數據分析發現某些學校投入對學生學業成績在一定程度上是具有顯著影響的(Hedges et al.,1994a,1994b;Greenwald et al.,1996a,1996b;Laine et al.,1996)。

關于這一問題之所以有如此大的爭議,主要是因為精確識別學校投入與學生學業成績之間因果關系存在很大的技術困難。學校之間在投入水平上存在很大差異,而學生在不同學校之間的分配也是非隨機的?,F實中,通常情況是私立學校投入超過公辦學校,精英學校投入超過普通學校,而學生擇校行為又與其家庭背景和個人能力密切相關(Clark,2010)。因此,在學校投入與學生學業成績的因果關系識別中,最關鍵的核心問題是如何構造出一種不同家庭背景與不同能力學生在私立學校與公辦學校、精英學校與普通學校之間隨機分配的數據條件。

為解決這一問題,安格里斯特與其合作者利用美國憲章學校(Charter School)隨機抽簽錄取學生這一制度形成對此類學校教學效果的因果識別與估計。美國憲章學校是一種特殊的公立學校類型,此類學校同樣接受政府財政的資助,但采用比傳統公立學校更加靈活、更加自主的學校運營模式。在許多城市,憲章學校改革取得了很好的成效,憲章學校學生的平均成績普遍高于傳統公立學校同類學生。然而,有不少人認為憲章學校學生成績之所以高,不是因為此類學校教學質量高,而是因為就讀憲章學校的學生的學習能力原本就比就讀傳統公立學校的同類學生強,這些學生的家長也要比傳統公立學校的同類學生家長更重視孩子的教育。

為解答這一疑問,安格里斯特等人利用馬薩諸塞州林恩市KIPP(憲章)學校通過抽簽決定學生入學資格這一隨機事件形成工具變量,完成了對憲章學校教學效果的因果推斷(Angrist et al.,2012)。按照馬薩諸塞州政府規定,若學校每年入學申請人數超過既定的學額數,就要采用隨機抽簽的方式來分派學額。2005 年,林恩市憲章學校入學申請人數首次超過學額數,開始通過隨機抽簽決定申請學生的入學資格。學生是否抽中入學資格完全由“老天”決定,這是一個外生的隨機變量。然而,獲得入學資格的學生未必就讀KIPP 學校,有一部分學生可能會放棄KIPP 入學資格而選擇就讀傳統公立學校或私立學校。因此,是否獲得入學資格對成績的影響只是一種“意向性處理效應”(Intent-to-treat Effect,ITT),它不同于學生是否就讀KIPP 學校對成績產生的處理效應。

對此,安格里斯特等人提出,雖然獲得入學資格不能直接作為處理變量,但它可以作為工具變量發揮作用。根據樣本描述統計,在抽簽獲得入學資格的學生中有73%就讀KIPP 學校,而未獲得入學資格的學生中僅有3.5%就讀KIPP 學校,這兩個比例相差69.5%。安格里斯特等人跟蹤了所有向KIPP 學校提交入學申請的學生的數學考試成績,他們發現獲得入學資格學生的數學平均成績比全州平均成績低0.003 個標準差,而未獲得入學資格學生的數學平均成績比全州平均成績低0.358 個標準差,兩者相差0.353 個標準差。根據工具變量的Wald 估計量公式:

可以計算出就讀KIPP 學校對學生數學成績的平均處理效應為:0.355/0.695=0.511,表明就讀KIPP 學校能使學生平均數學成績提高大約0.5 標準差。這一結果是在隔絕了學生個人能力、學習動機和家庭背景影響的條件下取得的,表明林恩市KIPP 學校學生成績優于其他學校同類學生并不是學生和家庭自我選擇的結果,KIPP 學校在提升學生學業成績方面確實取得了顯著的成效。

卡德對于學校投入亦有重要的研究發現??ǖ聦h納謝克的“學校投入無用”觀點持懷疑態度,他認為將學生學業成績作為學校教育結果過于短視,應以個人工資收入(而非學業成績)作為學校教育結果。早在1992 年,卡德與克魯格便合作發表有關學校投入的文章(Card & Krueger,1992)。他們以美國1980 年全國人口普查數據中于1920—1940 年出生的個體為樣本,采用雙向固定效應法(Two-way Fixed Effect),在控制個體出生隊列與所在州固定效應,以及家庭背景的條件下,就一系列學校投入指標對個人工資收入的影響進行估計,發現有部分學校投入指標(如教師學歷、女性教師占比等)對個人工資收入具有顯著的正效應。

總的來看,根據已有的因果研究,現實中有大量的學校投入確實是無效的,尤其是一些我們曾以為十分重要的學校投入都對學生學業成績無顯著的因果效應(Glewwe et al.,2011)。為什么如此多的學校投入是無效的呢?一種最具說服力的解釋是許多學校將資源都投入到不能有效促進學生認知能力發展的方面。如果這一解釋成立,那么接下來我們所面臨的將是另一個更重要的命題,即學生的認知能力究竟是如何形成與發展的,它最易受那些外界環境與投入的影響?對于這一問題,認知神經學家與經濟學家早已開始進行研究,并取得了許多突破性的成果,有興趣的讀者可參見Heckman(2006)和Nelson & Margaret(2011)。

四、目前我國教育因果研究存在的問題

近年來,我國教育因果推斷研究數量不斷增多,研究質量亦不斷提升,尤其是在義務教育政策領域,國內學者在應用因果推斷方法科學評價過往教育政策改革成效方面取得了較豐碩的成果(如孫志軍等人,2010;哈巍和余韌哲,2017;Huang et al.,2017;黃斌等人,2019;Ding et al.,2020)。但總體看,當前我國教育因果研究還處于“初級階段”,國內教育領域從事因果研究的學者數量還不多,量化文獻中因果研究數量占比還不高,高質量研究更是少之又少。以下,我們將對制約我國教育因果推斷研究發展的若干問題進行討論。

(一)重量化技術、輕研究設計

有別于傳統量化研究,因果推斷研究最重要的內核不是統計技術應用,而是準確識別干預分配機制并基于此形成有效的研究設計。要做到這一點,研究者必須對現實教育背景與政策改革有深入的了解,如此才能明白:在我們所研究的微觀對象中,哪些對象接受了干預以及接受了怎樣的干預;政策干預的分配是不是隨機的;如果不是隨機分配,處理組與控制組在哪些特征上存在顯著差異;這些差異顯著特征中有哪些會對因果關系識別產生混淆作用;我們應采用怎樣的研究設計實現處理組與控制組的數據平衡,以獲得因果關系的無偏估計;高質量的因果推斷研究一定是先基于現實政策背景掌握政策干預的對象、內容與分配規則,了解處理組與控制組數據的非平衡表現,再有針對性地采用一定的因果研究設計實現處理組與控制組之間的數據平衡,最后才是運用一定計量技術完成參數估計、統計推斷及各種假設檢驗。

與此相比,目前國內教育因果研究存在“頭輕腳重”的問題,即過度重視后期統計技術“套路”的運用,忽視前期干預分配機制識別與研究設計工作。有不少研究花費許多筆墨介紹某一因果推斷方法的基本原理、模型構建與估計法,對于真正需要濃墨重彩介紹的政策背景、干預分配機制與因果研究設計等內容,卻總是一筆帶過,語焉不詳;另有一些研究過度追求數據結構與量化方法的復雜性,對形成有效因果識別的一些基礎性工作卻視而不見。筆者曾評審過一篇文章,該文利用我國農戶多年跟蹤面板數據,在控制個體固定效應的條件下對農村勞動力(已完成學校教育)的教育收益率進行估計,并宣稱利用追蹤面板數據進行估計能獲得更加一致、穩健的教育收益率估計結果?!袄硐牒苊篮?,現實很骨感”,作者未曾想到既然樣本中個體已完成了學校教育,那么在他所追蹤的年份中同一個體的受教育年限變量取值必定是不變的,如此如何能通過個體固定效應模型估計出教育收益率呢?

(二)重參數估計、輕證偽檢驗

因果研究,無論是隨機對照實驗研究,還是基于可觀測數據的準實驗研究,其背后都蘊藏著極為嚴苛的前提假設與適用條件。當前國內有不少研究對各類因果方法的假設檢驗工作還不夠重視。

因果推斷研究是以潛在結果框架作為理論基礎,此框架要求干預分配應滿足非混淆性假設(Unconfoundedness),即個體是否接受干預應獨立于其所可能獲得的潛在結果。非混淆性假設是形成因果推斷的最關鍵假設,但可惜的是,由于個體的潛在結果總有一方是無法觀測到的,因此該假設無法被直接檢驗,只能采取證偽(Falsification)檢驗。倍差法的平行趨勢檢驗、工具變量法的獨立性檢驗、斷點回歸的概率密度檢驗與斷點連續性檢驗、傾向得分法的數據平衡性檢驗都屬于證偽檢驗。證偽檢驗慣用的邏輯是:“根據當前的研究設計所得到的因果結論,事件A 是不可能發生的,如果A 事件發生,即可證明該因果結論是不成立的?!币员恫罘ǖ钠叫汹厔輽z驗為例,該檢驗要求研究者應對干預發生之前處理組和控制組的結果變化趨勢進行研判,如果在干預之前這兩組的結果變化趨勢就已經發生分化,那么在干預期,這兩組的結果變化依然發生分化的可能性就非常大,此時控制組結果就不能作為處理組如果不接受干預時的反事實結果,若“強行”使用倍差法,估計得到的處理效應很可能就是有偏的。雖然本質上,證偽檢驗只能證明誰是“假”因果,不能驗明誰是“真”因果,但對于研究者捍衛自身估計結果的因果性與內部有效性來說是極為重要的,不容忽視。

近年來,國內教育學期刊中使用傾向得分法的應用性文章數量激增,但該方法被濫用和錯用的問題也最為突出。與其他因果方法相比,傾向得分法有三方面特性:首先,由于匹配變量通常包括若干隨時間變化的特征變量,因此理論上實施傾向得分匹配應至少擁有兩期跟蹤面板數據。研究者使用干預發生前的基期數據進行處理組和控制組匹配操作,而后再使用干預實施后的一期數據進行處理效應估計。如此做的目的在于保證干預實施前處理組和控制組便已經處于數據平衡狀態,如同我們在進行隨機實驗時總是在實驗之前就完成處理組和控制組的隨機分配。其次,偏估可分為可觀測的顯性偏估(Overt Bias)和未觀測的隱性偏估(Hidden Bias)兩大類(Rosenbaum,2002,p. 71)。傾向得分法只能用于糾正顯性偏估,無力解決隱性偏估。也就是說,只有在模型中絕大多數偏估可以通過已有數據觀測到的條件下,它才能形成對因果關系的正確識別。因此,為盡量減少模型偏估的可能性,實施傾向得分匹配必須要在匹配前后做數據平衡檢驗,以評估其對顯性偏估的糾偏作用,并將匹配法與倍差法或斷點回歸法配合使用,以解決隱性偏估問題。最后,傾向得分匹配一般要采用一定方法對原樣本進行重組,但這一過程包含許多帶有濃厚主觀色彩的技術操作,如匹配變量的選取、選擇模型形式的設定、具體匹配法的選擇等,不同的參數和技術組合可能會使匹配后樣本的容量與結構發生較大變化,其估計結果亦“飄忽不定”。

對于傾向得分法的上述特性,國內已有研究大都不重視。以一篇剛在教育學刊物發表的文章為例,該文采用傾向得分法對農村勞動力的職業教育收益率進行估計,文中使用的數據是近期某年橫截面的調查數據,處理變量為農村勞動力是否接受過正式的職業教育。該文存在一些明顯的錯誤:一是樣本中絕大多數處理組個體在調查之前就已經完成了職業教育,這意味著作者是采用干預發生之后的協變量對處理組和控制組進行匹配,所形成的是處理組和控制組在干預之后的數據平衡,嚴重偏離因果推斷的重要假設;二是形成匹配樣本后直接通過處理組和控制組均值對比來估計平均處理效應,未配合使用其他因果方法,對明顯存在的職業教育收益率隱性偏估問題不做任何文字討論與檢驗;三是未對匹配變量的選取和選擇模型形式的設定進行檢驗,刻意降低顯著性水平以確保所有匹配變量的平衡檢驗得以通過。

King & Nielson(2019)指出傾向得分匹配存在嚴重的模型依賴問題(Model Dependence),他們認為觀測數據研究的關鍵在于破解數據產生的過程,傾向得分匹配正是通過構建和估計選擇模型來完成這一破解任務,但可惜的是我們對于現實中觀測數據的產生過程知之甚少,這使得我們在使用傾向得分法時帶有較大的主觀性和隨意性。估計結果有賴于模型設定,當有多個模型都能很好地擬合數據并達成數據平衡目標時,研究者自然青睞于那個能產生自己心儀結果的模型,由此量化研究就喪失了客觀與科學的品質,淪落為一種單純為獲得參數估計的“技術游戲”。

(三)重效應識別、輕機制分析

教育科學研究的重要使命是揭示教育現象背后的教育運行規律,這就要求研究者不僅要回答“X 對Y 是否具有因果效應”,還需解釋該因果效應的發生機制,闡明X 是通過何種途徑對Y 發生因果效應的(即“How”問題),以及X 是在何種條件下對Y 發生因果效應的(即“When”問題)。目前國內教育因果研究還主要關注兩變量因果關系的識別與估計,對因果關系的發生機制研究得還不夠,對于許多重要的教育投入與其結果變量之間的因果關系,我們僅知其然,但不知其所以然。

探究變量間影響機制一般要采用中介效應分析,就X 是否通過Z 或其他變量進而對Y 產生影響進行分析。本質上,中介效應“X→Z→Y”反映的是帶有明確作用方向的多變量間因果關系,而當下流行的各種中介效應檢驗法,無論是早期提出的分步檢驗法(Baron & Kenny,1986),還是近來流行的自舉法檢驗和條件過程分析法(Hayes,2018),都不是從因果推斷的正式分析框架(潛在結果框架)推演出來的,它們只能實現變量間機制的相關分析。然而,國內有大量教育研究將這些方法用于因果中介效應估計。以另一篇剛在教育學刊物發表的文章為例,該文利用省級面板數據就留學教育對我國經濟增長的因果影響機制進行回歸分析,其中外國直接投資、技術研發與創新為中介變量,所構建中介模型如下:

在模型(3)—(5)中,留學教育規模(edu_os)是處理變量,但各省留學教育規模受多種經濟、社會因素的影響,因此它是內生變量。同理,中介變量外國直接投資(FDI)和技術研發與創新(RD)也是內生變量。因此,模型中幾乎所有的主要估計系數(a1、 β1、 π1、 π2和 π3)都很可能是偏估的。退一步說,即便模型未遺漏重要變量,不存在任何的隱性偏估,式(3)中的a1也是偏估的,因為它很明顯遺漏了中介變量外國直接投資(FDI)和技術研發與創新(RD),而該研究對中介效應的第一步檢驗便是看估計系數a1是否顯著。第一步檢驗便是錯的,之后檢驗更是錯上加錯。

事實上,識別因果中介效應“X→Z→Y”要比僅識別兩變量因果效應“X→Y”困難得多,亦嚴苛得多。要實現對因果中介效應的一致估計,既要保證個體是否接受干預與潛在結果、中介變量潛在取值無關,還要保證在給定干預的條件下中介變量取值與潛在結果無關。目前有關因果機制識別與估計方法的研究尚處于探索階段,具體討論可參見Imai 等人(2011)。

五、推動我國教育因果研究發展的兩點建議

針對上述問題,可從教育量化方法教學改革與教育因果研究創新能力提升兩方面提出一些建議。

(一)圍繞學生因果思維培養,改革教育量化方法課程體系

當前國內高校教育學相關專業的量化方法教學多以教育統計學為基礎課程,該課程大都沿襲心理統計學的教學傳統,授課內容以概率與統計初步和心理研究常用方法為主。然而,心理學研究較多采用實驗方法,在干預為隨機分配的實驗數據條件下研究者通過簡單的組間均值對比與檢驗或簡單線性回歸便可獲得因果結論,而相比之下,教育研究(尤其是教育政策研究)所使用的數據多為非實驗的觀測數據,若照搬心理實驗研究慣用方法來判定變量間因果關系,其結果必大謬。

教育量化方法課程的目的是培養學生運用科學思維與方法探究人類學習成長與教育行為規律的能力,而科學思維中最重要的就是因果思維,科學方法中最重要的亦是基于科學實驗方法原理形成的因果推斷方法,但吊詭的是,目前絕大多數教育量化方法課程都未包含有關因果思維與方法的知識。如此設計課程容易造成學生對量化方法學習目標的“認知偏差”,使學生形成一種“為學習方法而學習方法”的錯覺。譬如,學生在學習OLS 線性回歸時總是關注如何獲得主要解釋變量的顯著估計結果,對模型中應控制哪些變量卻不太關心,這是因為現有方法課程習慣性地把掌握某種統計技術當作教學目標。如果方法課程是以探索變量間因果關系作為教學目標,讓學生明白一種結果的產生有多種可能的解釋,預設的“因”只是其中一種“備選解釋”,如此學生自然會思考應采用怎樣的控制策略才能獲得較為可靠的因果結論,并關注在控制不同變量的條件下主要解釋變量的估計結果會發生怎樣的變化,如此學生也就不會產生“只要控制變量不顯著,就可以踢出模型”這樣的錯誤認識。

因果推斷方法的發展帶來的不只是更多新的統計技術,更是量化思維的徹底革新。我國教育學各專業未來應充分借鑒和吸收前沿因果推斷思想,圍繞強化培養學生科學思維與因果推斷能力這一核心目標,對現有的本科與研究生量化方法課程與教學體系進行改革:首先,可考慮在本科階段單獨設置一門“因果思維”課程作為所有教育量化方法課程的前置課程,此課程不講授任何具體的統計技術,以介紹因果推斷的基本知識與社會科學因果推斷經典研究為主要內容。也可考慮將這些知識濃縮,放入到“教育統計學”的靠前章節中進行講解,如美國普林斯頓大學教授、統計學家今井耕介(Kosuke Imai)編著的著名教材Quantitative Social Science: An Introduction中,引言之后的第二章便介紹因果定義及相關方法;其次,可考慮在本科生高年級設置“教育因果推斷方法”選修課程,并在研究生低年級設置“教育因果推斷方法進階”必修課程,作為“教育統計學”的后置課程,具體講解隨機對照實驗設計與各種常用的準實驗方法。

(二)立足我國教育政策實際,提升教育因果研究創新能力

如前所述,正確識別干預分配機制是實現可靠因果分析的前提條件,而要做到這一點,研究者需對現實教育背景與政策有透徹的了解。在因果研究中,事實邏輯永遠優先于技術邏輯。一旦研究設計與教育現實不符,無論獲得多么漂亮的數據分析結果,亦是無用的,甚至是有害的。

首先,研究者需明白誰為因,誰為果。對于結果變量來說,政策干預是原因,它應是結果變量的前定變量;而對于政策干預來說,控制或匹配變量是原因,它應是干預變量的前定變量。研究者只有對政策實施的歷史與現狀有足夠的了解,才能形成各變量之間在因果鏈條上的準確時序,才不會犯變量間因果時序顛倒的“低級錯誤”。

其次,研究者需明晰政策干預的對象、內容和過程。即便是同一政策,在地方落地實施過程亦可能呈現出很大的差別。教育政策的多樣化與差異性正是教育政策研究創新的重要來源。譬如,對某一教育事權下放制度改革進行成效評價研究,我們以往常將干預賦值為0 和1,實施該改革的地方賦值為1,未改革的地方賦值為0。而事實上,教育事權概念復雜,它包括多種權力,如教育服務舉辦權、監督權與調控權等(魏建國,2019),不同省份對不同縣區下放的具體事權很可能是不同的,由此導致該政策干預在不同地方實際運行中會產生不同的效力。如何將政策的多樣性與差異性用變量間數量變化關系呈現出來,是未來教育因果研究尋求突破與創新的一個重要方向,而要實現這一點,研究者就必須非常了解政策干預在不同地方的實施內容與過程。

最后,研究者需基于教育現實、政策背景和數據結構來挑選因果識別策略。譬如,有效的工具變量需滿足第一階段效應、獨立與排他限制三個假設,其中第一階段效應與獨立假設可通過一定方法得到直接或間接的檢驗,而排他限制假設幾乎是不可被檢驗的,只能依靠事實邏輯進行判定。一個“好”的工具變量可以來自研究者的經驗或直覺判斷,也可以來自研究者基于理論理解所形成的對變量間內在邏輯的知識構建,無論來自何處,它都必須符合事實邏輯,與教育現實和政策背景不沖突。正如安格里斯特在Instrumental Variables and the Search for Identification一文中所指出的:“在我們看來,好的工具變量常來自對決定自變量取值的經濟機制和制度的細致了解?!?/p>

(黃斌工作郵箱: huangbin@nju.edu.cn;本文通信作者為李波:libobnu@163.com)

猜你喜歡
學校研究教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
FMS與YBT相關性的實證研究
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
教育有道——關于閩派教育的一點思考
EMA伺服控制系統研究
辦好人民滿意的首都教育
學校推介
留學生(2016年6期)2016-07-25 17:55:29
奇妙學校
主站蜘蛛池模板: 久久国产高潮流白浆免费观看| 久久综合国产乱子免费| 99视频在线精品免费观看6| 国产精品流白浆在线观看| 国产97公开成人免费视频| 精品无码视频在线观看| 午夜国产小视频| 广东一级毛片| 无码精品国产VA在线观看DVD| 五月天综合网亚洲综合天堂网| 99视频全部免费| 国产91小视频在线观看| 国产成人a毛片在线| 91成人免费观看| 欧美午夜在线播放| 99热国产这里只有精品无卡顿"| 国产小视频免费观看| 欧美人与动牲交a欧美精品| 一区二区三区精品视频在线观看| 欧美日韩高清| 国产办公室秘书无码精品| 亚洲 欧美 偷自乱 图片| 囯产av无码片毛片一级| www欧美在线观看| 久久特级毛片| 中文字幕色站| 亚洲色图在线观看| 99视频在线观看免费| 日韩精品免费一线在线观看| 亚洲精品色AV无码看| 国产成人无码Av在线播放无广告| 操美女免费网站| 91福利免费| 欧美国产精品不卡在线观看| 亚洲国产精品VA在线看黑人| 玖玖精品在线| 三上悠亚精品二区在线观看| a天堂视频在线| 99re在线免费视频| 亚洲最新地址| 伊人久综合| 久久人搡人人玩人妻精品一| 欧美福利在线观看| 亚国产欧美在线人成| 国产99热| 亚洲欧美一区二区三区图片| 国产又爽又黄无遮挡免费观看 | 五月天综合婷婷| 中国国产高清免费AV片| 无码福利视频| 亚洲欧洲日本在线| 日本AⅤ精品一区二区三区日| 色综合久久久久8天国| 欧美午夜视频在线| 香蕉99国内自产自拍视频| 性激烈欧美三级在线播放| 亚洲男人的天堂在线| 沈阳少妇高潮在线| 青青青草国产| 午夜一级做a爰片久久毛片| 国产精品视频白浆免费视频| 91九色国产porny| 波多野结衣第一页| 国产二级毛片| 中文字幕免费在线视频| 色婷婷视频在线| 欲色天天综合网| av午夜福利一片免费看| 99中文字幕亚洲一区二区| 国产精品片在线观看手机版| 亚洲欧美在线综合一区二区三区| 国产av无码日韩av无码网站| 亚洲无码视频一区二区三区| 欧美另类视频一区二区三区| 中文字幕久久波多野结衣| 午夜啪啪网| 国产精品不卡片视频免费观看| 色哟哟国产成人精品| 萌白酱国产一区二区| 亚洲日韩精品无码专区97| www.国产福利| 99久视频|