施鵬飛
[提要] 同伴效應作為影響教育產出的一個重要因素,近年來被國內外經濟學、社會學以及教育學高度關注。但是,由于同伴效應本身所具有的特性給同伴效應的識別增加了很多難度,近些年來隨機試驗以及自然試驗的興起給因果關系的識別帶來曙光。本文從同伴效應的概念出發,介紹同伴效應估計的一般模型——均值線性模型。指出同伴效應估計過程中出現的三個主要障礙,分別是自選擇、反向因果和機械關聯性。回顧目前興起的利用隨機試驗和自然試驗識別同伴效應,從而展望新的研究方向和未來的新進展。
關鍵詞:同伴效應;隨機試驗;自然實驗;自選擇:反向因果;機械關聯性
中圖分類號:F01 文獻標識碼:A
收錄日期:2019年10月7日
一、引言
勞動經濟學非常共同關注一個問題:究竟是哪些因素在影響學生的教育生產過程,從而決定其教育獲得以及教育成就。總的來說影響教育的各種因素可以分為以下幾類:一是學生個人的特征,如學生本身具有的能力特征影響了教育成就;二是來自家庭的影響,父母的教育程度在一定程度上影響了孩子的認知水平;三是所在學校的資源、師資、管理文化等方面的作用,學校教育存在異質性特點。以上三點影響教育的因素具有很強的穩定性,在短時間內改變比較有難度。影響教育生產第四類因素是學生的同伴這是較易于改變的,通過不同成績水平的學生在各班級的重新配置,從而可能扭轉學生教育獲得的不利局面。
同伴效應是從同伴個體間交互過程中產生的一種溢出效應,這種影響可以來自于不同家庭背景之間的融合,也可以是同伴之間行為的互相影響。例如,如果一個同伴成績相對突出,其他同學可以直接向他學習,還可通過影響教師的教學行為影響其他同學,包括同伴之間的競爭行為都是同伴效應。總的來說,同伴效應限制在一個群內,群內個體之間相互影響。這些研究的群體范圍廣泛,包括在高等教育,班級、年級以及學校內的同伴效應的研究主要在初等和中等教育,大學宿舍間的同伴效應。
二、同伴效應的估計模型
同伴效應估計過程中的最常見模型是線性均值模型,學生的結果變量是學生的背景特征(包括一些人口學特征)、同伴的背景特征、同伴平均結果的線形函數。這種模型具有簡化分析的優勢,方程一方面考慮到了同伴當前結果的內生效應,也考慮同伴背景特征的外生影響。這個模型是一個同質化的模型,也就是所有的學生背景和能力分布水平上同伴效應的大小固定不變。因為模型的簡化,帶來了估計的極大便利,均值線性模型也在實踐中得到廣泛應用。伴隨著同伴效應的同質化和依照結果變量和背景變量均值線性變化的假設,線性均值模型在實證研究中也面臨著兩個主要問題。Hoxby(2000b)和Hoxby、Weingarth(2005)指出,一方面,從這個一般化模型出發,同伴結果和背景特征對群內個體的平均影響是固定不變的,因此不同個體在各個群體之間重新配置,影響的只是個體水平上和單個群體水平上結果的變化,不會影響所有群體總的結果。從福利角度出發,不同成績和學習能力的學生在班級之間的配置不會影響總的社會福利水平。從福利水平角度,特別是想提高社會總體福利水平角度出發,這個同質化的模型可能不是太具吸引力。另一方面,從經驗證據角度,研究者已經發現這種同伴效應事實上并不是依照均值線性變化的。一些文獻存在這樣的結論:最有能力的學生受益于有更多的高能力學生,而能力最差的學生實際上是會受到高能力學生的加入和低能力學生移除的負向刺激。Hoxby和Weingarth(2005)以及Burke and Sass(2008)利用中學測試成績作為結果變量,都發現了這種互補性因素的存在。在大學教育中,Sacerdote(2001)發現了一些證據,高能力學生互相受益超過平均受益或低能力學生的收益。考慮到同伴效應的均值線性模型的不足,同伴效應的異質性分析在近些年來受到廣泛關注。Hoxby和Weingarth(2005)在研究三到八年級學生的同伴效應。根據學生過去的成績,將學生分為十個百分位,用學生先前成績的百分位和落在每十個百分位上的同伴進行交互,共獲得100個交互項。研究發現處于分位數最底端的學生的成績受處于分位數15%的學生的成績的影響,處于最高分位的學生的成績受同樣處于高分位的學生的成績的影響,處于中間分位的學生的成績受到同伴效應的影響則相對較小。Ding和Lehrer(2007)利用中國江蘇的數據,采用分位數回歸分析,發現與低能力的學生相比,高能力的學生從較高成就且方差較小的同伴中獲益更多。對異質性同伴效應的研究,打破了傳統線性均值模型認為學生個體在不同班級的重新分配,都無法增加總的學生成就水平,也無法增加總的社會福利水平。
三、同伴效應估計過程存在的一些問題
同伴之間具有的關聯,可能是由于其他因素導致了相似的結果,即使是缺乏真正的同伴效應,在同伴效應的估計過程中存在著三個主要經驗研究的挑戰:自選擇問題、反射問題和機械關聯性。
(一)自選擇問題。人們通常會選擇自己所在的社區、學區、班級同學和室友。因此會出現重點中學學生升學率明顯高于其他一般學校,表面上看好像是優秀的班級同學提高了整體學習水平,但實質上可能是成績好的學生一種主動選擇在一起。這種選擇性偏誤實質上是一種遺漏變量問題,關鍵問題是這種選擇機制有時候是很難完全掌控的,在同伴效應的均值線性模型中,用同伴的平均能力(行為或者結果)估計自身能力,不可避免的受到選擇性偏誤的影響,因為同伴的能力和自身的能力可能共同收到學校聲譽的影響,同伴效應的估計很難控制這些混雜因素,這給估計真正的同伴效應的大小帶來了很多不便。
(二)反向因果問題。這種反向因果問題也稱為反射問題,在同伴效應的均值線性模型中,如果自變量和因變量都是結果變量,這個結果變量在時間上可能會同時產生,也就會產生通常所說的聯立方程組問題。在實證過程中可能出現的一般情況是,在估計同伴效應時,將個體學生成績作為因變量,將同伴的平均成績作為自變量。但這個時候就會出現問題,單個個體的學生成績同時也會影響其他同伴的學習成績,因此就很難估計同伴效應的凈影響。