鄧 輝,王 錳
(1.陜西省圖書館;2.南京大學信息管理學院)
近年來,越來越多的圖書館學學者采用各類回歸模型研究學術接受[1]、借閱量[2]、科技創新[3]、城市化[4]、區域經濟[5]、經濟增長[6]、財政[7]、高校科研[8]等領域。在CNKI收錄的2011-2016年核心期刊論文中,僅基于時間序列模型研究圖書館的論文就有16篇,而基于面板數據模型研究圖書館的論文也有6篇,可見各類回歸模型已經成為圖書館學研究的重要手段。
圖書館學研究方法和研究領域的拓展固然可喜,可是這些研究成果幾乎都沒有討論數據內生性(Endogeneity)問題,更沒有采用相應的工具處理內生性問題。
數據內生性是采用回歸模型實證研究常常遇到的問題,許多社會科學都非常重視內生性問題。圖1是2006-2016年CNKI收錄的以“數據內生性”為主題的論文發文量變化趨勢。經濟學、管理學和社會學綜合排名最高的《經濟研究》《管理世界》和《社會學研究》三種期刊中分別有34篇、39篇和5篇涉及相關問題。作為對比,截止2016年,《中國圖書館學報》《大學圖書館學報》《圖書情報工作》《圖書館雜志》《圖書館論壇》《圖書館建設》6種CNKI收錄的圖書館學核心期刊中,沒有一篇論文主題涉及“數據內生性”問題。可見,圖書館學作為一門社會科學,相對于其他學科缺乏對數據內生性問題的重視。

圖1 2006-2016年“數據內生性”論文發文量
所謂數據內生性問題,指的是某些變量影響回歸模型的誤差項(隨機干擾項),使得回歸模型不具有因果推斷力,繼而不符合最小二乘法成立的假設條件。測量誤差、遺漏變量(Omitted Variable)和聯立性偏誤(Simultaneity Bias)是造成內生性問題的三種常見原因。[9]
數據內生性問題的三種成因在社會科學領域具有普遍性,圖書館學計量研究也會遇到內生性問題。首先,大量圖書館學計量研究采用歷年《中國文化文物統計年鑒》《中國圖書館年鑒》中的數據,但在實際統計工作中,由于統計樣本選擇、響應率、統計問題措辭、問題順序以及統計人員素質等因素,大部分的統計數據或多或少的會存在測量誤差。其次,圖書館學學者在研究時難免有主觀局限性。由于選擇效應的原因,學者過于關注單個解釋變量對事物發展的影響,[10]遺漏其他重要變量,從而會造成模型產生內生性問題。另外,在圖書館學眾多計量研究的模型中,其解釋變量和被解釋變量存在廣泛的雙向因果關系。公共圖書館等文化建設,不僅受財政、經濟增長、科研水平等因素的影響,其本身也是影響財政、經濟增長、科研水平的因素,這種雙向因果關系會造成計量模型產生聯立性偏誤,是內生性問題的重要成因。
內生性問題會造成計量回歸結果有偏(Biased)。如果解釋變量和誤差項之間正相關,模型就會高估解釋變量的影響;如果解釋變量和誤差項之間負相關,模型就會低估解釋變量的影響。因此,忽視數據內生性問題會導致圖書館學計量研究相關結論被夸大,甚至有些研究結論不成立。
以研究圖書館各類指標和經濟增長關系為例,忽視數據內生性問題就可能嚴重影響計量結論。首先,經濟發展會影響測量誤差。經濟發展程度較高的地區,政府更為高效,執行規章制度也就比較嚴格,因此當地圖書館數據質量較高。相反經濟發展落后的地區,數據質量就可能較差。因此相關計量研究會低估經濟發展對發達地區圖書館各類指標的影響,而高估經濟發展對欠發達地區各類指標的影響。其次,由于圖書館讀者受教育相對水平較高,而各地教育水平會影響當地經濟發展,因此經濟發展在一定程度上是各地教育水平對圖書館各類指標的間接影響變量。當計量回歸模型遺漏各地教育水平,就會高估經濟發展對圖書館各類指標的影響。最后,圖書館各項指標和經濟發展難免有雙向因果關系。如,經濟增長會增加政府對公共館圖書館財政補助,而財政補助也會影響經濟增長。我們假設兩個最簡單的回歸模型。

其中,Y是經濟增長率,X是財政補助,a1和a2是回歸系數,u1和u2是誤差項。當a1·a2≠0時,可以獲知 X= (a2·u1+u2) /(1-a1·a2),此時 X 和 u1相關,回歸方程(1)就不符合最小二乘法成立的前提條件,這就是聯立性偏誤。因此,聯立性偏誤同樣可能會造成相關計量研究結論高估經濟發展對圖書館各類指標的影響。
由于圖書館學計量研究必然廣泛存在數據內生性問題,忽視相關問題會影響研究結論,甚至可能導致相關結論不成立,因此,圖書館學在計量研究時必須重視數據內生性問題。
計量經濟學之所以區別于統計學,就在于計量經濟學特別重視分析事物間的因果關系,并發展了一套相應處理內生性問題的工具。[11]工具變量、雙重差分和斷點回歸是計量經濟學處理內生性問題常用的三種統計方法。
為了避免內生性問題,越來越多的社會科學開始借鑒這些計量工具。如,美國社會學非常重視工具變量的應用,三大頂級社會學期刊僅僅在2000-2009年間就有57篇論文采用工具變量方法。[12]隨著中國學者學術水平的提高,2006-2016年CNKI中文論文使用這三種統計方法的論文數量在不斷上升(見圖2)。

圖2 歷年CNKI論文中采用三種計量工具的論文數量
在使用雙重差分法和斷點回歸解決變量間的內生性問題時,一般會借用各種政策法規頒布時間及其具體規定,并要求政策法規的具體規則、實施時間滿足一定的隨機性。其原理在于政策制度對社會個體的沖擊,類似于自然科學的可控實驗消除了數據間的內生性問題,因此經濟學將這類政策沖擊稱為準實驗(Quasi-experiment)或自然實驗(NaturalExperiment)。
雙重差分法和斷點回歸除了可以解決內生性問題外,還是定量分析公共政策實施效果的重要計量方法。圖書館學鼓勵定量研究,[13]也很重視公共政策,但很少有針對公共政策的定量研究。如,2014-2016年《中國圖書館學報》(雙月刊)和《經濟研究》(月刊)分別有10篇和11篇論文以公共政策為主題,然而《經濟研究》的11篇論文全部是定量研究,《中國圖書館學報》的10篇論文沒有一篇是定量研究。因此,重視使用雙重差分法和斷點回歸評估圖書館學相關公共政策格外重要。
當研究對象不滿足隨機沖擊時,雙重差分法和斷點回歸就不再適用。如,圖書館外借量和圖書館經費顯然存在雙向因果關系,而圖書館經費的增加不滿足隨機沖擊。對于這類研究課題,我們就需要采用工具變量解決潛在的內生性問題。正是由于使用工具變量法的約束條件較少,因此,圖2所顯示工具變量法在三種統計方法中被使用的次數最多。
實證各類政策效果時常常會面臨各種內生性問題,而雙重差分法(Difference-in-differencesModel,簡稱DID)是經濟學家定量分析各類法規[14]、政策[15]和制度[16]最常用的方法,可以有效地避免各種內生性問題,其基本思路如式(3)。[17]

式(3)中,β是對政策實施效果的估計量,Xtreatment是實施政策的處理組,Xcontrol是沒有實施政策的對照組,下標1和2分別代表政策實施后和實施前,△Xtreatment是處理組政策實施前后的變化量,△Xcontrol是對照組政策實施時間前后變化量。
我們以匿名審稿制度為例分析雙重差分法在圖書館學的應用前景。學術期刊的影響因子、總被引頻次、平均引文率等相關指標是文獻計量學的重要研究方向,匿名審稿制度可以有效地提高期刊相關指標,因此評估匿名審稿制度的實施效果自然也是圖書館學的重要研究課題。
我們在實證匿名審稿制度政策效果時就面臨內生性問題。首先是雙向因果問題,如,我們很難判斷影響因子較高的學科期刊是因為更高的學術追求實施了匿名審稿制度,還是實施匿名審稿制度提高了學術期刊的影響因子,或者是兩個方面兼而有之。其次是遺漏變量問題,如,隨著學者們越來越重視學術成果的互相借鑒,在沒有實施匿名審稿制度的情況下,期刊的平均引用率還是會提高。所以,忽視時間趨勢(時間固定效應)可能造成對匿名審稿制度實施效果的高估。
劉瑞明等采用雙重差分法研究匿名審稿對國內55種經濟學期刊影響因子、總被引頻次、平均引文率等指標的影響就成功規避了相關內生性問題,[18]因此,我們結合圖3與劉瑞明相關研究加以說明雙重差分法如何解決研究政策效果時所面臨的內生性問題。在圖3中我們假設2015年A類期刊采用了匿名審稿制度,而B類期刊沒有采用,直線m是A類期刊平均引文率的年度變化,直線n是B類期刊平均引文率的年度變化。此時A類期刊就是實施組,相應B類期刊就是對照組,而x軸是時間,y軸是平均引文率,a點是2015年12月,b點是2016年12月。

圖3 雙重差分法的基本思路
通過圖3我們很容易明白不能將(mb-ma)記作匿名審稿制度的政策效果。因為,隨著學術界整體發展,即便沒有出臺匿名審稿制度,A類期刊論文平均引文率依然會增加,所以,將(mb-ma)當做匿名審稿制度就忽視了時間趨勢(時間固定效應),進而造成對政策效果的高估。
為避免實證中對制度效果的高估,我們必須思考如何剔除時間趨勢的影響。在理想情況下,我們希望能夠得到沒有實施匿名審稿制度的A類期刊在2015年后平均引文率的變化趨勢,可以有效地剔除雙向因果、遺漏變量等內生性問題。如,圖3中直線m’是A類期刊2015年后沒有實施匿名審稿制度時其平均引文率的假想變化趨勢,此時(mb-m’b)就是內生性問題后A類期刊實施匿名審稿制度政策效果。
雖然現實中很難準確估算m’,不過可以引入對照組解決相關問題。如,可以通過傾向評分匹配法(Propensity Score Matching)[19,20]等方法找到 2015 年前平均引文率變化趨勢與A類期刊相似、且2015年沒有實施匿名審稿制度的B類期刊作為A類期刊的對照組。結合圖3看,就是要求B類期刊平均引文率變化趨勢n,與A類期刊實施匿名審稿制度前的變化趨勢m’斜率接近。此時由于對照組n和m’斜率接近,我們很容易得出(mb-ma)和(nb-na)之差與(mb-m’b)接近。也就是通過引入對照組B類期刊,巧妙地解決了實證匿名審稿制度政策效果面臨的內生性問題。
與雙重差分法類似,斷點回歸(Regression Discontinuity,簡稱RD)不僅可以有效減少數據內生性問題,它也是一種評估政策影響的常用計量方法。[21]斷點回歸(Sharp RD)基礎模型如下。

式(4)中,i代表不同個體,Y代表因變量,X是取值0或者1的政策虛擬變量,N是個體的特征值,c是截距,1、2是回歸系數,u是誤差。其中,X的取值和N相關,當N大于政策閾值時,X=1,當N小于政策閾值時,X=0。
斷點回歸對政策規則苛刻,它要求政策規則的設定比較隨意。如圖4所示,李宏彬等采用斷點回歸研究退休制度對中國百姓的消費影響[22]便符合使用斷點回歸的要求。這是因為退休年齡的設定比較隨意,因此60歲和59歲的年齡因素對個人影響很小,而社會個體也很難影響退休年齡閾值的制定,所以此時便可以采用斷點回歸。

圖4 退體制度對中國百姓消費影響示意圖
雖然斷點回歸法使用前提比較苛刻,但是,由于文化部門出臺的很多政策其閾值滿足隨機性要求,我們就可以借助相關閾值有效解決內生性問題。因此,斷點回歸法在圖書館學實證研究中有大量應用空間。如,實證研究圖書采購經費和借閱率的關系便面臨嚴重的內生性——雙向因果問題。借閱量越高的地區政府有更大的動力提高采購經費,借閱量在很大程度上影響了各級圖書館的采購經費,但我們很難實證圖書采購經費對借閱量的具體影響。同時,閱讀作為一種休閑方式可能受到人均收入的影響,而人均收入同時又在影響各地財政。與人均收入類似同時影響采購經費和借閱量的因素有很多,因此,在研究圖書采購經費和借閱率的關系中可能存在嚴重的遺漏變量問題。
此時,就可以借用斷點回歸解決相關內生性問題。文化部第六次圖書館評估定級中對各級圖書館財政報告有明確要求,其中規定,西部地區地市級一級館年財政撥款不得低于500萬,[23]各地政府為了滿足相關要求紛紛提高了采購經費。顯然“500萬”便是比較隨機的政策閾值。500萬和450萬并沒有質的區別,500萬的政策設定并不是受各地借閱率的影響,因此相關經費的增長內生性問題就會較少,也就可以利用該閾值研究采購經費和借閱量的關系。
無論是雙重差分法還是斷點回歸法,都需要借用政策規定等作為隨機沖擊。而實際中很多研究課題沒有好的隨機沖擊可以利用,此時工具變量法(InstrumentalVariable,簡稱IV)就是解決研究課題內生性問題較好的方法。
21世紀以來,由于Acemoglu等人的開創性研究,[24]工具變量法的使用范圍不斷拓展,除經濟學外,其他學科也非常重視工具變量的應用。如,陳云松在《社會學研究》中專門介紹了工具變量在社會學的應用前景。[25]
所謂工具變量,就是一種與核心解釋變量相關、但與誤差項不相干的變量。[26]以研究圖書館財政撥款和文獻外借量為例,首先要建立兩個回歸方程。

式(5)和式(6)是簡單的回歸方程,其中Y是圖書館文獻外借量,X是各地圖書館財政撥款,K是各地人口等控制變量,Z是工具變量,i是各地代碼,b和c是截距,β1和β2是系數,v和u是誤差項。
工具變量法的核心,就是將在式(5)得到的數據代入式(6)以去除數據的內生性問題,因此工具變量Z必須滿足以下條件。

這組公式表示工具變量Z和控制變量K以及誤差項u不相關,但和核心解釋變量X相關。實際中我們無法通過統計方法判斷Cov(u,Z)是否為0,只能判斷Cov(X,Z)和Cov(K,Z)。因此,工具變量的選擇需要依賴學科領域知識的積累,以判斷Cov(u,Z)是否為0。
在篩選工具變量時可以借鑒其他學科的相關研究。與圖書館經費與外借量的關系相似,司法投入和犯罪率之間也存在類似的內生性問題。如,司法投入和經濟發展相關,經濟發展和數據質量相關,這就會導致內生性的測量誤差;同時,司法投入和犯罪率之間也存在雙向因果關系。顯然這些內生性問題圖書館經費和外借量會存在。
陳碩通過將各地政法委書記的黨齡作為工具變量,巧妙地實證了中國司法投入和犯罪率間的關系。[27]陳碩選擇政法委書記的黨齡作為工具變量,其思路在于政法委書記黨齡越長,在常委會的決策影響力就越大,從而會影響司法投入。同時,各地政法委書記的黨齡和各地犯罪率不存在明顯的直接因果關系,也不會直接影響各地經濟發展,因此選擇政法委數據黨齡作為工具變量可以避免內生性問題。
借鑒陳碩的研究思路,可以利用宣傳部長、文化廳長等各地官員的黨齡作為工具變量,研究圖書館經費和外借量關系等相關課題。與陳碩研究采用類似方法,但選擇不同的工具變量論文還有很多,當圖書館學實證研究在處理內生性問題出現困難時,可以借鑒這些工具變量思路,以提高相關課題研究結論的可信度。
隨著圖書館學實證研究的增多,越來越多的學者開始采用各種統計方法。然而,長久以來圖書館學相對于其他社會科學,缺乏對數據內生性問題的重視。國內圖書館學核心期刊甚至沒有一篇文章討論過相關問題。本文提倡在圖書館學研究中重視內生性問題,并介紹了計量經濟學處理內生性問題的三種常用統計方法,列舉了它們在圖書館學的可能應用。
掌握雙重差分、斷點回歸和工具變量三種統計方法,除了可以避免數據內生性問題,還可以擴展圖書館學的研究領域。當研究對象滿足隨機沖擊時,雙重差分法和斷點回歸就非常適用。其中,雙重差分法適用于通過對照組研究政策法規的影響,而斷點回歸適用于通過閾值研究政策法規的影響,二者都可以拓展圖書館學對公共政策的定量研究。工具變量的使用范圍更廣,可以廣泛用于研究各類內生性問題,但工具變量的選擇更依賴于知識的積累。
隨著圖書館學越來越強調定量研究,非常有必要了解這三種計量方法,希望本文起到拋磚引玉的作用。
[參考文獻]
[1]李月琳,何鵬飛.國內技術接受研究:特征、問題與展望[J].中國圖書館學報,2017,43(1):29-48.
[2]龔新剛,等.圖書借閱歷史數據分析與預測[J].圖書情報工作,2015(S1):161-165,87.
[3]陳英,洪源.我國公共圖書館發展與科技創新的協同關系實證研究——基于時間序列模型的長期均衡與短期波動視角[J].圖書館工作與研究,2016,1(6):22-29.
[4]王惠.城市化、經濟增長與公共圖書館發展——基于我國省級面板數據[J].圖書館論壇,2015(12):25-31.
[5]李莉,胡玉洲.基于時間序列的公共圖書館與區域經濟動態耦合研究——以廣東省為例[J].圖書館理論與實踐,2014(5):61-65.
[6]趙迎紅.公共圖書館發展指標與經濟增長關系的計量經濟學分析[J].圖書情報工作,2012,56(9):61-65.
[7]萬雪芹,張婧.中國公共圖書館財政支出與經濟增長關系研究[J].圖書情報工作,2011,55(21):75-78.
[8]林可全,等.高校圖書館核心競爭力和高校科研能力相關性研究——以“211”高校為例[J].圖書情報工作,2014,58(24):5-10.
[9](美)達摩爾·古扎拉蒂.計量經濟學原理與實踐[M].李井奎,譯.北京:中國人民大學出版社,2013:112-142,310-313.
[10] Heckman J J,Smith J A.Assessing the case for randomized social experiments[J].Journal of Economic Perspectives,1995,9(2):85-110.
[11](美)喬舒亞·安格里斯特,納恩·斯特芬·皮施克.基本無害的計量經濟學[M].郎金煥,李井奎,譯.上海:格致出版社,等,2012:79.
[12] BollenK.Instrumental variables in sociology and the social sciences[J].Annual Review of Sociology,2012,38(22):37-72.
[13]葉鷹.圖書情報學中定性和定量研究方法的科學哲學基礎及雙重整合原理探析[J].中國圖書館學報,2017(2):4-12.
[14]王靖雯,魏思琦.“婚姻法司法解釋三”對女性勞動力供給的影響[J].經濟學動態,2016(7):44-50.
[15]劉瑞明,趙仁杰.西部大開發:增長驅動還是政策陷阱——基于PSM-DID方法的研究[J].中國工業經濟,2015(6):34-43.
[16]賈俊雪,寧靜.縱向財政治理結構與地方政府職能優化——基于省直管縣財政體制改革的擬自然實驗分析[J].管理世界,2015(1):7-17.
[17](美)詹姆斯·斯托克,馬克·沃森.計量經濟學導論[M].張濤,等譯.北京:中國人民大學出版社,2014:340-341.
[18]劉瑞明,趙仁杰.匿名審稿制度推動了中國的經濟學進步嗎[J].經濟學(季刊),2017(1):173-204.
[19]胡安寧.傾向值匹配與因果推論:方法論述評[J].社會學研究,2012(1):221-242.
[20]胡安寧.社會科學因果推斷的理論基礎[M].北京:社會科學文獻出版社,2015:1-23.
[21]余靜文,王春超.新“擬隨機實驗”方法的興起——斷點回歸及其在經濟學中的應用[J].經濟學動態,2011(2):125-131.
[22]李宏彬,等.中國居民退休前后的消費行為研究 [J].經濟學 (季刊),2014(4):117-134.
[23]文化部辦公廳關于開展第六次全國縣級以上公共圖書館評估定級工作的通知[EB/OL].[2017-05-16].http://zwgk.mcprc.gov.cn/auto255/201701/.
[24] Acemoglu D,et al.The colonial origins of comparative development: An empirical investigation[J].American Economic Review,2012,91(5):1369-1401.
[25]陳云松.邏輯、想象和詮釋:工具變量在社會科學因果推斷中的應用[J].社會學研究,2012(6):192-216.
[26](美)杰弗里·伍德里奇.計量經濟學導論:現代觀點(第五版)[M].張成思,等譯.北京:中國人民大學出版社,2015:447-483.
[27]陳碩.轉型期中國的犯罪治理政策堵還是疏[J].經濟學 (季刊),2012,11(2):743-764.