洪俊杰 楊志浩
數千年的歷史更迭形成中國“南腔北調”“十里不同音”的方言格局。復雜的方言格局在豐富文化多樣性的同時,也帶來語言交流不通暢的現實問題。為了降低交流壁壘,我國制定了《中華人民共和國國家通用語言文字法》(以下簡稱《國家通用語言文字法》),并于2001年1月開始施行。在此背景下,普通話在全國的普及率從2000年的約53%上升至2015年的73%左右①資料來源于中華人民共和國教育部官網(http://www.moe.gov.cn)。。然而,普通話的推廣無法完全消除方言差異引致的交流障礙,原因正如中國俗語所言:“鄉音難改”。心理學關于“詞匯獲得年齡效應”(Age of acquisition)的研究表明,早期習得的語言相較于晚期習得的語言在觸發激活時具有絕對優勢(Hernandez和Li,2007),年幼時習得的語言在成年后表現出的優先觸發激活優勢更為明顯(Arnon等,2017)。根據《中國語言文字使用情況調查資料》(中國語言文字使用情況調查領導小組辦公室,2006)統計,全國調查范圍內“小時候最先會說漢語方言”的人口比例為84.23%,而“最先會說國家通用語言普通話”的人口比例僅為13.47%,學習并使用方言是絕大部分人群在幼年時期的首要選項。幼年時掌握的方言口音、詞義及語法規范根植于個體的語言行為,在成年后的語言交流過程中會優先觸發激活,創造出具備地方方言特征的“地方普通話”。“地方普通話”在語音、詞義和語法等諸多方面偏離標準的普通話,有時會產生嚴重的交流障礙(陳亞川,1991)。
方言既是語言交流的載體,又是文化傳承的表征。對此,大量經濟領域的研究文獻也基于方言的文化效應視角開展研究。例如,研究文化多樣性對市場一體化、市場分割、區域間貿易以及民間金融等的影響(劉毓蕓等,2017;丁從明等,2018;張博和范辰辰,2018;高超等,2019),考察方言的文化認同感如何影響公司代理成本和社會信任(戴亦一等,2016;黃玖立和劉暢,2017)等。其中,部分文獻基于方言的交流功能開展研究。例如,考察方言流利性對買賣雙方信任感的影響(Armstrong和Yee,2001),探索語言障礙如何通過影響團隊成員認知和情緒反應,進而影響跨國團隊內部信任的構建(Tenzer等,2014)。然而,現有文獻鮮有關注方言差異引致的交流障礙如何影響創新績效。本文基于專利申請主體的詳細地址,利用高德地圖API開放平臺完成對中國全部申請專利所屬縣級行政單位的精準識別,并基于全國1∶100萬基礎地理數據庫和縣級行政單位的漢語方言數據,利用ArcGIS軟件完成對漢語方言邊界的識別。之后,以方言邊界作為交流障礙的識別變量,靜態分析交流障礙對創新績效的影響。為了更好地完成進一步分析,本文采取如下兩種方式動態地考察交流障礙對創新的影響:第一,借助創新主體與方言邊界之間的地理距離差異,識別創新主體面臨的交流障礙程度的變化,檢驗隨著創新主體與方言邊界之間地理距離的逐漸增加,方言邊界的創新抑制效應是否逐漸減弱。第二,根據2001年我國頒布的《國家通用語言文字法》對民族自治地區和非民族自治地區的機關單位和學校等教育單位使用普通話的差異化規定構造準實驗,采用雙重差分法考察減少交流障礙是否有助于提高創新水平。
在現有關于方言與創新的相關研究中,徐現祥等(2015)和潘越等(2017)的研究與本研究存在一定的關聯。徐現祥等開創性利用地級市內部的次方言數量和方言分化指數測度方言多樣性。他們發現,方言多樣性會降低城市技術創新,進而抑制經濟增長。潘越等采用同樣的方法測度方言多樣性,并將方言多樣性作為文化多樣性的代理指標,指出地級市的文化多樣性提高了轄區上市公司的專利申請水平。本研究是對前述研究的拓展和再檢驗。
第一,本研究是在前述研究基礎上的進一步拓展。徐現祥等認為方言多樣性通過抑制城市技術創新的方式阻礙經濟增長,但該研究僅將技術創新作為中介因素簡要分析,并未系統論證方言多樣性如何抑制技術創新以及應當采取何種方式減小方言多樣性對技術創新產生的負面影響。潘越等強調方言的文化效應能夠影響創新,但忽視了方言的語言交流功能對創新的影響。本文關于交流障礙與創新績效的研究有助于從語言環境視角為政府優化創新生態提供經濟學支撐。不僅如此,本文還更為全面地考察了方言引致的交流障礙如何影響各類型創新主體的創新水平,以及如何影響經濟整體的創新水平。
第二,本研究是對方言如何影響創新這一問題的再檢驗。如前所述,徐現祥等從地級市層面入手,認為方言多樣性抑制了城市技術創新。潘越等從上市公司層面入手,認為方言多樣性促進了上市公司的技術創新。基于不同的研究對象和數據樣本考察方言對創新的影響時,徐現祥等和潘越等得出相反的研究結論。在此背景下,本文基于縣級層面和企業層面的專利申請數據重新考察方言對創新的影響,有助于進一步揭開問題真相。
語言交流是完成知識溢出的關鍵環節,當存在交流障礙時,知識溢出水平受損。首先,交流障礙削弱知識傳播能力,阻礙知識溢出。知識根據是否適用于載體傳播可以劃分為顯性知識和隱性知識。顯性知識容易通過音頻、視頻及文本進行傳播;隱性知識難以具體化,具有很強的默會性。對于顯性知識而言,交流障礙直接影響顯性知識傳播的便利程度,進而影響知識溢出效率;對于隱性知識而言,交流障礙阻礙知識擁有者對知識接受者長期潛移默化的影響,不利于隱性知識的傳播,降低知識溢出水平。其次,交流障礙影響信任感的構建,不利于知識溢出。交流障礙干擾認知和情緒反應,不利于創新主體之間信任感的構建(Tenzer等,2014)。協作創新活動高度依賴于參與主體的彼此信任程度,缺乏信任的協作關系難以維系,短暫的無信任協作不足以實現有效的信息溝通和知識傳遞。因此,交流障礙通過抑制信任感的構建,降低知識溢出水平。內生增長理論(Endogenous Growth Theory)構建起知識溢出影響創新績效的理論背景。該理論強調知識溢出在經濟發展中的引擎作用(Lucas,1988;Romer,1990),其內在邏輯為:作為部分個體研發投入的產物,知識在溢出過程中會產生正外部性,提升其他部分個體的創新水平,進而實現整體內生技術進步。在此背景下,大量研究從區域、產業以及企業等層面論證了知識溢出對創新績效的影響,并且普遍認為知識溢出能夠促進創新。知識溢出會發生在不同區域之間,鄰近地區的創新活動對本地區的創新績效存在顯著的正向作用(Goncalves和Almeida,2009;Tseng,2009);同一區域的不同產業會在知識溢出作用下提升彼此的創新水平(Firestone,2010);知識溢出還存在于企業之間,成為提高企業技術水平的重要驅動力(Hoppmann,2018)。總而言之,交流障礙降低了知識溢出水平,因而對創新產生抑制作用。
交流障礙對創新的負面影響還體現在信息溝通成本方面,具體可以從財務成本和時間成本兩大視角展開分析。其一,財務成本視角。從知識擁有者角度來看,交流障礙迫使其在對外完成有效知識溢出時支付更高的信息釋疑成本;從知識接受者視角來看,陌生的外部語言環境提高其信息搜尋成本以及在獲取信息后的轉譯學習成本(Kogut和Singh,1988)。交流障礙引致的信息溝通成本會加重創新主體的財務負擔,縮減利潤空間,削弱研發投入能力,最終影響創新產出。其二,時間成本視角。對于開展高端技術創新的發明家而言,信息釋疑、搜尋和轉譯產生的時間成本可能比財務成本更為高昂。高端技術通常具有較高的學習壁壘,發明家難以通過委托編譯的方式將高端技術交由時間成本相對低廉的科研輔助人員進行信息釋疑、搜尋和轉譯。因此,在交流障礙存在時,開展高端技術創新的發明家通常需要付出相對高昂的時間成本來完成對其他語言的學習和掌握,以便使用其他語言完成對己方技術突破的釋疑,或者根據己方研究中面臨的瓶頸對外開展信息搜尋和轉譯。這種高昂時間成本的投入無疑會降低發明家的創新效率。
來自貿易領域的研究是語言交流影響創新的一個例證。在語言交流與國際貿易相關關系的研究中證實,共同語言的存在會降低貿易中的交易成本(Melitz,2008),共同母語會降低規避經濟風險時的信息搜索成本(Egger和Lassmann,2015)。貿易成本的降低有助于推動雙邊企業的貿易活動,而出口學習效應(Learning by exporting)的相關文獻進一步搭建起貿易與企業創新之間的橋梁。具備一定生產率優勢的企業會選擇出口(Melitz,2003),出口企業從海外市場可以獲得母國市場所不具備的知識輸入(Knowledge inputs),這會提升出口企業的產品創新水平和有利于其專利申請數量的增加(Salomon 和Shaver,2005)。進一步,企業的出口學習行為會對企業技術進口產生積極影響,出口學習和技術進口共同促進企業創新(Wang和Tao,2019)。由此可見,語言交流通過影響企業的國際化行為而影響企業從外部市場獲得知識和技術,最終影響企業創新。
在識別方言邊界之前,本文首先需要完成對漢語方言矢量地圖的構建。方言可劃分為方言區、方言片和方言小片(徐現祥等,2015),本文使用相對精細的方言小片作為方言邊界的識別基礎。中國的每個縣級行政單位均從屬于某一種方言小片,使用ArcGIS軟件把縣級行政單位所屬方言小片的數據與全國1∶100萬基礎地理數據庫中的縣級行政區劃矢量地圖做圖層關聯,便可得到含有地理坐標信息的漢語方言矢量地圖。
圖1是方言邊界示意圖,陰影部分區域D1和空白部分區域D2分別屬于兩種不同的方言小片,兩個區域之間的虛線C即方言邊界。A點和B點代表創新主體①本文中的創新主體主要包括縣級行政單位和工業企業。,其所屬方言小片為D2。創新主體在開展創新活動過程中,會受到其他創新主體知識溢出的正外部性影響。知識溢出由于存在地理局限,會隨著地理距離的增加逐漸衰減(Jaffe等,1993;Audretsch和Feldman,1996;Maurseth和Verspagen,2002;Rho和Moon,2014),故本文假設A點和B點能夠獲得的有效知識溢出區域分別為圓F和圓E。假設圓F和圓E面積相等,對于鄰近方言邊界的A點而言,其能夠獲得的有效知識溢出區域(圓F)部分位于與己方使用不同方言的D1中。在跨方言交流存在障礙的基礎上,A點將會損失位于D1中的有效知識溢出區域,或者為獲得來自D1中的有效知識溢出而付出信息溝通成本。相反,對于遠離方言邊界的B點而言,其全部有效知識溢出區域(圓E)均位于與己方使用相同方言的D2中,不存在因交流障礙而引致的有效知識溢出損失和信息溝通成本。因此,與遠離方言邊界的B點相比,鄰近方言邊界的A點在獲得知識溢出效益過程中受到方言邊界引致的交流障礙的負面影響,知識溢出水平較低。如前所述,知識溢出與創新之間存在正相關關系(Goncalves和Almeida,2009;Tseng,2009;Hoppmann,2018),信息溝通成本的增加惡化了創新環境、降低了研發投入效率。因此,交流障礙引致的知識溢出損失和信息溝通成本負擔加重會降低創新績效。

圖1 方言邊界示意圖
基于上述分析,本文提出研究假說1。
假說1:方言引致的交流障礙會抑制創新績效的提高。
如圖1所示,若要緩解或者消除方言邊界對創新的抑制效應,可以采取兩種方式:其一,推動A點向D2方言小片方向移動,增加A點與方言邊界C之間的最短垂直距離。隨著A點與方言邊界C之間最短垂直距離的增加,A點位于D1中的有效知識溢出區域持續縮減,有效知識溢出的損失程度逐漸降低。當A點能夠獲得的有效知識溢出區域(圓F)完全位于D2時,方言引致的交流障礙不再對A點的創新績效產生負面影響。其二,通過推行通用語言,消除語言交流過程中對方言的依賴。當方言邊界C完全消除時,D1和D2整合為統一的語言市場,交流障礙的創新抑制效應不復存在。基于上述分析,本文提出如下研究假說。
假說2:通過控制創新主體與方言邊界的地理距離,能夠減少甚至消除交流障礙的創新抑制效應。
假說3:通過推行通用語言和整合語言市場的方式減少交流障礙,有助于提高創新績效。
本文主要使用2010年縣級行政單位數據和工業企業數據來研究方言邊界引致的交流障礙對創新績效的影響,使用1995年至2012年的縣級行政單位數據考察在普通話立法背景下減少交流障礙對創新績效的影響。漢語方言數據來自中山大學嶺南學院徐現祥團隊根據《漢語方言大詞典》(許寶華和宮田一郎,1999)和《中國語言地圖集》(中國社會科學院和澳大利亞人文科學院,1987)整理得到的基于1986年中國行政區劃代碼標準下的2615個縣級行政單位的漢語方言數據。中國行政區劃曾經歷過復雜沿革,部分縣級行政單位在歷史演變中發生過拆分、合并、新設、被取締等情況。本文根據民政部和中國行政區劃網公布的歷年行政區劃代碼表和行政區劃沿革公告,將1986年縣級行政區劃代碼與2010年縣級行政區劃代碼匹配。然后,結合漢語方言數據得到基于2010年行政區劃代碼標準下的2632個①2632個擁有方言小片數據的縣級行政單位,約占2010年全國縣級行政單位總數的92.15%。其中,位于方言邊界的縣級行政單位占比為70.25%。剩余7.85%的無法獲得方言小片數據的縣級行政單位主要來自西藏自治區、內蒙古自治區和海南省,本文在研究中將這部分縣級行政單位剔除。含有漢語方言小片信息的縣級行政單位數據。縣級行政單位的專利申請數據是根據國家知識產權局發布的《中國專利數據庫文摘》(以下簡稱“專利數據庫”)整理而來。專利數據庫記錄了1995年至2012年全國所有科研單位、機關團體、大專院校、工礦企業、個人及其他六類專利申請主體的全部國內專利申請數據,包括專利申請類型、專利申請時間以及專利申請主體的詳細地址等關鍵信息。本文基于專利申請主體的詳細地址,利用高德地圖API開放平臺完成對每一條專利所屬縣級行政單位的精準識別,分年份在縣級層面進行加總,最終得到各年份各縣級行政單位專利申請數據。佛教寺廟數據來自哈佛大學地理分析中心(Center for Geographic Analysis)開發的全球地理信息數據庫②全球地理信息數據庫網址為http://worldmap.harvard.edu。。該數據庫收錄有中國古代遺址遺跡、自然災害、社會人口、能源環境以及民族語言等數據,其中包括本文研究所使用的1820年中國佛教寺廟分布矢量圖。工業企業數據來自國家統計局發布的中國工業企業數據庫,包含規模以上企業詳細的財務信息。本文依據企業名稱和地址將工業企業數據庫與專利數據庫合并,得到包含專利申請信息的工業企業數據。各縣級行政單位夜間燈光數據取自美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration)發布的全球夜間燈光柵格數據,PM2.5數據來自美國國家航空航天局(National Aeronautics and Space Administration)和哥倫比亞大學聯合發布的全球PM2.5柵格數據。縣級行政單位的區域面積、河流長度、鐵路長度等數據取自中華人民共和國自然資源部提供的全國1∶100萬基礎地理數據庫。人口總數和教育從業人員數量等數據來自2010年第六次全國人口普查分縣數據庫。“省直管縣”數據來自各省份頒布的關于“省直管縣”財政管理體制改革的相關文件①例如,2007年甘肅省頒布的《甘肅省實行省直管縣財政管理體制改革試點方案》中明確規定,甘肅省榆中縣等16個縣市自2007年開始實行“省直管”。。
本文采用如下基準回歸模型考察方言邊界對創新績效的影響:

lnpatenti代表各縣級行政單位的創新水平,用各縣級行政單位專利申請數量的對數測度。d iaboundaryi是本文的核心解釋變量“方言邊界”,識別各縣級行政單位是否毗鄰方言邊界。若是則該值取1,否則取0。Xi為縣級層面的控制變量,主要包括省界效應、夜間燈光亮度、人口數量、“省直管縣”、民族自治縣、河流密度、鐵路密度、區域面積、省份層面固定效應以及方言區固定效應。省份邊界通常是各省政府治理的“盲區”。在分權體制下,地方政府策略性減少省份邊界地區的交通基礎設施投資(唐為,2019),可能對創新產生抑制效應。因此,本文引入“省界效應”變量,如果某縣級行政單位位于省份邊界,則該變量取值為1,否則為0。夜間燈光亮度用以控制各縣級行政單位經濟發展水平,已有研究證實夜間燈光數據是區域經濟活動的良好替代指標(Henderson等,2012)。由于人員數量較多的地區更易迸發新思想,因而本文控制了各縣的人口數量。各省份實行的“省直管縣”改革策略賦予了部分縣級行政單位特殊的行政地位,受“省直管”的縣級行政單位在財政審批、行政審批等方面繞過地級政府,直接受省級政府管轄。對此,本文在回歸模型中引入“省直管縣”虛擬變量,如果截至2010年某縣級行政單位受到“省直管”,則該變量取值為1,否則為0。考慮到中國長期推行的民族區域自治政策賦予少數民族集聚地區更高的自治權以及少數民族地區使用的語言通常為民族語,少數民族地區可能在對外連通和信息傳遞方面存在更高障礙,因而本文在回歸模型中引入“民族自治縣”虛擬變量,如果某縣級行政單位屬于民族自治縣,則該變量取值為1,否則為0。各縣級行政單位河流和鐵路狀況影響其內部的連通和整合程度,進而影響內部創新交流,所以本文控制了河流密度和鐵路密度,其中河流密度使用河流長度與縣級行政區域面積的比值測度,鐵路密度使用鐵路長度與縣級行政區域面積的比值測度。最后本文在回歸中引入了各縣級行政單位區域面積,以控制各縣級行政單位在地理面積上的差異。εi為隨機誤差項。
值得注意的是,本文研究的出發點在于毗鄰方言邊界的地區比遠離方言邊界的地區存在更高的交流障礙,進而導致創新水平存在差異。例如,對于一個臨近方言邊界的縣級行政單位而言,其一部分鄰縣與其自身處于不同的方言小片,因而知識溢出會受到方言壁壘阻隔;而對于一個遠離方言邊界的縣級行政單位而言,其鄰縣皆與其自身處于相同的方言小片,知識溢出相對通暢。應當指出的是,盡管知識溢出具備地理局限性,鄰縣在知識溢出的過程中非常重要,但并不意味著相距較遠的個體之間不會開展創新交流。屬于同一方言區或者同一省級行政區的創新主體因語言障礙或者行政制度差異而受到的交流障礙通常較弱,因而創新交流也可能更為頻繁。換句話說,如果某縣級行政單位所在方言區或者省級行政區規模較大,其通常可能有更多的創新交流對象,也就更具創新優勢。對此,本文在回歸中控制省份固定效應φp和方言區固定效應θq。本文的主要變量描述性統計如表1所示。

表1 主要變量描述性統計
本文基準回歸結果見表2。

表2 方言邊界的創新抑制效應
表2回歸結果表明,在不引入控制變量時方言邊界變量的系數顯著為負,即相較于遠離方言邊界的縣級行政單位,毗鄰方言邊界的縣級行政單位的創新績效受到抑制。引入控制變量緩解遺漏變量引致的內生性問題后,方言邊界變量的系數值有所下降,但依然在1%水平上顯著。由此可見,方言邊界對創新確實存在抑制效應,本研究假說1成立。在控制變量方面,省界效應(proboundary)、是否屬于省直管縣(promanage)、河流密度(river)、是否屬于民族自治縣(minority)以及區域面積對數(lnspace)等變量與創新績效水平負相關;以夜間燈光亮度對數測度的經濟發展水平(lnlight)、人口數量對數(lnpopulation)以及鐵路密度(rail)等變量與創新績效正相關。
1. 排除偶然性因素干擾
本文使用2010年的縣級行政單位截面數據完成基準回歸,但各縣級行政單位單一年份的專利申請可能受到創新環境變化的影響,導致本文的研究結論受單一年份偶然性因素干擾。因此,本文分別采用2009年至2011年縣級行政單位專利申請總量的三年均值和2008年至2012年縣級行政單位專利申請總量的五年均值,來替代2010年縣級行政單位專利申請總量,重新進行回歸,結果見表3第(1)列和第(2)列。

表3 穩健性檢驗
2. 替換被解釋變量測度指標
前文中主要使用各類專利的總量測度創新水平,為了進一步驗證本文的研究結論不受創新測度指標差異的干擾,本部分分別選取人均專利申請數量、是否為“全國縣市科技進步考核先進縣”(是則取值為1,否則為0)、是否為“國家級高新技術開發區坐落地”(是則取值為1,否則為0)重新測度各縣創新水平。人均專利申請數量能夠有效反映縣級行政單位的平均創新水平,全國縣市科技進步考核是中華人民共和國科技部針對全國縣級行政單位開展的創新進步水平綜合檢測,國家級高新技術開發區的科技創新代表著高水平的區域科技創新。因此,選取這三大指標作為被解釋變量的測度指標具有一定的合理性,回歸結果見表3第(3)列至第(5)列。
3. 替換核心解釋變量測度指標
本文采用如下方式替換核心解釋變量的測度指標。首先,前文研究中利用縣級行政單位是否位于方言邊界識別交流障礙區,換句話說,利用縣級行政單位是否存在與己方使用不同方言小片的鄰縣作為交流障礙的測度指標。然而,對于不同的縣級行政單位而言,其鄰縣中與己方使用不同方言小片的鄰縣數量占比不盡相同。例如,安徽省祁門縣的五個鄰縣(休寧縣、黟縣、東至縣、石臺縣和浮梁縣)均與祁門縣使用不同的方言小片,所以祁門縣的鄰縣中與己方使用不同方言小片的鄰縣比例為100%。山西省保德縣的四個鄰縣中,僅有興縣與之使用不同的方言小片,所以保德縣的鄰縣中與己方使用不同方言小片的鄰縣比例為25%。本部分利用“鄰縣中與己方使用不同方言小片的鄰縣數量占比”(div1)替代“方言邊界”變量,重新考察方言差異引致的交流障礙對創新績效的影響,結果見表3第(6)列。其次,考慮到屬于同一方言片的不同方言小片之間通常交流難度較低,而屬于不同方言片的不同方言小片之間交流難度較高,所以本文利用“鄰縣中與己方使用不同方言片的鄰縣數量比例”(div2)作為核心解釋變量,再度檢驗本文研究結論,結果見表3第(7)列。最后,考慮到地級市層面的方言多樣性同樣能夠表征方言差異引致的交流障礙,本文參考徐現祥等和潘越等使用“地級市內部的次方言數量”(div3)和方言分化指數(div4)構造方言多樣性指標,并以此替換核心解釋變量,再次考察交流障礙對創新績效的影響,結果見表3第(8)列和第(9)列。
在上述穩健性檢驗基礎上,本文的核心研究結論始終成立,方言引致的交流障礙對創新存在顯著抑制效應。
歷史語言學家認為,語言每千年的核心詞保有率大概為85%(蘇三,2010),即語言的蛻變、分離和異化需要相當長的時間積淀。基于歷史語言學家的這一觀點,歷史上成形的方言邊界應當在相當長的時間里保持穩定,本文的研究存在反向因果的可能性不大。考慮到本文使用截面數據開展回歸分析,所以遺漏變量偏誤導致的內生性問題是本文研究結論面臨的主要威脅。對此,本文通過引入其他控制變量和采用工具變量估計兩種方式,緩解遺漏變量可能導致的內生性問題。
第一,引入其他控制變量。其一,歷史文化水平(culture)。為了充分控制可能的歷史文化因素的干擾,本文參考唐為(2019)使用各縣級行政單位的全國重點文物保護單位數量來控制歷史文化水平,回歸結果見表4第(1)列。其二,空氣污染狀況(PM2.5)。空氣污染影響個體健康與情緒狀況,顯著降低個體的創新活力程度;發明人更傾向于向環境質量優良的城市流動,遠離環境污染嚴重的城市(羅勇根等,2019)。所以,本文使用美國國家航空航天局與哥倫比亞大學聯合發布的全球PM2.5分布柵格數據,結合ArcGIS軟件獲得2010年中國各縣級行政單位PM2.5數據,來測度各縣級行政單位的空氣污染狀況,回歸結果見表4第(2)列。其三,教育發展水平(edu)。教育發展水平影響地區創新能力,所以本文使用各縣級行政單位的教育從業人員數量和人口總量的比值作為各地教育發展水平的代理變量,來控制教育發展水平對本文研究結論的干擾,回歸結果見表4第(3)列。其四,是否位于地級市邊界(cityboundary)。本文在基準回歸中已經控制省份邊界效應,減少了行政區劃邊界對本文研究的干擾。為了進一步控制行政區劃邊界的影響,本文引入“是否位于地級市邊界”虛擬變量。如果縣級行政單位位于地級市邊界,則該變量取值為1,否則為0,回歸結果見表4第(4)列。其五,創新水平的空間相關性。本文使用空間自回歸模型考察創新水平的空間相關性影響①空間加權矩陣根據各縣是否在地理上接壤來構建,如果兩縣相鄰,空間加權矩陣中對應元素賦值為1,否則賦值為0;空間自回歸模型的估計方法采用極大似然估計。,控制變量包括本文基準回歸中使用的所有控制變量,以及進一步引入的歷史文化水平、空氣污染狀況、教育發展水平、是否位于地級市邊界等變量,回歸結果見表4的第(5)列。在控制以上干擾因素后,方言邊界依然顯著抑制創新績效。

表4 內生性討論:增加其他控制變量
第二,采用工具變量估計。盡管前文已經從政治、經濟、人文、交通、地理、環境以及教育等諸多方面對影響創新的其他因素進行控制,但仍然難以窮盡所有的遺漏變量,因而本文采用1820年中國各縣佛教寺廟的數量(temple)作為“方言邊界”變量的工具變量對本文核心結論做進一步檢驗。如此選擇工具變量的原因在于:第一,歷史上,佛教傳教活動在中國開展的時間早且影響大。佛教傳教高度依賴于人員流動和語音互譯,因而佛教傳教活動越活躍的地區,其形成共同語言的可能性越大。具體而言:早在西漢哀帝元年(公元前2年),佛經《浮屠經》便開始在中國宮廷供奉。西晉時期(公元265年至316年),中國境內的佛寺已經達到約180所,3700余名僧尼從事佛教傳播活動(林寶卿,2000),僧尼人口約占西晉時期總人口的萬分之二點五。長期以來,佛教傳教使用的梵語對漢語音韻和詞匯的構建產生深遠影響(林寶卿,2000),佛教僧尼在不同地區的傳教活動搭建起不同地區之間語音互通的橋梁。此外,佛教的傳播高度依賴于“梵漢對音”,即梵語與漢語的口音、口語互譯。這其中便出現大量梵語與漢語方言的對音,比如,佛典在漢語方言“吳音區”便結合“吳音”特點進行對音與釋義(儲泰松,2014)。梵語與各種方言之間的對音推動佛教傳教地區語音語義趨同。由此可見,歷史上長期存在的佛教傳教活動對方言區的形成存在不容忽視的影響。考慮到佛教寺廟是佛家僧尼傳教的集中地,因此各縣佛教寺廟數量工具變量與方言邊界內生解釋變量存在相關關系,工具變量相關性(Instrumental relevance)條件得到滿足。第二,時間正序發展且不可逆的自然規律決定了現如今的經濟活動不會影響歷史事件。因此,1820年佛教寺廟的建設并不受本文研究時點2010年的各項因素干擾,工具變量外生性(Instrumental exogeneity)條件得到滿足。工具變量估計結果見表5的第(1)列和第(2)列。其中,第(2)列的兩階段最小二乘估計第一階段回歸結果表明,歷史上的佛教傳教活動顯著弱化了方言的邊界效應,即歷史上傳教越活躍的地區,使用同一方言的可能性越大;第(1)列的兩階段最小二乘估計第二階段回歸結果顯示,“方言邊界”變量估計系數符號及顯著性與基準回歸一致,系數絕對值略有上升,即方言邊界確實降低了毗鄰縣的創新績效。同時,工具變量“佛教寺廟”的F統計量為14.823,高于弱工具變量檢驗的臨界值10(Staiger和Stock,1997),因此不存在弱工具變量問題。

表5 工具變量估計
1. 專利申請主體異質性
專利申請主體包含科研單位、機關團體、大專院校、工礦企業、個人及其他六類。《國家通用語言文字法》對六類創新主體使用普通話的要求程度存在差異:要求機關團體及學校等教育科研單位以普通話為日常用語用字,要求企業在名稱設置時必須采用國家通用語言文字,而對于公民個體則僅僅強調其具有學習和使用國家通用語言的權利,且具有使用和發展本民族語言文字的自由。法律對不同創新主體使用國家通用語言文字的差異化要求,導致普通話在不同創新群體中推廣和使用程度存在差異,進而導致不同群體開展創新交流時受到方言引致的交流障礙的影響程度不同。本文將科研單位、機關團體及大專院校定義為“院校機關”,將工礦企業單獨列示,將個人和其他統一歸入“個人主體”,進而以之考察方言的創新抑制效應對不同的創新主體是否存在差異化影響,回歸結果見表6的第(1)列至第(3)列。該回歸結果表明,院校機關的創新績效受到方言邊界的抑制作用最小,工礦企業次之,而個人和其他主體受其影響最大。因此,普通話普及程度越高的創新群體,受到方言邊界的創新抑制效應越小。
2. 專利申請類型異質性
專利類型包括發明專利、實用新型專利和外觀設計專利。相較于外觀設計專利而言,發明專利和實用新型專利的研發門檻更高,研發周期更長,因而對語言的使用和依賴程度也更高。這可能會導致方言邊界對不同類型的專利申請產生差異化的影響。對此,本文分別考察了方言邊界對縣級行政單位的發明專利、實用新型專利和外觀設計專利申請狀況的影響,回歸結果見表6的第(4)列至第(6)列。其回歸結果表明,方言邊界對發明專利和實用新型專利申請的抑制效應相對較大,對外觀設計專利的抑制效應較小。因此,對語言的使用和依賴程度越大的創新活動,受到方言邊界的創新抑制效應越大。

表6 異質性分析
如前所述,方言引致的交流障礙會降低創新績效。按此邏輯,減少或者消除交流障礙有助于提升創新績效。然而,方言作為歷史長期演化的產物不會在短期內發生較大程度的變動(蘇三,2010),因而難以考察方言邊界的變動對創新績效的影響。幸運的是,盡管方言邊界難以變動,但可以借助創新主體與方言邊界之間地理距離的差異識別創新主體受到交流障礙抑制的程度,以此檢驗減少交流障礙能否提升創新績效。不僅如此,推行國家通用語言是破除交流障礙的有效手段。2001年頒布的《國家通用語言文字法》確立了普通話作為“國家通用語言”的法律地位,要求機關單位和學校等教育單位使用普通話作為基本用語(全國人民代表大會,2000)。同時,該法規定少數民族自治地區的機關單位和學校等教育單位在運行過程中有權使用民族語言代替普通話。法律對普通話使用和推廣的差異化規定,使得民族自治地區的機關單位和學校等教育單位受到的普通話立法沖擊明顯弱于非民族自治地區,因而為本文借助雙重差分法考察減少交流障礙如何影響創新績效提供了一個準實驗。
本文使用規模以上工業企業微觀數據考察地理距離變化對創新績效的影響。考慮到2010年工業企業數據庫存在大量的企業關鍵財務信息缺失,本文使用國家統計局發布的2009年中國工業企業數據與專利數據庫匹配后得到新的數據集,以之檢驗方言邊界抑制創新的作用距離。其具體操作如下:首先,根據工業企業數據庫中的企業詳細地址,利用高德地圖API開放平臺識別各個企業的經緯度坐標。其次,利用ArcGIS軟件和漢語方言矢量地圖識別方言邊界某一最短垂直距離范圍內的企業。本文以10公里為級數,分別識別企業至方言邊界的最短垂直距離為0公里~10公里、10公里~20公里、20公里~30公里、30公里~40公里、40公里~50公里以及50公里以外的企業。最后,在控制企業層面因素和企業所在地區層面因素前提下,檢驗增加與方言邊界之間的地理距離以減少企業面臨的交流障礙之后企業創新績效的變化情況。企業層面的控制變量包括企業規模、資產負債率、是否出口、增值稅利潤比以及企業所在行業,縣層面的控制變量與前文回歸一致。
表7回歸結果表明,方言邊界顯著抑制企業創新,且隨著企業與方言邊界之間距離增加,方言邊界變量系數絕對值遞減,即方言邊界對企業的創新抑制效應遞減,本文的研究假說2成立。以最能代表企業創新水平的發明專利為例,當距離方言邊界超過20公里之后,方言邊界對企業創新的抑制效應消失;當距離方言邊界超過40公里之后,方言邊界對企業創新績效的抑制效應不再顯著。

表7 邊界效應抑制創新的作用距離
如前所述,《國家通用語言文字法》要求機關單位和學校等教育單位以普通話作為工作語言,也規定民族自治地區的機關單位和學校等教育單位有權使用民族語言代替普通話①《國家通用語言文字法》第一章第八條規定:“少數民族語言文字的使用依據憲法、民族區域自治法及其他法律的有關規定”。同時《民族區域自治法》第三章第二十一條規定:“民族自治地方的自治機關在執行職務的時候,依照本民族自治地方自治條例的規定,使用當地通用的一種或者幾種語言文字;同時使用幾種通用的語言文字執行職務的,可以以實行區域自治的民族的語言文字為主”,其第三十七條規定:“招收少數民族學生為主的學校(班級)和其他教育機構,有條件的應當采用少數民族文字的課本,并用少數民族語言講課”。《教育法》第一章第十二條規定:“民族自治地方以少數民族學生為主的學校及其他教育機構,從實際出發,使用國家通用語言文字和本民族或者當地民族通用的語言文字實施雙語教育”。。普通話立法可以視作對語言交流環境的外生沖擊,受到立法沖擊強度較大的非民族自治地區的機關單位和學校等教育單位被強制要求使用普通話作為工作語言,而受到立法沖擊強度較小的民族自治地區的機關單位和學校等教育單位有權使用民族語言而非普通話作為工作語言。本文以民族自治縣為對照組,以與對照組樣本接壤的非民族自治縣為實驗組,使用1995年至2012年各縣的機關單位和學校等教育單位的專利申請數據,考察減少交流障礙如何影響創新績效①選擇1995年至2012年數據時段開展研究的原因在于,國家知識產權局發布的《中國專利數據庫文摘》數據截止年份為2012年,所以選擇2012年作為研究的截止年份。考慮到開展雙重差分法的平行趨勢檢驗必須保證事件沖擊之前留有足夠的年份考察實驗組和對照組在創新方面的發展趨勢,本文的事件沖擊年份為2001年,故選擇該年份之前6年的1995年作為研究的初始年份,便于完成相關檢驗。最終,本文得到120個實驗組樣本和383個對照組樣本連續18年的數據,構成平衡面板數據開展分析。各縣的機關單位和學校等教育單位的專利申請數據來自國家知識產權局發布的《中國專利數據庫文摘》,本文將《中國專利數據庫文摘》中的機關團體、科研單位和大專院校等專利申請主體定義為機關單位和學校等教育單位。。這種實驗組和對照組的選擇方式有如下優勢:第一,《國家通用語言文字法》頒布年份為2001年,同年中國加入世界貿易組織。加入世界貿易組織主要對中國企業(尤其是外貿企業)造成沖擊。因此,選擇各縣的機關單位和學校等教育單位的專利申請數據測度創新水平可以規避“入世沖擊”對本文研究結論的干擾。第二,知識溢出具有地理局限性,地理上鄰近的創新主體之間的有效創新交流相對更高,因而地理上接壤的縣級行政單位的創新水平在普通話立法前更可能保持相同的發展趨勢,雙重差分法需要滿足的平行趨勢假定更容易滿足。第三,地理鄰近的縣級行政單位在政治、經濟、文化等方面的特征更為接近,影響創新的其他因素在一定程度上得以控制。
本文的雙重差分模型構建如下:

lnpatentit代表各縣的機關單位和學校等教育單位的專利申請數量的對數。Treati用以識別各縣是否受到普通話立法沖擊,如果是則取值為1,否則為0;P ostt用以識別普通話立法沖擊年份,2001年之前取值為1,2001年及之后取值為0。Xit為控制變量,主要控制縣級行政單位的經濟狀況和環境狀況。經濟狀況用夜間燈光亮度測度,環境狀況用PM2.5排放量測度。υi和ηt分別為縣固定效應和年份固定效應,用以控制不隨時間變動的縣級行政單位特征和時間趨勢。εit為隨機擾動項。其回歸結果見表8。表8第(1)列回歸結果表明,普通話立法顯著提高創新績效,本文的研究假說3成立。表8第(2)列至第(4)列的回歸結果表明,分別使用發明專利申請量(對數)、實用新型專利申請量(對數)和外觀設計專利申請量(對數)替代專利申請總量(對數),前述結論仍然成立。

表8 普通話立法與創新績效
圖2展示了普通話立法促進創新的動態效果。其動態效果表明,在2001年《國家通用語言文字法》生效之前,系數值ωk的數值大小基本保持穩定;置信區間全部穿越零點,系數值ωk趨近于零且不顯著。這表明實驗組與對照組的創新水平在2001年之前并無顯著差異,雙重差分模型必須滿足的平行趨勢假定成立。2001年《國家通用語言文字法》生效之后,直至2004年實驗組和對照組之間依然沒有表現出顯著差異,政策的時滯效應明顯。2005年起,普通話立法政策效應開始顯現,實驗組的創新水平相較于對照組顯著提高。特別需要注意的是,2005年至2009年期間實驗組和對照組的創新水平差異呈現擴大趨勢。這表明,普通話立法對創新的促進效應具有多期性。從2010年開始,實驗組和對照組之間創新水平差異的擴大趨勢有所收斂。這表明,普通話立法對創新的促進效應強度隨著時間推移逐漸衰弱。

圖2 普通話立法促進創新的長期動態效果
本文通過靜態分析和動態分析兩種方法系統考察了交流障礙對創新績效的影響。靜態分析方面,利用2010年縣級層面的專利申請數據,使用方言邊界識別交流障礙,探討了交流障礙的創新抑制效應。動態分析方面,利用2010年企業層面的專利申請數據以及1995年至2012年縣級層面的專利申請數據,使用創新主體和方言邊界之間地理距離的差異以及普通話立法沖擊識別交流障礙的動態變化,分析了減少交流障礙如何影響創新績效。本文的研究可以得出如下結論,方言引致的交流障礙顯著抑制了創新。在排除偶然性因素干擾以及替換核心解釋變量和被解釋變量測度指標的情況下,這一結論仍然成立。為了消除內生性問題,本文引入大量的控制變量,從政治、經濟、人文、交通、地理、環境以及教育等諸多方面對影響創新的其他因素進行控制。不僅如此,采用工具變量估計再次檢驗本文的核心研究結論,結論保持穩健。本文的異質性分析表明,普通話普及程度越高的創新群體,受到方言邊界的創新抑制效應越小;對語言交流依賴越大的創新活動,受到方言邊界的創新抑制效應越大。本文的動態分析表明,隨著創新主體與方言邊界地理距離的增大,方言引致的交流障礙對創新的抑制效應遞減;通過推廣普通話減少了交流障礙,能夠顯著提升創新績效。
本文的研究結論具有如下啟示。隨著中國經濟步入新常態,加快發展方式轉型和實現創新驅動發展迫在眉睫。在此背景下,我們應將優化創新生態、培育創新動能列為工作的重中之重。本文認為,在現階段的中國,方言引致的語言交流障礙依然普遍存在,并對創新產生明顯抑制作用。因此,政府在優化創新生態過程中應當關注國內的語言交流環境,加大語言交流障礙的破除力度。大力推廣和普及國家通用語言普通話,著力解決普通話普及過程中涌現的“地方普通話”問題,推動國內語言統一。企業是推動創新發展的排頭兵,作為微觀主體的企業在“選址”和“遷址”的過程中應充分考慮外部語言交流環境對自身創新的影響,合理控制企業地址與方言邊界之間的地理距離,最大程度降低語言交流障礙對自身創新發展的阻礙程度。