臧 維,張延法,徐 磊
(北京工業大學 經濟與管理學院,北京 100124)
隨著人工智能基礎理論和核心技術的快速發展,人工智能逐漸成為推動我國新一輪產業變革的關鍵驅動力,我國政府緊跟變革新趨勢,不斷出臺相關政策,將發展人工智能作為提升我國綜合實力的重要戰略。自2015年《中國制造2025》發布以來,我國人工智能產業進入快速發展階段。2016年5 月,《“互聯網+”人工智能三年行動實施方案》提出我國人工智能產業在2018 年要達到千億元規模。2017年7月,國務院進一步印發《新一代人工智能發展規劃》,對我國人工智能發展作出“三步走”戰略部署,讓我國人工智能理論、技術和應用在2030年總體達到世界領先水平。2018年1月,《人工智能標準化白皮書(2018版)》正式發布,宣布成立國家人工智能標準化總體組,推行我國人工智能標準化工作。這一系列相關政策的發布與實施不僅將我國人工智能發展上升為國家戰略,而且進一步推動了我國人工智能產業健康快速發展。
人工智能政策不僅涉及理論指導,而且還涉及技術應用與產業發展,政策內涵十分豐富。當前,我國關于人工智能政策的研究大多傾向于政策現狀分析,而結合未來產業發展趨勢,從前沿趨勢中發現政策缺口的研究較少[1-2]。在人工智能快速崛起之際,厘清相關政策脈絡對于促進人工智能發展具有重要意義。因此,本文圍繞我國人工智能相關政策展開分析,重點探討以下問題:①我國政府部門出臺了哪些政策? 政策內容側重于哪些方面? ②使用了哪些政策工具? 實現了怎樣的政策目標? ③當前政策評價結果如何?④我國人工智能前沿趨勢側重于什么?今后出臺的相關政策建議應注意什么?
文本挖掘主要是從大量無結構的文本信息中發現潛在存在的聯系與規律,從中提取有效、可利用的分布在文本信息中有價值的內容,利用這些內容重新組織成更有價值的信息[3]。近年來,文本挖掘在文本分析中應用比較廣泛,其與特定領域的結合逐漸成為當前研究重點[4]。隨著大數據技術的應用,文本挖掘技術不斷成熟,文本挖掘在政策文本研究方面的應用越來越多,國內已有大量學者利用文本挖掘對政策類文本進行分析。袁利平等[5]利用文本挖掘對美國人工智能教育戰略進行研究,提煉出智能教育產業發展重點策略,為政府完善智能教育政策提供了現實指導;湯志偉等[6]基于文本挖掘對中美人工智能產業政策進行對比分析,發現中美兩國人工智能政策在政策目標、政策工具和政策執行方面存在差異,有利于政府更好地把握未來人工智能政策制定方向。文本挖掘以自身獨特優勢成為政策研究的重要分析工具。據此,本文從文本挖掘出發,對我國人工智能政策展開量化研究。由于文本挖掘使用的算法、詞庫、計算工具不同,所得到的語義分析結果也不同,因此需根據政策文本研究特點選擇合適的文本挖掘模型。
政策工具是政策制定者為實現政策目標而采取的政策干預[7]。在政策研究領域,政策工具是關于政策分析的工具科學,是政策科學的結構性理論。張永安等[8]認為,政策工具共同整合形成政策,政策反映了政府的政策價值和治理理念。
政策工具是政策分析的基礎模塊,政策工具維度劃分直接影響政策目標的實現[9]。研究角度不同,對政策工具的定義和維度劃分也不同,最經典的劃分方式由Rothwell & Zegveld[10]提出,其將政策工具劃分為供給型、環境型和需求型三大維度。另外一些學者從政府對資源的利用角度出發,將政策工具劃分為信息型、組織型和財政型三大維度[11]。Hoppmann等[12]根據政策工具作用層面差異,將政策工具劃分為戰略層、綜合層和基本層三大維度;湯志偉等[13]從政策工具和創新價值鏈兩個維度對我國地方政府出臺的人工智能產業政策進行文本分析,揭示兩個維度下政策工具的使用效度;毛子駿等[14]以政策工具為基礎,對5個國家的人工智能政策進行系統對比分析,發現不同國家對政策工具的使用存在差異。當前,學者對政策工具的研究較多,但研究內容不夠豐富,針對人工智能政策工具的研究仍需補充和完善。由于政策研究角度不同,政策內容研究側重點和方向也不同,面對錯綜復雜的維度劃分類型,對政策工具的適應性提出了更高要求。Rothwell & Zegveld的劃分方式綜合考慮政府干預手段和干預程度,且對二級政策工具的劃分比較符合現實情況,可以更好地闡述政策工具與人工智能政策的作用關系,因此本文采用這種政策工具維度劃分方法。
政策評價是指使用一系列研究方法系統衡量和判斷政策干預、實施的有效性,并確定其在改善不同利益相關者方面的社會價值和經濟價值[15]。政策評價最早在第一次世界大戰前的教育和公共衛生計劃中提出(楊雅南等,2013)。20世紀70年代以后,政策評價逐漸從社會科學評價中開辟出獨立研究領域。Suchman最初創建了政策評價五類評估法,隨后Poland創立了“三E”評估框架,之后Wollmann又提出經典政策評價[16],政策評價以實證方式不斷發展演進。這種不斷演進的政策評價方法雖然具有一定的科學性、合理性,但同時也展現出某些不足,而評價標準和程序是影響政策評價效果的重要因素,因此只有選擇科學合適的政策評價方法才能保證政策評價結果的真實性和準確性[17]。在已有的政策量化評價模型對比中,PMC 指數模型最突出。PMC指數模型的各項參數主要由文本挖掘提取,特別是對二級變量的提取能夠極大程度上減少人為主觀評價的影響,提高量化評價準確度;PMC指數模型以政策文本自身為研究對象,比以往的事后評價模型更加聚焦于政策內容;PMC指數模型不僅可以對某一政策進行量化評價,而且能夠對多個不同政策進行比較分析。胡峰等[18]基于PMC指數模型,對8項機器人產業政策文件進行量化評價,為機器人產業政策制定、調整、完善提供了重要支撐和決策依據。因此,本文利用PMC 指數模型和文本挖掘對人工智能產業政策進行量化評價,分析各項政策的優勢和不足,以豐富現有政策量化評價研究。
研究前沿最早由Price[19]提出,指在某一特定研究領域,作者積極引用近期文獻集合所代表的研究領域就是研究前沿。研究前沿的本質是某一特定研究主題或領域能夠在短時間內引起學者高度關注,其代表了未來發展熱點與趨勢[20]。識別研究前沿的方法主要有兩種:基于專家的方法和基于計算機的方法。其中,基于專家的方法就是用專家知識識別研究前沿,由于專家知識主觀性太強,無法保證研究前沿的準確性,因而逐漸被淘汰。而基于計算機的方法是利用計算機對文獻進行分析和挖掘快速識別研究前沿。當前,基于計算機的識別方法主要有兩種:基于引用關系的方法和基于文本內容的方法[21]。研究前沿能夠在短時間內引起學者共同關注,與之相關的文章也會被其它學者積極引用,進而導致引文網絡變化。研究前沿代表新的研究發現和進展,新研究必然引發文本內容的顯著變化。在當前研究前沿方法中無論采用哪種方法都無法避免方法自身的局限性。使用基于引用關系的方法時,引文層面聚類分析會出現引用時間與被引時間上的不一致,這種不一致會影響識別的準確性[22]。使用基于文本內容的方法時,由于單詞短語具有多種語境含義,在不同語境中單詞短語的語義不同,僅基于文本內容分析并不能完整表達文本中所隱含的所有信息,從而影響研究前沿識別的完整性[23]。由此可見,單獨使用某一方法無法準確識別研究前沿。因此,許多學者將兩種方法結合起來綜合形成基于復合關系的方法,有效發揮了兩者優勢,彌補了兩者的不足。王云等[24]使用復合關系法探究我國城鎮化研究進展與趨勢,本文也采用這種基于復合關系的探測方法識別我國人工智能研究的前沿趨勢。
為保證樣本數據的權威性和準確性,本文選取的政策文本來源于國務院、國家部委及各省政府部門官網。在人工智能政策文本檢索與選取過程中,本文主要遵循以下原則:①以“人工智能”為關鍵詞進行政策文本檢索,要求政策文本標題包含“人工智能”關鍵詞,且是針對人工智能發展而制定的政策內容;②要求政策文本發文機構為中央政府及各省政府,所選取的政策文本類型為法律法規、規劃、通知、計劃、意見和行動綱要等。根據以上檢索過程和原則,本文共收集與人工智能相關的政策文本30份,如表1所示。

表1 人工智能政策文本
首先,將收集到的30份人工智能政策文本導入文本分析軟件ROSTCM6進行分詞處理;其次,對處理后的政策文本提取高頻主題詞,得到人工智能政策文本詞頻分布,如表2所示。

表2 人工智能政策詞頻分布
對政策文本高頻主題詞進行分析能夠快速聚焦政策文本核心內容。表2數據顯示,我國人工智能政策文本高頻主題詞為智能、人工智能、技術、發展、應用和創新等。這些高頻主題詞反映出我國當前人工智能政策的重點在于人工智能技術創新應用與發展。通過表中其它高頻主題詞可以發現:①政府非常重視企業人工智能平臺搭建,人工智能平臺搭建是人工智能技術發展與應用的前提,政府推動建設平臺可為人工智能發展與應用提供保障;②政府重點工作是推進人工智能人才發展和科技研究。人才發展和科技研究是人工智能技術發展與應用的基礎,政府對人才服務的保障能夠加快人工智能技術科技研發;③政府鼓勵建立人工智能項目示范區,并積極培育人工智能發展環境。
語義網絡分析將人工智能政策中的高頻主題詞以網絡形式組合起來,用圖像形式直觀反映各高頻主題詞之間的結構關系。在語義網絡圖中,高頻主題詞由節點表示,節點大小代表度數中心性強弱。一個節點連接其它節點的數量越多,該節點的度數中心性越強,說明該節點越重要,語義網絡分析結果如圖1所示。

圖1 主題詞語義網絡
從中可見:①智能和人工智能方形圖塊最大,度數中心性最強,與其它主題詞的連接最多,為政策文本的核心主題詞,表明本文收集的政策文本內容均圍繞發展人工智能展開;②較為核心的主題詞為圓形圖塊所代表的技術、應用、發展和創新,這些主題詞體現出我國人工智能政策的目的在于推進人工智能技術創新應用與發展;③由平臺、建設、領域、服務和企業等田字圖塊還可以看出,我國人工智能政策為推動企業人工智能發展和建設提供一系列保障,注重服務領域和服務體系布局,以保障人工智能快速發展。
本文以Rothwell & Zegveld對政策工具的定義為基礎,結合我國人工智能產業政策制定的實際條款內容,參考呂文晶(2019)的政策工具劃分方法,提出本文關于政策工具的維度劃分,如圖2所示。本文將30份政策文本按照“政策編號-章節/條款”進行編碼,統計出我國人工智能政策工具,如表3所示。

表3 人工智能政策工具統計

圖2 政策工具維度劃分
政策工具統計結果顯示,本文選取的30份人工智能政策文本涵蓋3類政策工具,從政策工具條文分布看,人工智能政策以供給型政策工具為主,占62.16%;其次是環境型政策工具,占27.93%;占比最少的是需求型政策工具,僅占9.91%。
當前,我國人工智能政策工具主要集中在供給型政策工具和環境型政策工具兩個方面。其中,在供給型政策工具中,教育培訓占比最大,表現出國家對人工智能領域相關人才培養的高度重視;其次是信息支持,政策鼓勵人工智能產業信息發展,包括基礎設備設施建設和互動網絡建設等;此外,科技支持與財政支持占比相同,政府通過建設重點學科實驗室、組建項目研究組等支持人工智能技術發展。在環境型政策工具中,我國人工智能政策主要通過目標規劃引導人工智能發展,如產業布局和技術發展規劃等;法規管制和知識產權占比相差不大,表現在設立人工智能產業相關法律標準和監管制度上。環境型政策工具結構比例表明,政策工具缺少市場化金融激勵手段,環境型政策工具結構亟需調整。在需求型政策工具中,目前人工智能政策只采用服務外包和海外機構兩種政策工具拉動人工智能產業發展,且數量占比較少,政策工具使用不足。
PMC指數模型以Mobilis假說為指導思想,由Ruiz Estrada等[25]提出。該假設指出事物都是運動且相互聯系的,在統計變量時要盡可能統計每一個相關變量。PMC指數模型不僅可以分析政策的內部一致性,而且還可以分析該政策的優勢和不足,通過PMC指數繪制PMC曲面能夠對政策內容進行多維度評價和單指標分析。構建PMC指數模型主要通過以下幾個步驟實現:變量分類及參數識別、建立多投入產出表、PMC指數計算和PMC曲面圖繪制。
(1)變量分類與參數識別。本文以我國人工智能政策為研究對象,以Estrada的政策評價為基礎,參考張永安等[26]對相關變量的設定,結合我國人工智能政策的具體特點,選取9個一級變量和31個二級變量,如表4所示。

表4 政策評價變量設置
構建PMC指數除確立一級變量和二級變量外,還需要對PMC模型進行參數設定。本文中每個二級變量重要程度都相同,且在多投入產出表中所占權重也相同。將所有二級變量的參數值都設定為二進制0和1,當政策內容包含該二級變量時,二級變量參數值為1;若不含有,則參數值為0。
(2)構建多投入產出表。本文構建多投入產出表,以使每個變量都能在框架內進行多維度衡量。為計算9個一級變量的值,需要在多投入產出表中對31個二級變量進行賦值,由于各二級變量權重相同,所以對該變量采取二進制處理。本文結合我國人工智能政策各變量的具體特點建立多投入產出表,如表5所示。

表5 多投入產出表
(3)PMC指數計算。首先,對多投入產出表中的二級變量進行賦值,根據公式(1)計算各一級變量;其次,根據計算的一級變量值,利用公式(2)計算PMC指數;最后,根據計算的PMC指數對相應人工智能政策進行評價。依據PMC指數得分可以對各人工智能政策進行等級劃分,劃分等級如表所6示。

(1)
PMC=

(2)
(4)構建PMC曲面。PMC曲面由PMC矩陣構成,并以圖像形式更加直觀地展示政策評價效果。PMC矩陣是個三階矩陣,由PMC指數組成,依據公式(3)可計算該政策的PMC曲面。

(3)

表6 政策等級劃分
以人工智能政策評價框架為基礎,利用文本挖掘和PMC指數計算法得出30份人工智能政策的PMC指數,如表7所示。由PMC指數得分可以看出,所選取的30份人工智能政策文本評價等級均處于一般等級及以上范疇。其中,P2得分最高,與P9、P13同處優秀等級;P11得分最低,處于一般等級;其它政策文本均處于良好等級。本文研究發現,得分最高的P2為國務院印發的《新一代人工智能發展規劃》的通知(國發〔2017〕35號),該政策的作用群體廣泛涉及整個產業。得分最低的P11為教育部印發的《高等學校人工智能創新行動計劃》的通知(教技〔2018〕3號),該政策的作用對象為教育產業;針對不同產業發展政策文本評價等級呈顯著差異,為進一步探究該評價等級的差異來源,本文選取評價等級為良好的P3政策文本,P3為中關村科技園區印發的《中關村國家自主創新示范區人工智能產業培育行動計劃(2017—2020年)》的通知(中科園發〔2017〕43號),主要涉及高新技術創新產業。通過對處于不同評價等級、針對不同產業發展的3個政策文本進行比較分析,進一步識別出影響政策文本評價等級的具體變量。

表7 人工智能政策PMC指數
使用內容分析法和文本挖掘法對3份政策文本構建多投入產出表,如表8所示。

表8 人工智能政策多投入產出表
依據3份政策文本的多投入產出表計算PMC指數,再根據PMC指數構建PMC曲面,如表9所示。根據PMC曲面計算結果繪制曲面圖,結果如圖3~圖5所示。圖3~圖5清晰展示了各項政策中每個一級變量的情況。P2政策的PMC指數值為7.38,政策等級優秀,說明在全產業方面,P2政策在制定時較為全面地考察了各維度指標。P3政策的PMC指數值為6.28,指數值低于P2政策,政策等級為良好,可能是因為P3政策是針對特定高新技術創新產業的區域性政策,其作用范圍有限。由于P3政策是中關村園區的針對性發展文件,政策功能更偏重于規范引導和技術創新,所以指數值偏低。P11政策的PMC指數值為4.95,得分較低,政策等級僅為一般。P11政策是由教育部發布的主要針對教育產業的指導性政策,由于教育產業的特殊性,其在X1(政策性質)、X7(作用層面)和X8(激勵措施)方面的措施具有一定局限性,導致得分較低。盡管如此,政策制定者依然可以通過提高激勵措施所占比重發揮政策的激勵作用。總體來說,涉及不同產業政策文件的PMC指數依然處于可接受范圍,政策文件制定依然比較合理。

表9 人工智能政策PMC指數

圖3 P2曲面

圖4 P3曲面

圖5 P11曲面
政策工具和政策評價都是對政策現狀的客觀量化分析,缺少結合政策未來發展重點和發展方向的研究,而前沿趨勢研究法則能夠彌補政策現狀分析的不足,幫助管理者發現未來政策熱點和缺口,探尋未來政策制定和修改方向。前沿趨勢研究法主要包括引用關系分析法、文本內容分析法及將兩種方法結合起來的復合關系分析法[21]。其中,復合關系分析融合兩者優勢,目前在學術界得到廣泛應用[27]。同時,突發性探測有助于發現短期內出現頻次有較大突變的關鍵詞,常用來探究前沿熱點。因此,本文采用復合關系分析與關鍵詞引用突變相結合的方法探究我國人工智能產業前沿趨勢。
2015年5月,國務院總理李克強簽批《中國制造2025》,該文件首次以戰略文件形式將人工智能制造列入國家重點建設“五大工程”之一。自該文件發布以來,我國人工智能發展在學術界引起廣泛討論。本研究以國務院印發的《中國制造2025》為時間節點,在中國社會科學引文數據庫中以人工智能、機器人為關鍵詞進行檢索,共得到1 358篇樣本文獻。利用CiteSpace軟件構建共被引文獻與關鍵詞復合網絡并進行文獻關鍵詞突變分析,進而得到我國人工智能研究前沿知識圖譜。其中,圖6左側共被引文獻構成相應知識基礎,右側關鍵詞術語聚類標簽則表征領域研究前沿;圖7中關鍵詞出現時間越往右表明出現時間越晚,表征其可能是近年來的研究前沿。
圖6所示的共被引文獻網絡涉及被引文獻27 511篇。從文獻引用頻次突變看,突變文獻作者主要有杜嚴勇(2016)、曹建峰(2016)、牟智佳(2017)、王曉陽(2015)和鐘柏昌(2016),研究內容涉及人工智能安全、人工智能立法、人工智能教育和人工智能倫理等。同時,共被引文獻關鍵詞可劃分為16個聚類,主要包括鄰接權、智能教育、新聞生產、人工智能體、法律、勞動生產率、學習分析、圖書館機器人和物質性條件。由圖7 可知,近年來的突變關鍵詞主要有產業發展、工業機器人、情報學、人口老齡化、倫理風險、人類智能、專利地圖、中小學機器人教育、機器人、專利技術、學習分析、深度學習、智慧圖書館、個性化學習、智能圖書館、神經網路、信息技術和教育大數據,表明以上關鍵詞均為近年來研究前沿。同時,突變強度最大的突現詞包括機器人、智慧圖書館、工業機器人、深度學習、情報學、專利地圖、神經網路和教育大數據等,表明這些主題是研究短期內爆發的前沿熱點選題。
基于圖6和圖7分析,本文將人工智能研究前沿概括為以下幾方面:①宏觀發展方面,智能機器制造是未來制造業的重點,利用機器人研究推進智能產業發展成為人工智造的重要研究方向;②產業應用方面,智能教育是人工智能領域的研究熱點,既體現為人工智能知識教育普及,如大數據、神經網路深度學習;又體現為人工智能在教育上的應用,如智慧圖書館建設、智能課堂教育等;③管理監管方面,法律與倫理問題是人工智能發展衍生出的熱點問題。主要涉及責任劃分、專利技術保護、倫理道德風險和失業率上升等。

圖6 文獻共被引—關鍵詞聚類混合時間線

圖7 關鍵詞頻次突變分布圖譜(top18)
(1)從政策工具維度分析發現,我國人工智能政策涵蓋供給型、需求型和環境型3類政策工具。其中,供給型作為推動力,促進人工智能相關技術研發和創新;需求型作為拉動力,拉動市場對人工智能相關產品的需求;環境型作為支撐力,通過營造良好的支撐環境,保障人工智能產業健康發展。
(2)在PMC指數模型人工智能政策量化評價體系中,對3份不同產業類型的人工智能政策進行量化評價,結果發現3份政策文本都在可接受范圍內,同時PMC曲面圖中展示了政策維度的具體量化結果,為后續政策制定、修整提供了決策依據。
(3)通過對我國人工智能文獻研究前沿趨勢進行分析,探尋我國未來人工智能政策設立和改進的要點。即在宏觀發展方面,用政策保障智能制造發展方向;在產業應用方面,用政策促進智能制作學習、應用和推廣;在管理監管方面,用政策監督人工智能健康有序發展。
(1)重視需求型政策工具的使用。在我國人工智能政策中,需求型政策工具使用頻率較低,政府采購、購置補貼等政策工具的拉動效果并未顯現。當前,我國人工智能發展平臺搭建仍以政府為主,無法深入到細節工作中。因此,應合理使用政府采購等政策工具,減輕政府工作負擔,拉動社會整體對人工智能的需求,吸引更多優質的高新技術企業加入我國人工智能發展平臺建設。我國人工智能政策涉及眾多企業和消費者,人工智能產業發展成本由企業和消費者承擔,高昂的發展成本會阻礙人工智能產業規模的進一步擴大,而購置補貼等政策工具的使用則能夠顯著減少企業和消費者支出成本,增加市場對人工智能的需求,讓人工智能的發展成果惠及每一個參與者。另外,還應調整環境型政策工具結構。與其它兩類政策工具不同,環境型政策工具在我國人工智能政策中的作用主要體現在環境支撐上。外部環境不穩定、企業和個人參與度低是人工智能發展初期面臨的常見問題,因此政府應側重于使用目標規劃和法規管制等政策工具,保障發展環境穩定和發展方向一致。人工智能發展不僅需要政府金融支持,還需要企業和社會組織投入研發,金融支持工具的使用能夠有效提高企業和社會組織發展人工智能的積極性。所以,政府應提高金融支持工具結構比例,如細化財務金融手段和加強稅收優惠等。
(2)注重政策功能的全面應用。針對高新技術創新產業政策文本(P3),通過PMC指數模型可以看出,政策功能的應用仍需全面加強。對于區域性特定發展文件,不能因其作用范圍有限而忽略政策功能應用的全面性。從政策功能二級變量分值看,人工智能政策需在政府采購和制度約束等方面加大政策力度,以保障政策功能的全面應用。對于涉及教育產業的政策文本(P11),PMC曲面圖顯示激勵措施是政策得分較低的主要原因。人工智能在教育產業的激勵政策集中在人才引進和知識產權方面,這與教育產業特性有關,但也在某種程度上制約了政策激勵功能的發揮。所以,激勵政策仍有很大改善空間,政府可通過增加投資補貼和稅收優惠等措施促進人工智能教育產業發展。
(3)緊跟產業發展趨勢,調整政策方向。人工智能產業日新月異,其技術突破和業態創新時刻影響未來人工智能發展趨勢。政策文件作為政府指引和保障我國人工智能產業發展的重要手段,必須緊跟人工智能產業發展趨勢,適當調整政策內容重點和方向。①在宏觀指導性政策方面,繼續出臺人工智能支持性引導政策,指導和促進人工智能快速發展;②在產業發展政策方面,需要向智能機器制造方向傾斜,推廣擴大工業機器人應用,積極構建智能化基礎設施體系;③在管理監管政策方面,建立健全法律保障制度,確保人工智能符合倫理道德,同時完善技術保護政策,保障人工智能技術安全。