□文/ 陳 雯 李 廷 朱海鋒 杭州市科技信息研究院 汪嚴磊 德勤中國
2019 年科學技術部發布了《國家新一代人工智能創新發展試驗區建設工作指引》,開始在地方探索人工智能試驗區的建設。同年,杭州正式獲批建設國家新一代人工智能創新發展試驗區。杭州的人工智能產業提速發展,人才需求也進一步升級。高校作為人才輸出的主陣地,其人才培養狀況值得關注。
本文以中國知網(CNKI)數據庫的博碩士學位授予單位為依據,選擇12 家在杭高校(分別為浙江大學、浙江工業大學、杭州電子科技大學、浙江理工大學、中國計量大學、浙江科技學院、浙江工商大學、浙江財經大學、浙江農林大學、杭州師范大學、浙江中醫藥大學、浙江傳媒學院)為樣本,通過圖書分類號和關鍵字組合策略檢索獲得這些高校人工智能領域研究相關博碩士論文,并采用CiteSpace.5.8.R3 等工具對論文數量和關鍵詞進行深入分析,為了解在杭高校人工智能領域研究生培養情況提供一個縱向視角。
本次檢索共獲博碩士論文6637篇。其中,博士論文852 篇,占比12.84%;碩士論文5785 篇,占比81.16%。說明在杭高校開展人工智能領域研究的研究生主要以碩士研究生為主,這與高校博士點相對較少、博士招生人數相對較少有關。
從論文數量歷年趨勢看(如圖1),在杭高校博碩論文總量呈現波動式上升趨勢,且近幾年增長迅速。按研究生平均3-4年畢業時間向前推算,該趨勢與人工智能技術發展幾經波折有關。

圖1 在杭高校歷年博碩士學位論文數量趨勢圖
據研究,人工智能技術自其概念誕生以來經歷了多輪低谷,其中就有2006 年的低潮期,該低潮期直到2010 年神經網絡在圖像識別領域實現突破才得以走出,此后又以2016 年Alpha Go 事件為分水嶺,人工智能技術再次走入研究者的視線,又一次掀起研究熱潮。數據顯示,在杭高校研究生對人工智能領域的研究熱度與技術熱門程度密切相關。
隨著社會對人工智能技術熱度的不斷攀升,在杭高校人工智能領域研究生數量還將繼續快速增長。
在12所在杭高校中,2所綜合類高校論文總量占比達66.9%,4 所理工類高校論文總量占比達27.33%,兩者合計94.23%,可見綜合類高校開展人工智能領域研究的研究生要比理工類高校多。分析各高校情況,浙江大學、浙江工業大學和杭州電子科技大學的論文總量排名位列前三,論文總量占比分別為50.14%、16.75%和16.01%,合計達82.90%。其中,浙江大學一所高校的論文總量占到半數以上,遙遙領先其他在杭高校。此外,浙江大學的博士論文數量占比達94.82%,這充分說明浙江大學是在杭高校人工智能領域研究生培養的主導院校,其領頭優勢十分明顯。
論文首現時間體現了在杭高校研究生最早投入人工智能領域研究的時間。絕大多數在杭高校論文首現出現在2010年前后。論文首現較早的三所高校分別是浙江大學、浙江工業大學和浙江工商大學。
其中,浙江大學是最早出現研究生涉足人工智能領域研究的在杭高校,也是唯一一所博士論文出現時間早于碩士論文的在杭高校,再次體現出浙江大學對人工智能領域研究生的培養走在各高校的前列。
浙江工業大學論文首現年份在2001 年,該年份也是在杭高校論文總量陡然由少變多的一個關鍵時點。在2001 年以前,人工智能領域主要是博士研究生的研究范圍,論文數量寥寥,而此后,不僅博士論文數量徒增,碩士論文數量也在快速攀升,說明2001 年是在杭高校研究生開始關注人工智能領域研究的關鍵一年,而浙江工業大學貢獻了重要力量。
浙江工商大學作為財經類高校,其首現論文時間甚至早于部分理工類高校,說明人工智能技術較早影響財經、金融等領域,致使財經類高校少數研究生較早介入該領域的研究。
此外,杭州電子科技大學、浙江理工大學、中國計量大學論文的首現年份雖無先發優勢,但論文總量可觀,說明近些年來三所高校正加快對人工智能領域研究生的培養。
關鍵詞是論文內容的核心概括,高頻關鍵詞代表了研究熱點。本文獲得高頻關鍵詞如表1,其中頻次超過200 的關鍵詞依次是神經網絡、支持向量機、深度學習、卷積神經網絡、計算機視覺、遺傳算法、bp 神經網絡和機器學習,主要涉及機器學習和計算機視覺兩大技術領域,其中以機器學習為主。據相關研究,機器學習是人工智能較早開拓的研究領域之一,起先致力于計算機棋類博弈研究,后來分裂出神經網絡和行為模擬兩條研究路線。這也說明在杭高校研究生更傾向于神經網絡路線,并經歷了從bp 神經網絡、支持向量機、卷積神經網絡等淺層學習到循環神經網絡、生成對抗網絡等深度學習的技術變化過程。

表1 高頻關鍵詞信息表
分析博碩論文總量過百的6 所在杭高校的高頻關鍵詞,它們80%以上至少存在1 次重合,其中各高校top6的高頻關鍵詞高度重合,均包括神經網絡、bp神經網絡、支持向量機、卷積神經網絡和深度學習;而計算機視覺、特征提取、圖像處理、遺傳算法在5所綜合類或理工類高校中均有涉及,說明在杭高校研究生對人工智能技術研究的關注點差別不大,區別只在于介入時間的先后不同。當然,從各高校獨有的高頻關鍵詞中可以看出高校的研究特色,比如:浙江大學的腦機接口、數據挖掘;浙江工業大學的粒子群算法、人臉識別、路徑規劃、機器人、圖像識別;杭州電子科技大學的腦電信號、注意力機制、遷移學習、生成對抗網絡;浙江理工大學的蟻群算法等。
關鍵詞共現圖譜不僅可以更加直觀感受高頻關鍵詞,還可以顯示高頻關鍵詞之間的關聯,進而分析研究熱點的演進(如圖2)。圖譜中的節點代表了關鍵詞,節點標簽大小體現詞頻大小,節點年輪的顏色和厚度體現了關鍵詞在不同年份的頻次,而節點間連線表示關鍵詞共現關系,連線越粗說明共現次數越多,連線顏色則是關鍵詞共現關系的初現年份。另外,紫色輪廓節點是具有較大中介中心性(≥0.1)的節點,在網絡關系中具有重要意義,往往是研究熱點的轉折點,能反映研究熱點轉移關系。
結合圖2 和表1 可以發現,有些高頻關鍵詞存在共現關系,比如:神經網絡與專家系統有灰色連線,說明兩者較早便存在聯系,或許在杭高校對專家系統的研究中運用到神經網絡方面的算法;專家系統與遺傳算法之間,雖然沒有直接關聯,但是都與儀表設計關鍵詞有灰色粗線聯系,說明在杭高校研究生研究儀表設計方面可能存在專家系統和遺傳算法兩條技術路線;深度學習和卷積神經網絡與人臉識別存在綠線共現關系,說明近年來在杭高校研究生對人臉識別研究高度依賴深度學習和卷積神經網絡基礎研究。此外,專家系統、故障診斷、模式識別、圖像處理、計算機視覺等高中介中心性節點之間的共現關系揭示出,通過模式識別這個中介中心性最高的節點,在杭高校研究生研究熱點從知識工程向計算機視覺、機器學習等方向轉移。

圖2 在杭高校博碩士論文關鍵詞共現網絡圖譜
突變詞代表關鍵詞在某段時間出現頻次有較大變化,可以反映關鍵詞的興起和衰落,進而體現研究熱點的爆發和消跡。Citespace共生成64個突變詞,本文選擇strength≥10 的突變詞進行分析(如表2)。數據顯示,神經網絡、bp 神經網絡、支持向量機、極限學習機、深度學習和卷積神經網絡的起始年和終止年反映出在杭高校研究生對神經網絡領域研究的熱度變遷,從最初比較抽象的神經網絡概念開始,相關研究依次經歷了bp神經網絡、支持向量機、極限學習機研究的興起和衰落,再到近三年深度學習和卷積神經網絡研究的異軍突起,此演進情況也契合人工智能技術的發展趨勢,經歷從淺層學習到深度學習兩個階段。此外,突變詞還揭示出模糊控制、數據挖掘曾對在杭高校人工智能領域研究產生過影響,而在2009 年至2016 年間,人機交互、腦機接口、機器人出現過一小波高校研究熱潮。

表2 Strength≥10的突變詞
在杭高校人工智能領域研究生培養已具備一定規模,但增量會遇到瓶頸。近五年,在杭高校開展人工智能領域研究的研究生規模急劇攀升,已形成綜合類高校領頭、理工類高校追趕、其他類高校有特色地跟進的態勢,在杭高校一方面緊跟人工智能技術發展趨勢開展新技術研究,另一方面在金融、醫療、媒體傳播、種植等領域也開始引入人工智能技術的應用研究,兩者結合加速了人工智能領域專業性人才和復合型人才的培養,使得本地人才培養具備了一定規模。但相比較武漢、南京等城市,在杭高校總體數量偏少,而且綜合類和理工類高校又只占總體數量的一半,這使得在杭高校培養人工智能領域研究生的數量也相對受限,面對產業需求,從其他城市吸引人才,特別是高層次人才,依然是一條不可或缺的途徑。
目前,在政府大力引導和產業需求拉動的雙重作用下,在杭高校都在積極探索人工智能領域人才的培養。2018 年,杭州電子科技大學和浙江理工大學紛紛成立人工智能學院;2019年,浙江大學設立人工智能交叉學科,浙江工業大學成立了自動化與人工智能研究中心和人工智能系;西湖大學這類新型高等學校也持續發力人工智能領域研究。
新一代人工智能產業發展正考驗著地方高校的人才培養能力,在杭高校需要跳出傳統人才培養模式,主動在學科、機構、課程、培養方式等方面大膽嘗試開拓創新,才能為社會輸出更多擁有綜合知識、具備專業能力的人工智能領域人才。