徐云娟 金璐鈺 姚建民
1.蘇州托普信息職業技術學院;2.蘇州大學計算機科學與技術學院;3.蘇州市科學技術情報研究所
ChatGPT 的火熱跟隨著搜索引擎、自動問答、虛擬現實等一系列新一代信息技術的熱潮,預示著人工智能一步步更貼近改變人們的生活、工作方式和產業、經濟生態,成為最近最重要的產業和技術領域[1]。為了厘清蘇州市人工智能相關技術和產業領域、相關研發機構以及產業鏈的現狀,將嘗試利用人工智能領域國家和省級科技項目和科技獎勵數據,探索分析挖掘蘇州人工智能領域研發機構分布,將產業中各主體以鏈條形式串成一體,刻畫蘇州市人工智能產業生態。
從技術和產業角度分析,人工智能產業鏈包含應用層、技術層以及基礎層。應用層主要包含智能機器人、無人機等終端應用及行業解決方案;技術層主要包含計算機視覺、機器學習等算法技術;基礎層包括數據和算力支撐軟硬件,如數據、云計算、芯片等。如表1 所示[2]。

表1 人工智能產業鏈縱向分層和橫向領域概覽Tab.1 Overview of vertical layering and horizontal fields of the AI industry chain
作為科技產業集群支撐的現代工業城市、排名前列的科技創新增長極,蘇州2017-2021 年財政科技投入分別為124.03 億、152.04 億、181.58 億、219.62 億和235.14 億元。如何科學規劃科技項目管理、提高科技投入成效,是本次研究的目標。
本文利用科技項目和科技獎勵的數據挖掘分析,發現蘇州人工智能領域研發機構的分布和稟賦,為科技管理和產業發展提供數據和理論支撐。
提取2017—2021 年蘇州市科技項目和科技獎勵明細數據,具體信息包含項目或獎勵的級別、類型、名稱、承擔單位。其中級別包括國家級和省級;類型包含自然科學基金等基礎研究項目、產業前瞻與共性關鍵技術等產業研發項目、國家科技進步獎等科技獎勵;承擔單位指項目的承擔單位或獎勵獲得單位,包含科研院所或企業等機構主體。
根據表1 的人工智能產業鏈概覽,每個科技項目或獎勵歸于一個領域,并將該領域名稱設置為關鍵詞,用于統計分析人工智能項目占比或刻畫關鍵詞云圖,對出現頻率較高的關鍵詞予以視覺上的突出,每個詞出現的頻率以字號大小表示,在本文中表示相關項目或獎勵數量多少。關鍵詞云圖生成工具參考https://worditout.com/word-cloud/create。本文關鍵詞云圖用于分析蘇州人工智能產業或技術領域分布特征。比如,基礎研究項目關鍵詞云圖用于判斷蘇州在人工智能細分領域的基礎研究力量分布[3]。
數據包含國家自然科學基金和江蘇省基礎研究項目兩個類別,用于分析蘇州的基礎研究力量稟賦。國家自然基金項目承擔單位代表基礎研究領域的龍頭機構力量,相關項目數據如表2 所示,其中項目總數列出當年蘇州市承擔的國家自然科學基金項目的數量,AI 項目和AI占比分別是人工智能領域的項目數量和百分占比。

表2 國家自然科學基金項目中AI 占比和關鍵詞云圖Tab.2 Proportion and keyword cloud map in national NSF AI projects
2017—2020 年蘇州市每年大約承擔國家自然科學基金項目300 項,主要由蘇州大學(含醫學院及附屬醫院)、常熟理工學院、蘇州科技大學3 所高校各學科團隊承擔。該項目類型對團隊科研的前沿性要求高,項目承擔單位分布和關鍵詞云圖反映了蘇州基礎研究龍頭機構和科技領域分布情況。2021 年蘇州出現了一些新的承擔單位,包括蘇州系統醫學研究所、西交利物浦大學、中科院蘇州納米所、中科院蘇州醫工所等,承擔項目占比達1/8,這是科研項目承擔單位培育推進方面的大進步。
自然科學基金項目中,自然語言處理是蘇州大學的強勢研究領域,計算機語音、機器視覺是人工智能基礎技術的其他兩個方向,機器學習是整個人工智能基礎技術中的算法支撐,大數據、知識圖譜是人工智能應用的數據支撐或者領域知識基礎[4]。
江蘇省基礎研究項目承擔單位代表基礎研究機構在各個領域不同研究方向的分布。省項目有分配名額,單個龍頭機構承擔的省項目數量占比更低一些,承擔項目單位數量更多,比國家自然科學基金更能反映AI 相關科研機構及研究領域的分布,如表3 所示。需要強調的是承擔單位除大學和科研院所外,也包括一些前沿科技創新型公司,比如2017 年9 項(總數177 項),2021 年7 項(總數192 項)等。

表3 省基礎研究項目中AI 占比和關鍵詞云圖Tab.3 Proportion and keyword cloud map in provincial NSF AI projects
從國家和省自然科學基金項目占比趨勢圖(如圖1所示)可以看出,國家基金中人工智能占比高于省基金,分析可能的原因源自以下幾個方面:(1)人工智能前沿性強,基礎研究性質強,一般研究單位涉獵不多;(2)蘇州部分產業或科技領域性研究機構涉及人工智能研發比較少,比如蘇州納米所更多涉及先進材料、醫工所涉及醫療器械;(3)蘇州基礎研究投入尚需加強。國家基金的承擔機構經費源自蘇州財政的占比少,而省基金承擔單位經費結構更多源自蘇州財政,蘇州財政對基礎研究投入尚需加強[5]。

圖1 國家和省自然科學基金AI 項目占比趨勢圖Fig.1 Proportion trend for national and provincial NSF AI projects
國家、省產業研發項目的承擔單位,可以反映蘇州產業生態和稟賦。江蘇省重點研發計劃以產業技術研發為主,尤其是產業前瞻項目,承擔方基本是高新技術領域公司(醫療項目例外,大多是醫院承擔),一般每家公司承擔一個項目,承擔公司的分布體現了蘇州相關產業重點科技型企業、領域內科研機構的細分產業領域分布,如表4 所示。

表4 省產業研發項目AI 占比和關鍵詞云圖Tab.4 Proportion and keyword cloud map in provincial industry development AI projects
從省基礎研究項目和省產業研發項目關鍵詞云圖對比看,關鍵詞分布相似度很高,顯示出蘇州人工智能產業分布基本切合技術發展形勢。交互技術、機器人突出,顯示了蘇州電子信息產業硬件部分的優勢占比。大數據在產業項目中的比例高,符合經濟數字化和數字經濟化的潮流。產業力量和基礎研究力量的交集是優勢領域,否則是需要加強的領域,二者皆無的領域是缺失領域[6]。
國家重點科研項目的承擔機構和省科技獎勵獲獎機構,都是在國家科技產業體系或江蘇省科技工作中發揮重要作用的主體,相關機構的統計分析可以用于發現蘇州人工智能領域的龍頭機構,其領域分布也表現出蘇州市人工智能產業的優勢領域,如表5、表6 所示。

表5 國家重點項目AI 占比和關鍵詞云圖Tab.5 Proportion and keyword cloud map in national key AI projects

表6 省科技獎勵項目AI 占比和關鍵詞云圖Tab.6 Proportion and keyword cloud map in provincial award AI projects
國家重點項目的承擔單位包含企業和高校科研院所,是蘇州相關領域最具科研實力的機構。省科技獎勵對象包含企業和高校科研院所,也是蘇州最前沿龍頭機構的代表。
國家重點項目以蘇州大學、系統醫學研究所等高校科研院所為主體,體現了龍頭企業和龍頭高校科研院所結合的態勢。蘇州大學在自然語言處理(含知識圖譜)方向的優勢,使蘇州大學附屬醫院在智慧醫療領域頻獲項目支持。
在產業領域,龍頭科研院所和科技型企業在機器人、交互技術、傳感器領域表現出蘇州產業在新一代電子信息技術等領域的優勢。和普通科技項目相比,國家重點項目相關研發前沿性強,人工智能相關研發占比相對高,包含的基礎技術和AI+行業都較多[7]。
科技獎勵獲得機構是影響大、技術強的龍頭機構,總體數量少、年度變化更大。另外,人工智能是新興技術,在社會發展、制造中應用還不占主體,在省科技獎勵中更沒形成規模效應。從另一個角度思考,也說明在蘇州的整體產業結構中,人工智能影響還不突出,先進制造業占主體,蘇州獲得的獎勵也偏向先進制造業或者醫療(蘇州大學醫學院及相關附屬醫院)。
綜合項目和獎勵可以看出,人工智能作為新興技術,在研發中越來越占據主要位置,政府和企業都表現出足夠的重視,在研發中投入大;但蘇州的現有成果中人工智能仍不夠突出,需要更多發力[8]。
本文從人工智能的產業鏈縱向分層和橫向領域出發,通過蘇州市承擔的國家和江蘇省科技項目及獲得的省科技獎勵數據挖掘分析人工智能科技和產業機構的分布,利用關鍵詞云圖刻畫蘇州市的基礎研究機構狀況、產業鏈分布和龍頭機構的情況,分析勾畫蘇州市人工智能產業生態和科技稟賦,為蘇州市人工智能科技產業鏈的發展提供決策支撐。支持繪制產業鏈、發現產業鏈強鏈和缺鏈、推進科技鏈產業鏈融合、促進科技管理的科學化,提高決策水平。在未來的工作中,我們將進一步擴大數據深度和廣度,細化數據挖掘和分析方法,為科技產業集群建設提供支撐。