(1.上海大學圖書情報檔案系,上海 200444;2.上海大學圖書館,上海 200444;3.邯鄲學院圖書館,河北 邯鄲 056003)
人工智能(Artificial Intelligence,簡稱AI)一詞是1956年由McCarthy提出來的。學術界關于人工智能的定義莫衷一是。麻省理工學院Marvin Minskyren提出,“人工智能是一門科學,它使機器做那些由人需要通過智能來做的事情”[1]。在此基礎上,G.F.Luger認為,“人工智能是計算機科學中關于智力行為自動化的分支”。劉鳳岐在其著作中結合G.F.Luger定義和人工智能的發展趨勢,將其定義為“人工智能研究構成智力行為基礎或呈現智力行為機制,途徑是構造與評價按制定的這些機制設計的人造物”,并將人工智能分為博弈、自動推理與定理證明、專家系統、自然語言理解、模擬人生的性能、規劃與機器人、AI語言和環境、機器學習、神經網絡與遺傳算法、AI與哲學等十個應用領域[2]。
目前,全球即將進入人工智能引領的第四次產業革命。人工智能作為2016年底Gartner公布的2017年十大具有戰略意義的重大科技發展趨勢之一被廣為關注[3]。根據麥肯錫發布的報告《人工智能:下一個數字前沿?》可以看出,人工智能在高科技、金融服務、通信、醫療、零售、電力等行業有著廣泛的應用[4]。2018年9月17日,世界人工智能大會在上海舉辦,并發布了《2018世界人工智能產業發展藍皮書》,提出人工智能是科技革命與產業變革的核心驅動力量,對世界各地的經濟、社會和人類生活產生了深刻的影響[5]。在圖書館領域,人工智能在《新地平線報告2017年圖書館版》中被列為六大技術發展之一[6]、在《國際圖聯趨勢報告》中被列為四大技術趨勢之一[7]、在吳建中的論文《再議圖書館發展的十個熱門》中被列為十大熱門話題之一[8]。本文通過對中外圖書館人工智能技術應用專利在申請趨勢、技術構成、主要申請人等三方面的比較分析,探索我國人工智能技術在圖書館領域應用的發展趨勢。

表1 人工智能在圖書館中的應用領域及具體技術一覽表
本文采用IncoPat科技創新情報平臺進行檢索,該平臺數據覆蓋世界范圍的海量專利信息、全面可靠、檢索功能專業、效率高、界面友好,是企事業單位的研發工程師、專利管理人員常用的專利檢索系統[9]。在進行專利檢索之前,筆者調研大量與“圖書館”和“人工智能”主題相關研究文獻后,總結出人工智能在圖書館的應用技術及應用產品,詳見表1。筆者提煉出相應的關鍵詞及其英文,結合相應的IPC分類號,得出檢索式:TIABC=(((自然語言 AND 處理)OR((natural language process*) OR nlp)) OR ((智能 AND 排名) OR ((Intelligen* OR smart) AND rank*)) OR (((專家 AND (選書 OR 訂購 OR 集成)) AND 系統) OR ((expert* AND ((book AND (choose* OR select*)) OR (order OR subscription) OR integrat*)) AND system*)) OR ((機器人 OR robot*)) OR ((學習 AND (深度 OR 機器))OR((learn* OR study) AND (machine OR deep))) OR ((識別 AND (身份 OR 生物)) OR ((recognition OR identif* OR verification ) AND ((personal OR human OR authorship) OR (biometric OR biological)))) OR ((神經 AND 網絡) OR (neural AND network)) OR ((計算機 AND 視覺) OR (computer AND (vision OR visual)))) NOT (IPC=C OR A6 OR G01N)。使用高級檢索途徑在IncoPat中檢索,去除無關項和重復項之后,得到國內外專利28 303項,使用IncoPat簡單同族合并功能合并后,最終結果為16 778項專利。
筆者采用文獻調研法和比較研究法,首先對國內外有關人工智能技術在圖書館中應用的專利文獻和非專利文獻進行調研,掌握該領域的研究進展和應用狀況,以及面臨的問題和發展趨勢等。然后根據檢索到的人工智能在圖書館應用的專利結果,從申請趨勢、技術構成、申請人三個方面進行統計分析,以國內狀況和國外狀況作為比較對象,將分析結果與實際應用情況相結合,提出國內人工智能技術在圖書館應用的發展建議。
筆者對16 778項專利進行統計分析得出,在incoPat科技創新情報平臺中,國內申請專利數量最多,為8 222項,其次是美國、日本、韓國、世界知識產權組織、歐洲專利局等,詳見圖1。將國外專利數量合并后得到國外專利8 556項,檢索結果與《2018世界人工智能產業發展藍皮書》中對人工智能專利技術的分析結果大致吻合,在人工智能專利技術中,中國的專利申請量已躍居第一位,其次是美國、日本、韓國等國家[10]。下文采用比較分析法從申請趨勢、技術構成、主要申請人等方面進行對比分析。

圖1 人工智能在圖書館中應用專利全球布局
筆者統計分析了國內外圖書館人工智能應用專利申請日期,得出申請趨勢。在起步方面,國外早在1950年就將人工智能技術引進圖書館領域,是由英國國家發展研究公司申請的“Improvements in or relating to digital data storage systems”,該產品是有關數據存儲的光學掃描裝置。此后,國外進入30年左右的探索時期。國內圖書館領域最早出現有關人工智能技術的專利是在1985年,共有3項,分別是“垂直—水平自動傳送系統”“計算機智能外部存儲設備”“24針打印機用的新型漢字庫板”。與此同時,北京大學謝元泰在《新技術革命的挑戰與圖書館的發展策略》一文中提到微縮技術、大容量存儲技術、復印技術、光電傳輸技術等圖書館自動化技術是圖書館發展的重要課題[11]。從此,國內圖書館開始重視人工智能技術的應用。2000年之前相關專利零星分布,這一階段屬于探索階段。由此可見,與國外相比,國內人工智能技術在圖書館的應用專利申請起步晚,探索階段比較短。
發展過程方面,20世紀80年代國內圖書館開始引進人工智能技術時,國外人工智能技術在圖書館已經在積蓄了30多年之后進入發展階段,申請專利數量增長迅速,1991年數量突破百項,可將這段時間視為初步發展階段;1991-2000年可以看作快速發展階段,筆者在Web of Science平臺檢索相關文章,這一階段發表的相關文章數量年均10篇以上,增長幅度較小,說明這一階段國外人工智能在圖書館領域內的研究以實踐為主;2001-2017年,這一階段為重點發展階段,年平均專利申請數量398項,始終保持高速發展。該階段國外學者發表的文章從2001年的22篇快速增長到2017年的106篇,這說明國外學者在圖書館實踐基礎上,掀起了人工智能的研究熱潮。
國內人工智能技術在圖書館中應用專利申請在2000年開始進入初步發展階段,此時國外開啟快速發展模式。但是與國外相比,國內專利申請的初步發展階段較短,在2004年專利申請數量超過100項。從2006年起,國內人工智能專利申請快速發展,值得注意的是,僅用5年的時間,2011年中國申請專利數量就超過國外。2011年之后,中國專利申請數量急速攀升,其中2015-2017年年均專利突破千項,遠超國外。與此同時,該階段國內研究人工智能技術在圖書館中應用的學者越來越多,但發文量與國外仍有較大差距。
從發展趨勢看,由于數據發布滯后,目前2018年專利數據未收錄全,但根據趨勢可以斷定,人工智能技術在圖書館中的應用已勢不可擋,發展潛力較大。
3.2.1 國外技術構成分析

表2 國外圖書館人工智能應用專利技術構成前10位一覽表
筆者統計分析了國外人工智能技術在圖書館中應用專利數量前10位的IPC分類號(小類),詳見表2。可以看出,G06F小類專利申請數量最多,是國外圖書館領域應用最廣泛的人工智能技術;G06F代表的是有關電數字數據處理方面的技術,在國外圖書館中的應用如:電子書架系統、認證系統、云虛擬機的系統、手勢識別機構、數據轉換方法和系統、自動生成代碼深度學習系統、過濾興趣項目圖形用戶接口等。G06Q小類申請專利數量遠低于G06F類,但也占到國外有關專利的10%,該IPC分類號代表的是專門適用于行政、金融、商業、管理、預測或監督目的的數據處理系統或方法,在國外的應用如:認證方法和系統、圖形用戶接口、聲音輸出信息系統、智能卡讀取、寫入方法及其裝置等方面。另外,H04L(數字信息的傳輸)、G06K(數據識別;數據表示;記錄載體及其處理)、G11B(信息存儲)、H04N(圖像通信)、G06T(一般圖像數據的處理或產生)、G05B(一般的控制或調節系統)、H01L(半導體器件)、G10L(語音分析、合成、識別及處理)等IPC分類號涉及的人工智能技術也在國外圖書館中應用廣泛,如網絡管理設備與服務器、密碼推送方法以及頂推系統、指紋識別系統、優選內容的選擇、視覺圖形識別系統、面部表情識別、自然用戶輸入手勢庫、自動數據存儲庫、人臉分辨率重建方法及自動語言學習機等方面。
筆者進一步統計了國外圖書館人工智能應用專利技術前10位的申請時間,分析技術構成的發展趨勢。發現G06F小類年專利申請量始終保持在200—300項之間,起伏較小,說明國外在電數字數據處理技術方面的研究持續時間長,且具有活力,是人工智能技術在國外圖書館應用中重要的一部分。另外,其他技術在1999年到2017年間也并未出現較大幅度的波動,其中,G06Q、G06K、H04L在2012年到2016年之間出現小幅度增長,數據處理系統、數字信息的傳輸、數據識別、數據表示等方面申請專利數量增多,該技術在圖書館應用也隨之增多。

圖2 國外圖書館人工智能應用專利技術地域分布
筆者統計國外圖書館人工智能應用技術的地域分布(見圖2)以及前10位地域分布。由圖2可見,美國申請專利數量最多,其次是日本。其他申請數量較多的地區有韓國、世界知識產權組織、歐洲專利局、英國等。美國在申請數量和主要技術數量上都占絕對優勢。
綜上所述,國外圖書館人工智能應用專利技術主要集中在數據處理、數據傳輸、數據存儲和識別技術方面。占絕對優勢的技術是G06F小類,且申請數量變化趨勢平穩。美國是國外圖書館領域人工智能技術研發的領頭人,日本位居次位。
3.2.2 國內技術構成分析

表3 國內圖書館人工智能應用專利技術構成前10位一覽表
筆者統計分析了國內圖書館人工智能技術應用申請專利數量,前十名的IPC分類號(小類)、分類號代表含義、申請專利數量見表3。可以看出,與國外專利技術構成一樣,G06F小類專利數量最多,占總數量的43.42%。不同的是,國內專利技術構成相比國外較為分散。G06K小類在國內技術構成中居第二位,占17.10%,H04L小類是第三位,占10.20%,其次是G06Q,占9.66%,接近H04L。G06F小類代表電數字數據處理,國內應用領域為:滑動窗口文獻檢測、分布式文本檢測、皮膚生成方法、衛星導航系統、數據處理方法、人名檢測方法及信息網絡自動構建等;G06K小類代表數據識別、數據表示,記錄載體及其處理,主要應用在:人體圖像性別識別、動態人臉識別、網絡視頻人臉識別、行人特征提取及處理、座位管理系統、自然場景多標記分類、圖書盤點定位系統、共享書柜裝置等;H04L小類代表的是數字信息的傳輸,主要用于指紋認證方法、賬號登錄保護方法、通信故障預警裝備、設備安全控制系統、云端內容規則庫識別、電子圖書館管理系統等。另外,G06Q(數據處理系方法)、G10L(語音分析、合成、識別或處理)、G06T(一般圖像數據處理)H04N(圖像通信)、G05B(一般控制、調節系統)、G07G(登記收到的現金、貴重物、輔幣)、G06N(基于特定的計算模型的計算機系統)等人工智能技術也在國內圖書館領域申請專利較多,如:智云庫、信息推送、預防長期占座系統、聲紋識別終端控制方法、高清語音識別系統、語音交互系統、虛擬現實技術裝修、空座檢測系統、新型借還設備以及圖書分發設備等。
筆者進一步分析國內圖書館人工智能應用專利技術申請趨勢可知,與美國申請趨勢不同,前十名技術申請數量基本呈逐年增長的態勢,其中G06F申請數量最多且在國內應用較早,增長最快;G06K、H04L、G06Q等小類從2008年陸續出現,近三年來增長最快。說明,電數字數據處理、數字識別、數字處理、數字傳輸等技術同樣是國內圖書館采用的最廣泛的人工智能技術,且近年來發展勢頭良好,發展潛力較大。
通過對國內圖書館人工智能應用專利技術所處省份的分布情況分析可見,北京和廣東技術分布較為集中,是人工智能科技高地。在電數字數據處理方面,除北京、廣東外,上海和四川的技術實力也比較強。在數字識別、數字處理、數字傳輸等方面,依然是北京和廣東占有明顯優勢。由此可見,國內圖書館人工智能應用專利技術分布地域集中化的特征較為明顯。
綜上,同國外相比,國內同樣在電數字數據處理、數字識別、數字處理、數字傳輸等技術上占有優勢。不同之處在于,國外在信息存儲和半導體器件方面申請專利數量所占比重較大;國內在語音分析、合成、識別或處理技術研發力度較大。國外技術申請趨勢漲幅不明顯,屬于平穩、快速發展,而國內技術申請趨勢明顯漲幅較大,屬于快速發展;國內外都存在技術構成和技術分布空間集中化的情況。
筆者將申請人合并后,按照申請專利數量進行統計排名可見,中外申請人所占比重旗鼓相當,其中公司居多,高校較少。申請專利數量最多的是美國IBM公司,該公司是計算機產業的領頭羊,早在1959年就申請了“比較信息項以確定相似性的系統”專利,且至今一直持續申請專利,近20年是其人工智能專利技術的高產期。該公司在組織系統、社會網絡、語言解釋器、語言代碼等方面技術力量較強。第二名是美國微軟公司,于1992年申請第一項相關專利,2005年申請專利數量達到高峰。該公司在社會網絡、虛擬機、組織系統和安全管理等方面具有優勢。其他排名前十的國外企業有:日本富士通株式會社、日本電氣株式會社、日本制作株式會社、美國甲骨文公司、美國惠普研發公司、韓國三星集團等。
國內進入前二十名的申請人有7個。國家電網公司排名第六,該公司在智能識別、輸電系統、計算機可讀存儲介質、模式識別等方面具有技術優勢。排名第七的為騰訊科技(深圳)有限公司,該公司在特征識別技術和通信技術方面技術實力較強。北京奇虎科技有限公司的技術優勢在惡意代碼、系統修復、個性化推薦、主動防御、機器學習等方面。華為技術有限公司在人臉模型、人臉識別、語音識別、路由收斂、網絡數據流量、圖像識別、圖像匹配、隱私保護等方面表現不凡。阿里巴巴集團控股有限公司則在身份驗證、文字識別、信息搜索、信息管理、圖像索引等技術上優勢明顯。值得一提的是浙江大學和上海交通大學是前二十名中的高校代表,浙江大學在激光雷達、移動機器人、運書車、主分量分析、情感識別、數字圖書館、數據挖掘方面申請專利數量較多,而上海交通大學更專注于圖書管理機器人、計算機輔助決策、特征數據庫、圖像檢索方法、形態學神經網絡等方面。
排名前20的專利申請人中,國外申請人為13個,皆為企業申請人;其中IBM公司具有顯著的優勢,并且前5名都是美國、日本的公司。國內申請人有7個,其中5個為企業、2個為高校。值得肯定的是,人工智能技術在圖書館應用專利申請領域,浙江大學和上海交通大學走在世界高校的前列。
通過上述數據分析發現:在專利申請趨勢方面,國內外專利申請總體發展勢頭良好。與國外相比,我國近年來在專利申請數量和速度上都實現了突破性進展,但此時基礎理論研究已經跟不上專利申請的發展趨勢,亟待進一步加強;技術構成方面,國內外的優勢技術基本上集中在電數字數據處理、數字識別、數字處理、數字傳輸等方面,但在人工智能的核心技術如硬件、算法等方面處于弱勢。因此,我國應該一方面保持技術優勢,繼續開發新技術,另一方面應該加大核心技術的研發力度,爭取掌握主動權;在申請人方面,與國外企業申請人占有技術優勢相比,我國的企業和高校申請人都在TOP20中嶄露頭角;技術研發方面,應重視挖掘高校科研實力,加強校企合作,推動科技成果轉化;除外,智慧圖書館的興起是圖書館領域近年來的熱議話題,智慧圖書館的發展離不開人工智能技術的技術支撐和推動。為此,為推動人工智能在圖書館的應用,筆者建議可從以下幾個方面進行嘗試。
清華大學課題組《中國人工智能發展報告2018》指出:中國在人工智能論文總量以及高被引論文數量上排在世界第一;在人工智能專利方面,中國已成為專利布局最多的國家,其次是美國和日本[12]。由本文分析可知,與國外相比,人工智能技術在圖書館應用方面,我國專利申請起步晚,相關研究少,雖然后期發展快速,但論文發文數量仍與國外有較大的差距。《2018世界人工智能產業發展藍皮書》數據顯示,中國在人工智能領域的發文量近年來不斷增長,但全球占比仍然較小[10]。人工智能技術的發展,給圖書館的文獻資源采購和編目、圖書上架和管理、讀者導航、閱讀推廣、參考咨詢等方面帶來了技術變革,我國學者應借助人工智能研究熱度,以圖書館的實際應用情況為基礎,加強實證性研究。尤其是圖書館館員研究群體,對人工智能技術在圖書館中的實際應用情況了解程度高,基于實踐做出的理論研究更具說服力。在人工智能時代,圖書館員應該注重學習人工智能、機器學習等相關知識、掌握計算機、互聯網和通信技術,及時跟蹤人工智能在圖書館領域的新應用和新發展[13]。
《中國人工智能發展報告2018》提出,中國人工智能技術的發展和應用市場已處于國際領先地位。但中國的優勢主要是在人工智能技術應用開發領域,而在硬件、算法等人工智能核心技術領域,還比較薄弱[12]。報告提出的觀點,也在本文的專利分析中突顯出來,國內圖書館界應該加強人工智能核心技術的研究。譬如,黃曉斌和吳高提出以人工智能核心技術為支撐的智能搜索引擎面臨很大的發展機遇,但是目前,仍然在交互性差、無法提供多維搜索、無法呈現高度個性化結果等方面,無法實現人工智能算法技術突破[14];孟慶宇提出,在數字圖書館人工智能技術應用方面,面臨人工智能技術硬件設備的研究經費不足、人工智能技術人才不足等問題[15];由此可見,鞏固應用技術的發展,加強核心技術的研發,應該成為我國人工智能專利布局的新方向。
結合上述分析及全球技術申請趨勢對比,在技術分布方面,國內外數字數據處理技術專利申請數量一致居高不下,說明數據的處理在圖書館領域仍然具有較強的活力。另外,近年來陸續增長的數字信息傳輸、數據識別、數據表示、記錄載體及其處理等技術即將進入快速發展階段。在與國外技術構成對比時發現,我國在語音分析、合成、識別或處理技術研發力度較大,在信息存儲和半導體器件方面申請專利數量較少,明顯的優缺點對比,說明中國應該在保持語音處理技術優勢的同時,加強信息存儲、半導體器件的研發。國內技術分布較為集中,應該在保持成熟技術穩步發展的前提下,重視新興技術的發展熱潮,如識別技術、參考咨詢機器人、深度學習、神經網絡模型等。譬如,2017年12月華中師范大學圖書館開通“刷臉”進館和“刷臉”借書服務,該圖書館籌劃利用人工智能技術建設自建數據私有云、網絡安全多維度防護、手機借還、業務大數據平臺、高精度三維導航、讀者藍牙物聯等服務與應用平臺[16];2017年9月,百度聯合武漢大學把人工智能引入圖書館,合作建設AI圖書館,實現個性化推送服務[17]。
上文申請人分析中提到,人工智能技術在圖書館應用專利申請數量排名前20的申請人中,包含浙江大學和上海交通大學兩所高校。通過進一步統計前50名申請人可知,華中科技大學、西安電子科技大學、北京理工大學、北京航空航天大學、清華大學、華南理工大學、武漢大學等8所高校也位列其中。這說明,中國高校在人工智能技術領域的研究地位舉足輕重。2017年,全國申請開設“人工智能”相關專業的高校有250多所[18]。高校的熱情來源于市場的需求,人工智能領域內的產學研結合勢在必行。2018年6月,同濟大學舉辦了人工智能研討會,匯集領域專家學者和校友代表,挖掘人工智能應用場景,探討如何促進產學研合作。同月,字節跳動公司和吉林大學人工智能學院,達成戰略合作,雙方將在人才培養、技術交流、科研建設等方面深度合作[19]。《2018世界人工智能產業發展藍皮書》中也提出要促進技術的迭代和成熟、實現產品應用的落地,同時應該重視人工智能技術人才的培養,尤其是算法層面,加強人才儲備,鼓勵創新,挖掘人工智能研究者的強大潛力[10]。
由上文可知,國外人工智能的研究快速發展階段持續了20年左右,國內人工智能正處于快速發展階段的黃金時期。與此同時,業界對于智慧圖書館的研究如火如荼。可以推測,人工智能在智慧圖書館中的應用研究將成為圖書館界當前乃至今后較長一段時間內的一大研究熱點。為此,王世偉提出,智慧圖書館是以數字化、網絡化、智能化的信息技術為基礎,以互聯、高效、便利為主要特征,以綠色發展和數字惠民為本質追求,是現代圖書館科學發展的理念與實踐[20]。蔣康提出,人工智能可以應用在智慧圖書館的個性化感知系統、信息資源智慧處理系統、信息智能化分析系統、圖書資源信息收集、圖書資源分類的智能化、資源安全管理、網絡建設等方面,并且對人工智能在智慧圖書館中的應用進行了可行性分析。由此可見,人工智能技術與互聯網、云計算、物聯網等技術相結合在圖書館發展中的應用逐漸增多,人工智能技術能夠提高圖書館的工作效率、改善圖書館的服務方式,加速智慧圖書館的發展與最終實現。
人工智能技術將會被應用到圖書館的每個角落和各項業務之中,本文通過對比分析國內外圖書館人工智能技術應用專利的申請趨勢、技術構成和申請人,發現國內圖書館應用人工智能技術起步較晚,準備階段較短,發展較快,現在處于快速發展階段。根據國內外專利申請的趨勢和特征,提出五點發展建議,希望通過對中外圖書館人工智能應用專利的對比分析,能為圖書館人工智能研究及應用提供參考,拓寬研究思路。
此外,值得關注的是,習近平總書記在寫給2018年世界人工智能大會的賀信中提出,人工智能為經濟發展注入新的動力,要把握人工智能發展趨勢,同時也要處理好人工智能與法律、政府治理、安全、道德倫理、就業等方面的關系[21]。因此,在今后學術研究中,除了要考慮人工智能功能屬性、技術特征、應用范疇等技術因素外,還需要跳出這些微觀范疇,從國家戰略、社會倫理等宏觀層面思考如何將人工智能研究與社會人文、政府治理等問題相結合,除外,在制定人機共存規則和道德規范框架方面同樣還有諸多問題需要進一步探索和研究。