劉士軒

摘 要:[目的/意義]對國外“人工智能+圖書館”相關研究進行搜集與分析,梳理人工智能在圖情領域研究現狀,以期為人工智能在圖書情報領域未來研究提供參考。[方法/過程]運用CiteSpace.5.6.R3、Bicomb、Ucinet、NetDraw等工具對WOS收錄的關于“人工智能+圖書館”相關文獻進行可視化分析。[結果/結論]從研究文獻年度分布趨勢看,國外關于“人工智能+圖書館”發文量前期處于低迷狀態,近幾年呈直線上升趨勢。從研究熱點主題看,國外研究主要圍繞圖書館智能技術體系研發與建設、人工智能技術在信息檢索以及知識組織管理中的應用、信息安全與倫理素養等方面。
關鍵詞:人工智能;圖書館;研究熱點;可視化
1 緒論
人工智能(artificial intelligence,AI)是指研發關于模擬、延展人的智能的理論、方法、技術及應用系統的一門新的技術科學[1]。人工智能(artificial intelligence,AI)概念自1956年被麥卡錫提出至今,逐漸成為全球各領域衡量技術水平的核心標桿之一,時代也正由“互聯網+”向“人工智能+”演進。《2017全球人工智能報告》中指出人工智能將造成下一波數字化顛覆[2],人工智能一出現就引起了圖書館界高度重視[3]。本文試圖借助可視化工具、統計軟件等,對WOS數據庫中“人工智能+圖書館”相關文獻進行發文趨勢、研究熱點與主題分布等分析,以期為業界后續研究提供參考。
2 數據來源與研究方法
本研究國外研究數據來源于Web of Scienc數據庫核心合集中SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、ESCI六大引文數據庫,并以TS=((artificial intelligence or AI)and librar*)為檢索式,Web of Science類別選擇“INFORMATION SCIENCE LIBRARY SCIENCE”,通過整理得到有效文獻680篇。在量化分析基礎上,對代表性文獻進行內容分析,選取被引次數和影響因子較高的文獻進行閱讀整理,以期梳理分析國外“人工智能+圖書館”的研究主題。
3 國外“人工智能+圖書館”研究熱點與主題分布分析
利用Citespace軟件對國外近五年內(2015—2019年)圖情領域關于“人工智能+圖書館”主題研究提取頻次≧5,中心性≧0.05關鍵詞進行統計,如下表所示:
利用可視化軟件對國外人工智能+圖書館研究進行高頻關鍵詞共現網絡分析,如上圖,結合近10年高被引文獻歸納出“人工智能+圖書館”領域研究熱點主題分布在以下幾個方面:
3.1 圖書館智能技術體系研發與建設
上圖所示,由人工智能向周圍輻射,連線最粗的為“機器學習—自然語言處理—人工智能”,形成強有力的三角組織并向諸多研究方向衍進,包括大數據、信息檢索、數據挖掘、社會網絡分析等。機器學習與人工智能連線最粗,是該領域以數據為基礎進行計算機技術開發的熱點方向,機器學習是一門涉及面廣、多領域交叉學科,專門研究計算機如何模擬或實現有關人的學習行為,以便通過推演生成新知識地。自然語言處理則是人工智能以及計算機領域的重要研究方向,主要研究人與機器通過自然語言實現有效通信的理論與方法。從關系上來看三者并非獨立個體,機器學習是實現人工智能的核心與基礎,機器學習需要自然語言處理的支持與完善,自然語言處理則需要數據挖掘的支撐。通過大數據衍進可遍及各行各業中,實現人工智能的根本目標。Subramaniyaswamy V[6]等提出一種軟件應用程序,從Twitter中細致地聚集數據,基于詞匯情感分析和深度數據收集相結合,將情感分為不同層次來分析事件。Villasenor EA[7]等介紹了一種基于自組織神經網絡的人工智能程序,可以自動地對墨西哥50所最具生產力的高等教育機構的生產概況進行多參數科學計量特征描述,這個程序可自動識別和可視化描述在二維地圖中共享相似文獻計量資料的機構集群。Blank I[8]基于引文網絡和元數據創建了一個研究論文數據集,可為搜索引擎提供從元數據中提取關鍵字的能力以及為新論文作者推薦關鍵詞。
3.2 人工智能技術在信息檢索以及知識組織管理中的應用
此方面聯系最為密切的研究熱點為人工智能、大數據、數據挖掘、情報檢索、知識管理、專家系統、智能代理等。數據挖掘(Data Mining),是數據庫知識發現(KDD)中的一個步驟環節,一般是指從海量數據中通過算法探索隱匿的具有高質量信息的過程。數據挖掘促進了人工智能情報檢索智能化發展迅速,自然語言處理能力在大數據的支撐下可使用戶更加快捷精確的表達知識需求。信息數據處理系統可模擬某領域一個或多個專家幫用戶制定決策以及分析問題。智能代理則可以接受用戶指令并代表用戶完成任務,理解用戶用自然語言表達對信息資源和計算資源的需求,在一定程度上幫助用戶克服信息內容的語言障礙,推測用戶意圖并為其代勞等,人工智能發展推動了圖書館業務服務能力提升。Kane GC[9]探討了社交媒體對組織知識管理的影響,認為社交媒體將會隨著人工智能、虛擬現實等新興技術發展影響知識管理的實踐。Pieters W[10]認為人工智能專家系統需要能夠向用戶提供一個決策,其研究了在計算科學背景下解釋和信任之間的關系,運用系統論和行為網絡理論的元素應用于AI和信息安全領域。智能代理是一種自然語言交互接口,旨在模擬與真人的互動,Rubin VL[11]等人對加拿大20個最大圖書館網站進行調查,提出會話代理在教育、信息、輔助和社會互動等領域的四種實用目的,并將其轉化為圖書館設置。
3.3 信息安全與倫理素養
信息服務、信息安全、智能倫理等方面進行研究較為邊緣,但隨著人工智能不斷進步與發展,關于信息安全、智能倫理等方面的研究將會成為熱點。人工智能需要尊重人的思維與行為,且在倫理方面也應受到約束。人工智能進一步發展同時推動了人機交互的能力,智能機器人的研究大多集中于自動分類、智能檢索、參考咨詢聊天機器人等方面,如Herrero-Diz P等認為信息平臺上開發的聊天機器人是一個簡單的工具,允許與公眾進行直接和個性化交流,并且聊天機器人目標用戶是25歲到35歲的需特定內容的千禧一代。Gonzalez-Rodriguez D等認為從人類社區的自生視角出發,可將社會理解為自組織系統,將信息素養作為社會發展的助推器,信息素養和任何技術實現一樣重要。Qu R等提出了利用信息含量和概念特征的混合語義相似度測量方法,提出兩種稱為CORM和CARM的語義表示模型,在此基礎上計算系統的支持度。Duan YQ等為識別影響基于人工智能的決策系統相關的挑戰,為信息系統(IS)的研究人員提供一套研究建議,從概念和理論發展、人工智能技術、人類交互、人工智能實施等方面為IS研究者提出了12個研究命題。Wallach W討論了機器人思維和人類倫理需要一個全面的道德決策,構建了人工道德代理(AMAs)強調現有人類道德行為模型的殘缺性。