王建新
(南京圖書館,江蘇 南京 210018)
1956年,約翰·麥卡錫(John McCarthy)在達特茅斯會議上首次提出“人工智能”(Artificial Intelligence)的概念[1]。人工智能作為計算機科學的一個分支,被人們稱為“現代技術的三大尖端之一”。美國國際斯坦福研究所人工智能研究中心主任尼爾遜將人工智能描述為“有關認知的課程”[2]。麻省理工學院的溫斯頓教授認為,人工智能是研究如何利用計算機執行過去只有人類才能完成的任務[3]。雖然學者們對人工智能的定義各不相同,但他們的觀點都體現了人工智能學科研究的基本思路與內涵,將人工智能科學歸納為研究人類智慧活動的基本規律。
人工智能時代,世界信息量快速增多,技術的進步逐步改變了用戶的信息行為和信息需求,圖書館用戶流失的問題日益凸顯。2017年的調查數據顯示,我國網民人數超過7.5億人,其中移動互聯網網民接近10億人[4],我國國民的閱讀量與微信讀書時長持續增加。相關調查數據顯示,人們偏好利用搜索引擎檢索閱讀資源,圖書館網站的利用率較低,紙質圖書借閱量呈下降趨勢,用戶流失問題嚴重。
目前,信息服務領域的“信息孤島”問題仍然存在。雖然圖書館積極依托超星、CNKI、Elsevier、EBSCO等大型數據庫開展智慧化建設,但由于各數據庫的資源操作模式、數據格式不同,圖書館在人工智能資源利用方面存在較多問題。EDS、Summon、Primo等國外的搜索引擎支持統一檢索,資料公開,但我國CNKI、超星、百度學術等數據庫的搜索引擎仍無法全面實現精準檢索和知識聯系。美國圖書館協會的相關報告提出,2010年至2016年,學校圖書館的數字內容檢索成功率有所提高,但用戶體驗仍然不佳,說明學校圖書館在資源整合方面存在問題。
國外的Google、Bing、Yahoo,以及我國的百度、搜狗、360等搜索引擎大多以被動式檢索為主,用戶需主動輸入準確的關鍵字才能完成檢索,僅能提供鏈接,缺少與用戶的互動。目前,搜索引擎存在的主要問題為無法整合多維度的信息、難以處理詞語表達差異及難以實現個性化搜索等。為實現智能檢索,圖書館應對大規模結構化數據進行快速檢索、整理,以感知網頁中的內容及其含義,并將非結構化的聲音、影像等信息轉化為計算機可識別的數據。
圖書館大多為社會公益性組織,運營資金主要依賴財政撥款。在不明確人工智能技術經濟效益的前提下,圖書館應通過合資、自主開發或申請政府資助等方式解決技術資金問題,開展人工智能項目的研發工作。目前,僅有部分大型圖書館有機會獲得有關部門和機構的科研資金支持,但仍難以滿足圖書館對人工智能技術的研究需求。因此,圖書館要想在人工智能領域實現跨越式發展,就必須不斷尋找新的資金來源和合作途徑。
筆者構建了一種基于人工智能技術的圖書館框架,該框架主要涵蓋基本硬件層、數據融合層、技術處理層、應用服務層等主要層級,綜合利用大數據分析、數據挖掘、圖像信息服務、機器學習、智能信息提取等人工智能技術,實現多場景、多維度、多業務的圖書館智能服務規劃,以期為讀者提供智能圖書推薦、智能導航定位、智能參考咨詢、智能檢索及智能預約等智慧化服務。
3.2.1 基本硬件層。基本硬件層涵蓋傳統的電腦控制系統、存儲器、計算設備等要件,以及互聯網、傳感器、信息處理等人工智能技術設施,可為智能圖書館平臺的大規模信息化建設提供軟硬件支持。
3.2.2 數據融合層。數據融合層一般分為資源信息池、讀者信息池和認知信息池三個部分。其中,資源信息池是圖書館底層的數據資源,認知信息池包括無線感應、視頻監測、基于RFID技術的空間信息等要素,讀者信息池包含讀者的個人信息和行為信息。數據融合層可提供互聯網信息、資料庫信息、組織架構信息、開放存儲信息、網絡資源信息等基礎數據,這些信息部分來源于圖書館的資源管理數據體系,部分來源于互聯網、知識庫等[5]。
3.2.3 技術處理層。技術處理層是該總體框架的核心層,集成了統計分析、數據挖掘、機器學習、自然語言處理等功能,能夠實時對讀者的行為進行感知研究,發掘業務需求[6]。技術處理層的關鍵技術包括統計分析與數據挖掘、聚類分析與預測、定量分析與定性分析等。
3.2.4 應用服務層。應用服務層為圖書館智能業務的最終表現形式,主要包括智能數據信息資源業務、智能信息內容業務和智能信息需求業務三個部分,旨在準確掌握讀者的智能業務需求,開展有針對性的智能服務,協助讀者收集、使用及共享信息數據。
圖書館要想科學、合理、有效地利用人工智能技術,就要提升館員和讀者的技術素養,不斷拓寬人工智能技術的利用渠道,解決運營過程中存在的技術問題。為此,圖書館可引導館員深入學習人工智能技術,利用人工智能技術解決工作中的實際問題,提升他們的服務工作質量;加大對館員的培訓力度,使館員完全掌握人工智能技術的利用方式,提升服務能力;開設以人工智能技術為主題的專業培養課程,并注重信息技術的創新性研究[7]。
大數據關乎所有公民的個人隱私安全,因此,圖書館必須建立規范的大數據應用標準,明確基于人工智能的數據分析及應用權限,防止相關問題和糾紛的產生。一方面,有關部門應在法治倫理層面規范和約束圖書館利用人工智能技術的行為;另一方面,圖書館應根據相關法律法規建立智能圖書館數據使用標準,科學、正確處理在利用人工智能技術過程中出現的各類問題,維護讀者和館員的正當權益。