俞鵬
【摘要】智能圍棋軟件Alpha-go與圍棋九段李世石的人機大戰將人工智能帶入我們的視野,為圖書館大數據挖掘、大數據分析、圖書物聯網提供了新的解決方案,未來圖書館服務的提供將從人力向人力與計算機分工合作的方向發展,在保證服務數量的同時提高服務準度和精度。
【關鍵詞】alphago;人工智能;大數據;數據挖掘;數據分析;智能算法
【中圖分類號】G251 【文獻標識碼】A
2016年3月的一場人機世紀之戰,將Alpha-go這個名字帶入到世人的眼中,也將人工智能的火熱程度推向了一個新的高度,深度學習網絡(CNN)、蒙特卡羅搜索樹(MCTS)這些計算機領域的專業技術進入了圖書館人的視野,為圖書館智能化服務發展提供了一條可行的道路。
一、圖書館大數據發展現狀及不足
圖書館目前的大數據工作主要集中在兩個層面:收集層面和應用層面。收集層面有以下3個方面:一是依賴圖書管理系統的讀者基本信息的數據收集;二是依賴圖書管理系統的讀者行為記錄的收集;三是依賴網站、微信、APP的讀者行為記錄的收集;四是文獻資源的數字化。應用層面有兩個方面:一是依賴圖書管理系統的數據統計和分析;二是由讀者實時流量、圖書借閱排行榜、借閱分類排行榜、周期統計等數據組成的數據大屏等。
就目前圖書館大數據發展的狀況而言存在以下三個不足:
(一)讀者基本信息的數據收集不足
以匯文系統讀者注冊為例(如圖1所示),讀者信息包括姓名、性別、身份證號、職業、職稱、專業、電話、移動電話等,系統所規定的基本信息已經很完整。但關鍵在于很多圖書館在讀者注冊時沒有將信息填寫完整,一般只填姓名、身份證號、移動電話等,有的連性別、職業都沒有填寫。這樣就造成了圖書館擁有大量的讀者,可沒有足夠的讀者信息,無法對讀者進行聚類分析和關聯度挖掘。
(二)讀者行為信息的數據收集不足
目前大部分圖書館對讀者行為信息的收集還主要是收集讀者的借閱行為信息。但是有很多更為重要的行為信息被資源供應商掌握在手中,如什么讀者在什么時間下載過什么論文、閱讀過哪些繪本、觀看過哪些視頻,這些行為數據全部掌握在資源商的手中。同時,隨著科技的發展,新技術為我們提供了更多的行為信息收集手段來,如讀者在哪類書架前停留了多長時間、讀者在OPAC里搜索過什么詞條等等。因為沒有足夠的行為信息,我們對讀者的借閱行為還原度不足,分析素材不全。
(三)資源的數據標引不足
在這里我說的數據不足主要有三點:一是MARC數據的標引在數據分析領域的應用缺陷。這么多年來,我們圖書館一直在很注重紙質圖書的書目數據,每個圖書館都形成了一大批MARC數據,但對于書的內容,我們只是按照中圖法進行了分類,但同類書中內容的好與壞、內容的涉及面以及面對不同讀者產生的閱讀觀感都是不同的,所以現有MARC數據沒有辦法對很好的滿足在閱讀分析時的一個圖書定位分析需求;二是電子資源的數據標引不足。現在讀者的需求不僅僅局限在圖書、期刊、報紙,網頁、視頻、圖片等資源也進入到了讀者需求的范圍,但對于這方面的電子資源數據標引很多的圖書館還是一片空白;三是不同資源類型之間的數據挖掘不足,沒有很好地建立一個數據體系架構,沒有辦法提供給圖書館工作人員進行數據分析。
(四)圖書館數據的智能分析方法不足
這么多年來,我們一直在說讀者借閱行為分析、借閱行為預測、閱讀傾向分析、閱讀傾向預測,但我們的數據分析大多還只停留在統計分析層面,只是拿出數據進行對比、類比、環比,這只是分析的一個初級階段或者是統計階段,預測一下來館人流量的走向、排一下借閱排行榜等,最大的問題在于我們沒有引入當下比較行之有效的智能算法,還沒有一套完整的圖書館數據分析評價體系。
二、Alpha-go工作原理
從圖2中,我們不難看出Alpha-god其實包含兩個階段:一是線下學習,二是在線對弈。
線下學習又分三個階段:一是通過專業棋手的3萬多幅對局棋譜的全局特征和深度卷積網絡來訓練策略網絡,用局部特征和線性模型快速走棋策略網絡;二是利用第t輪的策略網絡與先前訓練好的策略網絡互相對弈,利用增強式學習來修正第t輪的策略網絡的參數,最終得到增強的策略網絡;三是先利用普通的策略網絡來生成棋局的前U-1步,然后利用隨機采樣來決定第U步的位置(這是為了增加棋的多樣性,防止過擬合)。隨后,利用增強的策略網絡來完成后面的自我對弈過程,直至棋局結束分出勝負。此后,第U步的盤面作為特征輸入,勝負作為label,學習一個價值網絡(Value Network),用于判斷結果的輸贏概率[1]。
在線對弈包含五個步驟:深度神經網絡引入到蒙特卡羅搜索樹(MCTS)中,以壓縮搜索范圍。一是根據當前盤面情況提取相應特征;二是利用策略網絡估計出棋盤其他空地的落子概率;三是根據落子概率來計算此處往下發展的權重;四是利用價值網絡和快速走棋網絡分別判斷局勢,兩個局勢得分相加為此處最后走棋獲勝的得分。五是利用第四步計算的得分來更新之前那個走棋位置的權重,當某節點的被訪問次數超過了閾值,則在蒙特卡羅樹上進一步展開下一級別的搜索。
三、圖書館大數據服務模型
從上面的Alpha-go的原理與圖書館大數據服務模式相比還是有很大的區別的:
(一)規則體系明確程度不同
圍棋有明確的規則體系,這個規則體系讓電腦在走每一步棋之前可以有一個具體的預判。而圖書館數據分析沒有明確的規劃體系,書、報、視頻等資源在被讀者獲取前沒有明確預判。但相反,電腦判斷每一步棋的真實好壞要在很多步之后,而資源在到達讀者手上之后便可立即評判這個資源是不是符合讀者要求。
(二)預測方向復雜程度不同
圍棋一共有361個點,則圍棋下一步可能性的極限值是361個,而資源單從分類來說,以圖書分類來說就遠遠高出這361種可能性;另外,可能性的層級不同,圍棋每一步只有361種可能性,但資源借閱就比這個更復雜。以書為例,除了不同分類的可能性,還有相同類下不同作者的可能性以及相同作者不同書的可能性等等。
(三)外延支撐不相同
Alpha-go的外延支撐相對簡單,專業棋手的3萬多幅對局棋譜,但對于圖書館的大數據服務模型來說,除了對讀者行為數據要進行線下學習外,還要針對讀者信息數據進行數據挖掘建立讀者關聯模型,針對資源建立大數據資源描述模型,這三個模式要相互適應。
讀者基本信息的數據收集不足。綜上可見,我們可以借用Alpha-go的原理,但要對Alpha-go進行模型改造,首先要解決先天的不足。
讀者基本信息的數據收集不足。這個不足其實很簡單,建設統一認證系統的同時與市民卡中心或者移動公司合作,通過第三方機構的用戶信息來完美自己的信息不足。
讀者行為信息的數據收集不足有兩種方式解決。一是要求資源商開放用戶原數據或者訪問日志,再進行數據或日志的分析集成;二是在建立統一認證平臺的基礎上建立統一訪問平臺,將資源統一集成到訪問平臺上,實現統一檢索統一訪問,行為數據由圖書館后臺記錄。
資源的數據標引不足。這項相對較難,目前的文獻資源標引體系沒有辦法揭示關聯數據和提供有效的評價信息,需要自上而下地對標引體系進行改革,當然,有一個更好的方法是引入評論分析體系,如引入豆瓣的書評[2]、各大網站的相關評論進行分析,輔助建立分析體系。
圖書館數據的智能分析方法不足。目前對于圖書館數據分析的研究尚顯不足,但其他領域的智能分析已經開展了很多,也有很多已經成型的我們可以借鑒的智能模型,這里就不多贅述。
(四)圖書館大數據服務模型[3]
從上文我們不難看出,圖書館智能服務模型(如圖3所示)共有三個階段:
第一階段有三個體系:讀者內聯分析體系,主要挖掘讀者之間的內在聯系,揭示讀者的相互影響度;讀者行為分析體系,主要分析讀者借閱行為,形成讀者行為的初步預測,同時對資源分析體系中的資源權值進行反饋[4];資源分析體系,對資源進行合理評分,同時對讀者行為分析體系中對行為權值進行反饋;將讀者內聯分析體系和資源分析體系分別納入線性模型訓練和深度學習模型訓練,分別形成讀者需求分析預測和推薦分析預測[5]。
第二階段預測校驗:讀者需求分析預測和推薦分析預測進入閱讀推薦模型,根據讀者的搜索進行優先推薦,根據讀者的選擇情況進行預測判斷的評價,同時,評價反饋給讀者行為分析體系和資源分析體系,對行為權值和資源權值進行修正。
第三階段體系修正:將第二步新的權值帶入第一階段的三個體系中進行再次的體系修正和權值更新[6]。
這樣的服務模型可以依據以往數據建立一個自適應的智能服務模式,并可以根據實時情況對預測體系進行權值更新修正,保證預測的準確率。
Alpha-go將人工智能帶入到我們圖書館人的視野中,我們通過Alpha-go了解到了深度學習網絡(CNN),了解到了蒙特卡羅搜索樹(MCTS),通過進一步學習,讓我們了解人工智能,了解到智能算法,其實我們可以在服務的過程中更多地引入當下主流的、行之有效的智能算法,如粒子群算法、魚群算法、蟻群算法和神經網絡算法等,當然我們不是都要用這些算法,只需要選擇其中合適的算法來構建適合我們的方式和策略。
參考文獻:
[1]鄭宇,張鈞波.http://www.thebigdata.cn/YeJieDongTai/29392. html,一張圖解AlphaGo原理及弱點,2016(3):16.
[2]嚴志永.基于豆瓣筆記的紙質書讀者閱讀行為研究[J].科技與出版,2016(4).
[3]何都益. 融合人工智能的圖書館資源建設問題反思[J].科技情報開發與經濟,2011(11).
[4]陳臣.基于大數據的圖書館個性化服務用戶行為分析研究[J].圖書館工作與研究,201(2).
[5]吳凱,季新生,劉彩霞.基于行為預測的微博網絡信息傳播建模[J].計算機應用研究,2013(6).
[6]陳愛軍.高校館藏文獻資源的質量評價[J].圖書館學研究,2009(11).