編者按:在資本注入、數據集聚、行業布局、技術突破、應用普惠、國家戰略……的多重力量驅動下,人工智能(AI)迎來了一個爆發發展期。
在被稱為“AI應用元年”的2017年,從AlphaGo驚人的學習能力到“女性公民”Sophia,從阿里“魯班”設計師到“說人話”的未來智能助理,不可否認,人工智能給予了我們許多好奇、興奮、驚喜與期望;不可否認,AI同我們每一個人的關系日趨親密,并不斷挑戰著我們的感知與認知極限;不可否認,在未來社會,AI不僅將是我們生活中的基礎資源,還將成為社會發展的驅動力。
在圖情領域,從百度和武大圖書館聯合重新定義“借書”,到機器人“圖小靈”蹣跚于上圖一樓大廳,從“浙思享”在杭城到“思維導圖”展現于禪城,懷抱AI的步伐亦堅實又矯健!站在AI時代來臨之際,我們認為,AI帶給圖情界的既是挑戰,如圖書情報的業務重構與事業轉型等,也是機遇,如基于AI的多場景應用、提升的用戶個性化深度服務體驗等;我們認為,AI時代的到來,也將對圖情事業、教育與研究均產生影響,智能情報、智能檢索等將真正實現, 圖情學術研究的方向、工具、范式等也將隨著AI時代的到來和發展而發生改變。
為此,我們組織了本期“人工智能與圖書情報”專輯,邀請到了吳建中、王世偉、黃曉斌、葉鷹、李廣建、黃水清等業內專家學者,分別圍繞人工智能時代的圖書館發展對策、圖書館服務重塑、圖書館發展變革、智能信息處理和智能信息分析、智能情報分析系統設計、機器學習圖情應用等主題展開學術探討,研究內容有宏觀框架也有微觀思辨、有實踐應用也有理論分析,是我國目前唯一的一組系統結合了AI與圖情研究的文章。
我們相信,本專輯文章必將對AI時代的圖情事業發展、業務重構、用戶服務、AI技術應用產生積極的學術支撐作用!
摘 要:文章從人工智能發展的技術環境、人工智能與信息組織以及人工智能在圖書館的應用三個方面,探討了人工智能對我國圖書館事業發展的影響。文章認為:圖書館在人工智能的應用方面要轉變觀念,人工智能既是一門工具,也是人類的朋友;圖書館要以更積極的姿態擁抱人工智能,并善于與之一起,共同為激活圖書館的交流功能和服務效能做出貢獻。
關鍵詞:人工智能;圖書館;物聯網;智慧圖書館;智能分析
中圖分類號:TP18;G250.7 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2017107
Abstract The author discussed the influence of AI on library from the technological environment of AI development, AI and information organization, and the application of AI in library. The author believes that the library should change idea about the application of AI. AI is a tool as well as a friend of human beings. The library should embrace AI with more positive attitude and use AI to activate the communicating function and service function of the library.
Key words artificial intelligence; library; Internet of Things; smart library; intelligent analysis
半個世紀前人工智能似乎還只是一種奢望,這兩年已成為街談巷議的熱門話題。中央高度關注人工智能的發展。2015年7月發布的《國務院關于積極推進互聯網+行動的指導意見》和2016年3月發布的《國家十三五規劃綱要》都提出要大力發展人工智能,2017年更是將其寫入《政府工作報告》,并于當年7月頒布《國務院新一代人工智能發展規劃》,由此,人工智能在我國進入實質性發展階段。
人工智能不僅已經走來,而且將深刻地影響著經濟、文化以及社會生活等各個領域。據有關預測,2045年約有一半的勞動崗位將由人工智能代替,而在中國這一數字將達到77%[1]。與此同時,人工智能也將促進新業態、新模式的涌現,并催生新的工作機會。本文將從人工智能發展的技術環境、人工智能與信息組織以及人工智能在圖書館的應用三個方面,探討人工智能對我國圖書館事業發展的影響,并提出發展和應對建議。
1 人工智能發展的技術環境
人工智能之所以成為近期發展熱點,主要源于兩方面因素:一是大數據及其處理速度的提升和信息流技術的發展。數十年前人類已進入信息爆炸時代,信息大量涌現且無處不在,但“信息孤島”現象相當嚴重,互聯網及智能技術的深入發展為信息根據人的需要有序流動和智能利用成為可能;二是腦科學和深度學習的發展。計算機通過大數據進行深度學習和機器學習,逐漸形成數據驅動的人工智能。如今人工智能正在從傳統的“用計算機模擬人的智能”,如人機博弈、機器識別、自然語言處理等,向“機器與人融合智能”,如自主無人系統、機器自主創作、智慧城市、智慧醫療、智慧金融、智能制造等的方向邁進[2]。
人工智能的實現必須有三個前提。首先是互聯。從傳統互聯網到移動互聯網,人類走進了一個萬物互聯的時代。不僅信息被有效地激活起來,而且通過與其他信息的連接和組合,不斷產生出新的信息。更重要的是,互聯網通過神奇的連接方式將分布于不同空間的信息在同一時間里聚集起來。簡單地區分有用信息和無用信息的時代已經過去了,任何包括結構化的或非結構化的信息都可能具備某種價值,有些信息現在有用,有些信息將來有用,有些曾經被認為無用的信息與其他信息連接起來會變成有用甚至關鍵的信息。而這一切的關鍵在于互聯;第二是規模。互聯是條件,數據是基礎,人工智能的實現有賴于龐大的數據量。如對于機器學習而言,數據量越大越能提升模型的精確性;第三是速度,數據傳輸速度與數據規模是成正比的,機器要模擬人腦,除了提升算法能力以外,還必須有龐大的數據規模和快速的傳輸速度支撐。也就是說人工智能要達到更高目標,有賴于更快的傳輸通道和速度,而5G時代的到來對于人工智能來說真可謂如虎添翼,有人甚至把5G看做是人工智能的鑰匙[3]。endprint
人工智能之所以沉寂了近半個世紀才迅猛發展起來,是因為數據規模有限、數據流通不暢以及信息孤島等問題嚴重地制約了它的發展。隨著現代科學技術的飛速發展,尤其是大數據、云計算、物聯網以及移動互聯網的廣泛應用,人工智能正步入發展的快車道,其影響必將滲透到社會各個領域、各個層面。總部設于美國的高德納咨詢公司(Gartner Group)每年都要發布年度科技報告,該公司2017年發布的《十大技術趨勢》,把人工智能和高級機器學習放在十大技術趨勢中的首位[4]。同樣由美國新媒體聯盟(New Media Consortium , NMC)發布的《2017年地平線報告:圖書館版》,也將人工智能和物聯網看作是未來四至五年內將對圖書館產生深刻影響的技術[5]。
2 人工智能與信息組織
人工智能離我們并不遙遠,這里舉兩個與人們日常生活有密切關聯的例子。如2016年8月,日本廣播協會(NHK)發布了一則新聞,披露了日本首次通過人工智能救治一名白血病患者的案例。東京醫科研究所用Watson從2000萬篇論文和1500萬件專利中獲得了有關白血病治療的信息,僅用了十分鐘就提出了一個有效治療的建議[6];2017年1月,《自然》雜志報道,美國斯坦福大學研究人員利用“卷積神經網絡”系統(Convolutional Neural Network)對皮膚癌病例進行診斷,研究人員訓練系統分析了近13萬張痣、皮疹和其他皮膚病變的圖像,然后讓系統與斯坦福大學醫學院的21位皮膚科醫生對比測試,結果發現系統的精確度與人類醫生相當[7]。這意味著未來我們攜帶有拍攝功能的手機就可與智能系統互聯,達到疾病診斷的目的。這兩個事例都表明,人工智能已經悄然來到我們身邊。
實際上,具有二十多年歷史的搜索引擎系統早就與人工智能結緣,現在一些知名的搜索引擎都在某種程度上應用人工智能以提升和增強自身的信息服務功能,如谷歌于2015年推出的RankBrain現已應用于日常搜索。這些年來,從搜索關鍵詞發展到搜索自然語言,從搜索語言發展到與語音、圖像和視頻結合,搜索引擎已成為規模最龐大的人工智能實驗和應用平臺。有學者認為,網絡搜索應用人工智能有很好的發展前景,它能借助數據分析獲得用戶的選擇偏好,從而讓用戶網絡搜索的過程更高效,搜索結果更符合用戶的真正需求[8]。
搜索引擎公司之間也在加強合作。2017年6月,美國艾倫人工智能研究所(Allen Institute for Artificial Intelligence)發布了一條新聞,稱該公司與微軟、谷歌、百度等合作,建立開放科學檢索(Open Academic Search,OAS)工作小組,加大智能檢索合作的力度。該公司由微軟的共同創建者保羅·艾倫建立于2014年,致力于人工智能與計算機科學的研究與開發。以前各檢索系統都利用各自的人工智能系統進行開發,如今全球最大的幾個搜索引擎能攜起手來,不僅有利于統一系統和格式,而且能給廣大網民帶來便利。據該網站信息,我國清華大學也參與了具體開發,其承擔的任務是權威檔的建設,即對同名同姓的作品等進行識別研究[9]。
人工智能的發展經歷了能存會算(運算智能)、能聽會說與能看會認(感知智能)和能理解會思考(認知智能)的三個階段。機器早已實現了能存會算的運算智能,而且在能聽會說與能看會認的感知智能上,機器也已證明在大多數情況下超越人類。有報道稱,機器識圖的能力已經超越人類,錯誤率小于5%[10]。就目前而言,機器在確定性、完整性、封閉性的知識領域,比人類做得更好(如阿爾法狗)。但是,真正意義上的人工智能是能理解會思考,從機器可讀到機器可懂是基礎階段,而從機器可懂到機器能像人一樣思考,即達到認知智能,機器還有很長的路要走。
這一點從圖書館目錄揭示方式演變就可以看得出來,圖書館目錄揭示方式經歷了三個階段:書本及卡片目錄時代是人可讀、機器不可讀,機讀目錄時代是機器可讀、一般人不會讀,而到了XML目錄時代是機器和人都可讀,基于XML的語義網技術的發展為邁向機器可懂創造了條件。為了讓機器像人一樣有智慧,本體語言、知識圖譜等應運而生,它們把人類知識表示成計算機能直接使用的形式,為機器實現認知智能奠定了重要基礎。
如果說20年為一代的話,人類至今已經歷了25萬代了,從猿到人,進化的過程是相當緩慢、潛移默化的。但人工智能從老鼠的智力,發展到猴子的智力,再達到類似人的智力只不過用了幾十年,機器達到強人工智能是近在眼前的事,用不了百年就能夠實現超人工智能[11]。
3 人工智能在圖書館的應用
數據是人工智能與圖書館的基礎,也是最大公約數。人工智能一出現就引起了圖書館界高度重視。1990年代,圖書館工作者就夢想借助人工智能提升參考能力,提出參考服務要借助人工智能從書目查詢向有針對性解決問題的方向發展[12]。《國際圖聯趨勢報告》(IFLA Trend Report)從2013年推出以后,每兩三年更新一次。在首版報告中,就已經提到人工智能,認為“人工智能的進展使互聯網設備能夠與語音識別、機器翻譯和語音合成相結合,從而支持實時多語言語音翻譯”[13]。2016年報告進一步指出,目前,人工智能既擁有加強已有的圖書館功能的能力,也有代替這些功能的能力。圖書館需要展開創新思維,開發科學動畫無國界(Scientific Animations Without Borders)行動等創新型工具[14]。在《國際圖聯趨勢報告》的文獻綜述中,人工智能被列為四大技術趨勢之一,并提出人工智能對圖書館未來的影響主要有三個方面:(1)下一代超越關鍵詞檢索的瀏覽器和對網頁內容的語義分析;(2)綜合語音識別、機器翻譯、語音合成以支持實時多語言翻譯;(3)對多元、復雜網頁內容的云服務眾包翻譯和識別[15]。此外,美國圖書館協會2016年度十大新聞也將人工智能發展列為第五位[16],由此可見人工智能已經進入圖書館發展的議事日程之中。在人工智能研究與應用方面,圖書館是可以大有作為的。endprint
(1)要著力自然語言檢索的研究,并探索圖情方法在自然語言中的移植和實現途徑。蘭開斯特(Frederick Wilfrid Lancaster)早就預測過,自然語言將成為情報檢索的規范,普通受控敘詞表的使用將會衰退,這似乎是肯定無疑的了[17]。在《21世紀圖書館展望(對話錄)》(吳建中著)中,張琪玉教授和侯漢清教授都認為自然語言化是當代檢索語言發展最重要的特征和趨勢,這一預測在人工智能熱的今天得到了證實。20世紀70、80年代情報語言學的重心是規范語言,如今將向自然語言轉移,探索情報語言學理論在自然語言處理及其在信息組織和檢索中的應用。情報語言學可以為人工智能的深入發展做出應有貢獻。
(2)要著力深入內容的智能分析能力。今天,一些人工智能技術和工具如卷積神經網絡和協同過濾(Collaborative Filtering)等在智能分析應用上已經比較成熟,這些智能化手段為圖書館情報咨詢和參考服務的精準化提供了更多可能性。此外,智能化信息檢索工具如語義計量(Semantometrics)和語義學者(Semantic Scholar)等在語義和內容關聯方面也做了一些有益嘗試。語義計量的特點是通過深入內容的語義連接,將不同文獻之間的相似內容進行比較和關聯,以此引向新的科學發現[18],語義學者是在谷歌學術(Google Scholar)之類的學術搜索系統基礎上的創新應用,它將深入論文內容,并展示論文中的數據圖表及參考文獻[19]。圖書館不僅要積極地將上述已有的成熟工具運用到圖書館管理與服務之中,還要主動地開發類似系統和工具,以提升自身的服務能力和質量。
(3)要著力探索人工智能在圖書館的應用。人工智能已經廣泛應用于智能要求較高的知識活動之中,如日本經濟新聞社于2017年1月宣布該社已開始利用人工智能自動發布“財經匯要”(Financial Summaries)[20]。還有報道人工智能應用于論文評議的案例,如由美國Aries Systems Corporation公司開發的國際上使用最廣泛的網絡投稿與審稿系統之一的Editorial Manager系統,已運用人工智能工具“元書目計量機器人”(Meta Bibliometric Intelligence)進行論文初審[21]。目前已經有不少圖書館應用人工智能的成功案例。如英國阿伯里斯特維斯大學的兩位學生開發了一款目錄查詢和位置引導機器人,為讀者提供該大學圖書館80萬館藏圖書的查詢和導引服務[22];美國康乃狄克州Westport圖書館于2014年9月引進機器人為讀者提供信息服務[23];日本山梨縣南都留郡山中湖村創造情報館也于2015年9月引進機器人作為正式員工[24]。雖然程度各有不同,但這些應用在提升圖書情報業務與服務的效能上走出了可喜的一步,值得推廣。
未來圖書館是知識中心、學習中心和交流中心。圖書館引進人工智能技術不是為了替代圖書館員,而是為了豐富和增強知識交流和人際交往。因此,圖書館在人工智能的應用方面也要轉變觀念,人工智能既是一門工具,也是人類的朋友。圖書館要以更積極的姿態擁抱人工智能,并善于與之一起,共同為激活圖書館的交流功能和服務效能做出貢獻。
參考文獻:
[1] 盧澤華.人工智能:全球競賽中國領跑(網上中國)[N].人民日報(海外版),2017-03-11(10).
[2] 鄧中翰.人工智能已進入2.0時代[EB/OL].[2017-06-06].http://news.sina.com.cn/c/2017-06-06/doc-ifyfuvpm7569175.shtml.
[3] 百家號.未來產業的霸主是人工智能?5G就呵呵了[EB/OL].[2017-03-27].http://mini.eastday.com/a/170327173440650.html.
[4] Gartner.Top 10 Strategic Technology Trends for 2017[EB/OL].[2016-10-14].https://www.gartner.com/doc/3471559?ref=SiteSearch&sthkw=top%2010%20trends&fnl=search&srcId=1-3478922254.
[5] Michele Cummins.Submit your projects for the NMC Horizon Report 2017 Library Edition[EB/OL].[2017-03-23].http://www.nmc.org/archive/submit-your-projects-for-the-nmc-horizon-report-2017-library-edition/.
[6] Munenori Taniguchi.IBMのWatson、わずか10分で難癥例患者の正しい病名を見抜く,醫師に治療法を指南[EB/OL].[2016-08-07].http://japanese.engadget.com/2016/08/07/ibm-watson-10/.
[7] Jessica Hall.Deep learning algorithm diagnoses skin cancer as well as seasoned dermatologists[EB/OL].[2017-01-25].https://www.extremetech.com/extreme/243352-deep-learning-algorithm-diagnoses-skin-cancer-seasoned-dermatologists.
[8] 亮晨.人工智能助力搜索引擎,讓用戶搜索過程更精準[EB/OL].[2017-06-22].http://www.citnews.com.cn/news/201706/47416.html.endprint
[9] Alan Boyle.Microsoft,Google and Baidu team up with Paul Allens AI2 on Open Academic Search[EB/OL].[2017-06-20].https://www.geekwire.com/2017/microsoft-google-baidu-team-paul-allens-ai2-open-academic-search/.
[10] 沈湫莎.人工智能何時才能讀懂人心[N].文匯報,2017-08-20(3).
[11] 嚴炎,劉星,編譯.霍金預測:未來百年內人工智能將接替人類[EB/OL].[2015-05-15].http://tech.ifeng.com/a/20150515/41082632_0.shtml.
[12] Riddick J F.Reference librarians and serial publications in the age of artificial intelligence[J].The Reference Librarian,1990,
12(27-28):281-287.
[13] 王晶晶,周伽姝譯,朱強校.乘風破浪還是隨波逐流?——如何在信息狂潮中把握方向(中文版)[EB/OL].[2013-08-22].https://trends.ifla.org/files/trends/assets/ifla-trend-report_simplified-chinese.pdf.
[14] IFLA.IFLA Trend Report 2016 Update[EB/OL].[2016-08-25].https://trends.ifla.org/files/trends/assets/trend-report-2016-update.pdf.
[15] IFLA.Technological Trends[EB/OL].[2017-08-18].https://trends.ifla.org/literature-review/technological-trends.
[16] ALA.Ten Stories That Shaped 2016[EB/OL].[2016-12-15].http://lisnews.org/ten_stories_that_shaped_2016.
[17] (美)蘭開斯特.楊勁夫,等譯.情報檢索詞匯控制[M].北京:科學技術文獻出版社,1982.
[18] Petr Knoth and Drahomira Herrmannova.Towards Semantometrics: A New Semantic Similarity Based Measure for Assessing a Research Publication's Contribution.D-Lib,[EB/OL].[2016-11-12].http://www.dlib.org/dlib/november14/11contents.html.
[19] Nicola Jones.Artificial-intelligence institute launches free science search engine[EB/OL].[2015-11-02].http://www.nature.com/news/artificial-intelligence-institute-launches-free-science-search-engine-1.18703.
[20] 日本経済新聞社.AIを活用した「決算サマリー」配信スタート[EB/OL].[2017-01-25].http://www.nikkei.co.jp/nikkeiinfo/news/press/394.html.
[21] Aries Marketing.Artificial Intelligence Integration Allows Publishers a First Look at Meta Bibliometric Intelligence[EB/OL].[2016-10-17].http://www.ariessys.com/views-press/press-releases/artificial-intelligence-integration-allows-publishers-first-look-meta-bibliometric-intelligence/.
[22] Pasi William Sachiti and Ariel Ladegaard.Meet Hugh,the robot librarian[EB/OL].[2016-02-26].https://www.aber.ac.uk/en/news/archive/2016/02/title-181095-en.html.
[23] WestportLibrary.Robotics at the Library[EB/OL].[2017-03-22].http://westportlibrary.org/about/news/robotics-library.
[24] ロボット図書館職員Pepperから見えてくる未來の図書館[EB/OL].[2017-02-02].http://current.ndl.go.jp/e1856.
作者簡介:吳建中,男,上海圖書館研究館員。endprint