羅希瑩,張燕,王華平,馬鵬飛,胡笳
(昆明醫科大學圖書館,云南 昆明 650500)
近年來,隨著新一代信息技術的飛速發展,智慧圖書館已成為業界的熱門議題,對于智慧圖書館的定義,也是眾說紛紜,研究者們認為:智慧圖書館專注于圖書館的管理與服務的智慧化。面對圖書館當前的智慧化發展趨勢,可將智慧圖書館概括為一種集技術、資源、服務、館員和用戶于一身,實現智慧化服務和管理的新一代圖書館模式。它是一個由智慧平臺、智慧空間和智慧服務三部分有機結合,構成的智能化“圖書館生態體系”。
智慧圖書館的建設時期是高校圖書館服務升級轉型的良好機遇期,服務是圖書館實現其功能和宗旨的重要途徑,提供滿足用戶需求的優質服務是智慧圖書館建設和發展的最終目標。隨著高校圖書館用戶信息行為和信息需求的不斷變化,當前高校圖書館的服務更強調“以用戶為中心”“可持續發展”“模式創新”等。本文以昆明醫科大學機構知識庫的開發應用為例,分享交流在建設醫學機構知識庫過程中的經驗做法,以期共同推動高校機構知識庫的建設及可持續發展。
信息化時代的高校圖書館的智慧服務主要有新理念、新能力和新服務方式三個方面的特征。目前,圖書館智慧服務主要有智能性、知識性、理念性三種概念及內涵。智能性的圖書館智慧服務主要指信息技術(智能化)在圖書館服務等相關領域的結合和應用,例如,圖書館館藏資源的數字化、機構特色書籍、文獻的電子化等,以智能化的方式構建圖書館的服務網絡,提升讀者用戶的體驗感。知識性的圖書館智慧服務主要是指圖書館的高級知識服務,是對于圖書館轉型的重要挑戰,例如,嵌入式服務、學科服務等。理念性的圖書館智慧服務是指圖書館在服務理念、定位上構想,及館員職業精神的體現等,例如,“讀者至上 快樂服務”等等,展現圖書館人的職業精神。
知識服務是圖書館發揮知識組織功能,以學科為基礎,以文獻、信息、數據等各類資源為目標,收集、提煉、整理、組織、保存和傳播知識,在用戶需求目標驅動下,為教學科研提供專業化和個性化的支撐服務。高校是才人培養的重要陣地,圖書館智慧服務的基礎是有效的知識管理。規范化、科學化的知識管理能有效地提高機構成果資源和圖書館資源的利用率,具有極大的推動作用。在智慧圖書館和數字校園的建設背景下,如何實現機構現有成果的有效管理和挖掘利用,使其發揮積極作用,是我們亟須思考的重要課題。
近年來,國內外對機構知識庫的研究相當重視,從中國知網中利用“機構知識庫”為主題檢索出的研究文獻量來看,呈現逐年上升的趨勢(從2009年以后,年均發文量在130篇左右),機構知識庫作為開放獲取實現的重要途徑之一,在經過十幾年的持續增長發展后,其數量和內容都已初具規模。
在教育部印發的《高等學校數字校園建設規范(試行)》的通知中指出,機構知識庫是基于全球開放理念而形成的一種新型學術交流與資源共享模式,目前已成為保存、管理和傳播機構知識資產的重要工具與機制。要將機構知識庫的建設納入高校數字校園建設中。
機構知識庫(Institutional Repository, IR)又稱機構庫、成果庫、典藏庫等,是由特定機構(如大學、研究所、圖書館、博物館等)通過收集、整理、長期保存本機構成員所產生的學術成果,并利用網絡、相關技術建立起來的數字化成果交流平臺,通過將這些數據資源進行規范化的分類、標引、分析后供本機構成員或合作機構成員免費使用。機構知識庫的建設是高校圖書館提供智慧化知識服務的有效載體,是數字校園建設的重要組成部分,也是高校“雙一流”建設的基礎設施。
圖書館作為學校教學和科研服務的文獻信息中心,是學科建設的重要支撐力量,因此,如何適應“雙一流”建設背景下醫學學科建設、新醫科建設的需要,構建醫學學科文獻信息資源體系,自覺地參與到學校一流學科建設,是當前醫學圖書館建設和發展面臨的機遇與挑戰,也是高校醫學圖書館建設智慧圖書館,創新知識服務模式的重要舉措。尤其是醫學高校圖書館建設機構知識庫,是促進和服務健康產業、醫療衛生事業創新發展的重要方式,也是圖書館提供特色醫學信息服務的重要手段。
昆明醫科大學機構知識庫的建設遵循了機構知識庫建設的基本理論和方法,借鑒參考國內外高校機構知識庫建設的經驗和失敗教訓,并針對昆明醫科大學成果產出的類型、特征、規律和形式,研究設計了具有個性化功能和特征的昆明醫科大學機構知識庫建設方案,在具有豐富相關經驗的軟件公司的協助下,對系統平臺進行研究開發,反復測試,建成具有本校特色的昆明醫科大學機構知識庫服務平臺,如圖1、圖2所示。利用該平臺對學校醫療、教學、科研以及管理人員提供服務,幫助學校各級各層次人員在利用成果申報各種基金獎勵,科研管理、科研合作、提升成果揭示度和學者影響力、本校各學科之間的對標比較分析等方面發揮了巨大作用。

圖1 機構知識庫系統架構

圖2 昆明醫科大學機構知識庫首頁
調研與設計是機構知識庫建設的第一步,決定了機構知識庫建設的定位和目標。首先對機構知識庫需求進行了調研,調研的部門包括各學院、各系、研究所、附屬醫院以及行政管理部門,調研對象包括師生、臨床醫生和行政管理人員。在給調查對象充分宣講機構知識庫建設的目標和意義的同時,注意收集和聽取他們對機構知識庫建設的理解、對機構知識庫的個性化需求以及未來機構知識庫應該如何發展等具體意見和建議。另外,還對現有IR系統平臺進行了調研,了解有哪些開源系統和商業系統平臺,這些系統和平臺的功能和性能如何,是否有數據清洗機制,如何采集和處理元數據,各自有哪些優缺點等等;還對學校各行政部門的信息系統進行了調研,如科研管理系統、人事管理系統的系統開放性、數據共享、接口對接等等。在遵循機構知識庫基本結構和功能的基礎上,結合昆明醫科大學的特點和需求,以及調研的結果,設計合理、可行、實用的昆明醫科大學機構知識庫的結構、內容和功能等。
3.2.1 機構成果典藏庫
廣泛采集昆明醫科大學科研成果產出數據,通過對本機構所擁有的所有類型、所有文件格式的知識產品的收集整理形成了“昆明醫科大學成果典藏庫”。這些知識產品包括公開出版和未正式發表的,形式有:期刊論文、研究報告、教材專著、會議論文、病案(病例)分析、專利和學位論文等成果元數據內容全面,支持引證元數據,包括標題、主要責任人、次要責任人、責任人機構、來源、標識碼、關鍵詞、摘要、被引頻次、影響因子等幾十項。數據采集來源主要包括Web of Science(SCI)、PubMed、中國知網、萬方等多種數據源。采集過程中,注意元數據規范和數據質量,建立數據質量控制體系,確保采集數據的完整全面。對采集到的各種類型的研究成果分門別類地導入軟件系統的后臺數據庫中。如圖3所示。

圖3 機構成果典藏庫
3.2.2 機構學者庫
機構學者庫是本機構知識庫的一個重要組成部分,提供從“昆明醫科大學”學者的維度去揭示本機構知識成果,揭示本機構學者的綜合實力和學術競爭力。學者庫的外在表現形式為本機構每個學者都有自己的個人學術主頁,內容包括每個學者的全部詳盡信息,特別是有關的學術信息。學者庫是相對獨立模塊,其中學者與機構典藏庫中的數據相關聯。學者文章列表中分別對發表日期、文獻(成果)類型、收錄情況進行顯示、排序。對學者學術歷程、合作者、發布期刊進行可視化展現。可提供學者成果引用情況和列表。學者主頁信息包括學者的個人簡介、學者唯一識別號、研究熱點、學術成果、合作關系、研究主題、關聯信息、被收錄引用下載情況、著作、研究項目/課題等。并將學者的科研產出以可視化的成果圖譜進行展示,如圖4所示。

圖4 機構學者庫
3.2.3 提供多維度多層次多類型的檢索與瀏覽
本機構知識庫提供多維度多層次多類型的檢索與瀏覽服務,可以對本機構成果進行全方位的揭示與挖掘,使用戶對本機構成果有一個更深的了解和理解。
支持全文檢索、一鍵檢索、復雜檢索、智能聯想檢索;同時還可以進行包括發表日期、文獻類型、發文語種、所屬學科、收錄類型、全文/無全文的分面瀏覽。同時支持相關度、題名、年份、被引次數、影響因子等排序方式。在檢索結果的顯示頁,每條成果按題名、作者、來源、收錄引用數量、替代計量指標圖、推薦數量等進行顯示;在成果詳細顯示頁面,顯示該成果所有詳細元數據信息、引用該數據的格式、與該成果關聯的其他成果等。
3.2.4 以數據和圖表的形式進行可視化展現
展現與揭示功能能夠提供給用戶更深層的角度去了解本機構的成果和產出。包括檢索結果多種排序方式;每條成果顯示內容豐富;多維多層次聚類分析、分面統計;可視化分析展示;學者成果列表;學者成果引用情況列表;可視化展現學者的學術歷程、相關合作者、發表期刊等;ESI學科評價、趨勢分析等,如圖5所示。

圖5 可視化分析
3.2.5 有效對接、整合數據資源
對接與整合功能是機構知識庫與外界系統進行數據交互的環節,是擴大機構知識庫作用和影響的重要功能,也是機構知識庫價值的體現。本機構知識庫的對接與整合分為三個方面,一是與WoS、ESI、Incites等商業數據庫的對接與整合,實時獲得本機構成果在相關商業評價數據庫中的評價數據信息;二是與科研管理、人事、教學系統進行對接,在實現統一的系統用戶認證的同時,實現數據交換,避免用戶數據和成果數據重復建設,實現機構內的數據共享和一致,避免形成信息孤島,大大節省人力和物力。三是與學科評價和趨勢分析系統對接,實現數據交換,從而保證評價系統數據的準確性和精確度,確保評價和預測系統結果的真實性和正確性,也提高了學科評價系統和趨勢分析系統的實用價值和可信度。
3.2.6 引入人工智能技術進行數據清洗
數據清洗一直是行業內在建設機構知識庫過程中必須要面對的困難和瓶頸。很多機構庫都是因為沒有對數據進行有效清洗,從而導致最終的機構成果不可信、不可靠而失敗或停滯不前。
數據清洗技術是一項比較復雜的數據處理技術,本機構知識庫開創性地采用合作網絡分析技術、語義挖掘技術、語義關聯和聯想技術等人工智能技術進行數據的清洗和優化,力求使清洗的數據達到一個極高的準確率,并保證依據此數據做出的各種聚類統計和分析結果準確無誤,真實反映學校某個院系、學科或者學者的真實狀況和實際學術影響力。目前,本機構知識庫的消歧率可達98%,且機構的學術成果皆可準確分配至二級學院及各附屬醫院。
從各種數據來源采集的數據往往存在機構名稱、作者姓名的變異表達,同名同姓、不同作者英文名相同等大量歧義現象和錯誤,很多研究成果如果不加處理很難定位到某一院系(醫院)或特定作者,因此要對采集的數據進行清洗和規范化,這樣才能保證機構庫統計分析的結果真實可信。數據清洗主要分為機洗和手洗,以機洗為主,手洗為輔。機洗即根據數據歧義或錯誤的原因和特點,編制相應的計算機程序對有關數據進行智能判斷和歸類、聚類,從而消除原始數據帶來的歧義現象。對于偶發錯誤導致的歧義,輔以手工清洗(即手洗)糾正,最終保證數據的全面完整和準確。
3.2.7 機構知識庫的可持續發展
一是數據更新機制。機構知識庫數據能否及時更新和清洗是機構庫可持續發展的關鍵。本機構知識庫提供了三種數據更新模式,一是每周從數據中心自動更新;二是用戶手動更新,通過填寫SCI檢索式同步更新(需要SCI使用權限),被引用頻次、熱點論文、高被引論文實時更新;三是從相關來源數據庫下載XLS批量上傳更新。歸納起來,本機構知識庫提供二種數據更新方式。其一,依托后臺的強大功能每周自動數據更新,各院系、學者文獻根據檢索式自動認領。其二,為管理員開發強大靈活的工具,可以針對某類或某二級機構的定向更新,做到查漏補缺,與第一種方式配合完美實現機構庫數據的持續更新。
二是應用多維度多層次聚類統計和分析技術。聚類統計分析的維度和層次越多,對系統的快速聚類、歸納組合、分類等數據處理能力要求就更高。本機構知識庫為每項成果提供全方位的信息展示,包括基本信息,各類評價信息等,這些評價數據實時更新。同時提供多維度、多層次的聚類統計分析,為學校各層級管理者和所有學者提供多種視角的數據支撐服務。系統提供作者、地址、第一作者地址、通訊作者地址、期刊、年代、院系、科室、學科、被引頻次、影響因子、關鍵詞、醫學主題詞等30多項聚類項供用戶選擇,并能夠對前一個聚類結果進行多層次不同維度的反復聚類,直到得到自己需要的特定結果。
三是推廣應用階段主要以“政策約束”和“利益引導”的方式實現校內“人人關注、人人參與”后續數據維護的運行方式,保證機構知識庫的可持續發展。在推廣至全校各學院、各院系、各附屬醫院的全體師生和管理人員使用時,注意收集反饋意見和建議,不斷修正和完善機構知識庫,及時在系統平臺中進行糾正和更新。
為了適應當前智慧圖書館的建設,更好地解決機構科研能力產出分析的難題,更好服務學校一流學科建設,積極探索圖書館創新知識服務模式,本機構知識庫在遵循IR基本結構和功能的基礎上,結合昆明醫科大學實際和特點,通過SWOT分析法來確定IR的建設需求,以用戶需求為中心,突出學科評價功能,應用多維度多層次聚類統計和分析技術可視化呈現本機構知識成果。同時,為保證數據的全面完整和準確,引入人工智能數據清洗技術,開創性地采用合作網絡分析技術、語義挖掘技術、語義關聯和聯想技術等人工智能技術進行數據的清洗和優化,真實反映本機構知識成果和學者的學術影響力。高校機構知識庫的建設、維護和使用是一項長期的系統工程,高校圖書館應敏銳地把握信息技術發展的趨勢,將大數據、互聯網、區塊鏈、人工智能等技術融入圖書館的智慧服務中,創新知識服務模式,不斷提高高校圖書館的服務能力。