靳婕
(中國音樂學院圖書館,北京100101)
數字圖書館相比傳統圖書館的優勢在于數字圖書館擁有更豐富的館藏資料,且以文本數據作為存儲方式,能夠滿足用戶數據檢索并獲取文本信息的需求。然而,大數據雖然給數字圖書館的發展帶來了新的機遇,卻也提出了新的挑戰。數字圖書館需要直面大數據帶來的挑戰與機遇,充分發揮出大數據的積極影響,以大數據技術增強數字圖書館的信息服務能力,同時提升其服務層次,從而有效推動數字圖書館的轉型發展,為知識型社會的建設提供助力。
將大數據技術應用于數字圖書館中,需要購置大量軟硬件設施,同時要在大數據的管理、服務等方面大量投入資源,才能夠有效發揮出大數據對數字圖書館的積極影響。然而,圖書館并非盈利機構而是服務性機構,其公益性特點決定了不可能以市場經營作為資金的主要來源,而是要依賴當地政府的撥款,這就導致圖書館的可用資金有限,難以籌集大量資金開展大數據的研發和建設工作。圖書館的資金一方面用于員工工資,另一方面則用于書籍訂購、整理歸檔等文獻采訪工作,能夠用于購置大數據相關的軟硬件設施的資金較少。作為一種社科類研究項目,大數據研究的資金缺口大,加上數字圖書館對于大數據的應用尚未形成明確的標準,導致圖書館在數字化建設的初步階段往往難以明確得出大數據所帶來的積極影響,給提高政府撥款帶來了一定困難。[1]
當前我國數字圖書館在應用大數據時通常采用直接采購或與企業協同開發的方式,獨立開發的大數據應用項目較少,其根本原因在于數字圖書館的大數據研發需要大量高素質人才的支持,但各行業普遍缺乏大數據高端人才,而數字圖書館與其他行業相比又缺乏足夠的競爭力,加劇了數字圖書館人才稀缺的問題。此外,很多圖書館對大數據的發展趨勢缺乏認知,不了解大數據的前沿發展動態,制約了其思維和視野的發展。在與企業合作進行大數據應用項目開發時,往往只是被動接受而沒有根據自身需求進行應用項目建設,使得企業對大數據應用項目的開發參與力度不足,所開發出的應用項目通常難以完全滿足數字圖書館的需求。
數字圖書館應用大數據的主要目的在于要利用大數據的海量信息存儲和處理能力,增強圖書館對數字化文本資源的存儲和檢索水平。在大數據時代背景下,文本資源的數字化使得數字圖書館需要處理的資源愈發豐富和復雜,這些異構分布的資源對數字圖書館的數據采集、處理能力提出了新的要求。[2]然而,即便數字圖書館建設了完善的大數據軟硬件設備,也會因工作人員數據處理能力或算法掌握能力等因素的影響,降低大數據采集處理的有效性。與此同時,在應用大數據進行數據的采集處理時,需要關注兩點技術之外的問題。其一是數字圖書館需要與出版社等合作機構進行協商,建立起完善的合作機制,確保文本數據資源的完整、有效;其二是要建立起用戶隱私保護和書籍的版權保護體系,確保數字圖書館的大數據建設不會引發法律糾紛。
大數據的發展使數字圖書館的進一步建設成為了可能,尤其是如云計算等技術的興起,為數字圖書館服務能力的提升提供了重要的推動作用。在大數據時代下,文本的數字化使得數字化資源愈發呈現出海量、異構的特點,這些多元化的信息資源為數字圖書館提出新的要求,需要數字圖書館積極提升信息處理能力。而大數據技術所具備的信息存儲、分析和處理能力,能夠有效分析出信息數據之間存在的聯系,通過掌握規律來將問題定量化處理,能夠有效提升數字圖書館的館藏建設水平。如語義技術能夠通過分析數據間的語義關系,利用文本間的語義關系提升用戶獲取知識的能力;數據聚類技術能夠將具有某一屬性或特征的數據進行聚攏,便于用戶的資源檢索;信息分析技術能夠通過對文本信息的分析,為用戶提供直觀的數據分析結果;檢索技術則能夠通過海量文本信息的檢索,在極短時間內找出用戶所需的文本資源。利用大數據能夠對傳統的圖書館館藏模式帶來顛覆性的革新,有效提升數字圖書館的服務能力。
應用大數據的信息處理能力,能夠在存儲海量文本資源的同時,在極短時間內對海量信息資源的檢索,完成人力所無法完成的工作。將大數據應用于數字圖書館建設的各個環節,能夠通過確保海量文本資源直接為用戶所用,實現與用戶的無縫對接。同時,數字圖書館可以通過大數據分析建立檢測分析系統,預測目標用戶群的需求,從而提高對用戶的信息服務能力。[3]在大數據環境下,數字圖書館可以開展如下幾種產品或服務模式:其一,服務產品。數字圖書館能夠借助大數據存儲海量資源,為增強自身核心競爭力,需要提供豐富的服務產品,除了文獻和信息的檢索閱讀外,應提供智庫等再生信息服務和知識科普等文化宣傳服務;其二,分析產品。大數據時代往往更加缺乏解決問題的知識和信息處理的能力。數字圖書館可以通過大數據分析用戶行為,通過整理用戶所關注的領域和話題進行需求預測,并結合預測結果推送文本資源,增強數字圖書館館藏資源的利用率;其三,服務模式。數字圖書館本應采取用戶自助式的服務模式,但在大數據環境下,用戶面臨著海量文獻資源往往很難找到真正想要的信息,這就需要數字圖書館將自助式服務轉變為主動推薦式服務,根據對用戶需求的預測結果主動推薦文本,或根據時事熱點新聞進行重點推薦,增強數字圖書館的資源推薦水平。同時,數字圖書館應開辦咨詢服務,采取系統自動應答、人工應答和專家應答三種方式,使數字圖書館能夠真正為用戶學習、工作、生活所用,充分發揮圖書館的社會教化功能。
在云計算、人工智能等技術的發展進程中,大數據已經呈現出了全新的技術生態,信息的存儲、處理、分析能力顯著上升,對各領域的轉型發展起到了重要的推動作用。如語音識別、文本分析等技術的發展,使得數字圖書館得以有效利用各種先進技術,調整現有的服務業態。我國數字圖書館以滿足用戶知識需求為主要目標,通過大數據實現了文本資源的廣泛傳播,且作用于經濟、文化等領域,使數字圖書館更大程度上發揮了公益服務和社會教化功能。在大數據環境下,圖書館需要構建新的管理模式以實現用戶與文本資源之間的直接對接,在擴大文本資源的傳播范圍同時,增強文本資源的知識服務能力,有效推動圖書館的突破性發展。因此,在大數據時代,圖書館應從以下幾個方面實現轉型升級:其一是打破資源框架。大數據時代,無論是數字圖書館存儲的文本資源,還是用戶所需求的信息資源都呈現出多元化的發展趨勢,對數字圖書館的資源采集、分析、管理和服務能力提出了新的要求。數字圖書館必須利用大數據技術建立數據框架,將文本和圖像信息納入到館藏之中,通過分析信息之間的語義關系建立信息組織框架,從而突破傳統圖書館的資源框架;其二是形成全方位的服務理念。數字圖書館應結合大數據技術拓寬自身的服務范圍,一方面要將受眾面向全社會,充分發揮圖書館的社會教化功能,為學習型社會的建設提供助力。[4]另一方面則要提供全資源服務,為用戶提供包括文獻圖像、視頻音頻、政策法規等多種形式的信息資源,以滿足用戶的多元需求。此外,數字圖書館需要調整自身的服務模式,通過信息推送、個性化服務等方式增強信息資源的輻射能力,全面開展數字圖書館業務;其三是發展高端業務。數字圖書館應以智庫作為建設目標,與各學科的前沿領域相結合,發揮其信息分析的能力為各學科的科研工作提供資源支持;其四是調整館員角色定位,數字圖書館館員應對大數據有深刻理解,具有一定的數據分析能力,懂得大數據的應用方法,利用各類軟件工具進行館藏資源的分析整理工作,并加強文獻數據庫的建設,以發揮出大數據對數字圖書館的積極影響。
數字圖書館建設中應用大數據技術,需要建立大量高新的軟硬件設備,不僅要求數字圖書館加大資金投入力度,還對館員的專業能力提出了新的要求。與此同時,大數據的信息采集和處理本身難度較高,且涉及到如出版社、合作企業等機構,需要數字圖書館對文本資源的采集處理、知識產權等有更高的重視。大數據技術雖然會為數字圖書館帶來諸多挑戰,但同時也帶來了新的發展機遇。在大數據時代,數字圖書館需要充分利用各類數字資源提升自身的資源建設水平,為更多用戶提供更為豐富的信息支持,同時大數據能夠提升數字圖書館的信息服務能力,使其開發新的產品或服務模式。此外,大數據能夠有效推動圖書館的轉型升級,使數字圖書館發展更多高端業務成為可能。