汪飛飛+唐智川
摘 要:數據開放共享已經成為大數據競爭戰略的核心。如何有效促進大數據環境下的學術交流與知識共享,對高校圖書館信息資源實現有效管理和共享利用,已經成為當今的研究熱點。文章首先概述了實現圖書館資源開放共享的重要性,其次分析了大數據環境下圖書館信息資源的特點,最后基于數據建設、機構知識庫和移動圖書館,提出了適合高校圖書館信息資源開放共享的相關途徑和建議。
關鍵詞:大數據;開放共享;數據建設;機構知識庫;移動圖書館
隨著社會信息技術和網絡技術的飛速發展,科研人員開始使用并逐漸依賴各種電子產品以輔助其研究成果的生成和共享。這些科研成果數據構成了科學大數據的主體,并以前所未有的速度在增長。國家“十三五”規劃建議提出:“實施國家大數據戰略,推進數據資源開放共享。”可見,數據開放共享已經成為大數據戰略的核心。
目前,圖書館資源普遍具有數據規模龐大、數據資源載體和結構多樣化、信息資源不能充分共享等特點,且所管理的科學數據具有零星分散、類型復雜、無統一格式與標準等問題。因此,在大數據環境下,如何推進學術交流與知識共享,對高校圖書館信息資源實現有效管理和共享利用,是順應大數據時代發展的必然趨勢,已經成為了當今的研究熱點。
一、大數據環境下圖書館信息資源的特點
1.大數據的特點
大數據是一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。大數據以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務或深刻的洞見,最終形成變革之力。
2.大數據環境下圖書館信息資源的特點
大數據環境下圖書館信息資源包含以下幾方面特點:
(1)信息資源規模龐大,質量參差不齊。隨著時間的積累,圖書館紙質資源和電子資源的數量一直在不斷增長。此外,隨著互聯網技術的發展,網絡的使用成本也越來越低,因此每天都有大量的網絡信息資源產生,從而導致網絡信息資源的規模越來越龐大,且質量參差不齊。
(2)信息資源載體和結構多樣化。隨著信息技術的飛速發展和應用,信息資源先后經歷了從紙質時代到電子時代再到網絡時代的過程,信息資源結構亦多呈現半結構化或非結構化特征。
(3)信息資源不能充分共享。一方面,由于傳統圖書館的共享意識淡薄,對于珍貴的、稀缺的資源,大部分圖書館不愿意共享其全部資源;另一方面,傳統的共享模式已經很難滿足讀者的多層次需求。
二、圖書館信息資源開放共享的途徑和建議
結合圖書館信息資源在大數據時代的特點,圍繞圖書館數據建設、機構知識庫和移動圖書館,提出以下高校圖書館信息資源開放共享的相關途徑和建議。
1.加強圖書館數據建設
由于圖書館信息數據規模龐大、質量參差不齊的特點,科學數據又具有零星分散、類型復雜、無統一格式與標準等問題,如何對這些大數據進行有效的數據建設和管理,直接影響到讀者的共享需求。
數據建設流程如下圖所示:
(1)需求分析。需求分析是數據建設和管理的第一步也是最關鍵的一步。因各學科結構、科研規模、數據類型不同,基礎設施條件也存在較大差異,在數據建設時,應根據實際需求,制訂切實可行的目標,然后根據目標對外部數據進行采集。
(2)數據采集。科學數據采集內容包括科研成果(包含作者、論文、專利、專著、項目)、圖書信息、多媒體資源等。大部分內容都可以采用網絡爬行器進行批量采集,個別零散的數據可能需要人工采集。
(3)數據清洗。高質量的數據是數據建設完成預期功能的基礎,因此數據采集后要對數據進行清洗。從外部系統采集到的數據避免不了存在人工錄入時出錯、數據重復以及數據沖突的問題,對數據進行清洗的過程尤為重要,目的是處理無效數據、刪除重復數據和糾正錯誤數據,從而達到數據的正確性和一致性。
(4)數據整合。針對不同用戶的具體需求,還需要將清洗后的基礎數據整合起來,以便得到最終想要的業務邏輯數據。為了保證數據的準確性,數據可經過抽取、轉換和裝載,合并到一個數據倉庫里。在清洗完海量數據之后,可利用大數據搜索引擎對數據進行分析和處理,從而將知識更好地呈現給用戶,并為數據管理者提供數據支持。
2.完善機構知識庫共享機制
圖書館機構知識庫一般由高校圖書館建立,基于網絡對高校成員在工作過程中所創建的各種數字化產品加以收集、整理、保存、檢索、傳播、共享和利用。基于開放存取的機構知識庫支持任何用戶隨時通過互聯網不受限制地合理利用其中的知識資源,有利于跨學科、跨地域的學術交流,全面系統地反映高校的教學和科研成果。機構知識庫能夠提供知識傳遞服務、促進信息資源的管理,同時也能夠有效促進大數據環境下高校學術交流和知識共享。因此,基于數據資源結構呈現多樣化的特點,完善機構知識庫共享機制有利于結構化信息資源的共享與傳播。
3.實現移動圖書館的多模式共享
隨著移動互聯網時代的到來,通過各種移動設備產生的信息資源不斷增長,造就了移動圖書館具有多資源化、多平臺化和多服務的形式的特點。同時,由于圖書館資源不能充分共享的特點,傳統資源共享模式已經很難滿足讀者多層次需求,因此,針對不同的信息資源,在資源共享的過程應該存在多種模式共存的共享機制。基于移動圖書館具有良好的多模式信息資源融合處理能力,因此,移動圖書館應該整合更加豐富的資源,提供多元、多方位的移動圖書館服務。
參考文獻:
[1] 賴劍菲,洪正國.對高校科學數據管理平臺建設的建議[J].圖書情報工作,2013(6):23-27.
[2] 曲翌敏,江 宇.健康大數據的來源與應用[J].中華流行病學雜志,2015,36(10).
[3] 李建偉,宋 文,湯怡潔,等.科研本體知識庫數據建設研究[J].現代圖書情報技術,2013(11):15-21.
[4] 周美華,魏文杰.建設高校圖書館機構知識庫的研究——以揚州大學為例[J].圖書館,2010(5): 62-64.
[5] 員 媛.基于數據管理的高校圖書館機構知識庫的構建分析[J].高校圖書情報論壇,2016(3): 16-22.
[6] 李 懿,徐升繼.多信息融合技術在移動圖書館服務的應用研究[J].河南圖書館學刊,2013(11):120-122.
[7]韓翠峰.大數據時代帶給圖書館的影響與挑戰[J].圖書與情報,2012(5).
[8]姜 山,王剛.大數據對圖書館的啟示[J].圖書館工作與研究,2013(4).