文/甘肅農業職業技術學院 樊惠民
淺析大數據對圖書館資源建設的影響
文/甘肅農業職業技術學院 樊惠民
大數據是21世紀的又一信息化產物,伴隨著互聯網和個人終端的使用,數據的采集、分析和使用成了又一焦點話題。圖書館作為知識和信息的載體自古都是以藏書為主,自有文獻記載以來,藏書的種類、數量一直都是衡量一所圖書館規模的標桿。在當前信息化時代下,以向用戶提供特定的數據服務為目的的高效可用的資源體系構建也受到了大數據帶來的巨大影響。相比較傳統圖書館,大數據的興起使得圖書館數字資源建設正面臨著巨大的影響和挑戰,不僅帶來了數據類型的豐富,還為圖書館未來資源的管理,服務的構建等提供了導向性的意見。本文通過對圖書館資源建設目標和大數據特征的闡述,歸納出在信息時代大數據對圖書館建設的影響,特別是圖書館資源建設過程中信息資源種類增多,產生大量半結構化和非結構化的數據。進而從三方面分析了伴隨數據結構的改變,圖書館資源建設所受到的影響。
大數據;圖書館;資源建設
圖書館自古都是以藏書為主,自有文獻記載以來,藏書的種類、數量一直都是衡量一所圖書館規模的標桿。新中國成立后,藏書建設的概念逐漸豐富與完善,藏書建設到新中國成立后七十年代逐漸形成了一個相對完整的體系,表現為各地區和學校相繼建立了具備藏書、查詢、借閱等功能的圖書館。隨著社會和經濟的發展,國內圖書館之間的各種交流合作增加,原有的藏書服務體系已無法滿足用戶需求,因此在20世紀80年代提出了文獻資源建設的概念。伴隨著智能終端和計算機網絡的普及發展,數字化虛擬圖書館的概念應運而生,到了20世紀90年代中期,文獻資源建設體系的弊病逐漸顯露出來,與此同時信息資源建設的概念開始蓬勃發展。
圖書館資源建設的目標是以向用戶提供特定的數據服務為目的的高效可用的資源體系構建。我國的圖書館資源建設現已發展了幾十年,在文獻資源建設和關系型數據庫資源建設方面取得了一定的成績,主要集中在大型的綜合數據庫和部分自建的特色數據庫中。伴隨著全球大數據呈現爆發式增長,大數據已經滲透到各個行業和業務職能領域。在當前圖書館數字資源的建設過程中,急劇增長的資源建設和多元化的信息服務建設引起圖書館的思考與探究。而大數據時代的來臨,使得圖書館數字資源建設面臨巨大的影響和挑戰。
“大數據”的產生學術界普遍認為是繼云計算、物聯網之后IT產業的又一次技術革新,會對人類探索和認識世界的思維方式帶來巨大的改變。同時“大數據”也是一個用來描述海量的結構化和非結構化數據的短語。有著廣泛的分布,包括業務流程的數據、企業產生的大數據、社會發展的大數據、個人生活的大數據、科學大數據等。利用大數據,不僅可以在產生、收集和傳遞信息方面精簡人力,提升工作效率,而且在信息分析和推理上形成重大的意義,還可以根據數據的產生趨勢進行正確、有效、有依據的判斷和決定。通過合理的使用大數據,可以為決策和個人生活帶來巨大的便利。大數據的產生也與以互聯網技術為標志的信息技術密切相關,其具體的形成過程涉及數據挖掘、海量存儲、數據分析等。雖然業界一直沒有對大數據進行準確的定義,但對大數據的特征可以進行如下的總結:
(一)數據量大。隨著互聯網和移動終端等的不斷發展,人們的個人信息、網絡社交等各種類型的數據呈爆炸式增長,形成了信息量龐大、內容不斷更新變化的大數據。對圖書館而言,伴隨著信息資源的電子化、用戶訪問和需求數據等的快速增加,數據量日漸龐大成了必然。
(二)數據類型多。數據的類型主要指數據結構。隨著移動互聯網的快速普及,移動智能終端和通信工具的發展,傳感器技術的滲透,數據的結構從以前的單一結構化慢慢增加為半結構化和非結構化的形態。
(三)數據流動快。數據的流動包括數據的創建速度和數據的處理速度。大數據的一個重要特點就是實時性,實時性是指數據的創建速度和處理速度都非常快。所有用戶通過智能終端產生的數據都具有流動快的特點,也都屬于實時數據,因此稱之為流式數據。而這類數據需要進行及時的采集和處理,這是傳統的數據服務系統無法滿足的。
(四)數據價值密度低。數據價值是進行大數據分析和挖掘的目標和意義。數據的價值與飛速增長的數據量沒有絕對的正比關系,相反伴隨著數據量的快速增加,數據所具有的價值沒有太大增幅數據的價值密度就會降低,因此增加了獲取數據中有價值信息的難度。
隨著大數據的應用向各行各業進行滲透,傳統的數據管理模式也將面臨重大的革新,特別是在數據的來源、存儲、組織、分析和價值利用等方面都將進行革新,而圖書館作為知識和文化的傳播橋梁也會受到影響。這些影響可分為數據類型和圖書館資源建設兩方面。
在數據類型方面,傳統圖書館數據以紙質類的圖書和報刊為主,近些年依托網絡和數字化建設,電子書資源和數據庫資源逐漸在豐富,許多紙質書籍報刊也都轉換為數字資源,甚至許多音頻和視頻資源也都進行了整理,而這些數據資源都屬于結構化的數據。隨著互聯網的發展,圖書館的數據類型也發生了改變,主要有以下三種數據:
1.基于社交平臺的半結構化和非結構化數據。在社交網絡逐漸成為生活中不可缺少的一部分時,借助大數據分析技術可以對社交網絡中產生的半結構化和非結構化數據進行收集,分析出當前大部分讀者的愛好和閱讀習慣。為后續圖書館資源建設和服務開展提供導向性意見。
2.由讀者產生的非結構化數據。根據讀者的各種檢索、查詢、借閱等信息綜合產生的讀者閱讀信息,與讀者所擁有的用戶信息、地理位置信息、瀏覽器信息等數據結合,再配合圖書館所固有的各種電子資源,成了圖書館的大數據。通過對這些進行收集、整理形成完整的圖書館大數據。
3.政府及相關機構發布的即時信息。這類即時信息的特征是實時性強,主要集中于社會關注的熱點和各行業的指導信息,大多屬于板結構化和非結構化的。圖書館通過對這類信息進行處理和分析,一方面挖掘這些數據的價值,另一方面可以為讀者提供各類即時服務,使讀者獲取更專業的知識和信息。
數據類型的改變也為圖書館資源建設帶來了諸多影響,可以歸結為以下幾點:
1.核心資源的轉移。目前圖書館的核心資源依然是經過長時間數字化形成的各種傳統關系型數據庫,但是隨著大數據分析處理技術的發展,數據背后的隱藏價值被發掘和利用,原有的傳統關系型數據庫其將發生重大變化,普通讀者用戶通過各類應用在互聯網上產生的社交網絡數據將取而代之。讀者在使用圖書館數字資源時產生的訪問數據,政府、新聞媒體及其他社會機構發布的即時信息等將成為大數據背景下圖書館的核心資源。
2.依托大數據進行服務質量的優化。圖書館行業的競爭本質上不局限于館藏信息資源的規模,還包括對大數據信息的挖掘、處理和分析,進行更符合讀者需求的數字資源建設以保持圖書館在傳播知識和信息領域的核心競爭力。通過大數據的分析還可以對圖書館未來發展提供支持,進行服務質量的優化和升級。
3.數據結構類型更加復雜。傳統圖書館的數據以處理關系型數據庫的數據為主,屬于結構化數據,而面對類型為半結構和非結構的數據時就無從下手。針對半結構和非結構數據進行分析、處理和挖掘,獲取這些數據可以為圖書館數字資源建設創造許多有價值的信息。
從上文論述可知,在大數據時代,隨著數據來源、數據類型等的改變,圖書館資源建設也面臨重大變革,主要表現在以下幾方面:
(一)擴大圖書館數字資源范疇。保留圖書館紙質圖書、期刊、報紙等資源的同時,一方面將傳統資源數字化,并且將一些政府信息、社會關注熱點、信息訪問量大的熱點包括其中,更要將用戶通過圖書館終端搜索、查詢、下載等的行為信息作為資源進行采集。另一方面,要增加對數據資源的關聯和挖掘分析,以形成各類由于的信息,真正擴大數字資源的范疇。
(二)加強圖書館數字資源加工深度。數字資源的組織加工時對數字資源的整序,是資源的一種知識展現形式。對于數字信息,結構化的信息所具有的表現形式基本上限制在資源庫內部。在大數據環境下,需要將圖書館數字資源建立語義關聯,形成面向社會資源的圖書館數字資源組織架構。同時,應將信息通過知識解構和知識建構的方式進行深加工。不僅充分發揮數據發掘、軟件分析工具的作用,更要特別提升圖書情報領域涉及的主題詞表、分類詞表等的應用和共享能力。
(三)促進圖書館用戶行為信息組織。用戶的行為信息是互聯網環境中圖書館所獲得的新的非文獻資源。用戶行為信息可以作為圖書館知識服務與推薦的寶貴資源,通過進行行為信息的深度挖掘和有效組織,能夠做的將用戶行為與文獻資源、目標資源以及其他資源進行關聯,為知識服務個性化提供參考依據。
(四)提升圖書館網絡設施建設。由于大數據處理需要較強的數據采集和存儲能力,較高的計算能力,因此對圖書館的IT構架提出更高的要求。同時隨著數據量的不斷增加,數據的類型越來越多,圖書館支持復雜數據組織和管理的硬件基礎設施提出了更高的要求。
(五)促進圖書館服務的變革。通過挖掘元數據倉儲使得網絡計量學和文獻計量學的某些統計以及評價方法可以擴展,發展成為便民服務;通過對數據信息的挖掘和分析,創建圖書館服務的新模式;對實時數據進行分析和決策,發揮圖書館的智慧導向功能。
圖書館作為知識傳播和推廣的平臺,其資源的建設和有效的利用非常的重要。在大數據快速發展的今天,利用大數據理論和技術對圖書館資源庫的建設進行擴展,不僅可以幫助圖書館建設更為豐富完整的資源體系,更可以為讀者提供更加優質的服務,進一步促進知識和文化的交流。
[1]張興旺.圖書館大數據體系構建的學術環境和戰略思考[J].情報資料工作,2013(2):12-17.
[2]劉明,李娜.大數據趨勢與專業圖書館[J].中華醫學圖書情報雜志,2013,22(2):1-6.
[3]楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報,2012(4):120-122.
[4]韓翠峰.大數據時代圖書館的服務創新與發展[J].圖書館,2013(1):121-122.
[5]王捷.大數據時代下圖書館開展信息服務的對策[J].現代情報,2013,33(3):81-83.
[6]蘇新寧.大數據時代數字圖書館面臨的機遇和挑戰[J].中國圖書館學報,2015(11):4-12.