黃新博
摘要:近年來,數字圖書館在逐漸發展中,且數字圖書館常常為人們提起。那么數字圖書館就是一個利用數據服務器為讀者提供全面有效信息的平臺。本文首先解釋了數字圖書館的概念,然后介紹了語義技術、數據聚類技術、信息分析技術和檢索技術在數字圖書館的應用。
關鍵詞:數字圖書館;應用;研究
一、數字圖書館的概念
數字圖書館是利用互聯網技術,實現跨區域、跨國家的多個數字化圖書館之間的有效連接,使讀者在何時、何地都能通過統一的界面來獲取數字圖書館所提供的信息[1]。數據圖書館是應用各種平臺的數據服務器,通過虛擬化技術對這些信息進行整合,并加快應用速度,提高可靠性和安全性能。由此可知,數字圖書館不是單純意義上的一種新型圖書館,而是一個綜合的、全面的系統工程。
二、數字圖書館的應用
信息時代,數字圖書館技術在數據處理上實現了一個質的飛躍,數據處理對象從傳統的區域范圍變成了廣域處理。這些改變不僅對數字圖書館的開放性服務產生了極大影響,而且將對整個數字圖書館的結構組成、知識范圍、應用技術等造成變革。因此,如何在大數據時代將數字圖書館與大數據技術有效的互相融合,是數字圖書館發展過程中必須仔細考量的難點。
(一)語義技術
語義技術在大數據和網絡數字化環境中發揮著重要作用,該技術可實現全方位的信息整合將大量的復雜數據進行串聯。數字圖書館則要思考的關鍵是如何將數字文獻中相關信息與書本和詞典中的語義進行融合,能夠極大方便讀者理解文獻資料。利用人工處理這些繁雜的數據來實現釋義是不現實的,因此需要借助AI與語義分析等技術對數據間的語義關系進行自動的識別和處理,使其語義連貫完整。語義技術因其準確反映出所要表達信息的特性,可擴大所收錄資源的知識和來源,進而最大化的增加資源信息之間的共享。
(二)數據聚類技術
聚類是指根據數據的內在性質將數據分為一些類別,每一類別的數據盡可能具有相同特性,不同類別的差異盡可能大。聚類分析的目標就是減少研究對象的數目,分析不同數據之間的相似性和差異性,按一定的規律將數據進行合理歸類。
在數字圖書館中通過對該技術的運用,人們在圖書館中能夠更加便捷、快速的使用信息的分析和整理服務。聚類技術根據按照數據的相似程度劃分類別,因而使數據與數據之間分割得更加明確,使同一類數據的相同性達到最大化,使不同類數據的差異性達到最大化。大數據時代下充斥著各種各樣的信息,但是海量信息中的可利用數據少之又少。聚類分析技術可以有效的把些有效信息篩選和利用起來,將數據資源和信息進行聚類分析可以將其劃分成多個子數據集合,這些子數據集合即相互關聯又存在本質區別,非常適合面向問題需求。方便用戶對所需信息的檢索、選擇和分析。
(三)信息分析技術
信息分析是通過對社會信息的收集、整理、鑒別、評價、分析、綜合等系列化的加工過程,形成一種新的的信息產品,最終成為一項為大眾人民服務的具有科研性質的智能活動。信息分析技術應該是大數據時代的數字圖書館建立的根本和技術基石[2]。
(四)檢索技術
信息檢索是指通過輸入關鍵詞在一個文檔集合中查閱用戶所需內容的方式。目前大多數數字圖書館的檢索方式是基于分類主題和關鍵詞匹配兩種方式來進行用戶所需信息的查詢。信息檢索在數字圖書館的建設當中已經起到重要作用。
在信息檢索中只要輸入關鍵詞,則系統就可選定范圍內進行檢索,并將檢索結果呈現給用戶。信息檢索技術能方便得運用于信息的管理中,可以提高管理效率,減輕管理人員的工作量。在石油開采、橋梁修建等大型項目中數據十分龐大,運用信息檢索技術能讓工程師或管理者方便、快捷地查找相關信息。
此外,考慮到數字圖書館在使用過程面對的對象,都是普通民眾,對于操作檢索的方式都是自助式檢索。為了達到通俗易懂,簡明扼要的目的,必須把檢索方式設置成便捷的、通用的的方式,更還要設置語言語義的模糊搜索,語義匹配搜索等方式,包括硬件上還要考慮到殘疾人、弱勢群體的使用便捷性。
結束語:
隨著大數據時代到來,數據逐漸成為這個時代最重要的組成部分。數字圖書館是以公共服務為目標的服務平臺,當前數字圖書館的建設應當是以數字化、信息化為主要任務。本文首先介紹了數字圖書館的概念,然后分別介紹了在語義技術、數據聚類技術、信息分析技術和檢索技術四種數據挖掘技術在數字圖書館中應用。通過本文讓人們開始了解大數據時代數字圖書館的潛在的重要應用價值,以改變人們對數據的看法和認識。同時通過撰寫此篇論文讓我了解了大數據時代中數字圖書館的重要,以及其在數據挖掘中的相關應用。
參考文獻:
[1]張興旺,李晨暉.數字圖書館大數據知識服務體系協同設計研究[J].圖書與情報,2015(03):61-70.
[2]陳傳夫,錢鷗,代鈺珠.大數據時代的數字圖書館建設研究[J].圖書情報工作,2014,58(07):40-45.