程彥玲
(拜泉縣圖書館 黑龍江 拜泉 164700)
數字圖書館建設與發展策略研究
程彥玲
(拜泉縣圖書館 黑龍江 拜泉 164700)
怎樣進行數字圖書館建設,怎樣確定數字圖書館建設的發展戰略,怎樣正確實施相關戰略,實現數字圖書館建設的目標,都是我們應該認真研究的重大課題。
數字圖書館建設;發展;研究
數字圖書館就是運用當代信息技術,對數字信息資源進行采集、整理和貯存,并向所有連接網絡的用戶提供,為一定的社會政治、經濟服務的文化教育機構以及這種機構的組合。前者稱之為狹義數字圖書館,后者為廣義數字圖書館。這個定義明確了數字圖書館的社會性質——文化教育機構;明確了數字圖書館的活動目的——為一定社會的政治、經濟服務;明確了數字圖書館的工作對象——數字信息資源;明確了數字圖書館的工作內容——采集、整理、貯存和提供數字信息資源;區別了數字圖書館和傳統圖書館的不同之處——利用當代信息技術,工作對象是數字信息資源和服務的對象是所有連接網絡的用戶;繪出了廣義數字圖書館和狹義數字圖書館的概念。因此這種表述方法還是比較準確、全面的。
數字圖書館涉及到許多高新的技術,其建設面臨著諸多技術方面的挑戰,如超大規模數據庫技術、信息壓縮與傳輸技術、分布式處理技術、安全保密技術、可靠性技術、數據倉庫與聯機分析處理技術、信息抽取技術、數據挖掘技術、基于內容的檢索技術、自然語言理解技術等。
(一)信息資源建設
數字圖書館作為一個數字資料庫,首先涉及到眾多資料的整理入庫問題。已有圖書的數字化工作,需要有效的管理機制。我國目前有各種各樣的圖書館幾千個,信息資源建設的協調管理是一個大問題,這其中有工具問題,也有管理問題。例如,對于同一本圖書,應該保證:如果某圖書館已經將其錄入,其他人就不要再進行錄入了。這項工作如果協調不好,很可能同一件事要做若干遍,重復勞動,而給社會造成極大的浪費。
(二)數據存儲與壓縮
數字圖書館所涉及的數據類型有文本、圖像、聲音、視頻等,而且所面臨的數據是海量的。這么大的數據量是迄今為止其他任何系統都沒有理到過的,需要大規模數據庫來存儲和處理這些數據。因此,如何存儲和管理海量數據是系統設計的核心任務之一。在數字圖書館的數據中,文本數據的存儲不是很大,真正大的是多媒體數據。因此.對多媒體數據必須進行壓縮,然后存儲在數據庫中,以降低庫的成本,使庫的規模保持在可管理的范圍內。如對一段“新聞聯播”中主持人講話的錄像,如果將其原封不動地保存下來放到數據庫中,可能要占幾百兆字節的空間,壓縮后,就可能只占幾兆的字節空間。
(三)分類、索引和檢索
在圖書館中,分類與索引是檢索的基礎。分類方法也有各種學派和門類,目前在數字圖書館領域中,還沒有完成統一的分類方法,這就提出了一個如何統一分類標準的問題。如果沒有一個統一的索引方法和分類帶,將來開發計算機的搜索工具就會非常困難,需要針對不同的分類方法制作不同的搜索工具。
另外,我們所面臨的數據類型也不同,如文本、圖像、視頻、音頻等信息,列不同的內容,需要不同的分類體系和索引機制、而能否制定一個比較好的分類方法、建立一個比較好的索引機制,將直接影響到能否開發出一個比較好的檢索工具。
對于檢索,假如在Internt檢索“數字圖書館”這個詞,目前的檢索常常是這樣實施的。把“數字圖書館”切分成“數字”和“圖書館”,凡是與“數字”、“圖書館”、“數字圖書館”打出的條目都會檢索出來,其實這些并不都是用戶所需要的,并且由于這樣檢索出的條目往往非常之多,從而使用戶無從下手,難于找到需要的信息。而目前的分類器絕大多數都是盡可能多地給你信息,而不管你有用沒用。
因此,怎樣做一個比較好的檢索工具,使得提供給用戶的信息恰恰是用戶最需要的(不需要的一條也沒有),也就是說,大量數據的搜索效率(最優解)與速度是系統面臨的最大挑戰,其中包括中文搜索、圖像搜索、語音搜索、智能搜索等。這當中涉及大量的人工智能的支持。
(四)傳輸與保護
目前,無論是訪問國內的站點還是國外的站點,速度都比較慢。因此,怎樣從服務器端進行調度、協調,當用戶提出—個服務請求時,用最短的時間對用戶的請求進行回答,這是系統能否成功的關鍵;這其中有很多問題需要解決,如帶寬的有效使用問題。現在,所有的搜索中都存在這一問題,搜索工具只管找到用戶的解,而不管使用多長時間。另外,當用戶提出的關鍵字關聯性不很強,其組合方式又很初級的時候,可以預見,這種檢索會花很長時間,解也會很多。在這種情況下,應該在檢索之前提醒用戶,再增加—些約束條件,以加快搜索速度,并使檢索中的信息真正是用戶所需要的。
在對多媒體檢索時,應該有快速圖像瀏覽機制,即多媒體解的分層傳輸;如果用戶提交了一個多媒體檢索請求,并且搜索引擎—次找到很多照片或圖像,系統的做法是將找到的照片分成若干層,將最粗層傳給用戶,用戶確認選擇后,再逐漸細化,而當用戶認為這張照片不是所要的時,可隨時結束,再換另一張。
保護包括版權保護和系統安全性保護。版權保護是數字圖書館作為商業系統運行的前提。沒有版權保護的手段,作者就不可能允許數字圖書館經營者把白已的作品放到網上,投資者也不會把錢投入到系統的建設上。
(五)交互界面
交互界面(用戶接口)是數字圖書館的重要組成部分,是系統與用戶交流的窗口;其實,這不僅是數字圖書館所面臨的挑戰,任何系統都有這個問題,即怎樣設計一個理想的用戶界面,
讓用戶使用時得心應手,能夠友好、直觀、方便,并具有人性化、智能化的特性、利用圖形、語音,將其融為一體等。
(六)輸出與信息表現
在計算機上用各種可能的技水表現信息是非常具有挑戰性的工作。信息的輸出和表現是數字圖書館可能為未來社會帶來很大好處的一個方面,除了在經濟、學習上有好處,通過對數字圖書館的研究,使得人類對信息的發現、信息的利用更上一個檔次。
(七)工具與平臺
工具包括圖書錄入工具、音像制品錄入和編輯工具、瀏覽器工具、開發工具等,平臺包括軟件平臺、數據庫平臺等。目前已經有一些商品化的軟件平臺,但是仍然需要專門為數字圖書館設計的專門工具與軟件,這是一個最大的挑戰。基中包括總體結構標準、軟件技術、信息錄入工具、搜索工具、知識挖掘工具等問題。
數字圖書館的建設是一項投入強度很大的工作,數字圖書館的發展在國內雖處在起步階段,目前對于具體的數字圖書館建設中遇到的各類問題,如元數據問題,海量存儲與檢索問題,基于內容的檢索問題,數字圖書館中的知識產權管理問題,安全性問題等還處在不斷研究之中。
針對實際情況,數字圖書館究竟如何建設才能真正實現國家文獻信息資源的共知、共建、共享,從而推動國家信息化建設的進程,從戰略的高度推進我國技術跳躍式的目標的早日實現呢?理論界主要對數字圖書館的內容、相關技術、人員等問題進行了研究。
數字圖書館的內容研究主要包括數字圖書館的基本理論、支撐技術與相關技術、資源建設和資源共享等,正如有文章所說的“當前是數字圖書館和傳統形態圖書館并存的時代,對數字圖書館的研究,特有力地推動傳統形態圖書館的現代化。數字圖書館研究的側重點有:1、數字圖書館的概念、特征、功能等基本理論的研究;2、數字圖書館應用技術研究:如對象數據描述格式、壓縮存儲技術、格式轉換、元數據、信息傳輸的技術標準、信息檢索系統等;3、數字圖書館的機制研究,如共建共享機制、權益分配機制、知識產權保護等;4、數字圖書館建設,如對象資源庫建設、元數據檢索系統和對象調度系統建設、保證機制建設等;5、數字圖書館信息傳播的法律控制和數字圖書館利用中存在的障礙等。”
在數字圖書館技術研究方面,人們將更多的注意力放在IT技術與相應的支持技術上,“發展數字圖書館是21世紀初文獻信息服務的核心戰略。……數字圖書館的全新的信息技術的支撐作用卻是眾所認同的。人們一般不會忽略數字圖書館的底層技術,但卻應該把更多的精力放在信息標準交換技術、信息格式轉換技術、信息集成技術以及互工作技術、互操作技術等方面,以優先、盡快地解決數字圖書館建設中信息資源、信息加工、信息平臺和信息系統中普遍存在的異構現象和異質現象。”這就說明信息技術在數字圖書館建設過程中是相當重要的。而在如何引進技術、開發技術和相關技術滲透方面還沒有能夠進行有效的研究。
數字圖書館對人員的要求上可以說是相當嚴格的,對傳統的文獻信息工作者來說,如何盡快進行知識更新、有效的調整知識與技能結構,就成為我們需要考慮的問題。國內一些學者也已經提出了這方面的問題,諸如“21世紀前10年,數字圖書館及其相關概念,網絡環境下的館藏發展、采訪、分類、編目等技術服務、讀者服務以及圖書館員素質的提高和角色的轉換等均成為主要的研究問題。”
[1]陳絳梅.我國數字圖書館建設策略研究[J].華南熱帶農業大學學報,2004(02).
[2]李玉安.電子圖書館、數字圖書館研究與實踐述評[J].中國圖書館學報,1999(06).
[3]王世偉.論數字圖書館的特點及其對當代圖書館學教育的影響[J].圖書情報工作,2001(03).