李深
【摘要】數據庫的建設是數字圖書館資源建設的重要內容之一。數據庫(database)原本為計算機行業的專業用語,其本質就是數據的排列與集合,并且該排列與集合可以被查詢和調取。在數據庫建設的各種標準的制定中,著錄和標引規則是重中之重,它直接影響圖書館數據庫的質量。
【關鍵詞】圖書館;數據庫;問題
數據庫的建設不僅僅是將紙本文獻、音視頻文獻數字化的過程,而是要運用現代信息技術對紙本資源、音視頻資源進行加工、處理的過程,從而實現從篇名、作者、作者單位、分類、關鍵詞、日期等多途徑檢索。尤其是全文數據庫、多媒體數據庫的建設,既有利于紙本文獻、珍貴圖片、聲音、影視等資料的保存和傳播,也有利于廣大讀者的學習與利用。但是目前學校圖書館自建數據庫的過程中存在一些不可忽視的問題。
一、數據庫建設缺乏統一的規劃、分工與合作
學校圖書館數據庫建設是一項長期的系統工程,周期長、投入大、見效慢。長期以來,學校圖書館由于體制及隸屬關系的原因形成了管理體制上條塊分割,在客觀上為統一分工、合作建設數據庫增加了難度,再加之閉門造車、急于求成的現象十分嚴重,形成了各館單獨建設專題數據庫,并普遍存在結構單一、規模小、專業面過于狹窄、缺乏建庫規范和數據的錄入標準等問題,影響了數據庫的使用效率,產品的市場化、商品化更是無從談起。
二、數據庫制作的規范和標準化程度低
標引、分編、檢索點選取沒有嚴格的質量控制,數據庫的建設各自為政,分別基于不同的系統。低水平的數據庫在本館或小范圍內或許能夠使用,一旦上網聯機在全球范圍內調用,它們的缺陷立即會顯露出來,僅不同計算機系統的互聯和數據的統一規范就會出現很多麻煩,甚至會嚴重到無法上網交換成為廢庫。
三、數據庫在類型上比較單一
中文數據庫居多,外文數據庫、多媒體數據庫偏少。單一類型的數據庫只能給用戶檢索提供部分的幫助,不能滿足讀者從多渠道獲取文獻信息的需求,因此只有單一類型數據庫的圖書館是不能令用戶滿意的。
四、學校圖書館數據庫建設過程的方向把握不準確
館藏文獻數字化要把數量如此龐大的印刷型文獻轉化為數字化,不僅任務十分艱巨,而且數字化還需要大量的技術、設備、人力、資金、文獻作保證。目前,同時具備上述條件的圖書館不多,中小圖書館就更是鳳毛麟角。因此,學校圖書館還沒有能力開展大規模的數字化工作,只能根據現有的條件對部分文獻實現數字化,逐步推進此項工作。然而,一些部門的決策人錯誤地理解“發展”二字,片面追求數量,為了擴大政績,他們不顧有無技術基礎、設備條件、經營經驗與經濟實力,盲目建庫。數量倒是增加了,但原本就相當緊張的人力、物力和資金被不斷分散,不僅所建的數據庫質量得不到保證,而且影響了學校圖書館日常工作的正常開展,真是有百害而無一利。
五、重復采購,保障率低
學校圖書館為了克服訂購書刊資金的不足,不得不采取保刊壓書、保品種壓冊數、保中文壓外文的辦法,集中在核心期刊、常用書刊的訂購上。這種自我滿足、實用化的原則便產生了你有我有、我無你無、重復率高、保障率低、學科覆蓋能力低、難以形成有特色的館藏文獻資源,依據這樣的館藏“文獻資源”所建成的數據庫,其質量就可想而知了。在網絡技術如此發達的今天,是完全應該避免的。
六、檢索效果未盡如人意
一個可行的專題數據庫檢索系統應是外部特征檢索、主題檢索、分類檢索、全文檢索的綜合應用。目前,已經建立的專題信息數據庫大多只有外部特征檢索和文本方式的全文檢索兩種檢索途徑。一般的用戶都能快速簡便地從作者、標題、日期、版次等外部特征入手查找資料,但前提是用戶已事先知道要查找的資料所在的日期及其他信息,否則,用戶要想擴大或縮小檢索范圍,查全查準資料,并非易事。數據庫缺乏科學的、輔助的檢索工具,影響了它的使用效果。
七、數據加工存儲的格式眾多
以文本方式存貯的全文檢索,具有占用存儲空間小、不需人工標引加工、便于查找文章細節、檢索結果直接可靠、檢索詳盡徹底、使用簡便易學等優點,但在不進行任何控制的情況下,文章中的每一個字、詞均可成為檢索點,無形中加重了檢索方面的負擔,使每次檢索的文獻量偏多,篩選量過大,用戶檢索所需時間長,直接影響了查準率,造成了檢索噪音。
以圖片方式存儲的全文檢索,必須進行耗時、費工的人工標引和技術加工,其標引難度很大,對“原文”內容又不能直接地逐字、逐詞進行檢索,由于“原文”采用鏈接方式,檢索速度相對較快,但占用存儲空間大,對古籍、檔案、照片和含有特殊公式、符號的科技文獻能進行原貌保存。因此要提高查全率、查準率,就必須提高文獻的標引深度和數據的加工質量。
八、人員素質及其知識結構影響數據庫的開發
在實際工作中,往往是精通開發數據庫的計算機技術人員一般都不了解數據所涵蓋專業知識,因而造成對文獻分類標引、主題標引的質量不高,不清楚自己制作的數據庫軟件是否科學、合理、易學、實用。同樣,從事文獻信息標引的專業人員通常都不懂得計算機程序編寫及系統設計等知識,或是只懂得一些計算機的基本操作。因此,常常由于雙方的溝通和知識結構差異的問題,都會不可避免地、或多或少地影響數據庫的開發進程。
【參考文獻】
[1]董焱,劉茲恒.圖書館館藏文獻數字化:虛擬圖書館信息資源建設的重要內容.圖書情報工作,2000(7):52~55.