沈丘縣圖書館 王建軍
本文闡述了電子計算機在圖書館應用發展的歷史,圖書館計算機文獻采購系統,計算機文獻標引系統,計算機文獻編目系統,圖書館數據庫。
1946年,美國生產了首臺電子計算機,從而開始了人類科學技術的一個新階段。在這些研究中,最先實現了把文獻按照固定的詞庫編制索引的是美國的盧恩。在20世紀五六十年代,出現了定題批示處理和回溯檢索系統。這一時期,工業較發達國家的圖書館自動化系統紛紛出現。比較著名的有1964年美國國立醫學圖書館建立的醫學文獻分析與檢索系統MEDLARS。進入20世紀70年代,隨著第四代計算機的問世,情報檢索已由批式處理向聯機檢索發展,其最大特點是讀者直接同計算機會話,遇到錯誤立即修改,并可以反復進行提問檢索。這時如美國的NASA、DIALOC、ORBIT、歐洲航天局的BECON系統等,都在原有的基礎上形成了跨國跨洲的國際網絡。美國國會圖書館于1981年關閉了傳統目錄卡片的使用,機讀目錄占主導地位。在圖書館自動化發展的歷程中,它是一個重要的里程碑。
網絡化可以平衡和協調網內的情報資源,以滿足在不同地理環境中的讀者對圖書情報的需求。網絡化是圖書情報自動化發展的趨勢。
圖書館計算機文獻采購系統運行的目的,是能在短時間內給圖書館工作者采訪圖書提供各種必要的數據,打印各種統計報表、處理訂單、經費管理以及代替執行某些手工作業,從而提高文獻采購的效率。
根據對文獻采購流程的分析,計算機文獻采購系統必須具備以下幾個功能:
處理訂單。計算機對每一份訂單進行存貯和檢索,并根據格式打印。
組織訂購目錄。計算機編制出訂購圖書的書名目錄,著錄目錄或其它形式的目錄,提高給出版發行部門或供訂購過程中的中間結果使用。
更新訂購主文檔。一本書處理完后,可刪除該書在訂購主文檔中的預定記錄。新的記錄不斷增加,處理后所剩的記錄不斷減少。這就是訂購主文檔的更新過程。
處理資金賬目。
進行訂購過程中各種數據的統計分析。國別統計、文種統計、各類書的統計、財經統計、預定統計、到書統計及差價計算日統計、日統計、年統計等。計算機不僅要統計,還要編制報表。
檢索。從書名、作者、出版機構、ISBN號等項目對預定主文檔實行檢索。
打印新書通報。
計算機文獻采購系統主要由以下幾個部分組成:
(1)采購文獻的建庫程序。這部分的主要目的是將訂購記錄存入計算機,一般應為一個獨立的文檔,數據供任何一道程序調用。
(2)倒排檔建立程序。這道程序供查重用,倒排檔的個數視需要而定,一般有書名倒排檔、作者倒排檔、ISBN倒排檔等。
(3)統計分析文檔建立程序。這道程序的功能是把采購系統中需要統計的數據從各個記錄中抽出來組織文檔,目的是為打印統計報表作準備。
(4)打印程序。統計、發票、財經以及其它需要計算的數據、在確定處理方案時,一定要按現行的圖書館的會計制度和技術要求進行,否則不可能實用。所以采購系統的設計必須建立在對館藏、經費、任務、財經制度、出版動態、以及其它系統功能充分調查的基礎上,盡量使數據和程序共享。
大多數計算機文獻自動標引方案都是以詞頻來作為判別某個詞是否能作為標引詞的標準。因此,其實現方案按如下步驟進行:
對于一個大小為n的文獻集合,計算出每篇文獻中每個不同的出現次數,即文獻之中詞K的出現頻率Fiko。
根據詞的頻率進行降序排列,找出一個適當的高頻閥值并除掉所有高于此值的詞。
找出一個適當的低頻閥值并除掉所有低于此值的詞。
剩下的詞將作為代表文獻的標引詞。
實現自動標引有兩個基本要素:自動抽詞和詞加權。而詞權值計算方法的優劣是決定自動標引質量的重要因素。因此,在自動標引研究中,其研究的焦點是如何有效地計算詞的權值。這里面以C.Salton的矢量空間自動標引模型以及M.E.Maron的概率自動標引模型最為突出,下面分別簡述之。
(1)矢量空間自動標引模型
該模型以矢量代數為其理論基礎,以數量積公式。
旅游小鎮建設開發要適度,生態環境保護是第一要務,在保障生態環境的前提下漸進發展,如何平衡開發與保護,和諧發展,是武陵山鄉旅游小鎮建設的重要挑戰。
(2)概率自動標引模型
該模型主要通過相關數來計算權值。然后,根據古典概率計算相關數,即計算條件概率。
該模型作為權值,它表示用戶所需的信息包含在文獻標引詞來形成提問式概率。
用計算機編制文獻目錄的工作,叫做計算機編目。保證并使計算機順利編目的設備、技術和流程,叫做計算機編目系統。計算機編目是對書目數據或字段集合處理的過程,也就是將文獻著錄項目記錄在計算機的可讀載體的過程。
計算機編目過程為:(1)收集書目數據。(2)編輯。即將表示各種著錄事項的編輯符號、字段指示符、子字段指示符和分隔符插入書目數據相應的位置上。并補充某些必要內容。(3)鍵盤輸入或穿孔卡片、磁盤輸入。(4)計算機處理。將磁帶、盤或紙帶上的代碼信息讀入計算機,通過機讀目錄程序處理,整理成機讀目錄的格式結構。(5)存貯。由計算機輸出經整理后的數據作為校樣,與原始輸入書目數據校對,如發現有錯,則將更正的數據再輸入,反復輸出校對,直至無誤,最后將正確記錄輸入機讀目錄數據庫中,以形成可再使用的機讀目錄。(6)用計算機打印出目錄卡片或其它形式的目錄。
機讀目錄也叫機器能讀的目錄或機器可讀的目錄,是目錄載體發展中出現的一種新型目錄。機讀目錄就是以代碼形式和特定結構記錄在計算機存貯載體上的,能夠被計算機識別和編輯輸出書目信息的目錄形式。機讀目錄是計算機編目后的輸出產品。
機讀目錄產生于美國國會圖書館,進入20世紀70年代后,MARC格式北接受為國際標準。
MARC系統是創制機讀目錄的一系列技術和操作方法的整體,包括硬件和軟件兩個方面。MARC系統大致分為四個子系統:MARC存貯子系統,MARC檢索子系統,MARC輸入子系統,MARC輸出子系統。
機讀目錄在圖書館工作中的作用有以下幾個方面:(1)行政管理。主要指對圖書館預算規劃工作進行幫助并提供所需要的各種數據。(2)采訪應用。機讀目錄是采訪工作的書目情報源。將機讀目錄并入自動采訪系統時,它的目錄數據可用來進行采訪檢索、制備各種訂單、制備印刷的或穿孔的收據卡和處理控制卡、編印采訪目錄、編制財產帳以及編制各種采訪統計報表。(3)編目應用。機讀目錄可以用來生產幾乎所有由編目形成的印刷品:目錄卡片、圖書目錄、工作單、檢索單、書標、書袋和書卡。(4)流通應用。用于制備流通卡,用主記錄檔編制流通文獻目錄和制備各種催書單。(5)參考工作和書目工作應用。機讀目錄實際上是一個完整的近期出版物數據庫,它可以進行各種綜合性和專題性處理。
數據庫是實現有組織地、動態地存儲大量關聯數據,方便讀者訪問的計算機軟、硬資源組成的系統,其主要特點是數據充分共享、交叉訪問、與應用高度獨立。
對圖書館而言,數據庫是一種經過編輯組織以機讀形式出現的書目記錄集合,其信息存儲在一定載體上,以供計算機檢索處理的工具。數據庫的建立和使用,是圖書館自動化的關健。
隨著數據庫的發展,產生了數據庫技術,稱為“數據庫管理系統”,它是操作和控制數據庫的一種工具,并能提供多個應用程序,或用一種軟件統一管理數據,進行數據維護、更新和檢索等。
數據庫目前大致分為文獻、事實、數值數據庫三種類型。
文獻數據庫是為了滿足讀者關于某一主題、某一課題、某一著者、某一機構的有關文獻以及查出某一論文的出處或收藏處所的需求,以順便完成他們的研究工作。
事實數據庫則用于滿足有關某一事實及其發生的時間、地點和過程的查詢。
數值數據庫用于滿足查詢某種數據、參數、公式、圖表或化學分子式等。這個數據庫裝的是直接使用的情報。這些數據事先由圖書館員從原始文獻中經過仔細選擇、整理、分析、運算后得出,然后進行科學地存貯,形成“數據庫”。