999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論圖書館數字文獻資源采集和檢索模式

2009-05-31 02:31:24鄭紅京
河南圖書館學刊 2009年6期
關鍵詞:采集

鄭紅京

關鍵詞:圖書館數字文獻資源;采集;檢索

摘 要:隨著信息技術的發展和廣泛應用,圖書館數字資源得到了迅猛發展。本文在系統介紹數字資源類型和來源的基礎上,重點論述了數字文獻資源采集中存在的問題及其檢索的模式方法。

中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2009)06-0078-03

1 數字資源的類型和來源

1.1 數字資源的類型

數字資源的類型包括:由未公開出版的著作、教材、學位論文、管理文件、科技報告、學報等“灰色文獻”形成的原生數字資源;由圖書館外購的館藏文獻所形成的館藏書目數據;由本地區或本院校學科專有文獻形成的特色數字資源;由專業特色資源加工的專題數字資源;由電子教案、網絡課件、電子教材、試題庫、教學參考資料等其他學科專業信息組成的數字資源;還有用通用性較強的圖書、報刊、圖片、聲像、縮微資料等加工后形成的數字資源。這些數字資源,按信息的表達方式分,有題錄、索引、文摘、全文以及圖畫、聲音、動畫、電影等形式,幾乎涵蓋包括馬列、哲學、社會科學、自然科學和綜合性等所有的學科;按信息使用范圍分,包括通用信息,系統使用信息,專業信息,專題信息等方面,其載體形態包括網絡數據庫,電子圖書,電子報刊,WEB資源,文本文檔,圖形圖像,聲頻、視頻等,由此構成一個由信息內容、表達方式和信息載體組成的三維立體結構。數字資源是一個發展著的有機體,數字資源的類型也不是一成不變的,而應是動態發展的。數字資源類型體系應及時吸納、涵蓋這些新興類型。另外,隨著數字資源內涵與外延的深化,拓展,數字資源的分類標準與分類方法也可能發生變化,數字資源類型體系亦應及時地予以調整,以保持數字資源類型與其定義的一致性。

1.2 數字資源的來源

(1)自建的數據庫。自建數據庫,是根據信息需求建立的具有較強特色和針對性的各種專題數據庫。包括中外文館藏書目數據庫,學位論文和會議論文數據庫,教學參考書數據庫以及各類全文數據庫等。(2)引進的資源庫。根據本單位的實際需求,從國內外數據商購買的聯機數據庫或網絡數據庫,光盤數據庫,聲像數字資源產品等。國外聯機數據庫,類型包括題錄、文摘和全文數據庫。如OCLC、First、seard、EI、scI等;國內聯機數據庫如中國期刊網,萬方數據資源系統國研報告,中經專網等;光盤數據庫,包括網絡光盤數據庫和單機光盤數據庫。如鄧小平理論研究、江澤民論著、人民日報、解放軍報、參考消息、中國大百科全書、四部叢刊、人大報刊復印資料等光盤數據庫、超星電子圖書、方正電子圖書、書生電子圖書、清華同方光盤、CNKI系列數據庫、萬方數據庫、重慶維普期刊全文數據庫等光盤數據。(3)因特網上下載或虛擬連接的信息資源。對利用率高的因特網上的信息資源,用代理服務器方式,通過虛擬連接,所建立的學術導航庫,根據用戶需求,有計劃地下載、重組的信息資源庫。

2 數字資源建設中存在的問題

2.1 數字化信息存儲載體壽命有限,依賴于其物理存儲載體的壽命。機讀磁帶、唱片、硬盤驅動器的壽命為十年至幾十年,其中磁帶的壽命約為15~20年,即使是最耐用的CD-ROM,其壽命也不過30年。只有不斷重新復制,才能保持已存儲信息的穩定性。人們最愛用的信息存儲載體的實際壽命遠不及經過特殊防腐處理的紙張和縮微膠卷。計算機專家習慣于考慮的問題是怎樣使電腦的記憶更豐富,運算更快,很少想到長期保存的問題。

2.2 版權問題。文字、圖像等作品在轉換成數字化作品后,通過計算機網絡進行傳遞。因此,各類作品之間界限模糊、相互滲透,而且使得作品復制的容易程度和速度,復制品質量、處理和修改作品的能力,復制品向公眾傳播的速度都會大為改觀,給侵權行為打開方便之門。一方面有版權的作品以數字化形式存儲后,就難以甚至不可能對侵權行為加以控制,這樣版權保護就成了一句空話。另一方面,數字化作品通過網絡在國際間傳遞,使版權問題更加復雜。

2.3 缺少統一的標準和規范。數字圖書館從概念的提出到實際的建設,時間很短,數字信息資源從技術開發、產品化到組織、使用和管理的一系列過程,缺乏有效的協調機制,沒有一套可供遵循的標準和規范。數字圖書館標準規范體系包括數字資源建設標準規范、數字圖書館應用服務標準規范、版權保護與權利描述標準規范、電子商務標準規范等。就數字資源建設和應用服務系統而言,涉及的標準規范包括:一是數字的加工、描述、組織、存儲、檢索和服務的標準規范;二是元數據統一結構框架和相應的元數據描述與加工處理、轉換、檢索的標準規范;三是網上資源搜集、篩選、編目、加工和使用方法的標準規范;四是統一的描述機制、統一的資源命名規則和惟一標識;五是開放的、可互操作的數字資源組織與管理標準規范;六是可互操作的數字對象調度機制等。由于沒有統一的標準和規范,同時加上經濟利益的競爭和沖突,不同企業在研究開發機制上缺少開放性,無形中強化了相互間的技術壁壘:其所形成的獨立的數據庫、檢索系統和發布系統,與其他企業在平臺、協議、體系結構上各不相同,各個數據源沒有統一的數據接口,無法通用共享,從而加大了數字圖書館的建設成本,降低了資源的使用效率。

2.4 存在著嚴重的異構現象。圖書館從各商家引進大量的數字資源后,就遇到大量的異構現象。數字資源的異構現象主要表現在兩個方面:(1)系統異構。就是信息資源數字化的加工、發布和管理所采用的資源加工系統、數據庫管理系統乃至操作系統的不同,構成了系統的異構。如,操作系統有UNIX、DOS、WIN等。數據的存儲,可能包括關系模式、對象模式、對象關系模式和文檔嵌套模式等幾種,有時,即便是同一類存儲模式,它們的模式結構也可能存在著差異。不同的數據庫使用不同的檢索軟件,其檢索界面的風格也迥然不同,具有很大的差異性。(2)資源異構。就是數字資源系統所采用的編碼結構、表達方式、數據格式以及描述和組織標準不同,檢索途徑和方法不同。目前的數據類型就是多種多樣的,如MS、Notes、DB2、Server,Foxpro,還有XML,CNMARC等格式。在信息資源的數字化建設過程中,不同的數據格式,不同的數據結構,不同的存儲方式,不相同的管理系統,構成了數字圖書館的異構數據源,造成了信息源數據難以融合。

2.5 讀者不能方便檢索。異構資源雖然能夠滿足本地數據存儲和管理要求,卻無法滿足用戶的一致性訪問需求,給讀者檢索和利用資源造成了許多困難和不便。(1)讀者在查詢多個數據庫時,需要重復地登陸數據庫,重復地輸入關鍵詞。當所要查找的信息可能包含在多種數字資源中時,只能分別檢索,同樣的查詢題目需要用相同的或不同的檢索方法,在不同的數據系統中重復查找。(2)讀者可以通過計算機上網檢索一個書目數據系統的數據,但是不能就有關的課題同時檢索其中多個系統。有的圖書館購置了數十萬冊電子圖書,但許多書目系統不能直接檢索這些電子圖書的信息,只能先在書目系統中檢索到有關著作信息,然后退出該系統再進入電子圖書系統瀏覽此書。(3)有的圖書館雖然引進了大量的國內外期刊全文數據庫,但大多沒有被包含在圖書館的館藏期刊檢索系統中。另外,一些重要的學科期刊論文,只提供索引或摘要數據庫,不提供與這些全文資源的直接鏈接。讀者在這些索引數據庫中找到所需的期刊論文的篇名信息后,還須再退出來重新進入全文數據庫查找原文。(4)檢索一種數字資源時,由于所需資源是連續出版物,存儲在多張光盤中,讀者要在這些數據庫中就同一課題檢索時,必須重復操作幾十次。數字資源的異構現象,給使用者帶來諸多不便,影響著數字資源的有效利用,也延緩了數字圖書館的發展。從某種意義上講,數字資源量越大,給用戶造成的負擔也就越重。

3 數字資源統一檢索的基本方法

3.1 基于本網站異構資源重組性統一檢索。對于自建、引索和網上下載的各種資源,最理想的途徑是開發或引進一個易用、高效、功能齊全的資源加工和整合系統,對異構資源重新進行分解組織,封裝整合,鏈接和統一管理,用戶從開始檢索不同來源不同性質的數據,到最終獲得原文,都在統一界面中進行,使用戶感覺如同只在一種信息資源系統中操作。其重組的方式是:(1)利用統一平臺,對館藏文獻資源按統一的格式進行數字化加工和流程管理,對電子教案、教材、研究生論文等原出數字化文獻,直接通過網絡進行提交,檢查校驗和發布。(2)利用資源加工系統對各種格式電子文檔、光盤數據、結構化數據產品、關系數據庫數據和高視頻文件等各種數據,包括數據存儲格式、訪問模式進行一致化處理。在統一的環境上進行轉換、導入和發布。(3)利用資源整合系統對各種不同結構數據庫的數據進行遷移、轉換,通過關系數據庫網關數據整合,實現數據從關系數據庫到全文數據庫的數據遷移式構成聯合的數據存儲機制,從而為用戶提供分類導航和全文檢索的統一入口。

3.2 基于分布式異構資源集成性統一檢索。數字圖書館是分布式信息資源的組織模式,必須能夠融合大量的信息源和信息服務,為讀者提供深層次的信息資源。建立一個統一的、互操作的、可伸縮的信息集成服務體系,將分布互連的異構資源集成為一個整體,屏蔽各信息資源的差異,在此基礎上提供統一的服務接口,語義化檢索,智能代理等高質量的信息服務。這是實現統一檢索的基本途徑。分布式異構資源集成性統一檢索,也稱一站式檢索,其實現方式有:(1)采用Z39.50協議對書目信息統一檢索。Z39.50協議廣泛采納基于MARC標準,良好的互操作性,屏蔽了不同數據庫間的異構性,使用戶能夠以統一的接口查詢所有的Z39.50服務器,實現了聯機編目。通過Z39.50協議,用戶可以在一個OPAC系統界面,對相關圖書館不同平臺上的OPAC書目數據進行分布式檢索,顯示各館符合檢索條件的命中記錄,不需要在各個圖書館不同的OPAC界面間來回切換。不過這種方式只是解決了書目信息的統一檢索,目前有的單位,通過SOAP協議與Z39.50協議的結合,實現了對全文的瀏覽。SOPA是用在分散或分布的環境中交換信息的簡單的協議,以XML格式發送消息,可以很好地與各種其他協議結合使用,在廣域網的包裝中,能夠確保互用性等。將SOAP協議與Z39.50協議相結合,以增強互操作性的功能。有的圖書館把書目數據套錄和轉換成標準的CN-MARC數據,并與各類管理系統的全文數字資源實現成功對接。用戶通過Z39.50協議,既可以完成書目數據的檢索,也可以直接鏈接數字資源,實現在線全文瀏覽。(2)采用OAI協議對PC元數據的統一采集和檢索。OAI協議是一個元數據采集標準,通過OAI簡單開放機制搜尋和集成數據提供方提供的基礎性元數據信息和讀取功能。建立元數據庫,數據提供方不提供一次文獻,用戶可以通過統一的界面用集中檢索模式查詢元數據,需要讀取數字對象則通過數據提供方檢索使用各種媒體的數字資源。與此種聯合檢索方式相似的檢索,還有基于編目中心思想的檢索。這種檢索就是將分布在各個地方的數字圖書館的元數據集中到一起,用戶檢索時先對元數據中心庫進行檢索,選中一個檢索結果后,通過數字圖書館建立的協議和組件編碼庫,到相應的數字圖書館中打開相應的對象數據的內容,讀者可以通過一個檢索門戶對網絡上所有的數字圖書館進行檢索。元數據中心的設立有三種方案:一種是設立全網性元數據中心。就是將網上所有數字圖書館的元數據都存在一個中心;第二種是在每一個數字圖書館都設一個全網性元數據庫。元數據庫通過網絡可以同步修改更新;第三種是按地域設立多個全網性元數據中心,用戶可以根據網絡情況就近或靈活連接最好的元數據中心,對元數據和對象數據進行檢索和調用。(3)采用多線程搜索技術對網絡資源實時采集和檢索。多線程搜索系統是一個網絡資源自動采集系統,通過這個系統能夠將用戶需要的目標站點、網絡資源庫中的內容實時地進行搜索,自動過濾,去重,對內容自動分類,標引,并自動導入本地指定的數據庫中,不再受原網站環境和數據格式的影響。(4)采用對象請求代理(ORB)和基于成本優化的查詢算法對多個網絡異構數據庫進行并行檢索。對象請求代理(ORB)是一種中間件,核心思想是分層,通過在操作系統與應用系統之間增加一層獨立的系統軟件或軟件平臺,屏蔽應用系統復雜的技術細節,實現對應用系統的透明訪問。目前,通過對象請求代理體系結構CORBA/IIOP已成為網上實現對象互訪的技術標準,IIOP已成為解決異構平臺,集成已有系統的基本協議,ORB也已經成為構建網絡分布式應用系統的重要支撐工具。其主要功能是能夠解決網絡分布計算機環境中多種異構數據資源的互聯資源共享,協同工作和互操作問題,實現了各種應用軟件的協同工作和多個目標系統之間的無縫連接。中間件技術與基于成本優化的查詢算法和多庫并行檢索技術的結合,使用戶可以通過一個統一用戶界面同時跨越不同的網絡,不同的機器和不同的操作系統,對多個分布的網絡數據庫進行檢索,并根據檢索結果返回的速度分別顯示。

上述解決數字資源統一檢索的方式,在類似問題上已經有成功的實例,在國內數字圖書館的建設過程中發揮了作用。它改變了人們觀察和創建數字資源的方法,為用戶提供了多樣化多層次多媒體的信息檢索服務。

參考文獻:

[1] 馬文峰.數字資源整合研究[J].中國圖書館學報,2002,(4).

[2] 張海濤等.數字圖書館的互操作研究:Z39.50和OAI協議的比較[J].現代圖書情報技術,2003,(2).

[3] 王善平.論數字信息資源的整合與標準化[J].情報資料工作,2002,(6).

[4] 李秀.數字圖書館的互操作與分布式構件技術 [J]現代圖書情報技術,2002,(1).

[5] 代根興,周曉燕.信息資源類型研究[J].中國圖書館學報,2000,(3).

猜你喜歡
采集
市政工程檔案采集與管理中存在的問題
血液標本采集對生化檢驗結果的影響分析
淺析微量物證的采集和包裝方法及其注意事項
EPS傳感器動態標定試驗臺
欲善“錄課”事必先利其器
溫濕度監測系統的設計與實現
科技視界(2016年15期)2016-06-30 10:07:41
探討網絡環境背景下的高校圖館文獻信息資源采集分析
科技視界(2016年11期)2016-05-23 20:15:39
基于工業無線網絡WIA—PA的項目實施與應用研究
淺談長輸管道施工階段數字化管理
電能計量遠程采集技術的應用
主站蜘蛛池模板: 亚洲三级视频在线观看| 露脸真实国语乱在线观看| 日韩视频福利| 97视频在线精品国自产拍| 国产精品自在在线午夜区app| 国产日韩欧美在线视频免费观看| 亚洲IV视频免费在线光看| 亚洲人成高清| 亚洲欧美成人综合| 国产亚洲精品资源在线26u| 国产一级视频在线观看网站| 国产精品深爱在线| 国产手机在线ΑⅤ片无码观看| 一本综合久久| 久久美女精品国产精品亚洲| 欧美激情网址| 爆操波多野结衣| 亚洲永久色| 热99re99首页精品亚洲五月天| 香蕉久久永久视频| 青青青国产精品国产精品美女| 国产亚洲精品97在线观看| 国产真实乱子伦精品视手机观看 | 97视频在线观看免费视频| 夜夜高潮夜夜爽国产伦精品| 精久久久久无码区中文字幕| 免费A∨中文乱码专区| 91福利免费视频| 欧美成人午夜视频免看| 欧美va亚洲va香蕉在线| 在线观看免费黄色网址| 最新日本中文字幕| 久久这里只有精品免费| 成人福利一区二区视频在线| 国产国语一级毛片在线视频| 欧美亚洲一二三区| 99久久精品免费观看国产| 天天综合网站| 国产成人亚洲精品无码电影| 欧美专区日韩专区| 国产欧美精品午夜在线播放| 91精品啪在线观看国产91| 成人一级黄色毛片| 日韩精品免费一线在线观看| 亚洲va视频| 国产第一页亚洲| 国产精品毛片一区| 亚洲香蕉久久| 亚洲A∨无码精品午夜在线观看| 国产精品女主播| 亚洲天堂精品视频| 在线观看免费黄色网址| 久久亚洲国产一区二区| 欧美69视频在线| 日韩av无码DVD| 91青青在线视频| 天天色综网| 国产一区二区三区在线观看免费| 嫩草影院在线观看精品视频| 日本欧美午夜| 激情网址在线观看| 成年人午夜免费视频| 国产成人精品一区二区三在线观看| 久久久久中文字幕精品视频| 亚洲一区二区三区麻豆| 伊人蕉久影院| 久久精品人妻中文系列| m男亚洲一区中文字幕| 国产在线精彩视频二区| 一区二区三区国产| AⅤ色综合久久天堂AV色综合| 欧美亚洲国产视频| 美女无遮挡免费视频网站| 韩国自拍偷自拍亚洲精品| 日韩资源站| 国产在线观看91精品| 亚洲日韩久久综合中文字幕| 亚洲成肉网| 国产天天色| 国产高清不卡| 国产一区二区三区精品久久呦| 亚洲精品无码专区在线观看 |