999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖書館網(wǎng)絡信息資源開發(fā)利用的策略探討

2022-02-26 00:52:07李華明
甘肅科技 2022年24期
關鍵詞:搜索引擎數(shù)據(jù)庫圖書館

李華明

(山東大學圖書館,山東 濟南 250012)

1 引言

在信息技術和5G網(wǎng)絡迅猛發(fā)展的今天,網(wǎng)絡信息資源已經(jīng)成為人類社會一種不可或缺的重要資源,網(wǎng)絡信息資源的優(yōu)勢表現(xiàn)在賦予人們較強的信息檢索和獲取能力。但在現(xiàn)實生活中,我們在許多場合并未感覺到使用它所帶來的極大便利,其主要原因在于,面對海量的網(wǎng)絡信息、繁雜的用戶界面以及眾多的搜索引擎,使得用戶在獲取網(wǎng)絡信息時會遇到各種各樣的困難。為此,通過分析人們在利用網(wǎng)絡信息資源時產(chǎn)生的難題,來制定并采取相應的開發(fā)策略,幫助他們在檢索信息中克服技術障礙,從而能快捷、方便、高效地利用網(wǎng)絡信息資源。

2 網(wǎng)絡信息資源的概念及分類

關于網(wǎng)絡信息資源的含義,學術界一般是指由數(shù)字化(數(shù)據(jù)庫)技術、信息存儲技術、通信網(wǎng)絡技術以及超文本(超媒體)技術所支撐的信息資源,而并非廣義所講的互聯(lián)網(wǎng)上的全部信息。較之傳統(tǒng)的文獻信息資源,它具有信息的動態(tài)性、內(nèi)容的廣泛性、訪問的快速性、搜索的網(wǎng)絡性和資源的開放性等特點。可見網(wǎng)絡信息資源的這種靈活性,決定了它比傳統(tǒng)文獻資源的歸類更難以把握,迄今為止,對網(wǎng)絡信息資源的分類還沒有明確、統(tǒng)一的標準和公認的劃分結果。現(xiàn)階段就圖書館的業(yè)務性質而言,結合網(wǎng)絡信息資源的特點和形式,將其劃分為三大類。

2.1 聯(lián)機目錄資源

反映某個地區(qū)(系統(tǒng))的圖書館或信息服務機構收藏文獻情況的統(tǒng)一目錄,如全國中西文期刊聯(lián)合目錄、CALIS(中國高等教育文獻保障系統(tǒng))公共目錄檢索系統(tǒng)。這類目錄資源主要是指用于檢索各類信息的檢索工具,以提供書目與索引等二次文獻數(shù)據(jù)庫為主。

2.2 聯(lián)網(wǎng)數(shù)據(jù)庫資源

一般包括網(wǎng)絡版光盤數(shù)據(jù)庫、計算機檢索數(shù)據(jù)庫和商業(yè)信息庫等。如國內(nèi)著名的CNKI中國學術文獻總庫、萬方數(shù)據(jù)庫等,外文的ACS(美國化學學會會刊)、Nature(《自然》周刊)全文數(shù)據(jù)庫等,這類網(wǎng)絡信息以提供全文數(shù)據(jù)庫和數(shù)值數(shù)據(jù)庫為主。

2.3 互聯(lián)網(wǎng)信息資源

包括網(wǎng)上發(fā)布的學術、政府、文化、教育和娛樂等信息,以及可以直接從網(wǎng)上獲取的各種電子化、數(shù)字化文獻。這類信息內(nèi)容龐雜且交互性和關聯(lián)度較高,涉及社會知識各個層面,由于任何機構、個人都可自由的在網(wǎng)上發(fā)布信息,很多信息不加任何整理,處于非線性無序排列的雜亂無章狀態(tài),決定了此類信息不易被人們了解和使用。

目前,數(shù)字化文獻資源、聯(lián)機數(shù)據(jù)庫、圖書館OPAC目錄(Online Public Access Catalogue“聯(lián)機公共目錄查詢系統(tǒng)”)以及互聯(lián)網(wǎng)上各社會組織(政府、大學、研究機構)所提供的各類機構信息,不僅比較穩(wěn)定、準確可靠、方便存取,同時也是學術研究的重要信息來源。因此,它們是圖書館網(wǎng)絡信息資源組織管理和使用的主要對象。

3 提高網(wǎng)絡環(huán)境下的信息資源組織方法

眾所周知,網(wǎng)絡信息具有數(shù)量龐大、內(nèi)容繁雜、質量參差不齊等特點,使得網(wǎng)上信息資源在很大程度上處于無限、無序的混亂狀態(tài)。因此,在網(wǎng)絡環(huán)境下,優(yōu)化信息資源組織方法的目的就是要解決海量無序的信息資源與人們有效利用之間的尖銳矛盾。在具體實踐中,通過對網(wǎng)絡信息實行整序、描述、標引等控制過程,使之成為符合用戶需要的有序信息流。

3.1 網(wǎng)絡信息的組織方法

就目前網(wǎng)絡信息資源組織方法而言,主要有分類組織和主題組織兩種,二者在網(wǎng)絡環(huán)境中互有長短,單純使用分類或主題的方法都滿足不了用戶多途徑查詢和檢索的需要,因此,分類主題一體化就成了現(xiàn)階段網(wǎng)絡信息資源組織的一種理想模式。一方面,由于信息被分別組織在不同的類目中,為過濾和篩選不需要的信息創(chuàng)造了條件;另一方面,將標引語言納入分類體系除了可以直接使用自然語言外,也可以在任何類下進行語詞檢索,即在某一類下進行語詞檢索就相當于分類法與主題法組配查詢,這樣,在選定范圍內(nèi)查詢到的結果則會更加貼近人們的需求,從而大大提高了檢準率。用分類主題一體化組織信息資源,既能滿足用戶的分類族性檢索習慣,又能實現(xiàn)主題特性的檢索要求,極大地方便了網(wǎng)絡用戶的選擇和使用。

3.2 網(wǎng)絡信息的編目方法

書目控制歷來是圖書情報機構組織信息的主要手段,現(xiàn)階段對網(wǎng)絡信息資源進行編目控制其重要性依然十分突出。MARC(Machine Readable Catalogue)格式作為全球機讀編目權威性的著錄標準,在揭示文獻信息本質特征方面具有得天獨厚的優(yōu)勢。早在1995年,USMARC(美國國家標準機讀目錄)就增加了856字段,即電子資源地址與存取字段(Electronic Location and Access),利用每一個856字段來準確地指向一個網(wǎng)址,彌補了萬維網(wǎng)統(tǒng)一資源定位系統(tǒng)URL(Uniform Resource Locator)的不足,因而對于質量較高的網(wǎng)絡信息可采用MARC格式著錄。同時,也應當看到,由于MARC格式太過于復雜、缺乏靈活性,造成對大量的網(wǎng)絡信息進行著錄成本高、效率低等不足。于是一種全新的信息描述工具DC(Dublin Core)元數(shù)據(jù)方式開始在網(wǎng)絡資源組織中發(fā)揮著越來越明顯的優(yōu)勢,DC即都柏林核心,由于DC元數(shù)據(jù)已被結構化,并支持字段查詢,為從根本上解決網(wǎng)絡信息資源的組織與搜尋提供了切實有效的方法。

4 優(yōu)化圖書館網(wǎng)絡信息資源開發(fā)利用的路徑

4.1 創(chuàng)建圖書館自己的專業(yè)檢索系統(tǒng)

目前眾多網(wǎng)絡搜索工具的使用方式不僅多樣化,且信息覆蓋面又太廣,用戶往往在查找某一特定學科信息時,一方面使得任何一個檢索工具都可以查詢利用,另一方面由于這類網(wǎng)絡檢索工具的專業(yè)性不強,致使檢索出的信息結果系統(tǒng)性、完整性都較差。

有實力的圖書館應根據(jù)學科分工將本專業(yè)的網(wǎng)絡信息按事先約定的某種體系概念分門別類地加以組織,形成用戶特定需要的序列化有效信息資源,并同時開發(fā)與之相配套的專業(yè)搜索引擎。或者借助于類似Robot的智能代理軟件,將網(wǎng)上有價值的主頁或文章等信息自動取回并進行排序、索引,形成一個詳盡的可供用戶按學科查詢的Web頁專業(yè)數(shù)據(jù)指引庫[1]。由于這類指引庫采用學科知識組織信息資源,故能從宏觀上為用戶提供一張掌握信息資源的“網(wǎng)上地圖”,使人們根據(jù)這張“知識地圖”能思路清晰地查找某一類信息,從而避免了“迷路”問題的發(fā)生,它對希望查詢某一范疇、學科專業(yè)方面信息(主要是網(wǎng)址)的用戶很適用。

4.2 積極推進網(wǎng)絡資源的整合工作

現(xiàn)實中不難發(fā)現(xiàn),由于缺乏統(tǒng)一的整合技術或者根本就沒有考慮過整合的問題,致使許多研發(fā)出來的網(wǎng)絡資源盡管獨立使用效果很好,但放在非整合環(huán)境中使用時效率就大打折扣。比如,由于無法互相跨庫鏈接檢索,查詢相同的課題就不得不在諸多的數(shù)據(jù)庫中重復查找;用戶在索引數(shù)據(jù)庫中找到了所需要的篇名信息后,則必須退出該系統(tǒng),重新進入全文數(shù)據(jù)庫查找原文等。非整合的網(wǎng)絡信息確實影響了用戶對信息資源的有效利用,將各種異構信息資源整合于同一個系統(tǒng)已成為5G時代發(fā)展的必然。理想的資源整合應該是在制定網(wǎng)絡信息產(chǎn)品統(tǒng)一開發(fā)標準的基礎上,把不同的信息資源通過一致的對外接口無縫透明地連接在一起,使用戶能方便快捷地瀏覽和訪問不同的異構信息。從最初檢索到最后獲得所需原文,都在統(tǒng)一的整合系統(tǒng)中完成,用戶感覺如同是在一個資源豐富的“信息超市”(Information Supermarket)里瀏覽和選擇自己的所需信息,這種理想的資源整合應該成為網(wǎng)絡信息開發(fā)利用中所追求的一個重要目標。

基于Z39.50協(xié)議的系統(tǒng)和模塊,是目前實現(xiàn)網(wǎng)上異構信息整合的理想工具。Z39.50協(xié)議是用來定義計算機之間信息檢索的標準通信協(xié)議,它不僅可以屏蔽不同系統(tǒng)、平臺和文件格式的異構性,同時又規(guī)定了異構信息系統(tǒng)之間傳遞數(shù)據(jù)的標準方法,通過自我編碼和解碼,靈活動態(tài)地選擇和容納了多個數(shù)據(jù)系統(tǒng),使用不同數(shù)據(jù)格式的信息交換雙方只要都遵循Z39.50協(xié)議,Z39.50協(xié)議便自動實現(xiàn)聯(lián)機數(shù)據(jù)交換[2]。這樣,用戶通過屏蔽異構信息間的差異來達到資源整合,從而實現(xiàn)對Web上異構數(shù)據(jù)庫進行檢索和互訪。

4.3 構造友好的集成化用戶界面

圖書館所提供的信息資源主要有:電子書刊資源、聯(lián)機數(shù)據(jù)庫、OPAC目錄以及不同出版商生產(chǎn)的脫機或光盤(網(wǎng)絡版)數(shù)據(jù)庫等,這些信息資源的用戶界面復雜且繁多,有些不僅需要在用戶端安裝下載專用閱讀和檢索軟件,有時更需進行一定的參數(shù)設置方能使用。可見,讓客戶掌握、熟悉如此復雜的界面是相當困難的,因此,構造友好的集成化用戶界面,方便用戶的信息查詢,已成為圖書館網(wǎng)絡信息資源開發(fā)和利用中的又一重要工具。

用戶界面的集成化處理,可利用人們熟悉和掌握的Web技術進行界面優(yōu)化,也就是將原來需要用戶端下載專用軟件才能使用的數(shù)據(jù)庫產(chǎn)品轉換成用Web瀏覽器查詢,或通過Web頁的形式達到交互式的分類信息檢索。這樣客戶只需掌握熟悉的Web瀏覽器檢索方法,就能非常容易地訪問和獲取眾多網(wǎng)絡信息資源,從而大幅度提高各類信息的獲取速度。

實踐證明,通過Z39.50協(xié)議也是優(yōu)化用戶界面的一種行之有效途徑。如前文所述,由于Z39.50協(xié)議為客戶提供了一種數(shù)據(jù)傳輸?shù)臉藴式涌冢虼耍脩粼谑褂脮r,不需要熟悉對方檢索系統(tǒng)的軟硬件配置及命令,只要遵循Z39.50協(xié)議,利用自己所掌握的檢索方法和用戶界面就可以方便查詢到對方的數(shù)據(jù)庫系統(tǒng)。事實上,一些集成化的試驗或應用系統(tǒng)已經(jīng)出現(xiàn),比較突出的有Ohiolink(美國俄亥俄州大學和學院圖書館共同組建的地區(qū)性電子文獻資源共享網(wǎng)絡)以及我國的CALIS系統(tǒng)等。

4.4 注重和發(fā)展智能搜索引擎,提高檢索效率

有網(wǎng)絡檢索經(jīng)驗的用戶都知道,使用InfoSeek、Looksmart等檢索軟件時,信息內(nèi)容特征抽取復雜,有時輸入一個檢索式,往往得到一大堆網(wǎng)址,用戶只能依次瀏覽,從中一個一個篩選出極少符合自己需求的信息,最后得到數(shù)據(jù)不僅正確性和可靠性缺乏保障,而且費時費力,查詢效果難盡人意。

網(wǎng)絡環(huán)境下為幫助用戶快速、全面、準確地查詢到所需信息,研發(fā)智能化的搜索引擎將成為圖書館參與信息資源開發(fā)與利用的關鍵內(nèi)容。目前的理論研究認為,5G時代的智能搜索引擎不僅保留傳統(tǒng)的快速檢索及相關度排序等基本功能外,同時又要開發(fā)出用戶興趣自動識別、用戶角色登記、智能化信息濾、內(nèi)容的語義理解和推送等拓展延伸功能,此外,還應具備了跨平臺工作和處理混合文檔結構的多文種能力,它既能處理SGML(Standard Generalized Markup Language標準通用標記語言);又能處理XML(Extensible Markup Language標準通用標記語言的子集)和HTML(HyperText Markup Language超文件標示語言)文檔以及其他類型的文檔,比如WPS Word等[3]。由于智能搜索引擎直接采用以知識庫為基礎的語義分析,將信息檢索從現(xiàn)有的基于關鍵詞層面上升到基于概念(或知識)的層面,故能夠提供更方便、更確切的搜索服務。智能搜索引擎將向以下幾個主要方向發(fā)展。

4.4.1 智能推送技術

智能搜索引擎利用漢語分詞、句法分析以及統(tǒng)計理論有效地理解了用戶的請求,通過觀察用戶的行為,根據(jù)用戶對信息的回饋,了解用戶的興趣愛好,在此基礎上將自動收集、整理用戶感興趣的網(wǎng)絡信息,并選擇最佳時機主動推送到用戶的頁面前,免去了用戶被動搜索的困擾。

4.4.2 駕馭書簽技術

通過挖掘用戶日常使用的書簽或收藏夾中內(nèi)在的價值,形成一個概念檢索體系,再利用類似鏈接評價分析法,對逐條記錄的潛在重要性進行評判并打出相應的分值,幫助用戶利用那些可能被大搜索引擎忽略掉的重要資源。

4.4.3 爬行代理技術

針對網(wǎng)上信息的動態(tài)性,利用被稱作Robot、Spider等名稱的爬行代理軟件,通過啟發(fā)式學習并采取最有效的搜索策略,在網(wǎng)上爬行收集、整理信息,自動完成在線信息的索引。

4.4.4 元搜索引擎技術

元搜索引擎(Meta-Search Engine)查詢時調用其他多個獨立的搜索引擎,并對從多個搜索引擎返回的查詢結果進行處理(主要涉及測試連接、格式轉換、去重排序等),以統(tǒng)一的界面顯示。它不需要自己的數(shù)據(jù)庫,只需存儲連接其他站點的信息,采用這種技術,能夠方便地實現(xiàn)各館之間數(shù)據(jù)和資源的互訪與共享,便檢全率大大提高[4]。

4.5 網(wǎng)絡信息資源的合法利用

由于網(wǎng)絡數(shù)字化信息的拷貝復制相當容易,因而其版權問題十分嚴重,圖書館如何在版權法允許的范圍內(nèi)合法地開發(fā)利用信息資源是當前一個比較突出的問題,為此,筆者強調應做好以下幾方面的工作。

(1)密切關注版權立法動態(tài),及時根據(jù)版權法的最新發(fā)展動向,調整自己的工作策略和方針,讓自己的行為更加符合法律準則。

(2)完善信息版權保護機制,系統(tǒng)應具有嚴格的版權認證功能,一般可通過用戶賬號、數(shù)字信息身份標識(DOI)和文件自我保護(SPD)等方式來實現(xiàn),從而有效地控制網(wǎng)絡用戶合法使用信息資源。

(3)教育和引導用戶遵守版權法,增強知識產(chǎn)權意識和信息價值觀念。避免卷入版權糾紛。

(4)加強與版權人、出版者的溝通與協(xié)作,積極參與立法,維護公眾利益。

5 結束語

毋庸置疑,隨著機器深度學習技術、爬蟲技術和AI推送技術等網(wǎng)絡信息挖掘所需的支撐技術的逐步成熟,網(wǎng)絡信息資源的開發(fā)與利用將朝著個性化代理模式的方向發(fā)展,即根據(jù)網(wǎng)絡信息的屬性和用戶需求,提供一個多媒體、多途徑的信息資源統(tǒng)一開發(fā)環(huán)境,以人們習慣的方式逐層、逐類地實現(xiàn)網(wǎng)絡信息資源最大效用。

猜你喜歡
搜索引擎數(shù)據(jù)庫圖書館
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
飛躍圖書館
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
網(wǎng)絡搜索引擎亟待規(guī)范
圖書館里的是是非非
基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
去圖書館
主站蜘蛛池模板: 欧美日韩一区二区在线免费观看| 国产第一页屁屁影院| 熟妇人妻无乱码中文字幕真矢织江 | 欧美日韩精品一区二区在线线| 亚洲午夜福利精品无码| 日韩大片免费观看视频播放| 99资源在线| 亚洲嫩模喷白浆| 99er这里只有精品| 狠狠色丁香婷婷| 亚洲激情区| 国产在线精品人成导航| 91啦中文字幕| 无码日韩视频| 四虎永久在线精品影院| 国内精品视频区在线2021| 亚洲精品777| 欧美a在线| 老司机精品99在线播放| 国产人在线成免费视频| 露脸真实国语乱在线观看| 久久无码av一区二区三区| 亚洲一区无码在线| 中文字幕在线欧美| 亚洲人成影视在线观看| 黄网站欧美内射| 波多野结衣久久精品| 久久先锋资源| 美女内射视频WWW网站午夜| 国产97视频在线| 99草精品视频| 91啪在线| 免费亚洲成人| 免费人成在线观看成人片| 72种姿势欧美久久久大黄蕉| 国产黄在线免费观看| 美女国产在线| 亚洲美女高潮久久久久久久| 欧美日韩国产在线人| 伊人AV天堂| 亚洲国产系列| 国产日韩欧美在线播放| 免费福利视频网站| 国产成人精品在线1区| 91国内视频在线观看| 日本亚洲最大的色成网站www| 亚洲成人精品在线| 精品综合久久久久久97超人该| 亚洲品质国产精品无码| 操操操综合网| 久久伊伊香蕉综合精品| 午夜a视频| 亚洲成年人片| 欧美日韩成人在线观看| 国产91av在线| 亚洲丝袜中文字幕| 免费AV在线播放观看18禁强制| 国产区91| 国产欧美日韩视频一区二区三区| 婷婷丁香在线观看| 无套av在线| 亚洲av片在线免费观看| 久久狠狠色噜噜狠狠狠狠97视色 | 好紧太爽了视频免费无码| 亚洲美女一区二区三区| 国产精品嫩草影院av | 亚洲αv毛片| 欧美精品v| 成人午夜久久| 91外围女在线观看| 国产乱人免费视频| 婷婷开心中文字幕| 综合五月天网| 99热亚洲精品6码| 精品色综合| 国内精品免费| 国产精品xxx| 亚洲欧美在线综合图区| 日韩精品久久无码中文字幕色欲| 999国内精品视频免费| 中日韩一区二区三区中文免费视频| 国产精品免费入口视频|