摘要:隨著1nternet的迅速發(fā)展,網(wǎng)絡(luò)信息以驚人的速度增長(zhǎng),但這些信息大多分散無(wú)序,缺乏有效組織。人們很難從海量信息中獲取自己所需信息,造成信息使用率的不斷下降。針對(duì)這種狀況本文提出相應(yīng)的解決思路,以求更好的對(duì)網(wǎng)絡(luò)信息資源進(jìn)行組織管理和利用。
關(guān)鍵詞:網(wǎng)路信息資源;組織技術(shù);網(wǎng)絡(luò)導(dǎo)航
作為近幾年才頻繁出現(xiàn)的新術(shù)語(yǔ)“網(wǎng)絡(luò)信息資源(Network information resource)”,到目前為止還沒(méi)有被公認(rèn)為是一個(gè)專業(yè)術(shù)語(yǔ)。一般把網(wǎng)路資源理解為“通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和”。具體來(lái)說(shuō)網(wǎng)絡(luò)信息資源有廣義和狹義之分。廣義上是指網(wǎng)絡(luò)的一切信息資源,包括有用的和無(wú)用的網(wǎng)上各類信息資源的總和。而狹義上是指借助于各種信息技術(shù)而存儲(chǔ)在各種網(wǎng)絡(luò)上的信息資源,并能夠被存取和利用而且能夠滿足廣大信息用戶的各種需求的各類信息資源的總和。
一 、網(wǎng)絡(luò)信息資源的組織管理
1.網(wǎng)絡(luò)信息資源組織管理的內(nèi)涵與特點(diǎn)
網(wǎng)絡(luò)信息資源組織實(shí)質(zhì)上是一個(gè)序化的過(guò)程,這個(gè)過(guò)程通常可分為兩個(gè)階段,即序化階段和優(yōu)化階段。網(wǎng)絡(luò)信息資源的序化是按照一定的方法將無(wú)序的信息組織成為有序信息的過(guò)程,它又包含了兩層意義:一是把沒(méi)有必然內(nèi)在聯(lián)系的信息,為了利用和管理上的方便而加以組織;二是把本質(zhì)上具有必然內(nèi)在聯(lián)系的信息,按照其自身的客觀邏輯結(jié)構(gòu)加以組織;前者主要是主觀因素,后者主要是客觀因素。而網(wǎng)絡(luò)信息的優(yōu)化是在序化的基礎(chǔ)上進(jìn)行的,針對(duì)某種目的,依照結(jié)構(gòu)功能優(yōu)化原理對(duì)信息進(jìn)行再序化的過(guò)程,它是信息序化的繼續(xù)和升華。
網(wǎng)絡(luò)信息資源組織有如下特點(diǎn):(l)過(guò)程的整合性。網(wǎng)絡(luò)信息資源組織是對(duì)各類網(wǎng)上有用資源進(jìn)行重新整理、加工、再利用的過(guò)程,并根據(jù)組織者按不同的標(biāo)準(zhǔn)把相關(guān)信息資源組織在一起,形成一個(gè)新的信息集合體,這些信息集合體按信息組織的語(yǔ)法、語(yǔ)義和語(yǔ)用三個(gè)層面將各種不同來(lái)源,不同類型的網(wǎng)絡(luò)信息資源組織在一起。因此,網(wǎng)絡(luò)信息資源組織具有明顯的整合性。(2)技術(shù)的綜合性。網(wǎng)絡(luò)信息資源組織的理論是通過(guò)不同學(xué)科的概念、原理、方法和技術(shù)手段相互融合、相互借助而形成的,但這些概念、原理、方法和技術(shù)手段并不是簡(jiǎn)單地堆砌在一起,而是要經(jīng)過(guò)某種移植和創(chuàng)新、改造和加工,通過(guò)理論的借鑒、方法的移植、技術(shù)的應(yīng)用使得彼此之間能夠有機(jī)地融合在一起形成新的應(yīng)用技術(shù)。 (3)理論的綜合應(yīng)用。網(wǎng)絡(luò)信息資源組織的理論吸收了邏輯學(xué)、認(rèn)知心理學(xué)、管理學(xué)、系統(tǒng)科學(xué)、信息傳播理論、信息檢索理論等不同學(xué)科的理論和方法。從微觀上看,網(wǎng)絡(luò)信息資源組織的研究中采用了科學(xué)抽象、分析與綜合、歸納與演繹等多種具體方法即有定性的,也有定量的。
2.網(wǎng)絡(luò)信息資源的組織管理
?。?)通過(guò)自由文本方式組織管理網(wǎng)絡(luò)信息資源。這種方式主要用于全文數(shù)據(jù)庫(kù)建造,是對(duì)非結(jié)構(gòu)化的文本信息進(jìn)行組織與處理的一種方式,如傳統(tǒng)文獻(xiàn)的數(shù)字化,就是建立全文數(shù)據(jù)庫(kù)。使之成為計(jì)算機(jī)可以閱讀和處理的文本。自由文本方式是用自然語(yǔ)言揭示文獻(xiàn)中的知識(shí)單元,并以此為依據(jù),按文獻(xiàn)全文的自然狀況直接設(shè)置檢索點(diǎn)。它所組織的是人們所創(chuàng)或采集的網(wǎng)外全文信息,是輸入網(wǎng)絡(luò)的新資源。以自由文本方式組織網(wǎng)絡(luò)信息資源具有以下優(yōu)勢(shì):第一、以文本共享與傳輸信息,這種組織方式簡(jiǎn)單方便,計(jì)算機(jī)有一整套文件處理的理論與技術(shù)。在組織網(wǎng)絡(luò)信息資源時(shí)可以容易地利用這些現(xiàn)成的技術(shù)與方法。第二、這種組織方式是存貯非結(jié)構(gòu)化信息的天然單位,對(duì)于圖形、圖像、圖表、音頻、視頻等非結(jié)構(gòu)化信息,可以方便地利用本系統(tǒng)來(lái)管理。
(2)建立網(wǎng)絡(luò)資源數(shù)據(jù)庫(kù):數(shù)據(jù)庫(kù)是將所獲得的信息資源按照固定的記錄格式存儲(chǔ)組織,它最小存貯單位是字段,數(shù)據(jù)庫(kù)方式是對(duì)大量規(guī)范化數(shù)據(jù)進(jìn)行組織管理的技術(shù),它具有以下優(yōu)點(diǎn):第一、對(duì)大量的結(jié)構(gòu)化數(shù)據(jù)處理效率很高。大大提高了信息的管理效率。第二、可根據(jù)用戶需求靈活地改變查詢結(jié)果集的大小,從而大大降低了網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)呢?fù)載。
(3)超媒體組織的方式。這種信息組織方式是將超文本與多媒體技術(shù)結(jié)合起來(lái)組織網(wǎng)絡(luò)信息資源的一種主要方式。超文本方式打破了順序線性存取的限制,將文本信息組織成立體網(wǎng)狀結(jié)構(gòu),使用戶可以從任一節(jié)點(diǎn)開(kāi)始,根據(jù)網(wǎng)頁(yè)中信息之間的聯(lián)系,從不同角度瀏覽與查詢信息。超媒體方式是將文本、表格、聲音、圖像等多媒體信息以超文本格式組織起來(lái),通過(guò)節(jié)點(diǎn)與鏈接結(jié)構(gòu)在數(shù)據(jù)庫(kù)中尋找所需的媒體信息。采用超媒體方式組織信息資源的優(yōu)勢(shì)主要有: 第一,以非線性的方式組織信息,符合人們思維聯(lián)想與跳躍習(xí)慣。 第二、節(jié)點(diǎn)中的內(nèi)容可多可少,結(jié)構(gòu)可以任意伸縮,具有良好的包容性和可擴(kuò)充性。 第三。方便描述和建立各種媒體之間的語(yǔ)義聯(lián)系,完全超越媒體類型對(duì)信息組織與檢索的限制。
二、網(wǎng)絡(luò)信息資源的組織技術(shù)
(1)WEB數(shù)據(jù)庫(kù)的基礎(chǔ)技術(shù)。所謂WEB數(shù)據(jù)庫(kù),其實(shí)質(zhì)是在傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)技術(shù)之上,融最新的網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、存儲(chǔ)技術(shù)和檢索技術(shù)為一體,完全基于Internet應(yīng)用的數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù)庫(kù)模型的新型數(shù)據(jù)庫(kù)。典型的WEB數(shù)據(jù)庫(kù)系統(tǒng)有一個(gè)WEB游覽器作為用戶界面,一個(gè)數(shù)據(jù)庫(kù)服務(wù)用作信息存儲(chǔ)和一個(gè)連接兩者的WBB服務(wù)器。用戶使用WEB瀏覽器訪問(wèn)WEB頁(yè),通過(guò)WEB頁(yè)上顯示的表格與數(shù)據(jù)庫(kù)進(jìn)行交互操作。
?。?)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)。數(shù)據(jù)倉(cāng)庫(kù)(Date Warehouse)數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過(guò)程的,面向主題的、集成的、隨時(shí)間而變的、持久的數(shù)據(jù)集合;而斯坦福大學(xué)數(shù)據(jù)倉(cāng)庫(kù)研究小組則認(rèn)為"數(shù)據(jù)倉(cāng)庫(kù)是集成信息的存儲(chǔ)中心,這些信息可用于查詢或分析"。目前己成為企業(yè)決策者進(jìn)行管理分析和決策的一種有利工具。而Internet也使得任意時(shí)間任意地點(diǎn)對(duì)信息的訪問(wèn)變得更容易,代價(jià)更低。這兩項(xiàng)技術(shù)結(jié)合起來(lái)可以使得重要信息的處理和傳輸更有效、更經(jīng)濟(jì),因此它導(dǎo)致了基于網(wǎng)絡(luò)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的產(chǎn)生。
(3)基于WEB數(shù)據(jù)挖掘技術(shù)。Web挖掘是利用數(shù)據(jù)挖掘技術(shù)從Web文檔及Web服務(wù)中自動(dòng)發(fā)現(xiàn)并提取人們感興趣的信息。它是一項(xiàng)綜合技術(shù),涉及到Internet技術(shù)、人工智能、計(jì)算機(jī)語(yǔ)言學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域。通常Web挖掘過(guò)程可以分為以下幾個(gè)處理階段:資源發(fā)現(xiàn)、數(shù)據(jù)抽取及數(shù)據(jù)預(yù)處理階段、數(shù)據(jù)匯總及模式識(shí)別階段、分析驗(yàn)證階段。Web挖掘可分為三類:內(nèi)容挖掘、結(jié)構(gòu)挖掘、用戶訪問(wèn)模式挖掘,而Web內(nèi)容挖掘和用戶訪問(wèn)模式挖掘是Web挖掘的兩個(gè)主要方面。
(4)搜索引擎技術(shù)。搜索引擎,,一般是指通過(guò)超文本(超媒體)技術(shù)和在Internet網(wǎng)上建立的一種向網(wǎng)絡(luò)用戶提供網(wǎng)上信息資源檢索和導(dǎo)航服務(wù)的專門(mén)站點(diǎn)或服務(wù)器。它通過(guò)搜集網(wǎng)上的信息,如網(wǎng)站、網(wǎng)頁(yè)、URL、以及非WWW形態(tài)的BBS、Telnet、FTP、Newsgroup等,進(jìn)行整理、組織、加工、處理,建立管理和存儲(chǔ)這些信息的索引數(shù)據(jù)庫(kù),并提供基于該索引數(shù)據(jù)庫(kù)的檢索。搜索引擎的最終目的是能夠根據(jù)用戶需求查找到相關(guān)信息。
(5)指引庫(kù)技術(shù)。所謂指引庫(kù)是指所建立的數(shù)據(jù)庫(kù)中,從物理上講并不存儲(chǔ)實(shí)際的信息資源,但對(duì)其進(jìn)行訪問(wèn)卻可以檢索到有關(guān)數(shù)據(jù)庫(kù)的實(shí)際資源,即指引用戶到特定的地址獲取所需信息,這樣就可以把因特網(wǎng)上與某一或某些主題相關(guān)的節(jié)點(diǎn)進(jìn)行集中,按照方便用戶檢索的原則,用熟悉的語(yǔ)言組織起來(lái),向用戶提供這些資源的分布情況,指引用戶查找。信息資源指引庫(kù)包括三部分:一批反映該專業(yè)國(guó)外信息源的URL;一批原始信息,包括訪問(wèn)頻度高的原始信息資源的鏡像,自建的信息資源等;一套方便信息組織與用戶查詢的支持技術(shù)。
三、基于網(wǎng)絡(luò)導(dǎo)航對(duì)網(wǎng)絡(luò)信息資源的利用
針對(duì)用戶的需求有效地利用和組織Internet上浩瀚的信息資源,建立一個(gè)網(wǎng)絡(luò)信息資源導(dǎo)航庫(kù),使無(wú)序的資源變得有序、分散的變得集中,提供導(dǎo)航,指引用戶利用網(wǎng)絡(luò)資源,就能使用戶在浩瀚無(wú)邊的信息海洋里不至于迷失方向和耗費(fèi)太多的時(shí)間。網(wǎng)絡(luò)導(dǎo)航是指有關(guān)因特網(wǎng)網(wǎng)站、網(wǎng)頁(yè)甚至私人信息的檢索及目錄等服務(wù)。隨著網(wǎng)絡(luò)信息資源的不斷變化發(fā)展,網(wǎng)絡(luò)導(dǎo)航的內(nèi)容也是在日益增長(zhǎng),但就目前能夠被人們認(rèn)識(shí)和利用的主要有以下幾個(gè)方面的內(nèi)容: ①教學(xué)科研機(jī)構(gòu)。主要提供高校資源、學(xué)術(shù)動(dòng)態(tài)和科技成果等等與教學(xué)、科研有關(guān)的網(wǎng)絡(luò)信息。②文獻(xiàn)信息機(jī)構(gòu)。主要提供各種文獻(xiàn)信息的網(wǎng)絡(luò)服務(wù)。這類機(jī)構(gòu)網(wǎng)站包括圖書(shū)館、中科院文獻(xiàn)情報(bào)中心、情報(bào)所等相關(guān)網(wǎng)站。③出版發(fā)行機(jī)構(gòu)。主要提供圖書(shū)資料的出版發(fā)行信息,同時(shí)也提供圖書(shū)的訂購(gòu)業(yè)務(wù)。這類機(jī)構(gòu)網(wǎng)站包括各種出版社網(wǎng)站和網(wǎng)上書(shū)店。④搜索引擎。主要提供用戶自由檢索的強(qiáng)大搜索工具,包括了Google、新浪、網(wǎng)易、搜狐等等。⑤可直接利用的各種免費(fèi)資源。如各種免費(fèi)的或試用的數(shù)據(jù)庫(kù)、報(bào)紙資源、期刊資源、其它圖書(shū)館的數(shù)字化資源。⑥重點(diǎn)學(xué)科資源導(dǎo)航。主要是為用戶提供以學(xué)科為單元的Internet上的相關(guān)學(xué)術(shù)資源的導(dǎo)引和檢索線索的導(dǎo)航,它將某一學(xué)科的網(wǎng)絡(luò)學(xué)術(shù)資源集中、有序化,讓用戶了解本學(xué)科的最新研究動(dòng)態(tài)及各種學(xué)術(shù)資源。它是圖書(shū)館現(xiàn)代信息服務(wù)和學(xué)科咨詢服務(wù)的一部分。
作者單位:衡水學(xué)院圖書(shū)館
參考文獻(xiàn):
[1]安新穎. 網(wǎng)絡(luò)信息資源組織研究[J].現(xiàn)