999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中文網絡信息資源的開發利用

2009-04-29 00:00:00孫廣勝
現代情報 2009年12期

〔摘 要〕本文分析了中文網絡信息資源開發利用過程中存在的問題和制約其開發利用的因素,并對網絡信息資源開發利用相關策略進行了探討。

〔關鍵詞〕中文;網絡信息資源;開發利用

〔中圖分類號〕G250.73 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)12-0055-03

Exploitation and Using of Chinese Web Information ResourcesSun Guangsheng

(Xingtai City Library,Xingtai 054000,China)

〔Abstract〕This article analysed the problems and constraints that existed in the process of exploitation and using Chinese web information resources.It also discussed the development strategies.

〔Keywords〕Chinese;web information resources;exploitation and using

隨著網絡技術的迅猛發展,網絡已成為世界上主要的信息傳播媒介和最重要的信息源之一。以電子計算機為核心的現代信息技術與互聯網絡的應用和普及,帶來了社會經濟、貿易、信息傳播的全球化,深刻地影響著社會各個層面,巨量信息涌入因特網,使Internet成為一個信息資源種類繁多,覆蓋面廣的巨大信息資源庫,網絡信息資源的開發利用也因此經歷了一個從無到有,從簡單到復雜的過程。就我國網絡信息資源建設現狀來看,高檔次硬件、中配置系統、低層次應用的情況仍然普遍存在。本文擬就中文網絡信息資源開發利用略作探討,以期拋磚引玉。

1 網絡信息資源的內容和范圍與傳統的信息資源相比,網絡信息資源在數量,結構,分布和傳播的范圍,載體形態,內涵傳遞手段等方面都顯示出新的特點。這些新的特點賦予了網絡信息資源新的內涵。作為知識經濟時代的產物,網絡信息資源也稱虛擬信息資源,它是以數字化形式記錄的,以多媒體形式表達的,存儲在網絡計算機磁介質,光介質以及各類通訊介質上的,并通過計算機網絡通訊方式進行傳遞信息內容的集合。簡言之,網絡信息資源就是通過計算機網絡可以利用的各種信息資源的總和。目前網絡信息資源以因特網信息資源為主,同時也包括其他沒有連入因特網的信息資源。

2 中文網絡信息開發利用各個環節中存在的問題

2.1 中文網絡信息數量增長速度驚人,質量良莠不齊根據中國互聯網絡信息中心(CNNIC)調查報告顯示,近幾年,隨著我國互聯網基礎建設投入加強,網絡需求亦步入成熟期,眾多中文網站的涌現,使網上中文信息貧乏的狀況得到改變,中文網絡資源總量增長速度驚人。但另一方面,網絡共享性與開放性使得人人都可以在互聯網上存放、發布信息,由于沒有質量控制和管理機制,這些信息沒有經過嚴格編輯和整理,良莠不齊,各種不良和無用的信息大量充斥在網絡上,形成了一個紛繁復雜的信息世界。同時,網上信息的發布沒有統一的標準和格式,為信息的傳播和用戶檢索設置了障礙。

2.2 中文信息編碼不統一盡管全球中文網絡使用的都是中文,但在計算機編碼方面卻有很大的不同,即大陸通行的是簡化漢字,采用GB編碼方式;港澳臺通行的是繁體漢字,采用的是BIG5編碼方式;而海外(主要是北美)采用的又是HZ編碼方式。盡管近年來推出了轉換內碼軟件,網絡瀏覽器也相應具有內碼轉換功能,同時眾多網站均設置了GB版或BIG5碼版(有些還設立圖形版),已經打破了信息交流的障礙,但閱讀者在獲取信息、資料以及交流方面仍感到極大不便。此外,專業用語的不統一,也帶來了很大的麻煩。外國人對這種情況更感到莫衷一是。中文是世界上使用人口最多的文字,是聯合國6種工作語言之一,但目前的狀況很難使中文成為信息社會的強勢語言。

2.3 網絡信息組織無序面對海量的網絡信息,用戶往往會感到無所適從。在這種情況下,只有把大量隨機的、分散的、無序的信息轉變為有規律的、有序的信息,才能充分發揮其作用。早在1991年,OCLC就開始了一項名為“給因特網編目”(Cataloguing the internet)的計劃,研究網上信息資源能否應用USMARC格式進行標準化編目。就我國而言,近幾年來對網絡信息分類組織的研究已經取得了不少有價值的研究成果,但還不十分完善,研究大多停留在淺層次上的理論探討,缺乏必要的實證性研究,重復研究現象比較嚴重。

2.4 從檢索而言,中文網絡信息檢索工具功能有待改善目前,中文搜索引擎主要有3種類型:目錄式搜索引擎(如新浪、搜狐、中文雅虎)、機器人搜索引擎(又稱全文搜索引擎,如百度,Google)和元搜索引擎(如萬緯搜索),與國外檢索工具相比,還存在著很多的缺陷:

2.4.1 信息覆蓋面有限現階段搜索引擎所覆蓋的數據庫的規模非常有限,據美國科學期刊Natures一篇報告中稱,全球最大的搜索引擎也只能覆蓋現有網頁的16%。中文搜索引擎因起步慢、中文信息所占互聯網全部信息的比例小(只占全部網絡信息的5%)等原因在這方面尤為突出。

2.4.2 標引深度不夠,查準率較低大多搜索引擎根據單詞、短語在頁面中出現的頻度和位置來篩選、描述、標引頁面,信息加工深度不夠;分類體系與科學知識體系之間缺乏內在聯系;類目之間邏輯關系模糊,導致檢索路徑與搜索引擎類目錯位;檢索功能單一;檢索詞的專指性較差;大部分的檢索結果是題錄式而非全文式,其內容簡單等等。機器人搜索引擎的分類和索引缺乏人工的參與,其查準率不如目錄式搜索引擎,且檢索結果中還含有大量的重復、虛假的信息。

2.4.3 對多媒體信息的檢索技術不完善目前大多數的中文搜索引擎由于技術原因,無法滿足用戶對除了文本信息外的聲音、圖形、圖像等多媒體信息的檢索要求。

2.4.4 專業性的搜索引擎發展遲緩目前中文搜索引擎大多是綜合性的,能同時收錄各行業、各學科的多種信息,但在反映某一行業或某一專題的信息方面很難做到全面、精確,不能給用戶提供特定的信息服務。

2.4.5 檢索功能方面存在缺陷一是檢索中符合布爾邏輯運算符的搜索引擎極為有限;二是要害詞檢索輸出的結果相關度排序方式雜亂,不能根據用戶需要來選擇信息輸出的方式;三是多數的搜索引擎是面向主題搜索不是面向用戶搜索,不能重復利用用戶檢索過的成果,更不能對特定的用戶進行定題跟蹤服務;四是檢索網站的主頁不規范,有些太簡,有些又太繁,而且廣告內容太多,無法進行有效檢索。

2.5 網絡信息的保存問題日益突出網絡信息資源雖然浩如煙海,壽命卻非常短暫,宛如曇花一現。在新的網頁不斷產生的同時,舊的網頁也在不斷地消失,一個網頁的平均壽命只有44天。作為一種“原生性”數字信息,網絡信息資源除了數字形式之外,別無其他形式。如果不能進行有效的保存,它們會很快地消亡。經常使用搜索引擎的人都有類似的經歷,當打開檢索結果中列出的鏈接時,會得到“頁面已不存在”的提示,這給用戶帶來了極大的不便。必須加快腳步、積極探索網絡信息資源保存的新思路,否則將會有大批網絡信息永遠消失,這種損失是無法估量的。

3 制約網絡信息資源開發利用的因素分析

3.1 宏觀調控管理不力從管理體制上來說,近些年來,我國的文獻信息資源開發利用雖有了很大發展,但從總體上還缺乏統一規劃和組織協調,文獻信息資源開發基本上還處于小范圍協作和單兵作戰狀態。“條塊分割”、“各自為政”導致信息資源開發分散、重復、規模小、標準不統一等種種弊端,成為影響我國網絡信息資源開發利用的主要因素之一。

3.2 技術因素的制約漢語不同于西文,西文以詞為基本單位,不存在分詞問題,而漢語則以字為基本單位,如果不將單詞分析出來,就無法進行以詞為單位的索引。盡管中文信息處理技術有了很大的發展,但到現在也沒有很好的解決詞切分問題。

3.3 信息服務人員素質亟待提高由于長期以來信息服務人員隊伍的短缺和低水平,致使絕大多數信息服務部門都存在有技術設備管理不善、應用不足,很多可以開展的服務無法正常開展,已開展的服務技術含量低、服務質量差。這種水平的落后實際上導致了投資的浪費,并成為桎梏信息資源開發利用的重要不利因素。

3.4 社會環境因素的制約一方面,由于我國東西部經濟社會發展水平和文化教育水平不同,造成區域之間的信息傳播落差,這種發展的不平衡制約了網絡信息資源的開發利用。另一方面,由于信息化建設的策劃者、領導者及工作者的重視程度不同,在資金和政策上缺乏具體化、有力度的支持和保護政策,資金投入不均衡,不能吸引更多的社會資本和外資投向信息資源開發。實踐證明,投資乏力,是目前制約網絡信息資源開發利用的重要因素。

4 網絡信息資源開發利用的策略

4.1 統籌規劃協調信息資源開發通過政府或行業組織對信息資源建設進行信息立法、行業規范與控制,制定統一的規劃,統籌協調各方面的資源力量,建立健全的開發管理體制。如在網絡化建設、軟件及相關的建設中,制定統一的標準規范,保持與國際有關標準兼容,在數據庫建設上走聯合的集約化方式,通過全國網絡實現資源共享;國家要加大對網絡信息資源開發利用的經費投入力度,保證基礎性、公益性、綜合性網絡信息資源開發利用所需的資金;制定稅收傾斜政策,減免或減低從事網絡信息資源開發利用行業的稅收等一系列優惠政策,吸收更多的社會資本及外商投資,參與信息資源的開發利用;建立健全信息資源開發的法規體系,制定好信息網絡與資源管理的政策法規,提高全社會對信息資源開發利用的認識,保障信息資源建設健康有序的進行。

4.2 搞好網絡信息資源的加工、組織與提供

4.2.1 科學設計導航路線,開發多通道職能界面要能通過多種搜索引擎,對某一或某些主題信息上網查詢、瀏覽,并參考相關文獻,選擇應用價值較高的信息資源,設置2~3級類目,引導網絡用戶迅速找到所需的網址。在各級類目和具體的信息資源網下,應有對該類目和具體網址的內容介紹,以方便用戶對網絡信息進行選擇,準確、快速地找到所需信息。

4.2.2 加強網絡信息資源的專業性發展,建立特色虛擬館藏要利用現代技術,對各種網絡信息資源進行專業性處理,利用網絡信息資源中的關鍵詞、主題詞一級分類標準,對其進行分類整理,有針對性的編制文摘、綜述、題錄等,通過各種交流途徑傳遞報道出去,及時提供給用戶。并根據特定用戶的需求,有計劃地組織信息資源和鏈接www信息服務器,通過過濾整理網上信息資源,下載用戶重點研究課題所需的信息資料,并將其存儲在自己的web服務器上,建成具有本單位特色的虛擬館藏,向本單位和網上用戶提供特色信息服務。

4.3 加強網絡信息資源開發利用技術的研究信息技術的核心是技術,在網絡信息資源的開發與利用上,應注意技術集成,瞄準網絡操作系統,優化資源配置,研究開發力量,完善技術創新體系,下大氣力提高服務質量,這樣才能擁有發展的主動權。 實現較高水平的跨越。

4.3.1 優化元搜索引擎技術,切實加以利用元搜索引擎(META Search Engine)是對分布于網絡上的多種檢索工具進行全局控制的機制,它通過一個統一用戶界面幫助用戶在多個搜索引擎中選擇和利用合適的(甚至是同時利用若干個)搜索引擎來實現檢索操作。元搜索引擎一般都沒有自己網絡機器人及數據庫,它們的搜索結果是通過調用、控制和優化其它多個獨立搜索引擎的搜索結果,形成一個由多個分布的具有獨立功能的搜索引擎構成的虛擬邏輯整體并以統一的格式在同一界面集中顯示,從而實現對這個虛擬整體中各獨立搜索引擎數據庫的查詢與數據處理。用戶可通過元搜索引擎優化檢索結果,提高檢索效率。目前已有的中文元搜索引擎,由于技術尚不完善,效果較好的只有馬虎聚搜、佐意綜合搜索、比比貓等少數幾個,而大多數元搜索引擎如萬緯搜索、壹家搜、知合網的網頁搜索、MMGOOGLE圖片搜索等等,往往速度慢,功能較少,或單純利用其他搜索引擎拷貝搜索結果,效果不盡如人意。

4.3.2 開發小型專業搜索工具專業性的搜索引擎是為專門收錄某一行業,某一主題的信息而建立,能夠提供專題信息查詢服務的搜索引擎。目前我國互聯網上的搜索引擎不論大小都是綜合性搜索引擎,搜索結果指向差,使得專業人員,是某一領域的學者、專家不愿意利用中文搜索引擎去查詢資料。而小型專業搜索引擎具有針對性強、開發周期短、技術復雜性低、見效快等優點,特別符合我國目前互聯網上的發展現狀。

4.3.3 開發智能化搜索引擎智能搜索引擎是未來搜索引擎的發展趨勢。可以通過自然語言與用戶交互,最大限度地了解用戶的需求。智能檢索一是表現在搜索引擎技術的智能化,研究重點放在自然語言處理技術和人工智能技術的研究上;另一表現是體現在搜索引擎面向檢索者的智能化,它致力于通過分析檢索者的檢索和瀏覽行為來學習檢索者的需求,利用搜索引擎現有的服務有選擇地為檢索者提供個性化的服務。

4.4 加強信息服務人員的培養網絡下的信息服務人員在素質上應具有良好的職業道德和奉獻精神、扎實的專業知識、相關的背景知識和較高的外語水平;在能力方面應具有嫻熟的現代信息技術、敏銳的信息意識和信息獲取、創新能力等。這是在互聯網日益普及,用戶自我查詢能力日益增強的背景下,用戶對信息服務需求的新特點。對于信息服務人員的培養模式應該是跨學科的,即從技術、文化、人文3個層面,來培養復合型人才。在我國,加強復合型人才培養的途徑主要有兩個:一是繼續教育,對從業人員進行“補課”,彌補其知識結構中的不足;二是在校教育,這需要調整我們現有的課程結構,使我們的專業設置更符合社會需要。

4.5 促進網絡信息資源的聯合開發和資源共享再生性信息的生命周期比較短,讀者層次比較高,要求量越來越大,這就要求信息資源開發必須注意速度和時效,及時地對主要信息產品進行更新,并不斷改善產品結構,提高產品檔次,盡可能地預測讀者將要產生的新的需求,生產新的產品,滿足讀者需要。要實現這樣的目標,一個單位難以完成,必須組織力量聯合攻關。由于我國信息化建設發展不均衡,部門之間、地方之間互相分割,自成體系,不同程度存在著重復分散、浪費和效率低下的現象,這不僅嚴重影響著我國信息化建設的健全發展,而且同信息化建設客觀要求的共享性也不相容。鑒于我國的國情,比較理想的做法就是要在充分掌握我國文獻信息資源分布和開發利用情況的基礎上,根據各地經濟社會發展需要,統一標準,相互協調,先建立起區域性的文獻信息資源開發利用管理網絡,通過文獻信息整體化建設,分工開發和綜合性利用,克服資源重復建設的問題,發揮整體優勢,實現文獻信息資源的共同開發和利用。只有大聯合,才能形成規模經濟的優勢,才能在國際信息的激烈競爭中爭取主動。

參考文獻

[1]王輝.網絡信息資源開發淺議[J].現代圖書情報技術,2001,(2):86-87.

[2]皮介鄭.網絡信息資源管理初探[J].現代圖書情報技術,2001,(2):43-45.

[3]范興坤.圖書館發展過程中的內部阻滯因素分析[J].圖書館雜志,2005,(1):15-19.

[4]唐承秀.高校圖書館網絡信息資源建設的質量控制[J].圖書館雜志,2005,(2):36-38.

[5]王翔,譚誼.網絡信息檢索的工具[EB].http:∥www.lwbst.com/viewAction.do?lunwenid=109403,2009-06.

[6]元搜索引擎.百度百科[EB].http:∥baike.baidu.com/view/7203.Htm,2009-06.

[7]盧燕萍,李志寧,等.網絡信息資源的開發與利用[EB].http:∥www.zslib.com.cn/xuehui,2009-06.

[8]賈林川.互聯網中文搜索引擎存在的問題與發展趨勢探析[J].武警學院學報,2007,(7):94-96.

主站蜘蛛池模板: 手机成人午夜在线视频| 最新国产网站| 91国内视频在线观看| 欧洲欧美人成免费全部视频| 国产午夜无码片在线观看网站| 欧洲熟妇精品视频| 国产Av无码精品色午夜| 四虎在线高清无码| 亚洲精品在线观看91| 欧美三級片黃色三級片黃色1| 亚洲精品爱草草视频在线| 视频一本大道香蕉久在线播放 | 久久婷婷六月| 2020国产免费久久精品99| 亚洲日韩久久综合中文字幕| 亚洲熟女偷拍| 国产波多野结衣中文在线播放| 无遮挡国产高潮视频免费观看| 自拍亚洲欧美精品| 人妻丰满熟妇AV无码区| 欧美日韩精品一区二区在线线| 国产真实自在自线免费精品| 国产高清又黄又嫩的免费视频网站| 精品亚洲欧美中文字幕在线看| 国产乱子伦手机在线| 青草视频久久| 精品日韩亚洲欧美高清a| 尤物亚洲最大AV无码网站| 午夜激情婷婷| 国产jizzjizz视频| 首页亚洲国产丝袜长腿综合| 91精品日韩人妻无码久久| 91精品国产一区| 国产欧美视频在线| 亚洲av日韩av制服丝袜| 亚洲色无码专线精品观看| 色婷婷视频在线| a天堂视频在线| 成人国产一区二区三区| 亚洲精品视频免费观看| 欧美亚洲国产精品久久蜜芽| 国产精品无码久久久久久| 亚洲免费毛片| 女人毛片a级大学毛片免费| 亚洲一区二区三区国产精品 | 精品国产Av电影无码久久久| 伊人久久久大香线蕉综合直播| 成人午夜网址| 91亚洲影院| 青青青国产视频| 久久青草视频| 五月激情综合网| 一本一道波多野结衣av黑人在线| 国产丝袜无码精品| 四虎在线高清无码| 亚洲国产精品不卡在线| 国产在线欧美| 亚洲色图在线观看| 国产激情无码一区二区三区免费| 久久综合成人| 精品人妻无码中字系列| 久久综合成人| 亚洲国产精品无码久久一线| 久久久无码人妻精品无码| 26uuu国产精品视频| 国产成人一区免费观看| 大学生久久香蕉国产线观看| 一区二区无码在线视频| 精品国产女同疯狂摩擦2| 亚洲欧美综合精品久久成人网| 国产精品2| 超薄丝袜足j国产在线视频| 色欲不卡无码一区二区| 欧美 亚洲 日韩 国产| 高清乱码精品福利在线视频| 亚洲视频免| 女同久久精品国产99国| 欧美一级一级做性视频| 亚洲最猛黑人xxxx黑人猛交| 免费高清a毛片| 久久精品国产在热久久2019| 久草视频一区|