【摘要】信息資源是重要的社會財富。近年來,海量信息的出現(xiàn),造成“信息過載”,怎么依托計算機強大的存儲能力處理這些信息?本文就此進行了探討。
【關(guān)鍵詞】圖書館;計算機;網(wǎng)絡(luò)信息
【中圖號】G250.73【文獻標(biāo)示碼】A【文章編號】1005-1074(2008)11-0188-01
1依托計算機強大的存儲能力,解決海量信息資源的存儲問題
信息資源是重要的社會財富,人類很早就認識了這一點。先后通過刻畫甲骨、縑帛、竹簡。紙張等來記錄信息,并通過圖書館來保存和利用信息。古埃及的亞歷山大圖書館,是人類最早的大型圖書館之一,建于公元前3世紀,曾擁有公元前9世紀的古希臘詩人荷馬的全部詩稿等著作,成為古代希臘文明的象征。而在我國,殷墟博物苑存儲的甲骨文,距今約3600多年,被譽為世界上最早的檔案館、最早的圖書館。前不久,考古專家宣布,寧夏大麥地巖畫,面積約450平方公里,遺存史前巖畫一萬幅以上,共有3172組,8453個個體圖形,巖畫的相形性與漢字中的相形字體相似,可能是我國最古老的圖畫文字,距今8000年到7000年左右。它不僅比甲骨文早數(shù)千年,甚至比國際學(xué)術(shù)界公認的,產(chǎn)生于公元前3350年的南美索不達米亞復(fù)雜刻畫、產(chǎn)生于公元前3200年的蘇美尼亞楔形文字、產(chǎn)生于公元前3050年的埃及象形文字還要早幾千年。我國最早的圖書館的命名叫“盟府”,始于周朝。宋、明、清均有國家興建的大型藏書樓。
在專制統(tǒng)治時代,統(tǒng)治者常常實行“愚民”政策,僅僅向民眾提供篩選過的少量書籍,不愿意將信息資源交給全民分享。在我國古代歷史上,秦始皇焚書坑儒,規(guī)定以為師,禁止民間藏書;梁武帝“愛”書,藏書十多萬卷,又將其全部焚毀;清朝大興“文字獄”,也曾大量焚毀前朝書籍。
以法國“百科全書派”的啟蒙運動為先導(dǎo),人類逐漸形成共識,社會的文明與進步,依賴于知識的傳播與分享。從此后,世界各地紛紛出版圖書,建設(shè)圖書館,傳承文明和知識。圖書的大量出版,產(chǎn)生了一個如何有效利用知識的新問題。對于浩如煙海的書本上的知識,人類一直只能靠人體自然的記憶機能來加以使用。在今天,這種利用信息的方式遠遠不能滿足社會發(fā)展的需求。一天讀一本書,按70年計算,人的一輩子不過能讀兩萬多本書,而我國目前每年出版的圖書就超過10萬種。
到了上個世紀的50年代,由于計算機技術(shù)的出現(xiàn),大量的知識、數(shù)據(jù)和圖書、文獻轉(zhuǎn)化為計算機信息,存放到數(shù)據(jù)庫中。依托計算機強大的存儲能力,解決了海量信息資源的存儲問題。網(wǎng)絡(luò)是分享海量信息資源的最佳渠道。通過網(wǎng)絡(luò),可以提高信息資源的開發(fā)效率,減少重復(fù)勞動;可以清除時間、空間上的障礙,讓巨大的信息資源向每個社會成員開放。網(wǎng)絡(luò)文化資源、文化信息建設(shè)工作的實質(zhì),從信息學(xué)角度來看,就是創(chuàng)造越來越多的信息資源形態(tài)的文化產(chǎn)品,通過網(wǎng)絡(luò)提供給廣大人民群眾。
各式各樣的搜索引擎已成為人們處理海量信息必不可少的工具。上世紀后半期以來,“信息爆炸”造就了巨大的“信息過載”壓力。隨著網(wǎng)絡(luò)信息建設(shè)的深入,大量的聲音、影像、三維狀態(tài)描述等形式的文化信息,產(chǎn)生出來,網(wǎng)絡(luò)文化的信息資源,總量正在成數(shù)量級地增長。依靠人的大腦和傳統(tǒng)的手段,無法解決著海量信息導(dǎo)致的“信息過載”的問題。建設(shè)網(wǎng)絡(luò)文化信息,今天,各式各樣的搜索引擎已成為人們駕馭海量信息必不可少的工具,徹底改變了人類在海量信息面前的被動局面。可以這樣說:搜索引擎是網(wǎng)絡(luò)信息建設(shè)的核心技術(shù),每一項網(wǎng)絡(luò)信息服務(wù)的提供,都離不開搜索引擎技術(shù)。搜索引擎技術(shù),就目前來看,可以分為三類:一是分類查詢;二是索引檢索;三是全文檢索。先說分類查詢的方法。此方法是將信息按照學(xué)科領(lǐng)域的類別進行分類劃分,這樣做比較符合人們的認知習(xí)慣。如雅虎,就是最早采用這一方法的搜索引擎網(wǎng)站。此后,幾乎所有的搜索引擎網(wǎng)站都提供分類查詢的服務(wù)。這種方法的關(guān)鍵在于分類。它有計算機自動分類和人工分類兩種。計算機自動分類的優(yōu)點是分類速度快,效率高,缺點也存在,那就是分類不準(zhǔn)確。人工分類準(zhǔn)確度高,但效率很低,無法跟上“信息爆炸”的速度。再說索引檢索這種方法。它來自計算機數(shù)據(jù)庫的管理經(jīng)驗,完全由計算機完成。它將信息看作一個個字、詞的集合,出于效率的考慮,只能設(shè)定少數(shù)幾個關(guān)鍵詞。對于關(guān)鍵詞范圍內(nèi)的詞匯,它的檢索效率和查全率都很高,但缺點也來了:對于超出這一范圍的詞匯,就沒有檢索能力了。索引檢索方法,比較適用于靜態(tài)的科技或社科文獻數(shù)據(jù)庫。
關(guān)于全文檢索方法,這是目前最流行的搜索引擎技術(shù)。幾乎所有的網(wǎng)站都在采用全文檢索技術(shù)。全文檢索方法,通過在整篇文章中機械地進行關(guān)鍵詞的匹配來進行檢索,這樣,查全率就高,但缺點是,查詢效率嚴重依賴于計算機的性能。在上世紀90年代中期之前,由于計算機性能的限制,全文檢索發(fā)展緩慢,但此后,由于高性能計算機的普及,全文檢索成為最主流的搜索引擎技術(shù),應(yīng)用到幾乎所有的信息處理領(lǐng)域。以谷歌網(wǎng)站為例。運用全文檢索技術(shù),通過互聯(lián)網(wǎng)向全體網(wǎng)民提供免費的信息搜索服務(wù)。使得每一個人都獲得了強大的信息駕馭能力。谷歌的數(shù)據(jù)庫里收錄了80多億個網(wǎng)頁,在不到一秒鐘的時間里,可以完成對幾十億個網(wǎng)頁的全文檢索。如此高的搜索效率,使得谷歌成為全球最受歡迎的搜索引擎,成為全球10多億網(wǎng)民的強有力的“外腦”。但是,新的問題出現(xiàn)了:今天,谷歌收錄的網(wǎng)頁還不到整個互聯(lián)網(wǎng)信息資源的5%,還有網(wǎng)上的文化類信息資源,還僅僅是人類文化信息資源的一小部分。這要求我們要繼續(xù)開發(fā)和推廣先進的搜索技術(shù),開發(fā)效率更高、更易于使用的搜索引擎。這是網(wǎng)絡(luò)信息建設(shè)者面臨的新的課題,新的重大的課題。我們還有大量的艱巨的工作要做。
2抓網(wǎng)絡(luò)信息水平整體提升,以信息產(chǎn)業(yè)大國向網(wǎng)絡(luò)信息化強國邁進
人類已進入網(wǎng)絡(luò)信息時代,信息越來越成為人們生存和生活的必需品,離開信息,人們幾乎寸步難行。我國已成為信息產(chǎn)業(yè)大國,但并不等于信息化強國。來自前沿的科學(xué)家、中國工程院院士、中科院計算所所長李國杰4月16日表示:我們在核心信息技術(shù)上與發(fā)達國家的差距是兩代,長此以往,我國將被技術(shù)邊緣化。世界經(jīng)濟論壇的報告指出,中國信息化水平已連續(xù)兩年下滑,落到第59名。而排在前列國家的成功,在于很早就將工作重心放在教育、創(chuàng)新和信息技術(shù)的滲透和擴散上。今天的競爭,就是人才的競爭。我國為此正在大力推進科教興國,要成為創(chuàng)新型國家。如龍芯2F系統(tǒng)芯片研制成功。李國杰說:“中國人在信息產(chǎn)業(yè)的核心技術(shù)方面,完全能夠通過創(chuàng)新跨越取得突破”。(2007年10月13日光明日報)信息化,為什么要研究信息技術(shù)的滲透和擴散呢?強調(diào)滲透,說明信息技術(shù)的應(yīng)用方式需要不斷深入。強調(diào)擴散,說明信息技術(shù)的應(yīng)用領(lǐng)域、應(yīng)用人群需要不斷擴大。通過滲透和擴散,可以擴大網(wǎng)絡(luò)信息通信技術(shù)的使用人群。我們知道網(wǎng)絡(luò)效能原理。根據(jù)這個原理,網(wǎng)絡(luò)的效能與網(wǎng)絡(luò)節(jié)點數(shù)的平方成正比,這樣,信息化水平將呈現(xiàn)爆炸性的發(fā)展。而我國現(xiàn)在的實際情況是怎樣的呢?我國東西部之間、城鄉(xiāng)之間的“數(shù)字鴻溝”還在不斷增大。這樣下去,如何發(fā)揮網(wǎng)絡(luò)效應(yīng)呢?
由此可知,如果不抓信息化水平整體提升的做法,我國將會在謝謝時代的大潮中面臨失去機遇的危險。怎樣抓信息技術(shù)的滲透和擴散呢?一是把網(wǎng)絡(luò)技術(shù)滲透和擴散到廣播電臺中去。也就是說,廣播電臺利用建立在因特網(wǎng)站上的廣播服務(wù)器和特定軟件運行傳輸,再經(jīng)過計算機上安裝的廣播接收軟件連接的過程。它既是網(wǎng)絡(luò)傳播多媒體形態(tài)的重要體現(xiàn),也是廣播網(wǎng)絡(luò)化發(fā)展的體現(xiàn)。網(wǎng)絡(luò)廣播有許多優(yōu)點:傳播速度快,音質(zhì)清晰,信息容量大,覆蓋面廣;二是使電臺節(jié)目形式上得以大大刷新和擴展;三是突破與彌補了傳統(tǒng)廣播單一的線性播放與收聽服務(wù)模式,為廣播節(jié)目提供了多層次、多樣性、個性化的節(jié)目服務(wù);四是它有廣闊的發(fā)展前景。如:發(fā)展多元化電臺網(wǎng)絡(luò)廣播,五大媒體高度融合:電臺、互聯(lián)網(wǎng)、移動網(wǎng)、固定電話網(wǎng)以及廣播網(wǎng)。這樣開發(fā)、拓展增值空間,就會增強網(wǎng)絡(luò)廣播的市場生命力。
2007年中國信息化推進大會推出了“三合一”的“乙太網(wǎng)絡(luò)信息現(xiàn)代服務(wù)系統(tǒng)”,即電信網(wǎng)、電視網(wǎng)、互聯(lián)網(wǎng)三網(wǎng)合一。該系統(tǒng)在無需網(wǎng)關(guān)和專用設(shè)備投入的情況下,就可實現(xiàn)電話會議、視頻會議、商品交易、廣告展示等多項功能,打破了傳統(tǒng)互聯(lián)網(wǎng)圖片加文字的靜態(tài)網(wǎng)頁格局,可實現(xiàn)網(wǎng)頁主人與顧客的即時交流,視訊溝通以及遠程網(wǎng)絡(luò)聲訊、視頻監(jiān)控。
3參考文獻
1林平忠.論圖書館信息資源的深層開發(fā)[J].中國圖書館學(xué)報,2000,(1)
2 賀玲勇,肖自立.從文獻資源建設(shè)到知識信息存取[J].情報資料工作,2000(4)
3王純.特色文獻資源與特色服務(wù)[J].大學(xué)圖書館學(xué)報,2000,(3)