李晨
(長春理工大學(xué)光電信息學(xué)院,吉林 長春 130114)
隨著我國科學(xué)技術(shù)的不斷進(jìn)步,信息技術(shù)得到了空前的發(fā)展。如今網(wǎng)絡(luò)覆蓋范圍越來越大,網(wǎng)絡(luò)信息傳輸速度也越來越迅速,聯(lián)網(wǎng)智能設(shè)備移動終端普及后人們能更加快速且精準(zhǔn)的在網(wǎng)絡(luò)上,運用網(wǎng)絡(luò)檢索系統(tǒng)查閱自己所需要的資料和獲取相關(guān)資源,在節(jié)約個人時間的同時,也提高了信息資源利用的有效性。在信息技術(shù)的推動下,圖書館與時俱進(jìn)的引進(jìn)了相應(yīng)文獻(xiàn)檢索技術(shù)。
早期我國文獻(xiàn)資源檢索主要依靠手工檢索的方式,手工檢索十分浪費時間和人力,檢索效率也非常低;后來隨著計算機的出現(xiàn)和信息技術(shù)的發(fā)展,大部分圖書館建設(shè)了脫機檢索設(shè)備以供高效師生使用,脫機檢索可檢索計算機中磁盤所存儲的文獻(xiàn)條目,以尋找到合適的文獻(xiàn)資源。值得一提的是一開始圖書館多運用磁帶和磁盤對相關(guān)數(shù)據(jù)機型存儲,而后多使用光盤數(shù)據(jù)庫,前者存儲資源十分有限而后者擁有更大的存儲空間,提取數(shù)據(jù)的速度也相對較快;1970年后隨著計算機軟件技術(shù)和硬件技術(shù)的進(jìn)步,在文獻(xiàn)資源檢索方面引入了分組數(shù)字通信技術(shù)和實時操作技術(shù),使一臺主機可以連帶多個終端系統(tǒng),高校師生可以在終端系統(tǒng)設(shè)備上通過撥號或者電信專線數(shù)據(jù)傳播檢索所需信息,此階段實現(xiàn)了計算機聯(lián)機檢索,是現(xiàn)代計算機檢索技術(shù)的雛形;網(wǎng)絡(luò)時代的到來使以往聯(lián)機檢索的范圍不斷擴(kuò)大,直到超文本技術(shù)出現(xiàn)后,聯(lián)機檢索完全轉(zhuǎn)變?yōu)榱司W(wǎng)絡(luò)化信息檢索。
SFX技術(shù)即新型的數(shù)字資源聚合軟件系統(tǒng),發(fā)展至今已經(jīng)不斷被優(yōu)化。SFX技術(shù)發(fā)展基礎(chǔ)為OpenURL協(xié)議,是較為成熟的聚合技術(shù),可整合復(fù)雜數(shù)據(jù),將所有數(shù)據(jù)的檢索方式統(tǒng)一。廣大師生在使用此技術(shù)檢索數(shù)據(jù)的過程中,不但可實現(xiàn)資源之間的不同轉(zhuǎn)化,還能借助OpenURL協(xié)議的優(yōu)勢使廣大師生簡單的搜索便能有效地利用資源。SFX技術(shù)優(yōu)勢在于其數(shù)字資源的無限擴(kuò)大、源之間互補兼容、實現(xiàn)動態(tài)處理搜索、設(shè)置管理簡單、智能化。
WebService技術(shù)以互聯(lián)網(wǎng)技術(shù)為架構(gòu)基礎(chǔ),以此分布式組間基礎(chǔ)模塊。通過網(wǎng)絡(luò)WebService技術(shù)可實現(xiàn)多平臺互動,且互相效果良好。WebService技術(shù)的工作特點主要是實現(xiàn)不同信息系統(tǒng)平臺之間的信息共享。WebService技術(shù)的優(yōu)勢在于可以優(yōu)化不同平臺信息之間的差異并融合,使得平臺之間有效互通,另外WebService技術(shù)的信息處理在綜合性和協(xié)調(diào)性運作也非常強勢,有效管控不同系統(tǒng)之間的搜索內(nèi)容,實現(xiàn)信息處理優(yōu)化。
P2P技術(shù)是互聯(lián)網(wǎng)覆蓋層網(wǎng)絡(luò)存在的方式之一。在信息處理過程中,廣大師生可能需要和信息主體進(jìn)行信息溝通和交流,這種信息處理技術(shù)手段即P2P技術(shù)。P2P技術(shù)覆蓋環(huán)境中,任何與廣大師生連接的智能終端都能夠進(jìn)行信息資源的實時有效共享,期間需要多種技術(shù)對其支持。目前P2P技術(shù)的構(gòu)成結(jié)構(gòu)主要為樹形結(jié)構(gòu)、哈希表結(jié)構(gòu)、網(wǎng)絡(luò)結(jié)構(gòu)等。
Grid技術(shù)是網(wǎng)絡(luò)技術(shù)的一種,來源于電力網(wǎng)概念。Grid技術(shù)特點在于靈活性和多變的信息處理模式。Grid技術(shù)原理是將所有計算機聯(lián)系在一起,其形成形態(tài)結(jié)果是一個計算機式網(wǎng)絡(luò),以此為基礎(chǔ)將不同信息進(jìn)行整合,以達(dá)到有效利用資源的目的。在Grid技術(shù)運用過程中能體現(xiàn)多種優(yōu)勢,如資源共享、生產(chǎn)知識、開放存儲等。目前Grid技術(shù)網(wǎng)格應(yīng)用相關(guān)內(nèi)容運用豐富,如計算通信系統(tǒng)、地震工程等。數(shù)字圖書館建設(shè)也使用Grid技術(shù)進(jìn)行信息數(shù)據(jù)處理和實現(xiàn)共享信息,通過Grid技術(shù)建設(shè)數(shù)字圖書館有利于整個信息資源的處理率和利用率的提高。
整個圖書館文獻(xiàn)檢索系統(tǒng)運行和實現(xiàn)的核心是數(shù)據(jù)挖掘,數(shù)據(jù)挖掘必須先確定行動的目標(biāo)以及任務(wù),然后跟進(jìn)開發(fā)出挖掘工作所需要的計算方式,同一種數(shù)據(jù)挖掘方式往往有著多種形態(tài)的實現(xiàn)方式以及計算方式。在數(shù)據(jù)挖掘過程中,需要讓KDD引導(dǎo)高校師生從信息資源處理結(jié)果中發(fā)現(xiàn)最終需要的信息,以此使信息內(nèi)容滿足高校師生需求。以往的數(shù)據(jù)挖掘多是信息層面內(nèi)容處理,一些具體的圖片信息則涉及較少,因此數(shù)據(jù)挖掘應(yīng)對每個任務(wù)或者模式的具體實現(xiàn)形式的要求進(jìn)行基本滿足,以此進(jìn)行有效的圖像數(shù)據(jù)挖掘,如淘寶的圖片識別物品技術(shù)、百度的圖片上傳式搜索都是基于此,圖書館文獻(xiàn)檢索技術(shù)也可按照此種方式進(jìn)行圖形數(shù)據(jù)挖掘。
目前,在信息數(shù)據(jù)挖掘過程中尚未能完全實現(xiàn)智能化,但是通過高校師生和智能設(shè)備之間的共同寫作可以實現(xiàn)深入信息挖掘。在信息處理系統(tǒng)的建設(shè)過程中已經(jīng)考慮到運行程序和人的互動,互動形式主要通過人機界面進(jìn)行信息傳導(dǎo),人機界面可以更加智能化和人性化提高數(shù)據(jù)挖掘水平。
圖書館文獻(xiàn)檢索系統(tǒng)整體結(jié)構(gòu)最理想化的是通過人機Agent和管理Agent的互相傳導(dǎo),進(jìn)行資源的處理和挖掘,最終輸出廣大師生認(rèn)可的內(nèi)容。以往的數(shù)據(jù)信息挖掘系統(tǒng)體系龐大,數(shù)據(jù)處理復(fù)雜,而使用多個Agent的模式能夠簡化數(shù)據(jù)處理過程,從而提高信息檢索效率,使之成為一個整體結(jié)構(gòu),智能化和通用型都得到了保障。
通過上述的分析可知,由于圖書館文獻(xiàn)資源檢索技術(shù)的出現(xiàn),進(jìn)而給人們帶來極大的便利,然而,現(xiàn)今的檢索技術(shù)較為淺顯,還不夠深入,不能有效滿足高校師生的需求,本文對圖書館文獻(xiàn)資源檢索技術(shù)的應(yīng)用進(jìn)行相應(yīng)的闡述,希望給高效師生帶來一定的借鑒意義。