?。壅?要]本文運用統計、比較方法對近幾年我國研究信息檢索可視化的相關著作和論文進行了統計研究,描述了信息檢索可視化研究的主要內容,歸納了信息檢索可視化研究的熱點。
?。坳P鍵詞]信息檢索;可視化;面臨的問題;展望
?。壑袌D分類號]TP391.1 [文獻標識碼]A [文章編號]1005-6432(2011)10-0072-02
1 前 言
隨著網絡技術的發展和信息量的激增,信息檢索越來越受到人們的關注。而傳統的信息檢索大多集中在關鍵字匹配方面,對其語義的處理涉及的不多。因此,雖然有較高查全率,但查準率卻不高,同時無法實現人機交互。對于互聯網這樣一個分布的信息空間,采用人工智能方法是實現人機交互學習的一種較好的方法:它可以代替人來完成繁雜的信息收集、過濾、聚類等任務,實現信息檢索系統的智能化。
2 信息檢索可視化研究方向與狀況
近幾年,國內關注信息檢索可視化的專家學者也逐漸增多?,F在已經有越來越多學者關注面向網絡及大規模信息資源的檢索可視化技術、各個具體領域的可視化、各種算法的改進等具體問題。國內現今對于信息檢索可視化的研究主要體現三個方面:
2.1 理論探討
理論探討主要是對國外現有的信息檢索可視化基本原理和基本技術的引入式學習。李春旺分析了國外三個具有代表性的可視化信息系統,FilmFiPmEJA4CJ1G7lQCt9WGg0nK1wsnZYRnrWItGKRmC1Yt4=nder、CoBrowse及WAV系統。最后闡述了當前信息檢索可視化研究的主要任務及今后的發展趨勢。文燕平在總結分析了已有信息檢索可視化系統的基礎上,提出了WWW信息檢索可視化的一般原理,并指出信息檢索可視化的實現需要始終堅持以支持信息檢索為目標的原則。張學福在文中論述了信息檢索可視化的基本問題,包括:信息檢索模型、信息內容描述、可視化映射技術、可視化顯示技術、全局映射與局部映射、實時可視化和人工參與的可視化等。
2.2 技術開發
曹錦丹等分析了傳統信息檢索系統的不足及可視化信息檢索的優勢,介紹了一種將信息檢索與信息可視化集成用于網絡信息資源可視化檢索的新工具——WIDAS,并與其他幾個可視化檢索系統進行了比較和評價,對信息檢索可視化的發展及前景作了討論。張會平等將信息可視化的相關方法和技術應用到跨語言信息檢索領域當中,提出了跨語言信息檢索可視化模型,并介紹了一個實例——澳門法律信息檢索可視化系統。曹艷討論了信息檢索可視化交互和視覺設計,結合Aqua browserLibrary闡述了信息檢索可視化在圖書館OPAC中應用的意義,討論了書目信息檢索與信息檢索可視化技術融合需關注的一些問題。張學福借助信息檢索可視化技術研究非一般意義上的概念空間,即以對象內能夠描述對象內容的詞為概念,通過詞共現方式構建的概念空間,研究它能否在一定程度上替代一般意義上的概念空間、效果如何等,為構建基于概念空間的信息檢索可視化系統打下基礎。
2.3 實際應用
復旦大學圖書館采用VRML及JAVA提供逼真的圖書館場,實現了書庫三維漫游和圖書可視化。大連理工大學和東北大學合作研究的中文文本可視化表示機制,能以直觀的方式組織和表示文本及文本集,都屬于信息資源描述的可視化。武漢大學信息資源研究中心開發的“信息可視化與知識檢索原型系統”,是教育部人文社科重點研究基地重大項目“信息可視化與知識檢索”的成果之一。
3 信息檢索可視化面臨的問題
3.1 沒有形成系統的結構
國內對信息檢索可視化技術的研究尚屬雛形階段,還沒有形成比較系統的體系結構,目前主要偏重于對國外問題的跟蹤研究,對信息檢索可視化的研究與應用,特別是在商業軟件方面,同國外先進水平還有相當大的差距。
3.2 將現有可視化技術綜合
信息檢索可視化是一種信息的可視化,它沒有內在的、固有的結構可以繼承,缺乏堅實的理論基礎,缺乏從多個方面進行系統的研PmEJA4CJ1G7lQCt9WGg0nK1wsnZYRnrWItGKRmC1Yt4=究,沒有將用戶的檢索需求、檢索興趣等考慮進去,以及原型系統多而投入使用的產品較少。由于信息檢索可視化沒有一種內在的結構可以繼承,造成了信息檢索可視化方法的多樣性。將現有可視化技術進行綜合也是我們所要解決的一個問題。
3.3 全文可視化
隨著可用全文數據庫越來越多,為全文進行可視化變得越來越重要。與全文可視化相關的問題有以下一些(當然不是全部):如何將為全文可視化和為數據集可視化綜合到一個可視化環境中,并從數據收集可視化到全文可視化平穩轉換;如何為全文可視化研發新的可視化模型;在全文中如何計算及計算對象間的相似度;如何構建有意義的語義框架。
3.4 評價
科學的可視化需要有一種結構來評價可視化,但信息可視化由于是抽象體的描述,在把它映射到二維空間后,對它的評價缺乏一種固有的準則。這是信息檢索可視化的負面影響。有許多問題,如可視語義框架的效率評價,視覺空間和用戶行為中隱喻的影響,模糊、導航中的方向障礙等。另一個重要的問題就是對信息檢索可視化結果的評價。
4 信息檢索可視化的未來展望
從發展上看,由于信息檢索可視化具有以往檢索系統不具備的許多優勢,對于提高網絡信息資源的利用效率,特別是實現與用戶的直觀交互,具有特別重要的意義。因此,網絡信息檢索的可視化將成為現代信息資源管理的重要發展方向。從目前的情況看,信息檢索可視化與智能化的研究與應用正趨向二者相互融合、相互推進的發展方向。信息可視化作為智能化檢索的一種重要工具,正越來越受到人們的青睞。它在數字圖書館、電子商務、電子政務、信息資源中心、企業資源計劃等眾多領域都有著廣泛的應用前景,其研究成果的應用將有利于這些不同領域中信息生產與信息消費的形式從專家型向大眾型轉變,真正使信息和人類的知識成果得到充分的利用。隨著可視化技術應用領域的擴展,可以預料,未來的互聯網將是可視互聯網。從這個意義上講,信息檢索可視化及其應用的研究對于互聯網的發展、網絡信息的發現和利用無疑會起到一個推進作用。
參考文獻:
[1]李春旺.信息檢索可視化技術[J].現代圖書情報技術,2003(6):44–46
?。?]文燕平.信息檢索可視化實現原理研究[J].現代圖書情報技術,2005(4):10–13
?。?]張學福.信息檢索可視化基本問題研究[J].中國圖書館學報,2006(3):37–40
?。?]曹錦丹.可視化技術在網絡信息檢索中的應用[J].情報雜志,2005(8):113–115.