[摘要]本文通過介紹信息可視化發展與特點,常用的分析方法,以及在知識服務中的應用,指出了信息可視化可以應用于數字圖書館服務,學科主題動態跟蹤,創新研究服務和研究學科熱點學科前沿分析等方面,是高校圖書館拓展信息服務,改進知識服務技術手段的重要方式。
[關鍵詞]信息可視化;知識服務;圖書館
中圖分類號: G2 文獻標識碼:A 文章編號:1674-098X(2015)07(c)-0000-00
Study on the application of information visualization in the University Library in knowledge service
Cheng Xiang (Library of Youjiang Medical College for Nationalities,Bose533000,Guangxi Zhuang Autonomous Region,China)
【Abstract】In this paper, by introducing the development and characteristics of information visualization, the common analysis methods, and the application in knowledge service, and points out that the information visualization can be used in the digital library service, dynamic subject tracking, innovation of service and research hotspot subject frontier analysis etc., is to develop the information service of University Library, an important way to improve the knowledge service technical means.
【Keywords】Information visualization;Knowledge service; Library
知識服務作為高校圖書館拓展信息服務的發展趨勢,已受到業界的廣泛關注與認同。目前國內圖書館學界研究知識服務主要集中在其以下幾個方面:基本理論、與信息服務的關系、運營模式、系統設計與開發、技術手段等。知識服務技術手段的創新也是圖書館服務的創新,創新服務能給圖書館增添活力。當前大數據時代帶來了大量的信息分析技術,信息可視化分析技術就是其一,通過信息可視化工具把大量的數據(可以是圖片、視頻、文本、數值等信息)轉換成直觀的、可交互、可視化的信息形式(表格、文本、圖形、聲音、動畫、視頻圖像、三維仿真乃至虛擬現實等),以便于人們的理解。這些工具如能廣泛應用于圖書館知識服務,將能滿足用戶的高質量、深層次、個性化的信息服務需求。
1.信息可視化的發展與特點
1.1信息可視化的發展
信息可視化是網絡信息空間形成與發展的必產物。它是由“可視化”這一概念發展而來,最早在1987 年2月美國國家科學基金會召開的圖形圖像專題研討會上提出了“科學計算可視化”的概念,由此開始了廣義信息的可視化研究工作。“可視化”學科隨后經歷了科學計算可視化、數據可視化、信息可視化、知識可視化等階段。網絡信息空間的發展和膨脹,使用戶在消費信息知識時提出了更高的要求,不僅僅追求理解信息本身提供的知識,更需要對信息之間的關聯有所了解,形成知識的擴展。信息可視化在面對復雜的信息條件和信息需求的情況下,需要從大量抽象數據中發現有用信息,創造性地反映信息相關性,把隱藏在可視化圖像深處和彼此之間的信息進行深層次挖掘,將其映射為空間的可視化形式加以觀察、分析。信息可視化依賴于數據挖掘技術的發展,它已不局限于信息的可視化表達和分析,更成為信息消費活動中知識發現和價值創造的必要過程[1]。
1.2信息可視化的特點
信息可視化技術的核心是為用戶提供直觀的、可交互可視化的信息表示方式。同一般科學計算可視化和數據可視化比較 , 信息可視化具有以下主要特點:
(1)表現多維性。結果顯示的圖形圖像主要有二維、三維、多維信息可視化和時間序列、層次、網絡信息可視化等。
(2)數據兼容性。信息可視化工具采集的數據可以是不同格式、類型、介質,盡管數據形式是圖形、圖像、文字、數字或者視頻都可以用統一的數據庫進行管理 ,從而為多源數據的綜合分析提供便利[2]。
(3)可交互性。在信息可視化分析過程中,用戶可以實時地調整可視化變量(如軸系、顏色、高度、數據量、陰影、視角、分辨率等參數)獲得不同的信息表現效果,又可以方便地用交互方式對多源信息進行對比、綜合、分析,從中獲得新的規律,以利于參考、規劃與決策。
(4)可視性。信息可以用圖象、曲線、二維圖形、三維立體和動畫等來顯示, 并可對其模式和相互關系進行可視化分析。用戶可以從表面上看來是雜亂無章的大量信息中, 找出其中隱藏的規律, 為科學發現、工程開發、醫療診斷和科學決策等提供依據[3]。
2.信息可視化常用的分析方法及工具
2.1引文分析
引文分析是一種較為常用的方法,用戶通過檢索各類數據庫收集相關研究主題文獻作為數據源,對其引用與被引用規律進行分析,揭示它們之間所隱含的相互聯系。引文分析可以用于揭示學科發展規律,追蹤研究前沿,監測研究熱點[4]。引文分析應用在信息可視化分析上主要有引文網絡時序圖、共引網絡圖譜。
(1)引文網絡時序圖。著名的湯森路透公司出品的Web of Science平臺,提供了由加菲德等開發研制的Histcite軟件。該軟件繪制生成研究文獻的引文網絡時序圖,同時分別輸出重要期刊列表、核心作者群列表和核心研究機構列表。該圖可反映學科研究的歷史發展軌跡[5]。引文網絡時序圖一般以時間作為縱軸,排列文獻發表的先后順序,標出各文獻間的引用關系,以文獻引用和被引用的次數作為判斷其重要性依據,圖中同時也可以反映出某個學科研究主題論文開源、最初著者和領軍人物、發展脈絡等。
學科館員在知識服務中往往會遇到許多新接觸的課題研究項目,如果對課題內容的本意及發展情況了能不夠深入,就難以很好的服務用戶,引入引文網絡時序圖就能很好地理解課題內容的來龍去脈。在進行科技查新服務時,同樣可以引入引文網絡時序圖,對查新內容的新穎性進行辨別。
(2)共引網絡圖譜。根據共引分析單元的不同把共引網絡圖譜劃分為三大類,即:文獻共引網絡圖譜、期刊共引網絡圖譜和作者共引網絡圖譜。文獻共引是指兩篇以上的文獻同時被別的文獻引用,引用頻次越高表明關系越密切,就意味著這兩篇文獻的學科背景越相似,可用來分析和揭示研究前沿及其知識基礎等[6]。其它兩種共引原理相似。由美籍華裔陳超美博士團隊研發的CiteSpace軟件,可繪制反映共引網絡的科學知識圖譜,可將知識領域中學科前沿和學科制高點,以直觀易懂的可視化圖像展現給學者,幫助學者挖掘和分析學科知識之間的關系,幫助識別學科前沿的演進路徑及學科領域的經典文獻[7]。期刊共引和作者共引可以通過德溫特分析家(TDA)軟件、Pajek軟件、Ucinet軟件、SPSS的聚類分析功能,繪制出共引網絡圖譜,直觀地呈現學科領域主流期刊、學術團體以及它們之間相互依賴和交叉關系。
學科館員可以通過共引網絡圖譜得到某一領域的研究現狀、發展趨勢以及研究熱點,推薦相關文獻(期刊)給該學科研究的新人。
2.2內容分析
內容分析法是一種對文獻內容作客觀的系統的定量分析的信息分析方法,其目的是理清文獻中本質性的事實和趨勢,揭示文獻所含有的隱性情報內容,對事物發展作分析預測。它實際上是一種半定量研究方法,其基本做法是把文獻內載錄的文字、非量化的有交流價值的信息轉化為定量的數據,建立有意義的類目分解交流內容,并以此來分析信息的某些特征。在應用于信息可視化分析服務中主要有以下幾種方法:
(1)共詞分析
共詞分析法利用文獻集合中詞匯組共現頻率的高低情況, 確定該文獻集合所代表的各學科研究主題之間的關系。詞匯組在同一篇文獻中出現的次數越多, 則代表這兩個主題的關系越緊密。由此, 通過數學方法統計出一組文獻的主題詞(包含非規范化主題詞或關鍵詞等)兩兩之間在同一篇文獻出現的頻率, 便可形成一個由這些詞匯組相互關聯所組成的共詞網絡,共詞網絡中各節點之間的遠近反映的是主題內容的親疏關系。共詞分析將文獻主題詞作為分析對象, 進行聚類分析, 把眾多分析對象之間錯綜復雜的共詞網狀關系簡化為以數值、圖形直觀地表示出來的過程[8]。一般運用SATI、SPSS、Ucinet等軟件對文獻樣本進行因子分析、聚類分析、多維尺度分析,來實現共詞分析對學科主題的動態跟蹤和主題演化分析功能。
(2)聚類分析
聚類就是將一組無序的數據集合按特定規則分成若干分類,相似度高的數據在同一類中,每個類都有其共同的數據特征。聚類分析可視化是將共詞分析、共引分析和聚類分析方法結合起來,對高詞頻、高被引文獻進行聚類分析,用于反映學科主題領域結構、研究熱點和研究前沿。主要采用SPSS、Matlab、SAS等軟件。
2.3社會網絡分析
社會網絡分析主要是研究社會實體的關系連結以及這些連結關系的模式、結構和功能。社會網絡分析同時也可用來探討社群個體間的關系以及由個體關系所形成的結構及其內涵。換句話說,社會網絡分析的主要目標是從社會網絡的潛在結構中分析發掘其中各團體之間的關系動態[9]。常用的分析軟件有NetMiner 、Pajek、STRUCTURE、UCINET、MultiNet、StOCNET等。
3.信息可視化在知識服務中的主要應用
3.1信息可視化在數字圖書館中的應用
數字圖書館融合了信息資源數字化、信息組織網絡化、信息資源的高度開放與共享、管理與服務計算機化、用戶為中心的服務模式等特點。知識服務離不開圖書館豐富的資源,利用數字圖書館的優勢資源,在知識服務中融入信息可視化分析方法,更有利于把圖書館資源用靈用活。將信息可視化技術引人到數字圖書館領域,可以解決用戶信息需求、信息服務和信息提供個性化等問題。
主要有以下三種應用途徑:其一,信息檢索過程可視化,用戶既是信息的使用者,也是信息的構建者。用戶構建的檢索過程可采用Shneiderman的信息可視化分類法進行精確測量,如果成功檢索出理想結果就將此過程插入隱性馬爾可夫模型程序中。此后的用戶即可在隱性馬爾可夫模型程序中動態比較,合成自己的檢索路徑。其二,信息檢索結果可視化,資源發現系統是數字圖書館重要組成部分,它融合了多個檢索平臺,實現異構檢索,檢索結果也可以實現信息可視化。資源發現系統通過對知識對象做唯一標識、深入挖掘、粒度分析,從而建立起蘊藏于各類文獻之間,不同知識對象的直接關聯,幫助用戶快速形成對所需信息的結構性認識。如超星發現、智立方等。其三,知識領域可視化,各知識領域相互之間有著某種聯系,通過信息可視化技術與文獻同引、文獻共詞結合,生成具有各種屬性的知識圖譜,表達學科、專業、文獻、作者之間的關系,揭示知識領域的結構、直觀反映學科知識發展態勢,幫助用戶獲得理想的知識效果[10]。
3.2信息可視化在學科主題動態跟蹤的應用
學科主題動態跟蹤主要有兩種方法。一種是共詞分析方法,利用科學圖譜展示的定性分析和相似性分析法則測定的定量分析兩種方法做對學科研究主題進行分析。定性分析由該研究領域專家依據其掌握的專業知識、經驗和綜合判斷能力,對學科研究熱點在時間軸上的發展變化情況給出專家判斷意見,定性分析依賴人的主觀意識較多,缺乏客觀性。定量分析是通過數學統計方法把文獻集合內的文獻信息按照時間順序確定研究領域的演變過程,定量分析較為客觀,但定性分析是定量分析的基本前提,沒有定性的定量是一種盲目的、毫無價值的定量。兩者結合成為共詞分析方法進行學科主題動態跟蹤的重要手段。另一種是共引分析方法,利用文獻引用和被引用次數為分析依據,繪制一種揭示學科整體結構的科學結構圖,用連線和相對位置關系表示某一學科、專業、文獻和作者之間的相關性[11]。
3.3信息可視化在創新研究中的應用
不少學者利用信息可視化分析研究與創新相關的問題。邵云飛[12]等利用社會網絡分析方法從文獻內容和數量方面闡述了在創新研究中的運用,提出用量化的研究和對組織結網過程的研究來實現。趙麗梅[13]采用社會網絡分析方法構建數字出版聯盟內部資源流動的網絡模型,得到降低出版成本和風險的成果。
3.4信息可視化在研究學科熱點分析和學科前沿分析的應用
學科熱點分析和學科前沿分析在學術研究中起著重要作用,為學科研究人員確定研究方向和研究內容提供科學的情報信息,使其能發現科學研究中最先進、最有潛力的研究主題或領域。開展學科熱點分析和科技前沿分析的研究主要采用基于內容分析的共詞分析、共引分析、聚類分析和耦合分析等,可視化圖譜的繪制主要有共引網絡圖譜、時間線視圖、戰略坐標圖、節點鏈接圖、MDS圖等。
結語
信息可視化分析技術是近年興起的情報分析手段,可應用在社會各行各業的情報分析中。其應用在高校科研工作中,能為研究者提供科學的研究熱點,研究前沿領域,學科的歷史演化過程等方面的分析數據,幫助研究者找出學科領域研究的新方向。高校圖書館學科館員是服務研究者的重要情報提供者,因此學科館員要勤于學習新知識新技術,提高自身的信息分析和管理能力。信息可視化分析也并不是非常專業非常高深的技術,不少的數據庫平臺(如知網、萬方、Web of Science)和資源發現系統(如超星發現、智立方)也提供有相應的可視化分析內容,科研人員也可輕松掌握較常用的可視化分析。知識服務是圖書館創新服務的研究熱點,通過不斷引入新技術新手段,改進知識服務,給用戶提供科學的新穎的便捷的服務,對促進高校科研力量科研環境的提升有著非常重要的作用。
參考文獻
[1]譚章祿,方毅芳等.信息可視化的理論發展與框架體系構建[J].情報理論與實踐,2013,01:16-19+32.
[2]宋紹成,畢強等. 信息可視化的基本過程與主要研究領域[J]. 情報科學,2004,01:13-18.
[3]徐新萍,王曉民等.淺議信息可視化基本原理與應用[J].中國體視學與圖像分析,2007,01:75-78.
[4]龐龍. 科學引文分析的科學評價功能和意義[D].山西大學,2006.
[5]程翔.基于可視化分析工具的學科服務優化策略實例研究[J].農業圖書情報學刊,2014,12:64-68.
[6]孫健夫,陳蘭杰. 基于知識圖譜的國際信息政策研究熱點與前沿分析[J]. 情報科學,2010,03:389-394.
[7]陳超美,陳悅,侯劍華等.CiteSpace Ⅱ:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009,28(3):401-421
[8]鐘偉金,李佳. 共詞分析法研究(一)——共詞分析的過程與方式[J]. 情報雜志,2008,05:70-72.
[9]周濤. Wiki社群的社會網絡分析[D].華東師范大學,2005.
[10]周靜怡,孫坦. 信息可視化在數字圖書館中應用淺析[J]. 現代圖書情報技術,2005,01:5-8.
[11]趙凡. 基于共詞分析的學科主題動態跟蹤相似方法探討[J]. 情報雜志,2009,09:35-40.
[12]邵云飛,歐陽青燕,孫雷. 社會網絡分析方法及其在創新研究中的運用[J]. 管理學報,2009,09:1188-1193+1203.
[13]趙麗梅. 基于社會網絡分析的數字出版聯盟運營機制研究[J]. 出版科學,2014,06:74-77.
一定保留:
[基金項目]2013年度廣西高等教育教學改革工程項目(2013JGB209);2014-2015 年度 CALIS 廣西壯族自治區文獻信息服務中心預研項目“信息可視化分析工具在圖書館學科服務的應用研究”;右江民族醫學院2014年科研課題項目“信息可視化在高校圖書館知識服務的應用研究”。
[作者簡介]程翔,男,1979年12月出生,2003年畢業于廣西民族大學計算機科學與技術專業,副研究館員,