[摘 要] 本文討論了信息可視化與知識(shí)組織的基本問(wèn)題,分別介紹了其基本思想和應(yīng)用領(lǐng)域,并結(jié)合實(shí)例著重討論了信息可視化工具在知識(shí)組織領(lǐng)域中的應(yīng)用。
[關(guān)鍵詞] 信息可視化; 知識(shí)組織; 知識(shí)體系
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2013 . 012. 048
[中圖分類號(hào)] G354 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2013)012- 0081- 02
1 信息可視化產(chǎn)生的背景及含義
對(duì)繁雜的抽象信息之間的復(fù)雜關(guān)系進(jìn)行探索的努力,促進(jìn)了信息可視化這一嶄新科學(xué)領(lǐng)域的出現(xiàn)。用圖形圖像方式來(lái)展示信息特征,可以利用人類視覺(jué)系統(tǒng)的特點(diǎn)幫助人們更快速、更深刻地理解信息,并可以便捷地進(jìn)行信息空間的導(dǎo)航,快速地檢索信息。因此,用圖形圖像方式來(lái)展示信息特征,可以利用人類視覺(jué)系統(tǒng)的特點(diǎn)幫助人們更快速、更深刻地理解信息,并可以便捷地進(jìn)行信息空間的導(dǎo)航,快速地檢索信息。可視化便是基于這種需求而產(chǎn)生的,并成為當(dāng)今信息科學(xué)領(lǐng)域的發(fā)展趨勢(shì)之一。
所謂信息可視化,是將非物理的抽象數(shù)據(jù)用可視的形式表示出來(lái),以便分析數(shù)據(jù)、發(fā)現(xiàn)信息的本質(zhì)規(guī)律和制定決策。信息可視化的任務(wù)在于搜索、發(fā)現(xiàn)信息之間的關(guān)系和信息中隱藏的模式,其對(duì)象主要是非物理數(shù)據(jù)及數(shù)據(jù)之間的關(guān)系以及沒(méi)有集合屬性的抽象信息,其核心問(wèn)題是尋找表示信息的可視化表達(dá),理解信息的知識(shí)表示。信息可視化通過(guò)對(duì)信息的感知將其信息表達(dá)化成知識(shí),它實(shí)際上是研究人與計(jì)算機(jī)表示的信息以及兩者之間相互影響的技術(shù),表現(xiàn)為人與計(jì)算機(jī)信息之間的一種可視化界面。
2 信息可視化與知識(shí)組織的聯(lián)系
知識(shí)組織的基本概念是“知識(shí)”。從可呈現(xiàn)角度來(lái)講, 知識(shí)包括隱性知識(shí)和顯性知識(shí),這里主要指后者。簡(jiǎn)單說(shuō),知識(shí)是抽象化、系統(tǒng)化、理論化的信息, 關(guān)聯(lián)是知識(shí)的本質(zhì)屬性。所謂知識(shí)組織,就是在信息組織的基礎(chǔ)上,研究知識(shí)的獲取、描述、整理、表達(dá)、控制、共享等整個(gè)知識(shí)組織過(guò)程的理論與方法,知識(shí)組織的精髓在于對(duì)知識(shí)及知識(shí)間的關(guān)聯(lián)進(jìn)行揭示和組織,知識(shí)獲取、知識(shí)處理、知識(shí)表達(dá)和知識(shí)共享是知識(shí)組織研究的重要內(nèi)容。其基礎(chǔ)是知識(shí)組織體系。知識(shí)組織體系是對(duì)資源內(nèi)容概念及其相互關(guān)系進(jìn)行描述與組織的機(jī)制作為對(duì)資源內(nèi)容概念及其相互關(guān)系進(jìn)行描述與組織機(jī)制的知識(shí)組織體系,即是指實(shí)現(xiàn)知識(shí)組織的內(nèi)在方式和途徑,它既指知識(shí)組織的過(guò)程,也指調(diào)控知識(shí)組織的方法和手段。
知識(shí)組織體系是伴隨著數(shù)字資源的知識(shí)組織而出現(xiàn)的一個(gè)新的研究課題。從知識(shí)組織與信息可視化兩者的關(guān)系來(lái)看,知識(shí)組織實(shí)現(xiàn)了知識(shí)單元的有序化和知識(shí)關(guān)聯(lián)的網(wǎng)絡(luò)化,而信息可視化在人和信息之間架起了一座橋梁。一個(gè)完整的知識(shí)管理體系應(yīng)該包括知識(shí)收集、知識(shí)提煉、知識(shí)存儲(chǔ)和知識(shí)應(yīng)用4個(gè)階段。知識(shí)形態(tài)之間的轉(zhuǎn)化,需要一種視覺(jué)化模型來(lái)表達(dá)和呈現(xiàn)。隨著知識(shí)量的增加,如何呈現(xiàn)知識(shí)成了信息利用的瓶頸。因此,把信息可視化的相關(guān)方法和技術(shù)應(yīng)用到知識(shí)組織中將是必然的選擇。
3 信息可視化工具在知識(shí)組織領(lǐng)域中的應(yīng)用
為了有效地表達(dá)和利用知識(shí)組織,信息可視化的相關(guān)工具和方法被應(yīng)用到知識(shí)組織的研究和管理中,這類工具主要有概念圖、主題地圖可視化、本體可視化等。
3.1 概念圖
概念圖是康奈爾大學(xué)的諾瓦克(J.D.Novak)博士根據(jù)奧蘇貝爾(David P.Ausubel)的有意義學(xué)習(xí)理論提出的一種教學(xué)技術(shù)。它是利用概念以及概念之間的關(guān)系表示和組織結(jié)構(gòu)化知識(shí)的一種可視化,通常將某一主題的有關(guān)概念置于圓圈或方框之中,然后用連線將相關(guān)的概念和命題連接,連線上標(biāo)明兩個(gè)概念之間的意義關(guān)系。概念圖支持并實(shí)現(xiàn)了有意義學(xué)習(xí)理論(Meaningful Learning Theory) 和建構(gòu)主義模式(Constructivism model)。諾瓦克教授提出的概念圖構(gòu)建準(zhǔn)則包括以下4個(gè)步驟:① 概念選取:列出關(guān)于某個(gè)主題的所有重要概念; ② 概念分類:分為廣度結(jié)構(gòu)和深度結(jié)構(gòu),廣度結(jié)構(gòu)根據(jù)概念間關(guān)聯(lián)性強(qiáng)弱將概念劃分為不同的分支,深度結(jié)構(gòu)將不同分支中的概念按照概念的寬窄由上至下排列; ③ 定位中心概念,連接概念:首先,獲取中心主題概念,作為整個(gè)概念圖的根節(jié)點(diǎn),然后,從中心節(jié)點(diǎn)出發(fā)連接每個(gè)分支的中心節(jié)點(diǎn), 形成概念圖的第二層,并注明連接詞,繼續(xù)上述過(guò)程, 直至連接完所有概念; ④ 連接交叉概念:仔細(xì)研究概念圖中的各個(gè)概念, 看它們是否存在交叉關(guān)系,若存在, 連接交叉關(guān)系, 并注明連接詞。概念圖的構(gòu)建過(guò)程即是知識(shí)創(chuàng)新的過(guò)程,利用概念圖可以沉淀隱性知識(shí)。而概念圖的構(gòu)建過(guò)程也是學(xué)習(xí)的過(guò)程,可以將學(xué)習(xí)中涉及到的資源鏈接到概念圖, 實(shí)現(xiàn)知識(shí)結(jié)構(gòu)與相關(guān)資源的整合。同時(shí),概念圖表示的知識(shí)結(jié)構(gòu)遵循人類的認(rèn)知和學(xué)習(xí)過(guò)程, 因此可以利用概念圖導(dǎo)航人們檢索所需知識(shí),也就是說(shuō), 我們還可以利用概念圖聚合顯性知識(shí)。
3.2 主題圖
主題圖則側(cè)重以可視化方式表示知識(shí)概念間的相互聯(lián)系,通過(guò)由主題、關(guān)聯(lián)和呈現(xiàn)3個(gè)核心概念組成的主題圖數(shù)據(jù)模型來(lái)描述主題、主題間的關(guān)聯(lián)性以及主題與資源實(shí)體之間的關(guān)系,并聯(lián)結(jié)與其相關(guān)的資源。主題圖是利用XMT標(biāo)記語(yǔ)言表達(dá)數(shù)據(jù)模型的,XTM定義了XML用描述和標(biāo)記主題圖的方式,可開放地標(biāo)記、存儲(chǔ)和傳輸主題圖數(shù)據(jù)。通過(guò)主題圖可以展現(xiàn)資源的知識(shí)結(jié)構(gòu)。主題通過(guò)關(guān)聯(lián)相聯(lián)系,通過(guò)呈現(xiàn)指向相應(yīng)的信息資源。主題地圖可視化的目的是幫助用戶快速定位相關(guān)信息,輕松識(shí)別相關(guān)結(jié)構(gòu)。因此,主題地圖可視化包括兩類要求:表現(xiàn)要求(Representation Requirements)和導(dǎo)航要求(Navigation Requirements)。好的表現(xiàn)形式幫助用戶定位感興趣的位置,有效的導(dǎo)航機(jī)制幫助用戶快速查看所需信息。表現(xiàn)機(jī)制不僅給用戶提供主題地圖的總覽,而且提供不同細(xì)節(jié)層次的多比例縮放機(jī)制,用戶可以從總體上把握主題地圖,同時(shí)可以聚焦主題地圖的各個(gè)層次細(xì)節(jié)。總覽提供了主題地圖的主要特征,用戶一眼可以發(fā)現(xiàn)主題地圖的主要特性。用戶首先要了解主題地圖有哪些概念及總體特征。這些信息應(yīng)體現(xiàn)在表現(xiàn)機(jī)制上以幫助用戶區(qū)分不同的主題地圖。
3.3 本體
本體是近幾年學(xué)術(shù)界研究的熱點(diǎn), 也是目前知識(shí)組織的常用方法。本體起源于哲學(xué)領(lǐng)域, 其定義為“共享概念模型的形式化說(shuō)明”。概念模型是針對(duì)客觀世界中的一些事物進(jìn)行抽象所建立的模型, 該模型確定了這些事物的相關(guān)概念及其關(guān)系。而形式化是指所建立的模型是機(jī)器可讀的。本體通過(guò)領(lǐng)域知識(shí)的邏輯抽象而構(gòu)筑起體現(xiàn)概念及關(guān)系的概念系統(tǒng), 是面向領(lǐng)域的通用概念模型,通過(guò)構(gòu)建領(lǐng)域本體可以規(guī)范化組織這一領(lǐng)域的共享知識(shí)。基于本體的知識(shí)整合的主要功能表現(xiàn):① 本體的構(gòu)建為實(shí)現(xiàn)資源一體化的知識(shí)整合奠定基礎(chǔ)。基于本體的知識(shí)整合可應(yīng)用于網(wǎng)絡(luò)資源、異構(gòu)資源系統(tǒng)及信息門戶的資源整合等多種領(lǐng)域, 其基本思路都是一樣的, 即是在資源集合的上層構(gòu)建一個(gè)反映資源知識(shí)結(jié)構(gòu)的本體概念模型。如果針對(duì)不同領(lǐng)域的信息集合建立起相應(yīng)的領(lǐng)域本體, 在此基礎(chǔ)上, 通過(guò)不同本體的語(yǔ)義映射實(shí)現(xiàn)異構(gòu)資源和系統(tǒng)之間的語(yǔ)義聯(lián)系, 即可將各個(gè)相對(duì)獨(dú)立的領(lǐng)域本體資源聯(lián)系成一個(gè)立體的知識(shí)網(wǎng)絡(luò), 人類所擁有的資源就呈現(xiàn)出具有完整結(jié)構(gòu)、規(guī)范有序的知識(shí)地圖。② 本體的構(gòu)建使得領(lǐng)域知識(shí)可以重用和共享。共享是本體的重要特征, 即指本體概念體現(xiàn)的是共同認(rèn)可的知識(shí)。由于本體反映的是相關(guān)領(lǐng)域中公認(rèn)的概念, 所以如果一個(gè)組織構(gòu)建了專業(yè)領(lǐng)域本體, 如法學(xué)本體、經(jīng)濟(jì)學(xué)本體等, 其他組織可以共享和復(fù)用。基于本體的資源整合能夠真正實(shí)現(xiàn)領(lǐng)域知識(shí)的共知、共識(shí)和共享。③ 在本體的支撐下實(shí)現(xiàn)基于語(yǔ)義的知識(shí)檢索。實(shí)現(xiàn)知識(shí)檢索是本體的重要應(yīng)用之一。本體作為領(lǐng)域知識(shí)的語(yǔ)義模型, 其主要功能體現(xiàn)在知識(shí)組織和知識(shí)檢索兩方面。知識(shí)檢索是知識(shí)組織的逆過(guò)程。實(shí)現(xiàn)基于概念語(yǔ)義的知識(shí)檢索, 必須有賴于知識(shí)組織體系的支撐。只有以基于本體的知識(shí)組織體系為基礎(chǔ),以領(lǐng)域本體的概念模型作為資源元數(shù)據(jù)的規(guī)范描述標(biāo)準(zhǔn), 才能真正實(shí)現(xiàn)基于語(yǔ)義的知識(shí)檢索。
主要參考文獻(xiàn)
[1] 趙剛,崔軍. 信息可視化初探[J]. 晉圖學(xué)刊,2007(2).
[2] 李綱, 鄭重. 信息可視化研究進(jìn)展[J]. 圖書情報(bào)知識(shí),2008(7).
[3] 馬文峰,杜小勇. 關(guān)于知識(shí)組織體系的若干問(wèn)題[J]. 中國(guó)圖書館學(xué)報(bào),2007(2).
[4] 周寧,張會(huì)平,陳勇躍. 信息可視化與知識(shí)組織[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2006(7).
[5] 張會(huì)平,周寧,陳勇躍. 概念圖在知識(shí)組織中的應(yīng)用研究[J]. 情報(bào)科學(xué),2007(10).
[6] 陸敏,楊發(fā)毅,彭駿. 基于本體的知識(shí)組織和知識(shí)檢索[J]. 現(xiàn)代情報(bào),2009(1).