潘鐵軍
什么是信息可視化?
由于在線教育的迅猛發展,信息可視化在最近的幾年中取得了快速的增長,該學科起源于20世紀80年代后期,當時的目的是使用計算機進行人機交互、圖像顯示,以加強對數據具體特征的理解。在關于信息可視化的眾多定義中,大家比較接受的是Card等人提出的定義:信息可視化(IV)就是“通過計算機的支持與交互作用,將抽象的數據進行可視化描述以增強認知”。根據這個定義,有四項內容是理解這一領域的關鍵:可視化描述、交互作用、抽象數據、認知增強。
1.可視化描述
在現實中,我們常常試圖通過使用圖形來理解一些現象和數據,如當人們需要尋找城市中的一條街道、了解股票市場在某一時期的走勢、查看天氣預報時,此時使用圖形要比使用文字更容易讓人理解。例如,圖1中顯示了一列數字和一些長條,這些長條的長度與左邊對應的數字成正比例,假設我們要找到數字中的最大值和最小值,如果沒有右側的長條,我們就要耗費更多的時間才能得出結論。
與文字或表格相比,數據的圖形化顯示利用了人的視覺感官優勢,感官有著強大的能量,它可以將大量的信息傳遞到我們的頭腦中,使我們能夠辨識出重要的特征,并做出重要的推斷。
2.交互作用
目前,性能優越、價格低廉的圖形計算機已經普及,通用個人計算機已全面進入了圖像化時代。同時,急劇膨脹的日常活動信息需要人們去處理,這就需要科學家利用使用者與算法交互的可能性來探索在計算機上顯示海量數據的新方式。
3.抽象數據
數據本身可以有多種形式,但我們只能辨別出具有物理對應關系的數據,如空氣的濕度、黃金的密度等,除了這些還存在著具有抽象性質的數據,如股票市場的波動、未來7天的氣溫走勢。我們也希望可以用圖像的方式對這些抽象的數據進行直接觀測,這樣的需求就促使了信息可視化的產生,其顯著特點是處理非結構化的數據集。
4.認知增強
圖形可以以多種方式輔助思考與理解。例如,我們進行37×73這一乘法運算時,心算比使用紙筆計算的時間要長5倍,這一操作的困難在于需要在記憶中暫存兩個數相乘的部分結果直到它們被使用(如圖2)。
這個例子顯示出可視化手段或工具對認知能力的增強,它向我們頭腦中傳遞信息,并使我們搜尋與之匹配的模式,識別出它與數據之間的關聯,從而更容易地進行推斷。
信息可視化的優勢
信息可視化的基本原理就是將數據以圖形的形式進行展示,并利用人的感官能力對其進行解讀。圖形展示可以幫助我們對復雜龐大的數據集進行描述和理解,正如Larkin和Simon在他們的開創性論文《一圖抵千言》中所說,圖形展示的這種效果是因為它們具有良好的空間清晰度,基于這個空間清晰度,再對數據進行良好的圖形化展示,這就能提高人們理解內容的效率。Larkin和Simon對比了物理問題中使用圖表計算和語句計算的效率,認為圖表在以下三個基本方面具有優勢:①通過將要使用的信息聚集在一起實現了信息定位;②通過使用信息定位將單一元素的信息編組實現了標簽最小化;③通過支持大量的、人們易于接受的感知推理來實現感知強化。這不僅避免了對不同信息的大量搜尋,還可以將需要同時處理的不同的信息緊密地定位在一起。例如,圖3描繪的是馬德里地鐵運輸系統的局部線路圖,通過將地鐵線路和站名放在同一張地圖中實現了信息定位原理的應用,乘客可以在圖中方便地查找到線路、交匯、站點等信息。如果一位乘客想要從San Bernardo出發到達Cristal,他可以找到多種不同的換乘線路組合,而且能夠大致確定哪條換乘線路組合用時最短。
信息可視化中的一個關鍵問題是我們如何將抽象數據轉化為圖形,這個圖形既要保留基本數據的意義,同時還要有新的觀點。研究者對原始數據進行圖形化構建,在這一過程中沒有萬能公式可用,因此,面對不同的數據性質、不同的信息類型,圖形化展示的設計者需要更多地發揮自己的創造力。
教育軟件中的可視化
在網絡學習平臺上應用圖形展示可以幫助教師了解學生的狀況,同時可以監測學生的行為。下面,我們將對兩種類型的應用,即用戶模型的可視化、學生行蹤數據的可視化展開介紹。
1.用戶模型的可視化
用戶模型是對一組用戶信息集合的描述,其中特別關注他們在不同領域的知識、學習動機及興趣偏好等。學生模型是智能教育系統中的關鍵元素,它用來描述學生對教學材料的了解程度。目前,在教育系統中開發了許多為用戶建模的方法,開發的這些模型增進了軟件的個性化,尤其是在網絡上,用戶模型是用來生成個性化網站的一組信息集合。下面介紹一種用戶模型的可視化工具——E-KERMIT。
KERMIT是一種基于知識的智能關系建模指導系統,它的功能是為大學生教授概念數據庫的設計。KERMIT以“提出需求-完成需求”的方式進行教學,它首先向學生展示出對數據庫的需求,然后學生根據需求設計相應的“實體-關系(ER)”表格完成數據庫建模。Hartley和Mitrovic在KERMIT的基礎上對其進行擴展,開發出了E-KERMIT,在E-KERMIT中,教師可以使用專門的界面查看學生模型的全局視圖(如下頁圖4)。圖中對課程內容按照類別進行了劃分,展示出了ER建模的過程和概念,在開放學生模型的展示中,課程內容的概念使用柱狀圖形進行繪制,黑色的柱狀圖顯示學生已經掌握的課程內容,白色的柱狀圖顯示學生未掌握的課程內容,并在圖中標示出了在這個類別的概念掌握上所占的百分比。例如,在圖4中的“結構”這一類別上,學生學習過的內容占47%,掌握的內容占35%,那么,他在該類別上的得分就為74.5(35/47×100)。
2.學生行蹤數據的可視化
在最近的幾年涌現出了許多軟件平臺,平臺上的課程管理系統(CMS)是用來對遠程學習提供支持的,該系統可以幫助教師發布信息、制作內容材料、布置作業、準備測試、參與討論,課程管理系統以日志的形式累積記錄了大量的追蹤信息,這些信息可以監控學生的行為,但是這些文本形式的日志文件并不適宜直觀訪問,這就很難滿足教師的需求。而信息可視化技術與工具則可以將日志中的大量信息進行可視化展示,從而為教師提供更加直觀、快速的參考。
最近,一些研究者開發出了許多圖形化展示工具用于分析學生行為數據,這里僅對其中一種做介紹。CourseVis是一個能夠將課程管理系統(CMS)中的數據進行圖形化展示的工具,它為教師查看學生的交往、認知、行為等方面的情況提供了支持,CourseVis首先進行系統的調查以查找教師想要了解的內容,并確定獲得這些信息的可行方式。在進行系統調查時,首先要制作調查表,然后根據調查結果形成需求,并進行圖形化展示的設計。圖5顯示了一個使用CourseVis生成的圖形化展示案例。該圖在二維平面空間上顯示,橫軸描繪的是課程日期,在縱軸方向上對應許多變量,表示的是課程的具體內容信息,該圖展示的是學生對內容頁面的訪問、對課程的總體訪問和課程的進度。
教師可以通過這張圖表辨別需要特殊關注的學生個體,發現學生在某一內容知識上是否遇到困難,然后有針對性地對難點知識進行細致講解。
結論與將來工作
在線教育系統聚集了大量的信息,這對分析學生的行為具有很大的價值。然而,由于這些系統產生的數據量十分龐大,使用手工方式很難處理,在過去的幾年中,研究者開始著手探索利用各種方法從中提取有價值的信息,以幫助教育者管理課程。數據挖掘與信息可視化是兩種可以用來從學生的使用數據中發現有用信息的方法,在本文中,我們展示了使用IV技術的一些想法和原理,利用IV技術可以將學習網站中搜集的信息以圖形的方式呈現出來。借助視覺感知能力,我們可以通過圖形化迅速展示發現數據的模式、規律、趨勢,還可以對數據集形成一個總體的概覽。另外,我們描述了一些使用了可視化的學習系統,用以描繪用戶模型數據、行蹤數據,從中可以認識到單獨使用數據挖掘算法是不夠的,同樣,單獨使用圖形化展示來分析復雜、龐大的數據集也并不是最有效可行的,而將數據挖掘和信息可視化兩種方法組合使用才能夠創建出具有更加強大功能的工具,未來的研究也一定會考慮兩種方法的聯合開發。