張慧軍,陳俊杰,張小龍
利用問(wèn)題求解理論來(lái)研究交互式復(fù)雜信息的可視分析行為
張慧軍1,2,陳俊杰1,張小龍3
(1. 太原理工大學(xué)信息與計(jì)算機(jī)學(xué)院,山西 晉中 030600;2.山西傳媒學(xué)院融媒技術(shù)學(xué)院,山西 晉中 030600;3. 賓夕法尼亞州立大學(xué)信息科學(xué)與技術(shù)學(xué)院,美國(guó) 賓夕法尼亞州 16802)
面對(duì)大數(shù)據(jù)的挑戰(zhàn),力圖將人的推理能力和計(jì)算系統(tǒng)的數(shù)據(jù)處理能力相結(jié)合的交互式可視分析研究變得愈發(fā)重要。然而目前仍缺乏有效的認(rèn)知理論來(lái)指導(dǎo)面向復(fù)雜信息的可視分析系統(tǒng)的設(shè)計(jì),諸如意義構(gòu)建等現(xiàn)有的理論框架通常著眼于分析行為的外在特征,未能對(duì)此類行為的內(nèi)在認(rèn)知機(jī)理進(jìn)行深入研究。因此提出將問(wèn)題求解作為一種理論框架來(lái)解釋交互可視分析行為的基本認(rèn)知活動(dòng),并建議從非良構(gòu)問(wèn)題的角度來(lái)描述可視分析過(guò)程中用戶所面臨的主要挑戰(zhàn),還從問(wèn)題表征及問(wèn)題求解策略等角度分析了可視分析系統(tǒng)對(duì)分析行為的影響。本研究在理論上,將認(rèn)知心理學(xué)領(lǐng)域的問(wèn)題求解理論引入到交互可視分析行為的研究中,該方法對(duì)設(shè)計(jì)面向復(fù)雜信息分析的其他類型交互系統(tǒng)也有啟示作用;在實(shí)踐層面上,從問(wèn)題求解的支持角度探索了可視分析系統(tǒng)的設(shè)計(jì)和評(píng)估問(wèn)題。
問(wèn)題求解;可視分析;意義構(gòu)建;問(wèn)題表征;問(wèn)題求解策略
人與復(fù)雜信息交互的過(guò)程中,面臨承載任務(wù)復(fù)雜、呈現(xiàn)信息量大、信息結(jié)構(gòu)多樣等諸多挑戰(zhàn),這些挑戰(zhàn)成為準(zhǔn)確、快速、有效決策的巨大障礙。大數(shù)據(jù)的出現(xiàn),更加劇了這方面的挑戰(zhàn)。為了應(yīng)對(duì)這些挑戰(zhàn)并幫助人們有效地分析和處理紛繁復(fù)雜的數(shù)據(jù),近年來(lái)學(xué)術(shù)界和工業(yè)界都逐漸開(kāi)始重視面向復(fù)雜數(shù)據(jù)的交互可視分析系統(tǒng)的作用[1-2]。
如何更好地設(shè)計(jì)交互可視分析系統(tǒng)來(lái)支持人類復(fù)雜的信息分析行為是一個(gè)重要課題。ENDERT等[3]指出系統(tǒng)的設(shè)計(jì)思想需要從“人在分析環(huán)路”轉(zhuǎn)變?yōu)椤叭司褪欠治霏h(huán)路”,這一轉(zhuǎn)變更加強(qiáng)調(diào)人類分析推理能力在數(shù)據(jù)分析中的主導(dǎo)作用,而設(shè)計(jì)支持人類分析推理的可視分析系統(tǒng),需要打開(kāi)復(fù)雜認(rèn)知活動(dòng)的黑盒[4-6]。
交互式可視分析過(guò)程包含多種復(fù)雜認(rèn)知活動(dòng),如意義構(gòu)建、問(wèn)題求解、學(xué)習(xí)等[7]。一些研究已經(jīng)逐漸認(rèn)識(shí)到復(fù)雜認(rèn)知活動(dòng)的研究在該領(lǐng)域中的重要性,如PIROLLI和CARD[8]針對(duì)情報(bào)分析場(chǎng)景提出的意義構(gòu)建瀑布模型,以及KLEIN等[9]提出的數(shù)據(jù)/幀意義構(gòu)建模型,但其僅著眼于數(shù)據(jù)分析的外在行為特征,對(duì)底層的認(rèn)知過(guò)程以及這些認(rèn)知過(guò)程如何影響信息的操作和產(chǎn)生還缺乏深刻的分析。因此,利用這些模型指導(dǎo)相關(guān)系統(tǒng)的設(shè)計(jì)時(shí),設(shè)計(jì)人員會(huì)面臨諸多困難,比如如何使設(shè)計(jì)的系統(tǒng)具有更好的可拓展性進(jìn)而應(yīng)用到更廣泛的領(lǐng)域中,如何有效地評(píng)估系統(tǒng)對(duì)復(fù)雜信息分析行為的影響等等。
人機(jī)交互研究的發(fā)展歷史告訴人們,可用性良好的交互系統(tǒng)其設(shè)計(jì)是建立在對(duì)用戶相關(guān)認(rèn)知行為有深入了解的基礎(chǔ)之上。如得到廣泛應(yīng)用的圖形用戶界面的成功,很大程度上得益于人類信息處理器(model human processor,MHP)[10]模型,其描述了人類在處理外部信息時(shí)的認(rèn)知機(jī)制并給出了相關(guān)的參數(shù)范圍。
交互可視分析系統(tǒng)的設(shè)計(jì)也需要相應(yīng)的基本認(rèn)知理論。基于這一出發(fā)點(diǎn),本研究探索能幫助解釋交互可視分析中復(fù)雜行為的基本認(rèn)知理論框架。綜合認(rèn)知心理學(xué)、人機(jī)交互、教育學(xué)等多學(xué)科的文獻(xiàn)調(diào)查,本文提出將問(wèn)題求解作為一個(gè)理論框架來(lái)支持對(duì)可視分析復(fù)雜行為的研究。
引入問(wèn)題求解理論框架對(duì)指導(dǎo)可視分析行為的研究具有諸多好處。首先在基本理論層面,與問(wèn)題求解相關(guān)的豐富文獻(xiàn)可以更好地解釋復(fù)雜信息分析行為的組件和過(guò)程。即問(wèn)題求解是問(wèn)題求解者從問(wèn)題的初始狀態(tài)出發(fā),在問(wèn)題求解策略的指導(dǎo)下,通過(guò)操縱一系列的算子最終到達(dá)目標(biāo)狀態(tài)的過(guò)程。交互可視分析行為則是用戶從數(shù)據(jù)出發(fā),根據(jù)一定的分析策略,通過(guò)使用可視化及數(shù)據(jù)處理工具等手段獲得新知識(shí)的過(guò)程。交互可視分析行為中涉及到的數(shù)據(jù)、可視化和數(shù)據(jù)處理工具、分析策略、新知識(shí)等主要組件可以分別映射到問(wèn)題求解中的初始狀態(tài)、算子、求解策略、目標(biāo)狀態(tài)等部件。在此基礎(chǔ)上,可以借鑒已有的相關(guān)問(wèn)題求解理論來(lái)支持可視分析行為的研究。如分析人員在分析過(guò)程中面臨的很多困難(如數(shù)據(jù)不完備、分析目標(biāo)不明確、分析工具不熟悉等),都可以利用問(wèn)題求解中的非良構(gòu)問(wèn)題理論進(jìn)行建模。其次,問(wèn)題求解理論既可以指導(dǎo)交互系統(tǒng)的設(shè)計(jì)實(shí)踐,也為交互系統(tǒng)的評(píng)估提供了一條新的思路。
近年來(lái),意義構(gòu)建逐漸成為了一種解釋、支持可視分析系統(tǒng)設(shè)計(jì)的認(rèn)知理論模型。本文提出問(wèn)題求解可以超越意義構(gòu)建,作為一種研究可視分析復(fù)雜行為的理論框架,研究主要包括意義構(gòu)建和問(wèn)題求解兩部分。
文獻(xiàn)[8]提出的意義構(gòu)建瀑布模型描述了用戶將原始數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)洞察的分析過(guò)程。該模型將分析過(guò)程分為:信息覓食環(huán)路和意義構(gòu)建環(huán)路2部分。同樣,文獻(xiàn)[9]的數(shù)據(jù)/幀模型也將焦點(diǎn)聚集在數(shù)據(jù)的意義構(gòu)建上,將用戶對(duì)數(shù)據(jù)的理解描述為“幀”,通過(guò)與新的信息和發(fā)現(xiàn)進(jìn)行不斷地比較來(lái)增強(qiáng)、修改或重建這些幀。與此不同,LEE等[11]使用“幀”來(lái)表示用戶對(duì)可視化工具的理解,并提出了新手用戶對(duì)可視化工具的意義構(gòu)建過(guò)程。這些模型都在一定程度上解釋了用戶對(duì)復(fù)雜信息進(jìn)行可視分析的過(guò)程。
意義構(gòu)建對(duì)交互可視分析的指導(dǎo)作用表現(xiàn)在一些交互系統(tǒng)的設(shè)計(jì)和研究上。STASKO等[12]系統(tǒng)體現(xiàn)了對(duì)文獻(xiàn)[8]的意義構(gòu)建模型中的主要分析環(huán)節(jié)的支持,而KODAGODA等[13]使用數(shù)據(jù)/幀模型[9]來(lái)研究用戶使用INVISQUE軟件的心理過(guò)程。WU等[14]基于意義構(gòu)建理論,提出了移動(dòng)式交互系統(tǒng)的設(shè)計(jì)指南以幫助用戶進(jìn)行環(huán)境感知。SocialNetSense[15]通過(guò)自底向上的數(shù)據(jù)驅(qū)動(dòng)和自頂向下的表示驅(qū)動(dòng)來(lái)支持社交網(wǎng)絡(luò)的意義構(gòu)建過(guò)程。
1.2.1 問(wèn)題及其分類
DUNKER和LEES[16]提出“當(dāng)一個(gè)人有目標(biāo)但不知道如何從當(dāng)前狀態(tài)到達(dá)這個(gè)目標(biāo)時(shí)便會(huì)產(chǎn)生問(wèn)題。”由此可知,問(wèn)題包括初始狀態(tài)、目標(biāo)狀態(tài)和障礙。障礙指中間狀態(tài),是從問(wèn)題的初始狀態(tài)到目標(biāo)狀態(tài)的每個(gè)步驟。狀態(tài)的轉(zhuǎn)變必須依靠算子的使用。初始狀態(tài)、目標(biāo)狀態(tài)和算子稱為問(wèn)題的三要素。NEWELL和SIMON[17]使用術(shù)語(yǔ)“問(wèn)題空間”來(lái)描述問(wèn)題的一系列狀態(tài)(初始狀態(tài)、目標(biāo)狀態(tài)、中間狀態(tài)),一系列算子及求解路徑(經(jīng)歷一些狀態(tài))的局部信息。問(wèn)題求解是求解者從初始狀態(tài)出發(fā),通過(guò)選擇和應(yīng)用算子,克服障礙到達(dá)目標(biāo)狀態(tài)的過(guò)程[18-19]。
問(wèn)題根據(jù)特征差異,可分為良構(gòu)問(wèn)題和非良構(gòu)問(wèn)題。在良構(gòu)問(wèn)題中,初始狀態(tài)、目標(biāo)狀態(tài)和允許的算子對(duì)問(wèn)題求解者而言都是清楚明確的[20-21],而非良構(gòu)問(wèn)題指問(wèn)題的某些方面僅僅被含糊地表達(dá)出來(lái),對(duì)問(wèn)題求解者來(lái)說(shuō)不是特別清楚[22-23]。
1.2.2 問(wèn)題求解過(guò)程
問(wèn)題求解過(guò)程包含問(wèn)題表征、解決方案的形成和執(zhí)行等子過(guò)程。問(wèn)題表征是問(wèn)題求解者基于對(duì)問(wèn)題的理解持續(xù)構(gòu)建問(wèn)題空間的過(guò)程。問(wèn)題表征分為內(nèi)部表征和外部表征。內(nèi)部表征指心智模型[24],如圖式[25]、幀[9]、語(yǔ)義網(wǎng)絡(luò)等。外部表征包含口頭表征、命題表征、圖表和圖形等,可視化便是一種外部表征形式。外部表征和內(nèi)部表征共同作用促進(jìn)了問(wèn)題求解過(guò)程[26-27],有研究表明外部的圖表表征在一定程度上指導(dǎo)、約束、甚至決定著問(wèn)題求解的過(guò)程[28-29]。對(duì)于良構(gòu)問(wèn)題,問(wèn)題表征的關(guān)鍵認(rèn)知活動(dòng)包括確定問(wèn)題的初始狀態(tài)和目標(biāo)狀態(tài),確定問(wèn)題的關(guān)鍵信息以及與現(xiàn)有圖式建立聯(lián)系;對(duì)于非良構(gòu)問(wèn)題,問(wèn)題表征包括定義問(wèn)題,搜索和選擇信息,以及形成正確的選擇。相關(guān)研究表明問(wèn)題表征的質(zhì)量直接決定了問(wèn)題求解的效果[30],所以從問(wèn)題表征的支持角度研究交互可視分析系統(tǒng)有很強(qiáng)的指導(dǎo)意義。
用戶求解問(wèn)題時(shí),需要找到一條從初始狀態(tài)到目標(biāo)狀態(tài)的路徑,即解決方案。解決方案的形成通常需要采用一定的求解策略。當(dāng)用戶在表征問(wèn)題時(shí),有圖式可以激活,則可采用類比策略來(lái)求解。當(dāng)在表征問(wèn)題階段沒(méi)有激活特定圖式時(shí),則需要一些其他問(wèn)題求解策略。文獻(xiàn)[17]認(rèn)為求解問(wèn)題時(shí),在所有狀態(tài)組成的巨大問(wèn)題空間內(nèi)尋找正確的解決方案需要大量的時(shí)間和精力。啟發(fā)式策略的使用使問(wèn)題求解變得更簡(jiǎn)單、高效。REISBERG[31]描述了2種最常使用的啟發(fā)式策略:爬山法和手段-目標(biāo)分析法。爬山法指問(wèn)題求解者總是試圖接近其目標(biāo),在必要時(shí)退后一步以實(shí)現(xiàn)目標(biāo),這可能是低效的。手段-目標(biāo)分析是相對(duì)更有效的策略,該策略將目標(biāo)或子目標(biāo)與當(dāng)前狀態(tài)進(jìn)行比較,評(píng)估其間的差異,并選擇一種動(dòng)作以減少差異,逐漸彌合信息狀態(tài)之間的差距。在這個(gè)過(guò)程中,問(wèn)題會(huì)被分解成多個(gè)子問(wèn)題。
綜上所述,意義構(gòu)建模型在解釋可視分析過(guò)程及指導(dǎo)系統(tǒng)的設(shè)計(jì)和研究上取得了一定進(jìn)展,但只解釋了用戶做什么,而對(duì)用戶活動(dòng)背后的認(rèn)知機(jī)理及原因缺乏必要的解釋,如用戶為什么這么做,是什么促使了用戶進(jìn)一步分析,為什么用戶在算法和可視化之間來(lái)回切換等。針對(duì)以上不足,本文提出將問(wèn)題求解作為研究交互可視分析行為的理論框架。問(wèn)題求解從全局系統(tǒng)的角度來(lái)看待可視分析行為。總之,問(wèn)題求解可以從問(wèn)題的定義、表征、求解策略等方面對(duì)交互可視分析組件及過(guò)程進(jìn)行全面的關(guān)注。此外,問(wèn)題求解框架下的每一個(gè)子活動(dòng)都具有明確的目的性,這使其適合為交互可視分析行為建立更為精準(zhǔn)的理論框架。
問(wèn)題求解理論框架可以為交互可視分析過(guò)程建模,在該框架下,交互可視分析過(guò)程被視為問(wèn)題求解的過(guò)程,同時(shí)可視分析過(guò)程中存在的諸多挑戰(zhàn)也可以使用問(wèn)題求解框架下的非良構(gòu)問(wèn)題來(lái)解釋。
交互可視分析的過(guò)程可以看成是用戶使用可視分析系統(tǒng)進(jìn)行問(wèn)題求解的過(guò)程。從問(wèn)題求解的角度看待交互可視分析行為,首先需要將問(wèn)題的各個(gè)要素與交互可視分析中的相關(guān)組件進(jìn)行對(duì)應(yīng)。交互可視分析的初始狀態(tài)是原始數(shù)據(jù),目標(biāo)狀態(tài)是獲得知識(shí)或建立關(guān)于數(shù)據(jù)的模型[32]。原始數(shù)據(jù)和知識(shí)(或模型)之間有一定的差距,其很難直接通過(guò)用戶思維來(lái)彌補(bǔ)。交互可視分析系統(tǒng)致力于利用外部信息工具(external artifacts)來(lái)幫助用戶求解問(wèn)題[33]。可視分析中的交互式可視化和數(shù)據(jù)處理算法都是有效地分析數(shù)據(jù)的外部化手段。從問(wèn)題求解的角度來(lái)看,這2種不同的算子,可幫助用戶從問(wèn)題的初始狀態(tài)(數(shù)據(jù))逐步操作經(jīng)過(guò)一系列中間狀態(tài)最終到達(dá)目標(biāo)狀態(tài)(獲得知識(shí)或建立模型)。
問(wèn)題可以分為良構(gòu)問(wèn)題和非良構(gòu)問(wèn)題,而可視分析所解決的問(wèn)題通常是非良構(gòu)的。可視分析中的一些挑戰(zhàn)均可從非良構(gòu)問(wèn)題的角度進(jìn)行解釋。交互可視分析的挑戰(zhàn)來(lái)自以下方面:
(1) 數(shù)據(jù)。數(shù)據(jù)經(jīng)常面臨數(shù)據(jù)量大、有冗余、多源異構(gòu)、不完整、不一致和不確定性等多方面的挑戰(zhàn),這是問(wèn)題的初始狀態(tài)不明確。
(2) 分析工具。用戶由于對(duì)可視化工具不熟悉,對(duì)數(shù)據(jù)處理算法相關(guān)的基本概念、工作原理和規(guī)則比較模糊,不能靈活運(yùn)用其求解相關(guān)問(wèn)題,不知道如何選擇和啟動(dòng)算法,不知道該如何設(shè)置和評(píng)估算法的結(jié)果,也不知道分析要經(jīng)過(guò)哪些步驟,這些是用戶對(duì)算子缺乏先驗(yàn)知識(shí)、對(duì)算子的限制條件不熟悉以及對(duì)問(wèn)題求解路徑不明確所致。
(3) 分析任務(wù)。有時(shí)任務(wù)表述比較含糊,如“找出數(shù)據(jù)之間的關(guān)系”這個(gè)任務(wù),用戶不知道最后找出的關(guān)系應(yīng)該是什么樣的,這是對(duì)問(wèn)題的目標(biāo)狀態(tài)定義不明確。
針對(duì)上述挑戰(zhàn),設(shè)計(jì)師應(yīng)該考慮:哪種設(shè)計(jì)能夠更好地幫助用戶了解問(wèn)題的各個(gè)狀態(tài);如何為用戶提供求解問(wèn)題的線索;算法和可視化如何結(jié)合才能夠應(yīng)對(duì)用戶對(duì)算子不熟悉的挑戰(zhàn)。
交互可視分析的過(guò)程實(shí)質(zhì)是問(wèn)題求解的過(guò)程。設(shè)計(jì)支持問(wèn)題求解的交互系統(tǒng)可以更有效地促進(jìn)復(fù)雜的可視分析行為。同時(shí),這也提供了一條從問(wèn)題求解的支持角度來(lái)評(píng)估交互系統(tǒng)的新思路。
分布式認(rèn)知[34]和心智模型[24]是可視分析系統(tǒng)支持問(wèn)題求解過(guò)程的理論基礎(chǔ)。傳統(tǒng)的認(rèn)知研究認(rèn)為認(rèn)知存在于人的大腦中,而分布式認(rèn)知在用戶和外部信息工具(artifact)之間分配,可以將知識(shí)委托給外部信息工具,從而減少存儲(chǔ)在記憶中信息量,進(jìn)而減少認(rèn)知負(fù)擔(dān)。交互可視分析系統(tǒng)便是一種外部認(rèn)知工具[35],其致力于外部認(rèn)知[33],利用可視化外部表征和交互設(shè)計(jì)來(lái)增強(qiáng)大腦的認(rèn)知能力。用戶在使用交互可視分析系統(tǒng)進(jìn)行數(shù)據(jù)分析時(shí),大腦內(nèi)部的心智模型和外部的可視分析系統(tǒng)相互作用。LIU和STASKO[36]指出可視分析場(chǎng)景下心智模型的含義以及與外部可視化之間的關(guān)系。
合理的交互系統(tǒng)設(shè)計(jì)應(yīng)該支持問(wèn)題求解的過(guò)程。本節(jié)從問(wèn)題表征和求解策略的支持角度來(lái)討論交互可視分析系統(tǒng)的設(shè)計(jì)工作。從問(wèn)題表征支持角度,設(shè)計(jì)師可以確定需要顯示哪些信息及信息之間的關(guān)系。從問(wèn)題策略支持角度,設(shè)計(jì)師可以確定需要設(shè)計(jì)哪些任務(wù)及任務(wù)之間的關(guān)系。這里需要說(shuō)明的是:用戶表征問(wèn)題和使用問(wèn)題求解策略并不是簡(jiǎn)單的順序過(guò)程。通常用戶在分析問(wèn)題之初,對(duì)問(wèn)題的理解并不深刻,用戶能夠建立的問(wèn)題空間也是粗粒度的,隨著問(wèn)題求解過(guò)程的執(zhí)行,用戶內(nèi)在的問(wèn)題空間逐漸變得更為精確。同理,交互可視分析系統(tǒng)的設(shè)計(jì)也可以遵循該過(guò)程,先設(shè)計(jì)一個(gè)粗略的、初始的系統(tǒng)原型,幫助用戶建立粗粒度的問(wèn)題空間,在問(wèn)題求解策略的支持階段逐漸完善該設(shè)計(jì)。
3.2.1 問(wèn)題表征與系統(tǒng)原型設(shè)計(jì)
用戶在使用交互可視分析系統(tǒng)進(jìn)行復(fù)雜信息分析時(shí),問(wèn)題表征是指用戶對(duì)數(shù)據(jù)(初始狀態(tài))、需要獲得的知識(shí)或構(gòu)建的模型(目標(biāo)狀態(tài))、交互式可視化和數(shù)據(jù)處理算法(算子)以及問(wèn)題求解過(guò)程中各個(gè)中間狀態(tài)的理解。交互可視分析系統(tǒng)是一種問(wèn)題的外部表征形式,用戶不僅需要通過(guò)使用交互系統(tǒng)對(duì)問(wèn)題的每個(gè)單獨(dú)的要素進(jìn)行意義構(gòu)建,而且需要理清其之間的關(guān)系,形成一個(gè)整體的、結(jié)構(gòu)化的心智模型。
設(shè)計(jì)師針對(duì)一個(gè)問(wèn)題,可以先確定問(wèn)題的每一個(gè)狀態(tài),然后通過(guò)可視化表征外化這些狀態(tài),以幫助用戶理解和識(shí)別。一些交互的設(shè)計(jì)(如視圖鏈接和聯(lián)動(dòng)等)更是驅(qū)動(dòng)了問(wèn)題求解過(guò)程中問(wèn)題狀態(tài)的變化,幫助用戶理解各個(gè)狀態(tài)之間的關(guān)系。如在關(guān)聯(lián)規(guī)則可視分析中,系統(tǒng)可以為用戶提供原始數(shù)據(jù)(初始狀態(tài))、頻繁項(xiàng)集(中間狀態(tài))以及關(guān)聯(lián)規(guī)則(目標(biāo)狀態(tài))的可視化視圖,并通過(guò)這些視圖之間的鏈接和聯(lián)動(dòng)等,幫助用戶理解這些狀態(tài)之間的關(guān)系,方便用戶進(jìn)一步分析。
設(shè)計(jì)師在原型設(shè)計(jì)中,還應(yīng)結(jié)合問(wèn)題本身的特點(diǎn)和用戶的先驗(yàn)知識(shí),為用戶提供合適的算子。可視分析問(wèn)題中有2類算子:交互式可視化和數(shù)據(jù)處理算法。這2類算子以不同的方法來(lái)促進(jìn)問(wèn)題狀態(tài)的改變,但兩者各有優(yōu)缺點(diǎn)。可視化中的交互工具相對(duì)容易理解,用戶通過(guò)短時(shí)間的熟悉或簡(jiǎn)單的培訓(xùn)能夠獲得操縱算子的知識(shí),促進(jìn)問(wèn)題狀態(tài)的變化,可視化表征更是將每一步的問(wèn)題狀態(tài)表示成容易理解的圖形,但其缺乏強(qiáng)大的計(jì)算能力。數(shù)據(jù)處理算法通過(guò)數(shù)據(jù)預(yù)處理、數(shù)據(jù)參數(shù)設(shè)置、數(shù)據(jù)模型建立、數(shù)據(jù)模型評(píng)估等算子實(shí)現(xiàn)了問(wèn)題狀態(tài)的變化,擁有強(qiáng)大的計(jì)算能力,但是由于黑盒性質(zhì),普通用戶對(duì)算子的陳述性知識(shí)(算法涉及的相關(guān)概念和中間狀態(tài)等)和程序性知識(shí)(如何啟動(dòng)算法、算法的運(yùn)行原理等)都比較缺乏。面向復(fù)雜數(shù)據(jù)的可視分析將交互式可視化和數(shù)據(jù)處理算法兩者有機(jī)結(jié)合起來(lái)實(shí)現(xiàn)更高效的分析[37]。在設(shè)計(jì)系統(tǒng)時(shí),交互式可視化和數(shù)據(jù)處理算法的結(jié)合,既要考慮問(wèn)題本身的特點(diǎn),還要考慮怎樣結(jié)合才能更方便用戶對(duì)算子的理解和使用。
3.2.2 問(wèn)題求解策略與系統(tǒng)的進(jìn)一步完善
對(duì)于復(fù)雜的問(wèn)題,特別是非良構(gòu)問(wèn)題,用戶很難直接找到合適的問(wèn)題求解方案,交互可視分析系統(tǒng)應(yīng)該支持和引導(dǎo)用戶使用啟發(fā)式的策略來(lái)求解問(wèn)題[38]。
問(wèn)題本身的性質(zhì)影響求解策略的使用。對(duì)于非良構(gòu)問(wèn)題,問(wèn)題的初始狀態(tài)、目標(biāo)狀態(tài)、算子的限制表述比較模糊,用戶很大程度上采用低效的試錯(cuò)策略來(lái)求解問(wèn)題。設(shè)計(jì)人員在設(shè)計(jì)交互系統(tǒng)時(shí),應(yīng)該考慮如何幫助用戶定義問(wèn)題,使問(wèn)題更加明晰,以減少試錯(cuò)策略的使用。如在交互系統(tǒng)的設(shè)計(jì)中對(duì)關(guān)鍵線索和信息進(jìn)行突出顯示。
交互可視分析系統(tǒng)的內(nèi)部邏輯實(shí)質(zhì)上反映了一種內(nèi)在的問(wèn)題求解策略。這種問(wèn)題求解策略與設(shè)計(jì)師組織任務(wù)的方式相關(guān)。如果系統(tǒng)對(duì)任務(wù)的組織是從目標(biāo)自頂而下逐層分解的,該系統(tǒng)多是引導(dǎo)用戶采用了手段-目標(biāo)分析策略來(lái)求解問(wèn)題。如在交通事故數(shù)據(jù)分析中,系統(tǒng)可以通過(guò)任務(wù)組織將整個(gè)問(wèn)題分解為分別調(diào)查不同因素和致命事故之間的關(guān)系,進(jìn)而引導(dǎo)用戶采用手段-目標(biāo)分析策略求解。如果系統(tǒng)對(duì)任務(wù)的組織是循環(huán)迭代的,那么系統(tǒng)在引導(dǎo)用戶采用爬山策略解決問(wèn)題。如很多系統(tǒng)對(duì)算法參數(shù)調(diào)整的支持,需要用戶比較每次調(diào)整后的效果。對(duì)于復(fù)雜的問(wèn)題,系統(tǒng)需要引導(dǎo)用戶采用多種策略來(lái)求解問(wèn)題。除此之外,交互可視分析系統(tǒng)還可以通過(guò)合理的設(shè)計(jì)將復(fù)雜的任務(wù)轉(zhuǎn)換為容易完成的視覺(jué)模式識(shí)別任務(wù)。
綜上所述,設(shè)計(jì)人員在進(jìn)一步設(shè)計(jì)系統(tǒng)時(shí),可以結(jié)合問(wèn)題的特點(diǎn),通過(guò)合理地設(shè)計(jì)和組織任務(wù),來(lái)引導(dǎo)用戶使用有效的策略求解問(wèn)題。
認(rèn)知心理學(xué)使用實(shí)驗(yàn)的方法來(lái)研究問(wèn)題求解的活動(dòng)[39-42],基于實(shí)驗(yàn)方法,本文從可視分析系統(tǒng)對(duì)問(wèn)題表征和求解策略的支持角度來(lái)探討系統(tǒng)的評(píng)估技術(shù)。
3.3.1 問(wèn)題表征視角的評(píng)估
成功求解問(wèn)題的前提是合適的問(wèn)題表征,通過(guò)衡量交互可視分析系統(tǒng)對(duì)問(wèn)題表征的支持程度可以評(píng)估系統(tǒng)的作用。用戶在與可視分析系統(tǒng)交互時(shí),對(duì)問(wèn)題表征的過(guò)程實(shí)質(zhì)上是不斷地構(gòu)建與操縱心智模型的過(guò)程。評(píng)估心智模型的狀態(tài)和構(gòu)建過(guò)程,可以讓研究人員深入了解用戶如何構(gòu)建關(guān)于工具、數(shù)據(jù)、算法和任務(wù)的知識(shí),這為交互可視分析系統(tǒng)的評(píng)估帶來(lái)了新的視角。
心智模型與問(wèn)題求解方案的質(zhì)量密切相關(guān)[30]。如果對(duì)于一個(gè)問(wèn)題只產(chǎn)生一些零碎的、沒(méi)有整合所有可用信息的心智模型,或是對(duì)問(wèn)題只停留到淺層的理解,通常難以解決問(wèn)題。具有正確性、完整性、連貫性的問(wèn)題表征才能幫助用戶正確有效地解決問(wèn)題。這也是專家處理復(fù)雜問(wèn)題時(shí)比新手速度快而且準(zhǔn)確的原因。LARKIN等[43]將問(wèn)題表征分為低層次和高層次表征。低層次表征主要是指對(duì)問(wèn)題的字面理解、對(duì)問(wèn)題表面特征的提取與加工,其容易受表面的誤導(dǎo)信息的影響,使問(wèn)題求解過(guò)程發(fā)生錯(cuò)誤。高層次表征以問(wèn)題的內(nèi)部結(jié)構(gòu)特征為主,求解問(wèn)題的過(guò)程更高效。問(wèn)題表征的層次與用戶的知識(shí)量和知識(shí)結(jié)構(gòu)直接相關(guān),所以對(duì)可視分析系統(tǒng)的評(píng)估可以從系統(tǒng)對(duì)用戶知識(shí)變化影響的角度來(lái)衡量。知識(shí)的變化可以從7個(gè)維度來(lái)刻畫:更大的容量、更密集的聯(lián)系、增長(zhǎng)的一致性、表征的精煉、更大的復(fù)雜性、更高層次的抽象性及轉(zhuǎn)變的視角[44]。MAYR等[45]提出了在交互可視化中用于評(píng)估心智模型的相關(guān)屬性,包含內(nèi)容(content)、結(jié)構(gòu)(structure)、一致性(coherence)、視角(perspectivity)、一般性(generalizability)和實(shí)用性(utility)等,這些屬性可以更全面地衡量問(wèn)題表征的質(zhì)量。
交互可視分析系統(tǒng)的評(píng)估既可以關(guān)注用戶使用系統(tǒng)前后的心智模型的差異,也可以關(guān)注心智模型構(gòu)建和變化的動(dòng)態(tài)過(guò)程。文獻(xiàn)[45]總結(jié)了在可視分析上下文中評(píng)估心智模型的多種技術(shù),有些是評(píng)估心智模型現(xiàn)狀的(如訪談法、排序技術(shù)、推理流技術(shù)、成對(duì)比較法、凱利方格法、草圖技術(shù)、概念圖),有些是衡量心智模型構(gòu)建和變化過(guò)程的(如非反應(yīng)方法、有聲思維),評(píng)估者可以針對(duì)上述準(zhǔn)則選用不同的評(píng)估技術(shù)。
3.3.2 問(wèn)題求解策略視角的評(píng)估
交互可視分析系統(tǒng)對(duì)問(wèn)題求解策略的支持作用可以看成是系統(tǒng)評(píng)估的另一個(gè)重要標(biāo)準(zhǔn)。當(dāng)前對(duì)交互可視分析系統(tǒng)的評(píng)估主要集中在對(duì)結(jié)果的評(píng)估(例如記錄和量化用戶獲得的洞察)或者是通過(guò)案例分析來(lái)展示系統(tǒng)的功能。用戶與可視分析系統(tǒng)的復(fù)雜交互過(guò)程實(shí)質(zhì)上反映了用戶形成和執(zhí)行求解方案的過(guò)程,其過(guò)程會(huì)使用一些問(wèn)題求解策略,如:手段-目的分析法、爬山法和類比法。文獻(xiàn)[45]指出問(wèn)題求解策略的研究可以為改進(jìn)交互可視分析系統(tǒng)提供有用的見(jiàn)解。研究人員逐漸開(kāi)始關(guān)注用戶使用交互可視分析系統(tǒng)求解問(wèn)題的過(guò)程,如一些研究通過(guò)記錄和分析用戶的交互事件來(lái)構(gòu)建用戶與系統(tǒng)的交互模型[46-47]。這種分析交互日志的方法只能從分析用戶行為上逆推用戶內(nèi)在的求解策略,并不能直接反應(yīng)交互背后的思維過(guò)程。在心理學(xué)和人機(jī)交互領(lǐng)域,有聲思維(think aloud)方法的使用可以很大程度上獲得用戶的復(fù)雜認(rèn)知活動(dòng)。在有聲思維研究中,被試在完成實(shí)驗(yàn)任務(wù)的過(guò)程中,盡可能將大腦中的思維活動(dòng)用言語(yǔ)表達(dá)出來(lái),而研究人員使用錄像及錄音設(shè)備進(jìn)行記錄,并將被試所說(shuō)的話謄寫為書(shū)面文本進(jìn)行分析。然而,用戶內(nèi)在的求解策略和外在的交互事件,這兩者之間的轉(zhuǎn)換發(fā)生在什么地方,依然是評(píng)估的一個(gè)難點(diǎn)。REDA等[48]認(rèn)識(shí)到該問(wèn)題的重要性,使用心理狀態(tài)和交互狀態(tài)之間的轉(zhuǎn)換圖來(lái)表示用戶在可視化探索過(guò)程中的求解策略及轉(zhuǎn)換。為了捕捉和分析用戶的求解策略,可以采用以下2個(gè)步驟:①?gòu)难哉Z(yǔ)報(bào)告(verbal protocol)中識(shí)別和編碼相關(guān)的認(rèn)知過(guò)程,并從日志文件和視頻記錄中找到用戶發(fā)起的交互。②使用轉(zhuǎn)換圖(state transition diagram)分析心理狀態(tài)和交互狀態(tài)之間的流動(dòng)。在這個(gè)過(guò)程中可以從言語(yǔ)報(bào)告中的心理過(guò)程和來(lái)自于視頻記錄和日志的交互事件組合成一個(gè)序列。從中分析交互狀態(tài)和心理狀態(tài)之間的轉(zhuǎn)換模式。這種評(píng)估方法不僅可以探索不同的系統(tǒng)設(shè)計(jì)對(duì)求解策略的影響,還可探索不同層次的用戶在使用同一系統(tǒng)時(shí)的差別。
本節(jié)以交通事故數(shù)據(jù)關(guān)聯(lián)可視分析系統(tǒng)為例介紹問(wèn)題求解理論對(duì)系統(tǒng)設(shè)計(jì)的指導(dǎo)作用。
該系統(tǒng)目標(biāo)是將交互式可視化與動(dòng)態(tài)關(guān)聯(lián)規(guī)則算法結(jié)合起來(lái)分析致命交通事故與各因素之間的關(guān)聯(lián)關(guān)系。本案例數(shù)據(jù)來(lái)自于美國(guó)公路安全管理局事故分析報(bào)告系統(tǒng)[49],為2011年發(fā)生的72 591起車禍?zhǔn)鹿视涗洠織l記錄都包含:駕駛員的年齡、性別、酒精測(cè)試結(jié)果、道路狀況、碰撞日期、傷害程度等多個(gè)屬性。
問(wèn)題求解理論指導(dǎo)下的可視分析系統(tǒng)設(shè)計(jì)過(guò)程包括問(wèn)題定義、問(wèn)題表征與系統(tǒng)原型設(shè)計(jì)、問(wèn)題求解策略與系統(tǒng)的進(jìn)一步完善等3個(gè)步驟。需要說(shuō)明的是問(wèn)題求解理論的指導(dǎo)作用更多地體現(xiàn)在了高層次的設(shè)計(jì)過(guò)程上,所以本節(jié)對(duì)視圖的選擇、布局等具體細(xì)節(jié)不做過(guò)多討論。
4.2.1 問(wèn)題定義
在問(wèn)題定義中,首先需要確定問(wèn)題3要素。問(wèn)題的初始狀態(tài)為交通事故數(shù)據(jù);目標(biāo)狀態(tài)是建立致命交通事故數(shù)據(jù)與其他因素之間的動(dòng)態(tài)關(guān)聯(lián)關(guān)系模型;算子包括交互式可視化和動(dòng)態(tài)關(guān)聯(lián)規(guī)則算法2種。
為了設(shè)計(jì)出與用戶先驗(yàn)知識(shí)及問(wèn)題相匹配的系統(tǒng),需調(diào)查用戶對(duì)數(shù)據(jù)(初始狀態(tài))、動(dòng)態(tài)關(guān)聯(lián)規(guī)則算法(算子)以及分析目標(biāo)(目標(biāo)狀態(tài))的了解程度。系統(tǒng)的目標(biāo)用戶是交通領(lǐng)域的專家,調(diào)查結(jié)果表明用戶對(duì)數(shù)據(jù)比較熟悉,但是對(duì)動(dòng)態(tài)關(guān)聯(lián)規(guī)則算法缺乏了解,不理解算法的相關(guān)概念、運(yùn)行原理等。同時(shí),也不知道分析結(jié)果,分析應(yīng)該從哪里開(kāi)始,要經(jīng)過(guò)那些步驟。由此可知,這是一個(gè)非良構(gòu)問(wèn)題,需要通過(guò)合理的可視化設(shè)計(jì)將非良構(gòu)問(wèn)題轉(zhuǎn)化為良構(gòu)問(wèn)題。
4.2.2 問(wèn)題表征與系統(tǒng)原型設(shè)計(jì)
問(wèn)題表征是用戶構(gòu)建問(wèn)題空間的過(guò)程,可視分析系統(tǒng)通過(guò)問(wèn)題求解狀態(tài)以及狀態(tài)之間的可視化來(lái)幫助用戶表征問(wèn)題。如圖1所示,左側(cè)的算子為數(shù)據(jù)處理算法,原始數(shù)據(jù)(初始狀態(tài))經(jīng)過(guò)頻繁項(xiàng)集挖掘算子生成頻繁項(xiàng)集(中間狀態(tài))。頻繁項(xiàng)集通過(guò)規(guī)則生成算子生成了動(dòng)態(tài)關(guān)聯(lián)規(guī)則(目標(biāo)狀態(tài))。右側(cè)的算子為交互式可視化,其中點(diǎn)圖幫助用戶理解動(dòng)態(tài)關(guān)聯(lián)規(guī)則,柱狀圖幫助用戶理解頻繁項(xiàng)集,日歷熱圖幫助用戶理解規(guī)則數(shù)據(jù)。3個(gè)視圖之間的鏈接和交互,可幫助用戶理解3種狀態(tài)之間的關(guān)系。點(diǎn)圖(圖2(b))被設(shè)計(jì)為表格形式,每行都表示一條動(dòng)態(tài)規(guī)則,最左列的文本描述了規(guī)則的含義,其他列用于顯示時(shí)間區(qū)域。每條規(guī)則被可視化為一個(gè)圓點(diǎn)。點(diǎn)的大小和顏色飽和度分別表示規(guī)則的支持度和置信度值。柱狀圖(圖2(c))用于分析規(guī)則對(duì)應(yīng)的頻繁項(xiàng)集,藍(lán)色柱表示數(shù)據(jù)項(xiàng),紫色柱表現(xiàn)項(xiàng)集,柱的高度由其表示的數(shù)據(jù)項(xiàng)或項(xiàng)集的支持度來(lái)確定。日歷熱圖(圖2(d))可幫助用戶查看與規(guī)則相關(guān)的數(shù)據(jù)是如何分布的。

圖1 可視分析系統(tǒng)的原型設(shè)計(jì)
4.2.3 問(wèn)題求解策略與系統(tǒng)的進(jìn)一步完善
可視分析系統(tǒng)通過(guò)任務(wù)的設(shè)計(jì)與組織引導(dǎo)用戶使用一定的策略來(lái)求解問(wèn)題。本系統(tǒng)根據(jù)用戶及問(wèn)題的特點(diǎn)支持手段-目標(biāo)求解策略。手段-目標(biāo)策略需要將問(wèn)題的目標(biāo)進(jìn)行分解,通過(guò)子目標(biāo)的實(shí)現(xiàn)逐漸減少當(dāng)前狀態(tài)與總目標(biāo)的差距,最后問(wèn)題得以解決。

圖2 可視分析系統(tǒng)的主界面((a) 規(guī)則概覽圖顯示所有的規(guī)則以及其包含的數(shù)據(jù)項(xiàng);(b) 動(dòng)態(tài)規(guī)則視圖支持規(guī)則探索; (c) 項(xiàng)集視圖用于分析規(guī)則對(duì)應(yīng)的數(shù)據(jù)項(xiàng)及頻繁項(xiàng)集;(d) 規(guī)則數(shù)據(jù)視圖用于查看規(guī)則數(shù)據(jù)分布;(e) 規(guī)則收集視圖用于保存有用的規(guī)則)
本系統(tǒng)的總目標(biāo)是建立致命交通事故與各因素之間的關(guān)聯(lián)關(guān)系模型,如圖3所示,本文采用自頂向下目標(biāo)分解的方法,將總目標(biāo)劃分為調(diào)查酒精、性別及年齡因素等多個(gè)任務(wù)。用戶在實(shí)現(xiàn)每個(gè)任務(wù)的過(guò)程中,需要完成子任務(wù)。如調(diào)查酒精因素需要分別檢查包含數(shù)據(jù)項(xiàng)Alc1(酒精測(cè)試結(jié)果為陽(yáng)性)和Alc0 (酒精測(cè)試結(jié)果為陰性)的規(guī)則,接著用戶需要查找感興趣的模式,但由于用戶對(duì)算法的先驗(yàn)知識(shí)缺乏,難以理解規(guī)則,這些任務(wù)還需要繼續(xù)向下分解為理解和檢測(cè)規(guī)則對(duì)應(yīng)的項(xiàng)集和數(shù)據(jù)分布等任務(wù)。
可視分析系統(tǒng)對(duì)目標(biāo)分解空間的支持,可以促進(jìn)用戶采用手段-目標(biāo)策略來(lái)求解問(wèn)題。規(guī)則概覽圖中矩陣視圖(圖2(a))引導(dǎo)用戶將總目標(biāo)分解為分別調(diào)查各個(gè)因素的任務(wù)。執(zhí)行圖3所示的每個(gè)任務(wù)會(huì)產(chǎn)生了新的問(wèn)題狀態(tài),并將中間狀態(tài)進(jìn)行可視化,以幫助用戶建立更細(xì)粒度的問(wèn)題空間。目標(biāo)分解空間內(nèi)的任務(wù)是相互依賴的,這種依賴關(guān)系在可視化設(shè)計(jì)中可以通過(guò)多視圖協(xié)調(diào)關(guān)系來(lái)體現(xiàn),如理解規(guī)則、支持度和置信度等含義,理解規(guī)則對(duì)應(yīng)的項(xiàng)集,檢測(cè)規(guī)則對(duì)應(yīng)的數(shù)據(jù)分布,這3個(gè)任務(wù)是相互依賴的,在可視設(shè)計(jì)中實(shí)質(zhì)就是點(diǎn)圖、柱狀圖和日歷熱圖這3個(gè)視圖之間的鏈接和刷新。此外,通過(guò)可視化設(shè)計(jì)還可以將子任務(wù)的結(jié)果整合起來(lái),方便用戶對(duì)分析進(jìn)度進(jìn)行把控和跟蹤,如規(guī)則收集視圖可以保存感興趣的規(guī)則。

圖3 目標(biāo)分解空間
研究問(wèn)題求解框架與現(xiàn)有模型之間的關(guān)系,有助于進(jìn)一步明確本文的研究工作在可視分析理論中的位置和作用。
CARD等[50]用信息可視化參考模型描述了將原始數(shù)據(jù)映射為視圖的過(guò)程。從問(wèn)題求解的角度來(lái)看,這是從問(wèn)題的初始狀態(tài)(原始數(shù)據(jù))經(jīng)過(guò)可視化相關(guān)的算子(轉(zhuǎn)換/映射)來(lái)獲得問(wèn)題外部表征(視圖)的過(guò)程。模型中的原始數(shù)據(jù)、數(shù)據(jù)表、可視化結(jié)構(gòu)與視圖,這些組件都是問(wèn)題的狀態(tài)。
知識(shí)發(fā)現(xiàn)模型[51]描述了數(shù)據(jù)通過(guò)數(shù)據(jù)挖掘的技術(shù)轉(zhuǎn)換為知識(shí)或模型的過(guò)程。從問(wèn)題求解的角度來(lái)看,這是從問(wèn)題的初始狀態(tài)(數(shù)據(jù))經(jīng)過(guò)操作一系列與算法相關(guān)的算子到達(dá)問(wèn)題目標(biāo)狀態(tài)(獲得知識(shí)或建立模型)的過(guò)程。
文獻(xiàn)[5]提出的人類認(rèn)知模型專注于人與計(jì)算機(jī)在信息發(fā)現(xiàn)和知識(shí)創(chuàng)造與擴(kuò)展方面的任務(wù)分配與合作。從問(wèn)題求解的角度看,這正是2種類型的算子(交互式可視化和算法)在用戶求解問(wèn)題的過(guò)程中來(lái)回切換的原因。
文獻(xiàn)[52]提出的過(guò)程模型包括4個(gè)組件:數(shù)據(jù)、模型、可視化和知識(shí)。在問(wèn)題求解框架中其分別對(duì)應(yīng)于初始狀態(tài)、算子和目標(biāo)狀態(tài)。該模型中,可視化數(shù)據(jù)探索通路(從數(shù)據(jù)通過(guò)可視化轉(zhuǎn)變成知識(shí))和自動(dòng)數(shù)據(jù)分析通路(從數(shù)據(jù)通過(guò)模型轉(zhuǎn)化為知識(shí))是使用2種不同算子求解問(wèn)題的途徑。這2種算子還可以通過(guò)模型的可視化來(lái)進(jìn)行關(guān)聯(lián)和切換。
SACHA等[53]提出了可視分析的知識(shí)產(chǎn)生模型。該模型包含計(jì)算機(jī)和人兩部分。計(jì)算機(jī)部分包含數(shù)據(jù)、可視化、模型組件,可幫助用戶進(jìn)行問(wèn)題表征(構(gòu)建問(wèn)題空間)。人的部分包含探索環(huán)路、驗(yàn)證環(huán)路和知識(shí)產(chǎn)生環(huán)路。這3層環(huán)路實(shí)質(zhì)上描述了用戶使用可視分析系統(tǒng)進(jìn)行問(wèn)題求解的過(guò)程。探索環(huán)路中的動(dòng)作是執(zhí)行問(wèn)題求解方案的過(guò)程。驗(yàn)證環(huán)路中產(chǎn)生的猜測(cè)幫助用戶形成問(wèn)題求解方案。在知識(shí)循環(huán)中,已被驗(yàn)證的猜測(cè)總結(jié)為知識(shí),問(wèn)題得以解決。
綜上,問(wèn)題求解框架不僅能夠很好地解釋和兼容可視分析中一些常用模型,而且從整體性和系統(tǒng)性的角度對(duì)可視分析的組件及相關(guān)過(guò)程進(jìn)行了更精確地描述。
問(wèn)題求解框架雖然在解釋交互可視分析行為、指導(dǎo)交互系統(tǒng)的設(shè)計(jì)與評(píng)估上具有優(yōu)勢(shì),但其仍存在局限性。首先,問(wèn)題求解框架從高層次的設(shè)計(jì)過(guò)程上考慮交互系統(tǒng)的設(shè)計(jì)問(wèn)題,其并不關(guān)注于顏色選擇、組件空間布局等設(shè)計(jì)細(xì)節(jié)。此外,問(wèn)題求解理論框架如何更好地支持和指導(dǎo)人類復(fù)雜的信息分析行為仍然需要更多的理論和實(shí)證研究。
本文提出了將問(wèn)題求解作為解釋交互可視分析行為的理論框架,力圖從分析行為的基本認(rèn)知機(jī)理層面來(lái)探索針對(duì)不同任務(wù)的分析行為的基本特征,并探討了其對(duì)交互可視分析系統(tǒng)設(shè)計(jì)的指導(dǎo)意義,同時(shí)也為交互系統(tǒng)的評(píng)估提供了新的視角和思路。
本文工作后續(xù)可以從2個(gè)方面進(jìn)行擴(kuò)展。①開(kāi)展更多的應(yīng)用研究,以便更詳細(xì)地驗(yàn)證問(wèn)題求解理論在交互可視分析系統(tǒng)以及其他交互系統(tǒng)中的效用。②從問(wèn)題表征和策略支持的角度對(duì)交互可視分析系統(tǒng)進(jìn)行實(shí)證評(píng)估。
[1] ELLIS G, MANSMANN F. Mastering the information age solving problems with visual analytics[M]. Goslar: Eurographics Association, 2010: 5.
[2] KOHLHAMMER J, KEIM D, POHL M, et al. Solving problems with visual analytics[J]. Procedia Computer Science, 2011, 7: 117-120.
[3] ENDERT A, HOSSAIN M S, RAMAKRISHNAN N, et al. The human is the loop: new directions for visual analytics[J]. Journal of Intelligent Information Systems, 2014, 43(3): 411-435.
[4] GREEN T M, RIBARSKY W, FISHER B. Visual analytics for complex concepts using a human cognition model[C]//IEEE Symposium on Visual Analytics Science and Technology.New York: IEEE Press, 2008: 91-98.
[5] GREEN T M, RIBARSKY W, FISHER B. Building and applying a human cognition model for visual analytics[J]. Information Visualization, 2009, 8(1): 1-13.
[6] 張慧軍, 張小龍. 可視分析中的復(fù)雜認(rèn)知活動(dòng)研究[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2018, 30(1): 57-67. ZHANG H J, ZHANG X L. Complex cognitive activity in visual analytic[J]. Journal of Computer-aided Design and Computer Graphics, 2018, 30(1): 57-67 (in Chinese).
[7] SEDIG K, UNIVERSITY W, PARSONS P, et al. Interaction design for complex cognitive activities with visual representations: a pattern-based approach[J]. AIS Transactions on Human-Computer Interaction, 2013, 5(2): 84-133.
[8] PIROLLI P, CARD S. The sensemaking process and leverage points for analyst technology as identified through cognitive task analysis[J]. Proceedings of International Conference on Intelligence Analysis, 2005, 2005: 2-4.
[9] KLEIN G, MOON B, HOFFMAN R R. Making sense of sensemaking 2: a macrocognitive model[J]. IEEE Intelligent Systems, 2006, 21(5): 88-92.
[10] CARD S K. The psychology of human-computer interaction[M]. Hillsdale: CRC Press, 2018: 220-225.
[11] LEE S, KIM S H, HUNG Y H, et al. How do people make sense of unfamiliar visualizations?: a grounded model of novice’s information visualization sensemaking[J]. IEEE Transactions on Visualization and Computer Graphics, 2016, 22(1): 499-508.
[12] STASKO J, G?RG C, LIU Z C. Jigsaw: supporting investigative analysis through interactive visualization[J]. Information Visualization, 2008, 7(2): 118-132.
[13] KODAGODA N, ATTFIELD S, WONG B L W, et al. Using interactive visual reasoning to support sense-making: implications for design[J]. IEEE Transactions on Visualization and Computer Graphics, 2013, 19(12): 2217-2226.
[14] WU A N, ZHANG X, CAI G. An interactive sensemaking framework for mobile visual analytics[C]//Proceedings of the 3rd International Symposium on Visual Information Communication - VINCE’10. New York: ACM Press, 2010: 22.
[15] GOU L, ZHANG X L, LUO A R, et al. SocialNetSense: supporting sensemaking of social and structural features in networks with interactive visualization[C]// 2012 IEEE Conference on Visual Analytics Science and Technology (VAST). New York: IEEE Press, 2012: 133-142.
[16] DUNCKER K, LEES L S. On problem-solving[J]. Psychological Monographs, 1945, 58(5): 1.
[17] NEWELL A, SIMON H A. Human problem solving[M]. New Jersey: Prentice-Hall, 1972: 56.
[18] ANDERSON J R. Problem solving and learning[J]. American Psychologist, 1993, 48(1): 35.
[19] MAYER R E, WITTROCK M C. Handbook of educational psychology[M]. London: Prentice Hall International, 1996: 47-62.
[20] GREENO J G. Natures of problem-solving abilities[J]. Human Information Processing, 2014, 5: 239.
[21] SIMON H A. Information-processing theory of human problem solving[J]. Handbook of Learning and Cognitive Processes, 1978, 5: 271-295.
[22] WOOD P K. Inquiring systems and problem structure: implications for cognitive development[J]. Human Development, 1983, 26(5): 249-265.
[23] HONG N S. The relationship between well-structured and ill-structured problem solving in multimedia simulation[D].State College: Pennsylvania State University, 1998.
[24] NORMAN D A. Some observations on mental models[M]. New Jersey: Lawrence Erlbaum Associates, 2014: 15-22.
[25] ERICSSON K A, LEHMANN A C. EXPERT AND EXCEPTIONAL PERFORMANCE: evidence of maximal adaptation to task constraints[J]. Annual Review of Psychology, 1996, 47(1): 273-305.
[26] KIRSH D. Thinking with external representations[J]. Ai & Society, 2010, 25(4): 441-454.
[27] HEGARTY M. The cognitive science of visual-spatial displays: implications for design[J]. Topics in Cognitive Science, 2011, 3(3): 446-474.
[28] CHAMBERS D, REISBERG D. Can mental images be ambiguous?[J]. Journal of Experimental Psychology: Human Perception and Performance, 1985, 11(3): 317-328.
[29] SUWA M, TVERSKY B. External representations contribute to the dynamic construction of ideas[M]// Diagrammatic Representation and Inference. Heidelberg: Springer, 2002: 341-343.
[30] MUMFORD M, HESTER K S, ROBLEDO I, et al. Mental models and creative problem-solving: the relationship of objective and subjective model attributes[J]. Creativity Research Journal, 2012, 24(4): 311-330.
[31] REISBERG D. Cognition: exploring the science of the mind[M]. New York: W. W. Norton & Company, 2010: 101-110.
[32] ANDRIENKO N, LAMMARSCH T, ANDRIENKO G, et al. Viewing visual analytics as model building[J]. Computer Graphics Forum, 2018, 37(6): 275-299.
[33] WARE C. Information visualization: perception for design[M]. Amsterdam: Elsevier, 2012: 222-233.
[34] HUTCHINS E. Cognition in the wild[M]. Cambridge: MIT Press, 1995: 98.
[35] LIU Z C, NERSESSIAN N, STASKO J. Distributed cognition as a theoretical framework for information visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2008, 14(6): 1173-1180.
[36] LIU Z C, STASKO J T. Mental models, visual reasoning and interaction in information visualization: a top-down perspective[J]. IEEE Transactions on Visualization and Computer Graphics, 2010, 16(6): 999-1008.
[37] ENDERT A, RIBARSKY W, TURKAY C, et al. The state of the art in integrating machine learning into visual analytics[J]. Computer Graphics Forum, 2017, 36(8): 458-486.
[38] MAYR E, SMUC M, RISKU H. Many roads lead to Rome: mapping users’ problem-solving strategies[J]. Information Visualization, 2011, 10(3): 232-247.
[39] SIMON H A, HAYES J R. The understanding process: problem isomorphs[J]. Cognitive Psychology, 1976, 8(2): 165-190.
[40] HEGARTY-HAZEL E, PROSSER M. Relationship between students’ conceptual knowledge and study strategies-part 1: student learning in physics[J]. International Journal of Science Education, 1991, 13(3): 303-312.
[41] GICK M L, HOLYOAK K J. Analogical problem solving[J]. Cognitive Psychology, 1980, 12(3): 306-355.
[42] ERICSSON K A, SIMON H A. Thinking-aloud protocols as data[M]. Pittsburgh:Carnegie-Mellon University, Department of Psychology, 1979: 3-5.
[43] LARKIN J, MCDERMOTT J, SIMON D P, et al. Expert and novice performance in solving physics problems[J]. Science, 1980, 208(4450): 1335-1342.
[44] CHI M T H, OHLSSON S,The Cambridge handbook of thinking and reasoning[M]. New York: Cambridge University Press, 2005: 371-399.
[45] MAYR E, SCHREDER G, SMUC M, et al. Looking at the representations in our mind: measuring mental models of information visualizations[C]//Proceedings of the Beyond Time and Errors on Novel Evaluation Methods for Visualization - BELIV’16. New York: ACM Press, 2016: 96-103.
[46] LIU Z C, KERR B, DONTCHEVA M, et al. CoreFlow: extracting and visualizing branching patterns from event sequences[J]. Computer Graphics Forum, 2017, 36(3): 527-538.
[47] LIU Z C, WANG Y, DONTCHEVA M, et al. Patterns and sequences: interactive exploration of clickstreams to understand common visitor paths[J]. IEEE Transactions on Visualization and Computer Graphics, 2017, 23(1): 321-330.
[48] REDA K, JOHNSON A E, LEIGH J, et al. Evaluating user behavior and strategy during visual exploration[C]//Proceedings of the 5th Workshop on Beyond Time and Errors Novel Evaluation Methods for Visualization - BELIV’14. New York: ACM Press, 2014: 41-45.
[49] NHTSA. Fatality analysis reporting system[EB/OL]. (2019-06-20) [2020-01-14]. http://www.nhtsa.gov/FARS.
[50] CARD S K, MACKINLAY J D, SHNEIDERMAN B. Readings in information visualization: using vision to think[M]. San Francisco: Morgan Kaufmann, 1999: 189-193.
[51] FAYYAD U, PIATETSKY-SHAPIRO G, SMYTH P. From data mining to knowledge discovery in databases[J]. AI Magazine, 1996, 17(3): 37.
[52] KEIM D A, MANSMANN F, SCHNEIDEWIND J, et al. Visual analytics: scope and challenges[M]. Heidelberg: Springer Press, 2008: 76-90.
[53] SACHA D, STOFFEL A, STOFFEL F, et al. Knowledge generation model for visual analytics[J]. IEEE Transactions on Visualization and Computer Graphics, 2014, 20(12): 1604-1613.
Using problem-solving theories to investigate user behaviors in interactive visual analytics of complex information
ZHANG Hui-jun1,2, CHEN Jun-jie1, ZHANG Xiao-long3
(1. College of Information and Computer Science, Taiyuan University of Technology, Jinzhong Shanxi 030600, China; 2. College of Media Technology, Communication University of Shanxi, Jinzhong Shanxi 030600, China; 3. College of Information Sciences and Technology, Pennsylvania State University, University Park 16802, USA)
Recently, to address the challenges imposed by big data, research on interactive visualization and visual analytics, which is aimed at combining human intelligence and machine computational powers in data analysis, has become increasingly important. However, the design of complex-information-oriented interactive visualization and visual analytics systems still lacks effective cognitive foundations as a guidance. Existing frameworks or design guidelines, such as sense-making, focus largely on the external characteristics of analytical activities and offer little insight into fundamental cognition that underpins analytical behaviors. In this paper, we proposed a theoretical framework based on problem-solving theories to help explain the essential cognitive activities in interactive visual analytics, advocated an approach to understanding the visual analytics process as a process to solve ill-defined problems, and explored the impacts of problem representations and problem-solving strategies on visual analytics behaviors. We see our contribution as two-folded. Theoretically, we borrowed problem-solving theories from cognitive science to study complex interactive activities in visual analytics, and this approach may offer insight into the design of interactive systems involving complex information-analytical behaviors. Practically, we discussed the design and evaluation of visual analytics tools from the perspective of supporting problem-solving.
problem-solving; visual analytics; sense-making; problem representation; problem-solving strategy
TP 391
10.11996/JG.j.2095-302X.2020030325
A
2095-302X(2020)03-0325-10
2019-11-03;
2020-01-12
國(guó)家自然科學(xué)基金項(xiàng)目(61572344)
張慧軍(1985-),女,山西太原人,講師,博士研究生。主要研究方向?yàn)榭梢暦治觥-mail:zhanghuijun1985@126.com
張小龍(1969-),男,山西太原人,教授,博士。主要研究方向?yàn)槿藱C(jī)交互、可視分析等。E-mail:zxl_psu@foxmail.com