以用戶為中心的可視化數字圖書館評價框架研究

2017-08-10 20:06:18張劍

新世紀圖書館 2017年7期

張劍

摘要論文從可視化數字圖書館的定義和資源類型出發，剖析“以用戶為中心”的可視化數字圖書館評價的必要性，在總結前人研究的基礎上，融入跨領域的人機交互、數字圖書館和用戶界面等要素，歸納總結出一個以用戶為中心的可視化數字圖書館評價框架，希望能為圖書館工作提供參考。

關鍵詞可視化信息用戶數字圖書館

分類號 G250.76

DOI 10.16810/j.cnki.1672-514X.2017.07.014

Abstract This paper takes the definition of visualized digital library and the resource types as a starting point， analyzes the necessity of evaluating user-centered visualized digital library. Based on the view of predecessors' research， it combines the field of human-computer interaction， digital library and user interface elements etc， and sums up an evaluation framework of user-centered visualized digital library， hoping to provide some references for library work.Keywords Visualization. Information user. Digital library.

近些年，圖書館的館藏資源，尤其是數字資源海量增加，圖書館用戶如何有效地利用館藏資源成為眾多圖書館面臨的難題。一方面，用戶需要直觀、生動、簡潔的界面；另一方面，在有限的界面空間里需要充分展示龐大的數字資源的導航。這對圖書館工作提出了更高的要求。信息可視化為解決這些難題提供了良好的對策。信息可視化技術是一種非數值型資源的視覺呈現技術，它將數字資源以一種用戶易接受的方式進行展示，為用戶提供人工視野和空間感知，解釋信息之間的關聯，發現海量館藏資源中的潛在隱性知識，在認知層面組織和管理信息，提高用戶對信息的感知能力。目前，國內銀多圖書館開始重視可視化技術，并對館藏資源進行知識化、可視化建設，提供面向各類用戶的知識服務，但是在可視化資源建設與服務水平上卻無統一的評價標準和指標。對此，筆者提出“以用戶為中心”的可視化數字圖書館評價框架，以期為圖書館工作提供一些參考。

1 可視化數字圖書館

數字圖書館聯盟給出的數字圖書館定義是提供資源的組織，包括軟硬件、網絡與專業人員，以一致性、永久性的方式將數字化館藏進行選擇、組織、提供查詢、解釋、傳播與完整保存，以便于這些數字館藏可以迅速、經濟地提供給特定社區和用戶使用。數字圖書館研究領導小組人員使用5S（FS）框架來描述數字圖書館，分別是數據流（streams）、結構（structures）、空間（spaces）、情境（scenarios）和社區（societies）。因此，無論從那個角度來看，數字圖書館實質上都是“數字資源的集合”，目的在于為用戶感興趣的主題和領域提供信息訪問。

數字圖書館允許用戶通過界面對特定領域的信息進行多次循環交互，館藏范圍涵蓋不同領域，包括（但不限于）教育、醫學、護理、法律、音樂、娛樂、存檔新聞、文化遺產等。具體到可視化數字圖書館來說，就是通過交互式檢索系統，讓用戶能夠訪問和使用可視化數字信息（如圖像和視頻）。圖像館藏包括原生的或數字化的照片和其他數字圖形或圖像，這些圖像可以是各種不同訪問格式和尺寸（從縮略圖到全尺寸高分辨率）；視頻館藏是指可訪問和播放的視頻信息，包括完整的電影或節目、場景、基于聚合的片段和故事情節片段等。這兩類可視化資源可以與任何數字圖書館進行連接，多次呈現在檢索系統中。

2 數字圖書館可視化資源

筆者通過對國內外數字圖書館可視化項目進行調研，發現圖書館界可視化的數據源主要以全文數據庫、OPAC資源、論文數據庫為主，通常以矩形圖、網絡圖、表格、樹狀圖、餅圖等可視化形式顯示，可視化特征以大小、位置、面積、顏色等來表示，一般用于用戶提問構建和檢索結果展示居多。數字圖書館中可以應用的可視化技術資料類型主要有以下四種。

2.1 圖書館資源覆蓋范圍概覽

圖書館館藏資源覆蓋范圍、目錄或結構，很難通過文字來進行描述，用戶難以準確有效地進行提問。可視化以圖形方式、顏色差異等對資源集合的構成成分進行概括性揭示，提高了用戶感官上對資源的了解，幫助用戶進行瀏覽。此外，豐富的交互功能讓用戶能夠基于所展示的信息對資源進行進一步的探索性操作，可大大擴展用戶的知識視野，并提升館藏資源的利用率[1]。

2.2 用戶提問的可視化

讓用戶更加清楚提問詞范圍，更好地進行定位，幫助用戶更恰當地進行選擇，預覽并優化提問。如Visual Thesaurus[2]可視化英語詞典，以網狀圖的方式顯示與提問詞相關的其他詞（同義或反義詞），界面右方則有所選詞匯的各種意思解釋，并且提供發音功能。

2.3 檢索結果的可視化

用戶通過圖形界面與網絡信息檢索系統進行交互，對檢索結果進行多角度分析，優化提問或查詢。可視化檢索結果遠比文字呈現的分類維度直觀，能夠有效地幫助用戶鑒別其組成部分，理解資源之間的關聯，探索并挖掘其自身的潛在信息需求。

2.4 用戶與數字資源交互行為的可視化

用戶與數字資源交互行為的可視化基于對用戶在線行為數據的采集，包括用戶對檢索結果頁面的每一次訪問、點擊、瀏覽及其他細粒度行為，用來評估數字資源的利用率及導航系統的效率，還可以對用戶行為進行分析，從而提供更好的信息服務[3]。

3 可視化數字圖書館評價的必要性

可視化數字圖書館的評估是多層次的。從實踐層面來說，比較典型的是TREC視頻檢索評估（TRECVid）和ImageCLEF圖像檢索。TRECVid評估嘗試對真實世界場景或者這些場景中的重要組件任務進行建模，通過開放的、基于度量的評估，來提升針對數字視頻的內容分析和檢索技術，被譽為評估可視化信息處理和檢索的新方法。ImageCLEF致力于為圖片提供一個基準（檢索、分類、標注等），它可為特定的任務（從圖像處理到圖像注釋等）創建特定數據集和評價措施，在無人參與的情況下從注釋圖像列表自動選擇圖像分析和概念。從應用層面來說，可視化數字圖書館的評估主要是對數字館藏和數字圖書館的應用進行評估，以及對系統性能的測試，包括響應時間和準確度、用戶的交互、認知和圖書館滿意度等。可擴展應用程序或人際交互評價指標主要是效率、效果和滿意度。

這些評估標準和指標雖然領先其他領域，但是從近些年的技術發展和用戶需求現狀來看，以用戶為中心的評價標準和模式是可視化數字圖書館研究與發展的下一階段，主要目標是對所開發出的信息系統進行評估。然而這也將引發一系列的問題：開發人員或圖書館員在哪里及如何評估可視化數字圖書館？最初的評估策略是什么策略，又是基于什么？圖書館員如何決定哪些標準對用戶來說是重要的？

目前，以用戶為中心的數字圖書館研究方法是具體到特定館藏、數據化項目和用戶組，但會反過來限制其他研究項目適用性，而可視化數字圖書館以用戶為中心的研究尚無一般化的評估。

在用戶尋找、發現、使用和與信息的交互中，可視化信息資源會產生巨大的變化。已證實用戶在給定的情形下進行可視化信息檢索時，會通過交互式會話高效地掃描大量代理。因此，除了數字圖書館其他類型（如文本）的評估之外，應該單獨評估接口、功能和用戶，因為他們屬于不同類型的館藏和視覺信息。

另外，知識環境下要求圖書館必須堅持以用戶為中心的服務理念，評價可視化信息檢索系統應通過標準化協議、便于實驗使用的公共數據集、任務定義和以系統為中心的檢索主題。

4 以用戶為中心的可視化數字圖書館評估框架

由于可視化數字圖書館的評估缺乏綜合性指標，故筆者在前人研究的基礎上，融入跨領域的人機交互、數字圖書館和用戶界面等要素，提出以用戶為中心的可視化數字圖書館評價指標，用于指導相關工作。

4.1 目標及動機

以用戶為中心的可視化數字圖書館評估框架設計目標主要有四點。一是形成一個基于單個項目需要，且適用于以用戶為中心的可視化數字圖書館的評估框架。二是確定并提出重要的、有影響力的和潛在的交叉重疊實驗因素，保證評估作為可視化數字圖書館評估框架的一部分。三是提供不同方法的具體實例，包括數據收集和分析，用于研究評價用戶和可視化數字圖書館應用情況。四是為未來以用戶為中心的數字圖書館研究提供指導。

實現上述目標將有助于研究人員更好地理解視覺數字館及與用戶的交互（如用戶界面），以科學有效的標準形式來進行評估。

4.2 以用戶為中心的評價框架

筆者從合成可視化數字圖書館研究中開發出了一個評估框架[4]。圖1顯示了框架的基本組成構件：用戶、交互、系統、領域、主題，組成框架的具體策略和方法可見表1。框架中不同評價組件之間的重疊將會得到很好的解決。

4.2.1 用戶

用戶是可視化數字圖書館評估框架的一個至關重要的組件，詳見表1。由于數字圖書館是交互式檢索工具，因此有必要進行面向特定用戶和以用戶為中心的分析。可視化數字圖書館是由不同的交互系統組成的，因此，支持檢索、瀏覽和可視化信息的評估是衡量用戶專業知識和技術水平的一項重要內容。美國學者威爾金斯[5]在2009年指導36個用戶憑經驗進行檢索，跨越多個位置來證明如何提高搜索和檢索效率，結果發現在系統的高級檢索中，新老用戶差別很大。因此，可視化數字圖書館對用戶的分析評估需要在特定的情境下進行。有關用戶背景或前期經驗的數據可以參照表1制定調查問卷進行收集。

②定量分析通常是指統計證據和對某些措施的觀察，如用戶交互、縮放比例和意見等；定性分析是指用戶的某些想法、執行操作情況及原因等

4.2.2 交互

交互是可視化數字圖書館評估框架的重要組成部分，是數字圖書館與其他檢索工具交互的基礎。可視化數字圖書館的交互評估應該考慮系統和用戶界面如何調整用戶行為。用戶交互評估可以由正在執行的操作進行，包括但不限于頻率和類型的搜索、瀏覽和來自系統的其他請求。可視化數字圖書館評估涵蓋各種交互技術手段，包括不同類型的文本檢索，如字段檢索或視頻記錄全文檢索等，具體到操作而言，可以按顏色、形狀、特性和紋理等來進行檢索。

瀏覽是掃描數字可視化信息的一個重要交互技術，它是最常見的交互，在豐富的可視化（如縮略圖或關鍵格）環境下，高效可視化瀏覽是非常重要的。可視化數字圖書館的用戶，尤其是目的明確的用戶，通過不同的可視化代理，可以瀏覽大量的館藏資源并返回搜索結果列表。

此外，可視化數字圖書館的評估需要測定不同交互預期，包括搜索和瀏覽行為，以及其他如選擇、保存、布局和現實配置和反饋等方法。

4.2.3 系統

系統是評估框架的另外一個主要組成部分。可視化數字圖書館應有高效的、令用戶滿意的、基于提問的檢索結果。其包括檢索特定可視化信息的功能，一般情況下，系統和檢索效率可以通過多種方式來評價，如響應速度和精準度。使用調查問卷來收集有關可視化數字圖書館有效性方面的數據（見表1），可通過用戶對系統的整體效率和檢索性能來判斷分析跨不同任務的、不同類型或類別的檢索主題。

4.2.4 多成分的評估

（1）用戶-交互。在評估框架組件中，用戶與交互之間有明顯的重疊。用戶是與數字圖書館相互作用的，因此有關交互的評估離不開用戶。在數字圖書館環境下用戶的信息需求可能更為詳細和精確，這些需求一般是基于特定領域知識和類似經驗的集合，因此不同用戶，其交互也不同。美國學者韋斯特曼調查不同領域專家的交互，將用戶分為“專業人士”和“非專業人士”，發現大多數專業人士在搜索時更頻繁地使用以視覺為導向的搜索功能，如顏色；而非專業人士則青睞于瀏覽和視覺掃描的集合。同時，非專業人士傾向于改變他們的交互方式與方向，專業人士則不斷優化其查詢[6]。

（2）用戶-系統。用戶與數字圖書館系統結合的評估見表1。這種評估不僅評價系統與用戶結合的有效性，還包括以用戶為中心的界面特性、設計和布局及一個數字圖書館的各方面組織。在這里，評估系統主要評價其為預期用戶和數字圖書館開發出的適當的情境和域的有效性。更具體地說，可用性和可學習性評估成為框架組件評估的重點，可用性是數字圖書館最重要的屬性，評估可視化數字圖書館的可用性包括效率、有效性和滿意度。

（3）交互-系統。交互-系統評價的程度依賴于與數字圖書館檢索過程交互的有效性，即在恰當的時間恰當的步驟和情況下可獲取的可視化信息或資源，簡而言之是“可視化數字圖書館的數據獲取效率”，通常通過系統事物處理或系統日志來評價其有效性，包括檢索會話的持續時間、訪問頻率、用戶瀏覽檢索結果集合大小。

（4）用戶、交互和系統。主要檢查用戶群組在完成檢索主題和一個信息任務時，如何與給定的可視化數字圖書館進行交互。用戶對圖像需求熟悉程度與檢索策略和任務等都是相互關聯的。視頻也成為類似評估的情境，用戶的知識會影響交互（包括可視化檢索使用），將產生更高層次的主題檢索。

4.2.5 領域和主題

領域和主題組成了評價框架的基本組件。很多時候，這些因素并不是相互排斥的，可視化需求與檢索主題應與數字圖書館的領域或情境相吻合。

用戶、交互和系統都對檢索主題的結構和構成有直接或間接的影響。可視化主題可以組成各種各樣的需求，包括基于內容的需求、文本需求、語義視覺需求、抽象視覺需求（如恐懼和憤怒）等。基于現實和多樣化信息需求來評價可視化數字圖書館是有價值的，它可以影響到數字圖書館的其他評價。

評價可視化數字圖書館不同類別的檢索主題，主要基于以下要素：步驟或請求的數量（即單個和多個）；語義和抽象；不同的特征，如視覺、文本或混合需求；不同組合的需求（例如分步語義可視需求）。通常任務越具體，用戶查全率越高。

此外，不同用戶交互檢索結果可能橫跨不同主題類型，如查詢模型和轉換。因此，評價可視化數字圖書館要考慮不同類型的可視化資源是否可以實現跨范圍的檢索，這對系統檢索主題設計將提出更高要求[7]。

領域的不同會影響檢索主題或信息需求。有些領域（如藝術，藝術史、新聞攝影等）的專家或專業人士的工作非常依賴視覺資源類型，藝術史領域的數字資源及系統充分展示出了可視化檢索評價的潛力。然而，這些特殊性并不代表可視化評價方式適應于其他領域，或是所有其他可視化數字圖書館。例如一個未經刪減的視頻是可視化館藏，但其所包含的信息（如一個人的頭部特寫）可能無法保證對具有相同特點的藝術歷史去進行評價；對關于口述歷史的視頻館藏，很可能重點放在講述這個故事上。另外，許多數字圖書館的研究指出了通過快速高效的方式瀏覽可視化館藏的重要性，如利用縮略圖進行瀏覽。有學者指出“單點的一個小時長的單人說話視頻”和“單點的情節串聯圖板沒有任何導航價值”，即評價一個可視化數字圖書館需要根據領域、任務和館藏性質來進行。

5 結語

可視化技術引進數字圖書館已經成為一種必然，大多數用戶已經適應并專注于用可視化方式瀏覽和檢索數字圖書館的資源，因此如何對可視化數字圖書館進行評價將成為業內關注的焦點，筆者所提出的可視化數字圖書館評價框架能促使研究人員和開發人員從用戶的角度來研發可視化資源，從而保證用戶使用所熟悉的可視化內容搜索、瀏覽和優化查詢，提高資源的利用率和用戶滿意度，為國內圖書館提供一些參考。