亞太數字圖書館國際會議(International Conference on Asia-Pacific Digital Libraries,ICADL)是以數字圖書館為研究主題的著名國際學術會議[1],目前已成長為以亞太地區為陣地,受世界關注的國際圖情學術會議[2-3]。一年一度的ICADL不僅有中國、日本、韓國、新加坡、澳大利亞、新西蘭等重要的亞太地區國家的學者參與,還吸引了美國、英國、德國、法國、瑞士、加拿大等歐美國家圖情學者的關注。我國學者也積極參與和舉辦ICADL會議,ICADL 2011曾由清華大學成功主辦,北京大學和中國國家圖書館協辦[4]。亞太地區是我國推行“一帶一路”戰略的重要區域,在經濟、文化、教育、科研等方面,亞太無疑是當今全球最具活力的地區之一。在此背景下,國內研究者保持對ICADL的關注有利于掌握亞太其他國家和地區學者們的研究進展和動向,為促進圖情學科交流,擴大中國圖情學科的區域影響力提供參考。
第19屆ICADL會議(以下簡稱ICADL 2017)于2017年11月13-15日,在泰國曼谷由泰國朱拉隆功大學藝術學院圖書館學系(Department of Library Science,Faculty of Arts,Chulalongkorn University)成功主辦,瑞士盧加諾大學(University of Lugano,Switzerland)、新西蘭懷卡托大學(University of Waikato,New Zealand)、泰國國家電子與計算機技術中心(National Electronics and Computer Technology Center,Thailand)協辦,指導委員會主席由來自日本筑波大學(University of Tsukuba,Japan)的杉本重雄(Shigeo Sugimoto)教授擔任。
隨著數字情境下的信息技術發展,用戶的學習與生活方式不斷發生變遷,數字圖書館也需不斷變革以滿足用戶多元化的信息需求。在此背景下,本屆ICADL會議以“數字生活情境下的數據、信息和知識”為主題,共收錄21篇長論文和5篇短論文。會議按主題劃分為自動分類與推薦、數據共享與檢索、詞匯與話語分析、移動應用、搜尋結果呈現與可視化、社交媒體、用戶行為、文化遺產與原住民知識等8個主題分會。通過分析會議論文的內容與特點,本文對ICADL 2017會議集進行述評,在總結研究方法、研究對象、研究主題基礎上,結合相關主題的其他文獻進行適當補充,以呈現目前數字圖書館領域的研究熱點。
為反映ICADL的發展趨勢,本文對近3年ICADL會議集收錄的論文作者國家分布進行描述性統計,如表1所示。ICADL近3年共收到來自全球5大洲超過30個國家和地區的科研人員提交論文,有21個國家的科研人員參會交流[5-7]。論文作者前三的國家分別是日本、新加坡、美國與泰國(并列),我國作者人數位列第五。可以看出,ICADL的輻射面逐年擴大,來自歐洲與大洋洲的研究人員占比逐年增加。

表1 近3年ICADL作者國家分布(總計)
數字圖書館的核心業務是針對種類眾多的數字資源進行組織和管理,隨著大數據環境下數字資源增長,當前的分類與推薦方法已不能適應多種類型數字資源。專利分類亦是如此,傳統以手工為主的分類策略已不能滿足現實需求。圖情領域的自動分類與推薦主要涉及圖書館書目推薦、數字文本自動分類中的特征語義關聯與加權方案、用戶推薦系統等。ICADL 2017很好地反映了這些趨勢,重點聚焦于數字圖書館用戶應答、專利自動分類等方面的算法優化與設計。
為優化數字圖書館的信息檢索算法,精準定位用戶信息需求。Pinto等[8]介紹了數字圖書館如何解決“基于陳述的搜索式”這一新問題。基于陳述搜索式需要識別科學文獻中的一個關鍵部分:知識陳述(Knowledge Claim,KC)。當前知識陳述隱藏在文獻中的非結構化與自由文本表達中。Pinto等認為,知識陳述是指包含了一篇論文主要研究貢獻的語句,并且知識陳述還能夠表示一個特定領域內受關注實體之間的關聯,能夠用于解決數字圖書館中基于陳述的搜索。該研究以一種非指導性的新方法整合了嵌入在知識陳述中的中性詞和基于圖書的算法,從而分析如何識別知識陳述以用于接下來的信息抽取。Pinto等以醫學領域為研究對象,選取PubMed數據庫中的真實詞匯作為實驗數據,證實了方法的有效性。該研究實現了基于陳述搜索式對文檔排名的功能,為相關研究者在優化數字圖書館搜索系統性能方面提供了較為新穎的思路方法。
專利作為體現技術與創新的關鍵智力資源,如何實現專利信息的有效獲取是研究人員乃至產業界亟需解決的難題。當前最廣泛使用的專利分類體系是國際專利分類(International Patent Classification,IPC)體系。Nugroho等[9]指出IPC體系還存在專利被授予多個分類號、專利類別相似度高等問題,當前專利審查員主要基于手工分類,較少利用機器進行專利自動分類。Nugroho等提出利用專利引文圖譜結構,能夠優化專利的自動分類,實現專利信息的有效獲取。研究分析了僅使用單一文本特征的影響作用,該文本特征是基于識別任務引用圖譜的專利類。研究結合了kernel-based方法來構建可以呈現引文相關信息特征的kernel函數,使用k-step隨機函數來計算每個專利對支持向量機的分類任務,利用子圖技術來表現專利知識圖譜在引文方面的信息。該研究是基于圖論中相鄰算法的思想,而對算法的評價是基于美國專利與貿易局的相關實證數據,結果顯示該研究算法優于之前相關研究提出的方法,專注于使用專利引用圖結構,提出將大型專利圖表示為代表引用圖的信息技術,為解決專利信息獲取提供了新思路。
過去數字圖書館中貯藏的科學文獻主要依靠助記碼和元數據來進行檢索。Safder等[10]指出當前搜索引擎還局限于文本的簡單描述,無法提供特定算法信息用于呈現運行時間復雜度、性能評估(如準確性、召回率等)、處理數據庫容量的大小等內容。Safder等介紹了挖掘這些特定信息的算法并用于實際檢驗,利用遞歸卷積神經網絡模型,研究將文獻中包含的相應效能信息通過算法進行抽取和挖掘。通過對數據庫中人工收集的258篇文獻進行測試,結果顯示76.35%的準確性,研究證實了該優化算法的可用性。未來研究可探索提取其他特定算法元數據的可能性,如運行時復雜性,輸入、輸出和兼容的數據結構。
除關鍵詞或書目檢索外,可供選擇的文獻檢索途徑是數字圖書館的成功因素之一。特別是在科學領域,化學物質、基因或數學公式等實體可能起著核心作用。Wawrzinek等[11]指出對于界限清晰的實體來說,在情境相似性和排名上的要求會有所不同。研究展示了在科學語料庫中使用的深度學習技術如何對實體進行具體的情境化描述。Wawrzinek等以分子生物學領域的實體為例,闡釋實體的學習情境和主頁如何反映它們的實際作用和可能的新應用,如藥物設計和再生產。評估結果表明,該方法相對于昂貴的人工判定分類更具優勢,但由于實驗僅依靠文本內容的深入嵌入,方法有效性有待其他領域應用的檢驗。上述研究創新了數字圖書館中特定學科領域的文獻分類與檢索模式。
科學數據是指通過科研活動等方式得到的反映客觀世界的原始數據,或依據不同科研活動需要,進行整理加工的各類數據集。雖然科學數據能夠為科學研究帶來巨大的投資回報,但前提是科學數據能在研究人員間實現良好的共享,并提供便捷的數據檢索以供研究。ICADL 2017主要關注不同類型的數據檢索,以及研究人員的態度對數據共享的影響。
目前大部分研究出版物(文本)與研究數據(數據集)使用相同的搜索引擎。Bugaje等[12]指出研究數據集中的用戶交互特征形式與研究出版物具有顯著差異,當前搜索引擎不適合作為數據檢索和使用的長期解決方案。Bugaje等通過系統實驗論證了研究出版物(主要是文本)檢索和研究數據(即數據集)之間的根本差異,包括服務器載荷、文件類型、大小和格式等方面的差異,證明了建立更高效數據檢索系統的必要性。該研究有助于以用戶為中心的、面向學科的數據檢索服務的實現,同時有助于數字圖書館領域綠色信息服務的實現。
世界各地的政府和資金機構已經主張研究數據的開放存取(Open Access,OA)。Chowdhury等[13]強調OA可帶來顯著的社會與經濟效益,但是研究人員對于是否想要以及準備分享其研究數據仍存在困惑。為此,Chowdhury等對英國、法國和土耳其3個國家的大學研究人員進行調查,發現研究人員對OA存在擔憂,主要是缺乏對數據公開使用和訪問要求的理解。研究指出應對OA政策加強宣傳力度,促使OA的愿景成為現實。該研究表明研究人員在研究數據創建和共享方面的看法與行為之間存在著較大的現實差距,并強調了學術與資助機構對OA所做的貢獻。基于這項調查,后續研究可以對相關數據開放政策進行針對性的探討,從而為構建OA的良好環境奠定基礎。
目前圖書情報領域在自然語言處理方面的研究集中在算法及技術上的抽取和機器學習。詞匯分析方面的研究大多從語言學角度出發,統計分析的指標主要是詞匯頻率、詞匯密度、詞匯長度及詞匯增長率,而自動問答與自動摘要等自動語篇生成系統也是自然語言處理與人工智能的主要研究主題。當前文本挖掘的相關研究粒度正在逐漸細化,語義關系、情感分析等主題是當前研究熱點。ICADL 2017主要聚焦于自動預測、應答和提取等相關技術的實現,以及用戶行為模式的識別。
每一個作者都有其獨特的寫作風格,包括選詞、句長、詞頻和虛詞等。Hassan等[14]指出,通過深度學習,根據文本語義與語法特征能夠實現作者歸屬的自動預測。Hassan等以PLoS數據庫作為研究平臺,獲取了158,918篇文獻,從中選取203位作者撰寫的803篇文獻作為研究對象,使用基于長短期記憶(Long Short-Term Memory,LSTM)的深度學習模型來預測作者歸屬。結果顯示,88.17%的作者歸類正確,熵誤差最大為0.2。未來研究可結合著作者、作者所屬、主題領域、期刊標題、城市、參考文獻和關鍵詞等指標改進該深度學習模型。
在線問答社區用戶規模的迅速擴大使面向問答的自動應答技術日益得到關注。Tagami等[15]指出在線問答(Question Answering,QA)可分為事實型與非事實型,但是當前自動應答技術仍無法處理考試等事實型的QA問題。為了滿足用戶需求,Tagami等提出了一個基于入學考試填詞問題的QA方法并將其運用到世界歷史考題中。在分析問題時,根據填空的周圍詞匯來估計答案類別,用于提取候選答案。此外,通過引入與周圍詞匯類別和情境一致的指標來評估候選答案。該研究通過與基線方法進行比較,提升了自動應答技術中答案預測的精度。
知識單元間的關系是進行知識重組、知識關聯和知識挖掘的基礎。關系抽取在信息檢索、問答系統和知識組織中有著廣泛的應用。Wu等[16]認為知識可以表示為兩個實體之間的關系,兩個實體之間的影響關系表現了一個實體對另一個實體的影響,但是這些影響關系是否跨領域相似還有待檢驗。Wu等考察了實體間的影響關系在不同領域中是否相似,研究如何使用現有技術從結構化文檔中提取影響關系。基于此研究問題,研究者收集處理了醫學、國際關系和環境科學三個領域中的實體影響關系。結果顯示,影響關系在3個領域的語義關系中占較大比例,3個領域共享一套共同的影響關系,每兩個領域之間都具有相當數量的共同影響關系。該研究有助于在提取非結構化文檔影響關系的過程中使用現有技術。
隨著文本挖掘研究的粒度逐漸細化,用戶生成內容的語篇特點也引起圖情界的關注。Yada等[17]強調社交媒體上的現有研究主要集中在賬戶社交網絡(即關注者和追隨者關系等)和推文(即回復和喜好)以及主題轉換(即主題趨勢檢測等),并且情緒是所有類型研究的關注重點,而當前鮮有研究分析不同帳戶或帳戶類型Twitter的話語特征。Yada等測量了Twitter序列的語篇規模,并觀察其特點。研究選取240個日本的Twitter帳戶,收集每個帳戶的3000條推文。通過話語量表計算應用于每個Twitter賬戶的前50個話語關鍵詞。結果顯示,無論用戶的興趣如何,每隔大約15條推文用戶都會提及他們的興趣。通過檢查社交媒體中的關鍵詞類型和主題頻次,能夠對用戶特征進行細分。
圖書情報領域在信息搜尋結果呈現方面的研究集中在算法與技術的優化和個性化結果的呈現。對圖書館數字資源的信息單元與信息組織方式進行可視化建設,能夠運用信息與數據的可視化語言表達揭示抽象的數據,優化信息搜尋結果的呈現,為各類資源或數據庫提供更直接的使用入口,增強平臺的可操作性與用戶粘性。ICADL 2017此次關注學術搜尋結果的呈現和搜索系統的改進。
解決信息需求和服務的個性化問題,提供個性化信息服務,是目前數字圖書館研究的重點與方向。Hagiwara等[18]強調了標題和摘要在選擇相關文獻時的重要性,并且也是決策制定的核心參考依據。Hagiwara等利用觀察法分析研究人員如何從學術數據庫的搜尋結果中選擇文獻,主要探究研究人員會對搜尋結果中的哪些元素進行檢查,并以何種方式進行排序。研究結果可用于改進數字圖書館的個性化信息服務。此外,Bainbridge等[19]指出數字圖書館中的元數據錯誤在學術文獻集合中已普遍存在,導致用戶在數字圖書館中檢索自己已刊登的文獻時遇到問題。為了解決這一問題,Bainbridge等提出了MEDDLE概念驗證系統,用以解決數字圖書館的此類搜索問題。同時,還提出可以向數字圖書館服務商提供已確定的問題及解決方法,以便進一步改進系統,典型的案例便是MEDDLE識別與處理重音、連字等,這都有助于數字圖書館的優化。
在搜索系統的改進方面,國際圖聯書目記錄功能要求(Functional Requirements for Bibliographical Records,FRBR)中定義的書目實體模型表明了從數字卡片目錄到以實體為中心的目錄。Aalberg等[20]指出雖然以實體為中心的目錄含有豐富實體結構和明確定義語義關系,但是如何更好地搜索和呈現這種以實體為中心的書目數據仍存在挑戰。Aalberg等提出了一個以實體為中心的搜索系統,以及一種全新的以實體為中心的文獻搜索結果呈現的評價方法。由于包含實體數量的不同,基于詞頻的默認排名在對片段進行索引時存在困難,未來研究可以探究結果排名。
探究查詢中兩個實體之間的可能關聯是檢索系統優化的難題。Pinto等[21]強調數字圖書館滿足信息需求的核心功能是提供文獻利用等方面的搜索功能,由于用戶決策的潛在影響,向查詢的用戶提供高質量的結果至關重要。Pinto等對檢索結果進行多樣化處理,并重新排列結果列表,通過論文聲明的使用以實現結果集的多樣性。該研究主要探究醫學領域實體間關聯的聲明,專注于涉及兩個實體的查詢問題。研究通過查詢PubMed獲得的語料庫來實證評估該研究提出的解決方案。結果表明,研究提出的論文聲明概念可用于優化檢索結果,未來研究可結合用戶反饋來優化本研究方法。
針對移動應用的研究主要集中在兩方面,一方面是對應用功能特點的改進,另一方面是以此為平臺研究用戶行為的特點。把握用戶的需求偏好及其行為趨勢,能有效支持個性化推薦,優化移動應用的產品和服務,從而顯著地提高社交媒體中用戶的個人體驗和用戶粘度。ICADL 2017主要關注用戶信息需求預測、用戶移動應用的使用與分享行為。
隨著移動APP的快速發展,移動設備已從單純的通信工具轉變為滿足個性化需求的途徑。Bahrainian等[22]強調APP組織可作為個人信息管理方式,即在正確的時間訪問正確的APP,或重新安排應用APP,以便更容易訪問APP。上述模式的實現可依據實時信息檢索(Just-In-Time Information Retrieval,JITIR),例如預測用戶將要使用的下一個APP,并在用戶嘗試訪問之前將其顯示在主屏幕中。為此,Bahrainian等提出新型預測方法,根據用戶智能手機中記錄的活動記錄和情境,預測用戶在不同時間和特定情境下的活動。根據預測結果個性化地組織手機上的內容。該研究設計的時間模型能在連續的時間片段上捕捉用戶的本地行為模式。同時,基于APP應用數據集的實驗結果證明了該預測方法的有效性,其效率超過了最新的奇異值分解(Singular Value Decomposition,SVD)和作者主題模型(Author Topic Model,ATM)。未來研究可分析與評估用戶和智能手機APP間的交互內容,以便設計能夠及時檢索用戶信息需求的模型。
智能手機以移動應用的形式提供功能和傳遞內容,更多用戶開始傾向于使用移動應用進行線上學習。Hinze等[23]指出移動學習被認為是未來人們學習的主要方式,在高等教育中,移動應用在收集處理信息、訪問內容、促進交流協作等方面具有極大的靈活性。為了解學者對移動應用的使用情況,Hinze等進行了在線調研。在受訪者中,有三分之二使用移動APP進行學術研究。在教學工作中,移動APP被用作向學生推送信息的手段。在學術研究中,移動APP被用作自我組織、與同事合作、存儲信息或與研究保持同步的工具。此項研究能夠為教育背景下的個人信息管理和高校圖書館服務提供積極借鑒。當前,在學術實踐中如何利用移動APP以滿足學術用途與潛在的用戶需求是新的研究熱點,移動APP的使用是數字素養的重要組成部分,在改變教學和研究實踐方面擁有潛力。
如今眾包和游戲融合的趨勢,引發了一系列眾包游戲的興起。圖書館項目利用這類游戲獲取地理參考元數據并開展相關研究。Pe-Than等[24]強調相較于傳統方法,眾包能以更加高效與廉價的方式生成內容,如圖像標記、語料庫注釋、語言翻譯、地理參考數據和元數據創建,但是用戶動機是驅動眾包的核心影響因素。為了更深切了解眾包游戲機制中的用戶參與動機,Pe-Than等分析了游戲中的協作和競爭如何影響玩家分享移動內容的動機。該研究分別使用非游戲應用程序和兩個虛擬寵物主題游戲進行實驗。結果表明,眾包游戲可以給用戶帶來更高水平的享受、沉浸和社交體驗。此外,不同的協作競爭類游戲在用戶成就、休閑、任務效率和技能發展方面帶來的體驗也有所不同。未來研究可探究更多的游戲機制對用戶動機的影響差異,同時考慮到游戲之間的機制差異,可檢查機制差異能否吸引不同興趣偏好的用戶。
針對社交媒體的研究主要包括社交媒體中用戶關系研究、用戶生成內容研究、用戶行為研究、用戶滿意與接受度研究等。此外,社交媒體閱讀推廣、社交媒體輿情、社交媒體謠言等主題也成為圖情領域新的研究點。ICADL 2017主要關注特定情境下的社交媒體信息行為、社交媒體謠言,以及社交媒體信息的自動檢測,分別涉及社交媒體的“用戶—內容—平臺”三個層面。
當前社交媒體研究開始細化,更多研究者開始關注特定情境下的社交媒體信息行為研究。Dodd等[25]強調了探究社交媒體上的行為方式(即溝通、訪問和分享信息等行為)的重要性,但是社交媒體上的信息交流也會導致數字鴻溝,并非所有用戶都能及時平等地獲取信息。Dodd等研究了大學入學背景下的青少年社交媒體信息行為。作者以Twitter為研究對象,采用詞頻分析來處理一個大樣本(n=494,180)的Twitter數據,以確定社交媒體信息交流中的主要參與者。通過分析入學過程的不同階段中青少年的主要交流對象,指出在大學入學等特定情境下,青少年在社交媒體上的交流量與其生活方式顯著相關。同時,研究指出雖然青少年在社交媒體上與教育機構進行交流的意愿較低,但是其主要交流對象依然是學校。該研究通過詞頻統計探究了大學入學情境下年輕人的信息行為,這為特定情境下信息行為的研究提供了新思路。
社交媒體是傳播信息最快的平臺之一,但同時也被用作傳播謠言。辟謠信息是指用作駁斥謠言的消息,是減少謠言傳播的重要手段。Goh等[26]指出網絡謠言會對發布準確信息的社交媒體平臺產生負面影響,損害個人和組織的聲譽并降低社會凝聚力,對于謠言與辟謠信息的研究迫在眉睫。Goh等對社交媒體中的謠言與辟謠信息進行了分析,主要探究Twitter中產生的謠言與辟謠信息的類型。研究以某國領導人的錯誤報導為對象,對關于某國領導人死亡的4321條Twitter消息進行了內容分析;結果顯示共有六類謠言信息、四類辟謠信息以及兩類其他類型消息。研究結論指出辟謠信息較謠言數量更多,在線用戶確實試圖通過辟謠信息來阻止謠言的傳播。同時,該研究也存在一些局限性,如僅檢查了Twitter上的謠言傳播,不同社交媒體(Facebook、微博等)上的謠言傳播可能具有差異性。同時,謠言的類型也會影響謠言的傳播機理,未來研究可對比自然災害、生理健康、政治事件等方面謠言傳播的特征。
社交網絡使用戶可以進行實時信息交互,在泰國,包括青少年在內的社交網絡用戶達數百萬。Tuarob等[27]指出社交媒體的口語屬性鼓勵了某些不符合標準的語言表達,其中一些被認為是辱罵和冒犯性語言,對社交媒體語言的自動檢測能夠規范網絡用戶,營造文明的社交媒體交流環境。相較于英語等語言,泰語等小語種還缺乏有效的濫用語言自動化篩選工具。Tuarob等研究了社交媒體中泰語濫用的自動檢測,社交媒體中的泰語使用者越來越習慣性地使用不禮貌的語言風格。作者指出如果辱罵性的語言在沒有得到適當指導的情況下暴露給青少年,青少年可能會習慣于不文明語言風格的使用。為解決上述問題,作者提出了一套基于機器學習的算法,在社交網絡中自動檢測濫用泰語。經檢測,該算法的最高收益率為86%(精確率為88.73%,召回率為83.53%)。未來研究可通過不同社交媒體上的數據集來測試算法準確率,并可嘗試使用不同語言的語法結構來提高分類效果。
數字化技術的革新推動用戶行為模式產生顯著變化,在新技術環境下探究用戶行為成為如今重要的研究趨勢。用戶行為主要涵蓋用戶行為理論、用戶行為模式、用戶行為影響因素等,研究熱點包含用戶協同行為、搜尋行為、健康信息行為等主題。ICADL 2017主要關注信息檢索行為、音樂信息行為、健康信息交流模式以及視頻信息搜尋,囊括了國外用戶行為領域的研究前沿。對于音樂、健康與視頻等方面的用戶行為研究,國內尚處起步階段。
用戶信息行為研究是圖書情報學的核心領域之一,其中用戶信息搜尋行為的研究尤其受到重視。近年來學者們開始關注情緒在搜索過程中的重要作用。Choemprayong等[28]認為由于搜索策略涉及時間短,并且搜索期間用戶的情緒狀態不斷變化,因此,探究搜索階段的情緒狀態轉變比關注某種情緒狀態更為合適。Choemprayong等探究搜索策略對Google使用時情緒轉變的影響。研究以本科生為研究對象,來自曼谷兩所大型公立大學的38名泰國本科生被要求使用Google執行3項搜索任務。基于史密斯的互聯網搜索策略模型,采用半結構式訪談和直接觀察法分析參與者的搜索策略。結果表明:評價策略與情緒轉換呈正相關,而文件結構策略、搜索成功率、任務難度與搜索過程中的情緒轉換呈負相關。基于該研究,未來研究可擴展到情緒元素在信息搜索中的理解,例如,本研究在很大程度上依賴于觀察情緒狀態的自我報告,不同的觀察技術(面部表情、語音語調或心電圖)可以幫助驗證結果。
音樂流媒體服務的出現、分布式采集方案的應用以及其他常見音樂資源的易逝性促使了個人音樂收藏行為的產生。圍繞音樂信息的需求表達、搜尋、管理和分享等信息行為已成為用戶日常信息行為的重要內容之一,Cunningham等[29]指出存儲的音樂信息涉及音樂作者信息、音樂類別等描述性元數據。Cunningham等研究了用戶音樂收藏行為,重點關注音樂媒體和格式、收集組織方案以及音樂獲取和使用的方法。研究通過對28份自動民族志數據的分析,指出用戶更多地使用音樂流媒體和云存儲服務,制定個性化的音樂列表,同時進行元數據級別的備份工作以保障音樂的可用性。用戶音樂信息行為是國外用戶研究的關注熱點,主要探究用戶音樂信息需求與表達和音樂信息搜尋行為。當前國內圖情領域較少涉及,未來研究可關注基于信息行為相關理論的、基于多影響因素的、基于移動互聯網的和基于用戶個人因素的用戶音樂信息行為。
雖然當前東南亞地區在線健康信息搜尋的研究較多,但是缺乏在線醫患健康信息交流研究。Inthiran[30]指出在線醫患交流是獲取健康信息的最簡單快速的方法,通過探究在線健康信息交流模式能夠提升用戶粘性與滿意度,優化健康信息咨詢流程。Inthiran以東南亞用戶為研究對象,招募50名參與者進行在線健康信息搜尋,參與者被要求描述在線搜尋信息中的醫患溝通過程。研究指出參與者向醫生詢問的有關在線健康信息大都屬于初步或防護類健康信息,而溝通風格、文化和社會規范、溝通環境和健康素養水平阻礙了醫患溝通。同時,作者指出醫生應承擔協作角色而不是咨詢角色,開展面向患者和醫生的健康培訓和教育計劃,以鼓勵持續的醫患健康信息溝通和討論。研究為東南亞地區健康信息科學的發展提供了理論依據。該研究還表明在線健康門戶可以向用戶提供應向醫生咨詢問題的建議,同時未來研究可對健康信息交流模式及影響因素進行探究,以優化健康信息交流成效。
視頻已被用于多種情境中以支持學習,YouTube、Vimeo等公共在線視頻存儲庫可為自主學習(Self-Directed Learning,SDL)提供良好資源。Loke等[31]指出視頻搜尋過程可分為視頻資源的選擇、查詢制定/重新制定、選擇預覽視頻、預覽視頻,以及搜索任務的決定。而在SDL期間的視頻搜尋屬于探索性搜索任務,具有模糊性,傳統信息搜尋模型與研究結論并不能應用于此類搜尋。Loke等探究了青少年SDL視頻搜尋行為,研究招募了14名大專學生,設置了兩個視頻搜尋任務,在視頻搜尋過程中,研究參與者展示了至少兩個級別的評估以完成視頻搜索任務。首先進行初步篩選,其次進行啟發式的評估。這兩個級別的評估表明,視頻搜尋者通過搜尋視頻線索和元數據,能以最小努力獲取相關視頻的內容。而視頻檢索界面的優化有助于視頻信息搜尋過程中認知負擔的減輕,彈性略讀(Elastic Skimming Technique,EST)等技術也可幫助預覽視頻工作量的減少。
信息技術的不斷發展,促進了傳統人文研究生態體系的變化,開始出現諸多以信息技術為支撐,面向文化遺產與本土知識的人文研究課題,如歷史事件可視化演示、家譜知識庫建設、古籍數字化等。信息技術在為人文學科研究范式轉變提供新思路的同時,也豐富了人文領域的方法論體系。而圖書館、檔案館和博物館等機構擁有的諸多非結構化文化數據資源,本身也對數字人文研究具有重要價值,數字人文已成為當前圖情研究的熱點。ICADL 2017主要聚焦于數字資源語義建模、文化遺產數字化影響因素,以及非物質文化遺產組織。
直接表示知識庫可以增強甚至提供以文件為中心的數字圖書館替代品。Allen等[32]強調了為數字人文資源建立索引的難度,并提出了發展具有豐富知識的“社區模式”(Community Models,CM)來改善檢索,CM可用于描述與日常活動和設施相關的事物,能夠涵蓋陶器、服裝、舞蹈和宗教傳統等有形和無形的文化遺產。Allen等探究了在知識庫中對現實生活中的日常活動和基礎設施進行語義建模,整合各類話題、本體集合和一系列其他知識資源。Allen等首先考慮模擬支持人類活動的常規程序技術。其次,考察技術與社會組織的相互作用。然后,分析了發展與驗證各實體間關系解釋的方法和問題。研究分析了日常活動和基礎設施中本體和模型的應用問題。這些本體論和模型建立在基本形式本體論(Basic Formal Ontology,BFO)嚴格的語義上,未來研究可探究如何將BFO的約束擴展到日常基礎設施,然后擴展到社會和文化描述中。
當前各類記憶機構(如畫廊、圖書館、檔案館和博物館)正利用數字技術,包括社會網絡技術來數字化、分享和保存遺產資源,通過建立國家知識庫來規避未來記憶的空白。記憶機構正力求與文化遺產擁有者與利益相關者合作對資源進行數字化。Boamah等[33]指出發達國家和發展中國家對于記憶機構中文化遺產的數字化皆面臨挑戰。在發達國家,記憶機構主要探究如何實現對龐大數字資源的有效導航;在發展中國家,對數字化的消極態度阻礙了數字化管理的進程,其中文化遺產所有者擔憂永久喪失其遺產資源,關鍵利益相關者缺乏相關積極性,信息工作者是發展中國家推進文化遺產數字化進程的主要力量。Boamah等分析態度對文化遺產數字保存的重大影響。結果指出在數字化和維護文化遺產的過程中,如果涉及源社區和各利益相關者,態度維度應該是一個關鍵考慮因素,在文化遺產研究與數字化進程中應當明確,未來研究可將態度作為數字人文資源存儲的重要維度,并納入問卷的量表設計中。
記憶機構擁有大量文化遺產信息(Cultural Heritage Information,CHI),如何實現文化資源的有效連接、發現、獲取和使用是一個重要問題。Wijesundara等[34]提出了數字環境下的文化遺產組織資源(Cultural Heritage in Digital Environment,CHDE),使得數字環境下的組織與非物質文化遺產得到有效組織。基于元數據的一對一原則,該模型將收集到的相關數字資源簡化為網絡環境下的單一數字檔案。Wijesundara等采用實例來組織非物質文化遺產,通過將提出的模型映射到成熟的文化遺產模型,以確定組成實體并澄清其優缺點。研究利用南亞和東南亞的文化遺產信息評估了模型的適用性。而通過區分物質與非物質文化遺產,可以開發面向不同文化遺產類型的CHDE廣義模型,有助于實現物質與非物質文化遺產的分類存儲。
第十九屆亞太數字圖書館國際會議(ICADL 2017)作為圖書情報學科的重要學術會議,其錄用的論文反映出數字圖書館領域理論與應用研究的最新成果,研究主題涵蓋了數字圖書館領域學術研究和技術發展的前沿。文章從研究對象、研究方法、研究主題三個視角對此次會議進行了總結:
(1)在研究對象方面,此次會議關注的研究對象涵蓋科研人員(教授、博后、科研助理等)、文化遺產利益相關者、高校學生、圖書館員、青少年等。并對其在特定情境(如健康信息搜尋、音樂信息搜尋、視頻信息搜尋、社交媒體謠言、眾包和游戲融合等)下的數據庫使用、數據檢索與共享等模式進行細粒度分析。
(2)在研究方法上,此次會議論文超過90%皆為實證研究,研究者通過數據挖掘(算法構建)、問卷調查、情境實驗、直接觀察、訪談等方法獲取研究數據。同時,研究者對日志數據、調研數據、數據庫數據、平臺API數據進行定性分析,涉及日志分析、主成分分析(Principal Component Analysis,PCA)等多種內容分析方法。本次會議論文還注重多種研究方法的交叉使用,實驗與訪談、訪談與日志分析、問卷調查與訪談等。
(3)在研究主題上,本次會議以“數據、信息和知識”為關鍵詞,系統從“用戶—內容—服務”三個維度展現當前最新研究進展,面向用戶主要探討個性化服務和用戶建模、安全和隱私等主題;內容構建主要涉及信息可視化、多語言支持、元數據編目、系統互操作性、檢索和瀏覽界面的數字內容建設、開源工具和系統等主題;服務建設主要分析新環境下的數字圖書館內容和使用、文化遺產呈現,以及移動服務端優化等議題。