曹璘琳
摘 要:數字策展(Digital Curation)是大數據時代下圖書館領域的研究熱點。文章介紹了數字策展概念的內涵,通過實例闡述了數字策展服務的主要方式和內容,最后從圖書館的角度考察了數字策展信息服務的具體內容。
關鍵詞:大數據;數字策展;圖書館;信息服務
過去,圖書館是針對非特定人群進行信息服務,如今在大數據的時代背景下,圖書館基于使用者的關注內容、個人喜好等,能夠提供個性化信息服務。數字策展(Digital Curation)在許多方面影響著我們的生活。
進入2010年以來,最受大眾矚目的詞之一就是“大數據(Big Date)”。無論是企業、公共機構,還是健康、醫療、廣播、教育等社會領域,大數據的實用性和價值均受到廣泛關注。隨著信息技術(IT)的持續發展、智能手機的普及、物聯網(IoT)浪潮的到來,大數據的關注度進一步提高。
對于大數據尚未有一個公認的定義,不同的定義基本是從大數據的特征出發,通過這些特征的闡述和歸納試圖給出其定義。在這些定義中,比較有代表性的是3V定義,即認為大數據需滿足3個特點:規模性(volume)、多樣性(variety)和高速性(velocity)[1]。大數據作為結構化數據、半結構化數據與非結構化數據的總和,其種類繁多、數量龐大,有文檔、圖像、音樂、視頻等各種數據類型。在快速增長的大數據環境下,人們越來越難直接獲取自己想要的信息,為使用戶在海量數據中快捷、簡便搜索到喜愛和滿意的信息,數字策展信息服務顯得非常必要。
1 數字策展(Digital Curation)的含義
17世紀中葉,“Curation”一詞被引入博物館學,當時出現了“the Curator of the Royal Society”類似說法,其中“Curator”意為“對于博物館、藝術館、圖書館或類似機構的主要負責人的正式稱呼”,“館長”。20世紀以來,隨著對博物館藏品相關知識發掘和傳播的重視,學界產生了“一流的Curator是一個學者,也是一個老師,更是一個向外界展示的窗口”的觀點。牛津英語詞典在1993年的修訂版中增加了“管理者對一系列保存或展出藏品的監管(Supervision)”這種釋義。Dallas將“Curation”和“Curator”的含義歸納為兩個方面:其一,取“領域專家”和“館長”之意;其二,取“展覽策劃人”也即“策展人”之意,“根據館藏或某種需求確立主題、遴選展品、設計展覽效果、完成展覽制作和與之相配套的學術研究、宣傳出版等”。 下面列舉幾個國內外具有代表性的觀點。
Harvey(2010)指出,為了實現數據的再現、再利用和增值,從數據產生之初到其不再有用,數字策展涉及對學術科研、行政管理和/或符合個人興趣數據的主動管理,用以確保數據長期的易用性、保存、可信性和完整性。數字策展比數字歸檔和數字保存的外延更廣。它處理數據全生命周期全程的所有環節。通過制定數據采集的標準,進而產生“Curation-ready”(數據處于能夠確保其在未來維護和利用的最佳狀態)的數據,數字策展開始于數據產生之前,并強調通過附加元數據或標注的方式促使數據集增值和再利用。
維基百科(2013)[2]中寫到,數字策展是對數字資產的選擇、保存、維護、收集和歸檔。為了當前和未來之用,數字策展建立和維護數字數據倉儲,并促使其增值。這種活動通常需要檔案學者、圖書館學者、科學家、歷史學家和其他學者的通力合作。企業在運營和戰略環節中利用數字策展來提高信息和數據的質量。成功的數字策展能夠延緩數字老化,能夠保證用戶對信息的永久存取。以往“Curation”一詞通常用于博物館和圖書館專家之間,現在它已經被應用到數字影像、網絡鏈接和視頻文件等社交媒體的保存之中。
根據DCC(Digital Curation Center, 2014),數字策展包含對數字科研數據整個生命周期的維護和保存,并促進其增值。對科研數據的主動管理可以減輕對長期研究價值的威脅并減緩數字老化的進程,還可以實現更大范圍內的整個英國科學界對可信數字倉儲中數據的共享,同時減少生產科研數據的重復勞動。通過使現有數據可以被未來更高水平研究獲取,數字策展提升了現有數據的長期價值。
2 數字策展(Digital Curation)服務
數字策展(Digital Curation)服務依據不同參與者進行信息過濾,分為“數據策展(Data Curation)”和“社會化策展(Social Curation)”兩個種類。數據策展是服務提供方運用信息或產品屬性、使用者和顧客個人喜好等,提供相關服務。亞馬遜(Amazon)網站和音樂推薦潘多拉(Pandora)網絡電臺就是數據策展服務的典型成功事例。
線上書城亞馬遜網站將所有顧客的購買信息存儲到數據庫,并對存儲記錄進行分析研究,從而掌握顧客的消費趨向和個人喜好。也就是說,通過分析顧客喜好,自動提供與分析結果一致的個性化產品。美國最大的個性化網絡電臺潘多拉創立了音樂基因組計劃,并在此基礎上發展出音樂自動推薦系統及網絡電臺服務。如果用戶輸入歌曲或歌手的名字,潘多拉的音樂信息數據庫會將音源分類為400個不同屬性,幫助確定聽眾偏好,做出播客推薦。用戶可以對每首推薦歌曲選擇“我喜歡”或“我不喜歡”字樣的拇指圖標,聽歌期間還可進入亞馬遜網站或iTunes商城購買歌曲和專輯。亞馬遜網站尤其圖書板塊是“長尾(Long-tail)”商業模式的代表性成功事例,它通過文章推薦、主題分類、顧客喜好分類等多種方式,自動推薦相關圖書產品,多樣化滿足各類人群需求,大幅提高銷售額。
與之相反,社會化策展中篩選、過濾產品的主體是消費者。與一般數字策展的區別是消費者或產品用戶可以訂閱他人過濾的產品信息,同時也可以與他人共享自己的產品內容。拼趣(Pinterest)是社會化策展的成功事例,其以圖片為基礎,用戶自己收集圖片并與他人分享,被稱為圖片形式的信息共享服務。拼趣采用的是瀑布流的形式展現圖片內容,高效而具有吸引力,無需用戶翻頁,新的圖片不斷自動加載在頁面底端,讓用戶更樂于沉浸在探索與瀏覽當中。