郭楠
摘 要:本文對數字圖書館移動視覺搜索的資源庫建設機制進行了分析,提出通過分包理念獲取新的視覺資源,從眾包任務的設計及眾包結果的質量控制展開深入探討,最終提出數字圖書館移動視覺搜索的資源建設機制。
關鍵詞:數字圖書館;移動視覺搜索;眾包模式
互聯網時代的到來使得用戶需求,信息形式等發生了重大變化,數字圖書館要想在新信息環境下更好的發揮作用,必須進一步豐富現有圖像與視頻資源,網絡視覺資源多樣化,更新速度各不相同。不同來源的信息結構差異,影響了視覺對象資源庫建設的基本架構,現有數字圖書館在精準化的用戶需求方面存在較大的不足。移動視覺搜索可解決資源構建中的各種場景問題。將移動智能終端與視覺搜索技術結合能快速幫助用戶找到其感興趣的信息資源。
1 數字圖書館移動視覺資源構建
大數據環境下,數據的類型多樣及復雜性等特征使得數據屬性更難把握,現有數字圖書館內容集中與傳統的圖書等文獻資源,隨著搜索引擎的不斷發展,數字圖書館在用戶獲取信息的業務上失去了優勢,其提供的服務視覺的直觀性有所欠缺,不能有效的開發移動終端視覺信息服務。
1.1 移動視覺搜索概述
移動視覺搜索指通過獲取視覺對象資源,在存儲知識庫中匹配視覺對象,移動視覺搜索技術可快速方便的連接到用戶所需查詢的信息內容。用戶對視覺資源進行掃描時,圖像識別軟件自動連接到相關信息內容。
移動視覺搜索技術使得用戶搜索訴求變為更加生活化的實體搜索,輸入方式因使用場景的多變性發生變化,輸入結果因移動設備的特征變得更加智能。使得信息搜索過程更加自然化,將人與設備的信息交互變為人與人間的信息交流,使得資源檢索過程更加人性化。
MVS指利用移動終端設備獲取視覺資源作為檢索項,返回相應結果的信息檢索方式,從廣義上理解MVS更貼近于圖情學科的角度,突破技術范疇延伸到更廣的服務理念與運作機制[1]。從資源采集,展示及服務的角度,MVS充分體現了大數據時代特征。
1.2 基于MVS的視覺資源庫構建
移動視覺搜索技術能開創數字圖書館信息的新局面,用戶可任意的訪問數字圖書館的圖書資源,將移動視覺搜索與多個數字圖書館相結合,用戶可同時獲取整合不同數字圖書館的相關資源信息。移動視覺搜索更側重于視覺資源的獲取重建,以視覺資源為主題的資源庫建設是構建基本的移動視覺搜索的前提。
目前各類搜索引擎,門戶網站等積累了豐富的圖片與視頻資源,博物館與檔案館進行了很多數字化工作,圖博檔已有的數字信息資源符合大眾提供的現實世界的視覺資源,如用戶通過移動終端上傳的圖像等更傾向于非結構化資源,面向結構化數據,可采用XML/RDF采集,非結構化的數據特征,可構建相應的視覺資源庫。
現有資源庫內容難以為視覺搜索服務提供支持,已有資源庫以圖書等文獻資源為主,更新速度慢,圖像資源相對偏少,檢索入口單一,難以為用戶提供更全面的知識服務。不能保障高效率的視覺對象資源庫的建設。圖書館數字資源庫建設依賴圖書館員,從視覺資源的采集獲取,標引與描述到使用維護,需大量的人力資源參與,對大數據背景下圖書館資源建設的需求分析基礎上,如何完成圖書館移動視覺資源構建值得進一步探討
2 移動視覺資源庫建設的眾包模式
2.1 眾包模式的概念
企業或可充分利用網絡的勞動力資源完成工作任務,如IT公司無法解決的技術研發問題,可能被外行人快速解決。眾包的概念由杰夫·豪在2006年提出,指企事業單位將工作任務,以自愿的形式外包給非特定社會大眾解決。其核心思想是利用群體力量完成機構無法完成的任務。眾包跨越了傳統的組織界限[2]。
眾包的理念源于互聯網的開放性,眾包必須依托后臺系統功能技術實現,眾包模式的搜索使得新一代搜索方式將人的智慧融入其中,用戶搜索時會相應的輸入用戶自身的行為數據,眾包模式的信息資源采集獲取方式有廣泛的應用前景。
2.2 眾包模式構建視覺資源庫的必要性
圖書館,檔案館,門戶網站等都包含了大量的視覺資源,需大量的檢索篩選才能更好的滿足大眾的社會信息服務。目前數字圖書館的資源多以人工標因的形式,各種非結構haunted數據為圖書館員的工作增加了難度。因相關訓練集尚不發達,對視覺對象機器標引的效果不很理想,眾包模式借助大眾參與共同完成資源庫的構建工作,提高了大眾的參與熱情,節約了圖書館視覺對象資源構建的成本。
2.3 MVS視覺資源庫構建的眾包模式應用
將眾包技術與智能終端相結合蘊含巨大的經濟價值,移動視覺搜索借助大眾參與,使得大眾參與者獲得信息,幫助了數據庫信息的擴充。洛杉磯創業公司開發了圖像識別應用,用關鍵詞對圖片進行標記,CamFind搜索有更多的使用機制,如用戶用CamFind識別寵物信息,后臺搜索到拍攝的物體,準確的識別搜索對象的顏色等信息,用戶可推搜索結果進行翻頁瀏覽。其結合眾包模式解決問題,CamFind讓相關專家為用戶反饋的圖像識別信息結果,專家無法給出準確答案時,APP后臺讓用戶參與共同識別圖像,參與識別圖像的用戶越多,反饋結果會更準確。
為進一步豐富館藏數字資源,上海圖書館推出關聯數據技術的開放數字人文服務,關聯數據技術用以發布連接各類數據信息,直接通過搜索可準確的查找分享相關聯信息,用戶可在線查詢自己家族信息,在下側表區中現實檢索的命中記錄,用戶可獲取姓氏概況,相關家譜等信息[3]。
3 數字圖書館MVS眾包模式分析
3.1 實現移動視覺資源庫構建的問題
大眾參與的數字圖書館建設方式旨在提高館藏利用率,增強用戶的忠誠度。數字圖書館因其非營利性,完成海量視覺資源的收集超出了工作人員的能力范圍,因而需引入眾包模式,使組織利用大眾將分散的資源進行聚集,網絡普及率提高的信息環境,為移動視覺資源構建眾包模式運用提供了有利保障。
數字圖書館移動資源庫建設需注重視覺資源的主題選擇,如基于特定主題的圖片收集等,應關注如何通過設計物質等建立模式提高用戶主動參與熱情,應關注所搜集的視覺資源內容糾錯,通過眾包模式實現數字圖書館移動視覺資源庫構建需解決眾包任務的設計,如何激勵用戶參與眾包活動?如何進行眾包結果的質量控制等問題。
3.2 眾包建設的質量控制
場景的復雜性與用戶的不確定性使得眾包服務出現許多弊端,視覺資源上傳結果質量參差不齊,如英文視頻信息標引,收集的視覺資源質量各有差異。一些參與者為使自己的利益最大化,可能錯誤的提高無關信息資源。進行視覺對象資源庫建設時要進行眾包結結果的質量控制,保證其準確性。為移動視覺搜索服務提供保障[4]將眾包過程中的質量控制按時間維度劃分,分別進行視覺資源庫眾包建設中質量控制。
視覺資源多基于UGC生成,搜集的高效性很大程度上取決于參與者的自身素質。資源搜集前識別參與者能力,如分析搜索歷史,標引歷史等信息,可測試參與者對資源標引的了解程度。基于識別的參與者能力形成個性化推送。
圖書館視覺資源構建的眾包過程中,因用戶知識水平不可識別,一些參與者僅為獲得報酬,眾包任務執行中識別欺騙者非常重要。可在眾包項目集合的任意工作段結束后,通過參與者投票的方法評估參與者的質量,組織可在任務中隨機添加常識問題,可添加簡單的動植物圖片讓用戶標引,如為欺詐者則進行剔除,任務進行中識別欺詐者,可節約任務完成時間成本,添加常識問題時避免被用戶發現。
3.3 比較分析
開展移動視覺資源建設,眾包模式在圖書館視覺資源建設中有廣泛的應用前景,視覺資源收集方式任務完成時間方面具有很大的優勢。傳統的方法視覺資源構建多依賴于組織內部完成,如某些高校課程教學視頻,資源構建與參與者不僅局限于圖書館員,面向社會大眾參與用戶。
傳統的內部人員構建視覺資源中,某些圖片等資料的整理常需耗費很大的人力,眾包項目為圖書館資源建設提供了豐富的信息資源。依賴圖書館員進行視覺資源構建工作時,資源收集工作具有工作時限,眾包模式跨越了時空的概念,用戶可隨時隨地的進行圖片上傳,網絡環境很好的融合了地域與時間間隔。基于眾包模式的視覺資源構建,保障了高質量視覺資源的建設。
4 結語
大眾參與者知識共享為組織資源建設提供了高質量的信息,本文探索高效的視覺資源庫的建設機制,重點從分包模式的任務設計,眾包模式的質量控制方面開展深入分析,提出移動視覺搜索的資源建設機制。
參考文獻
[1]韓璽,齊云飛,朱慶華.移動視覺搜索在國內圖書館應用的探索研究[J].圖書館學研究,2017(07):79-83.
[2]馬騰騰,趙宇翔,朱慶華.國外移動視覺搜索產品的比較分析研究[J].圖書館雜志,2016,35(09):81-88.
[3]張亭亭,趙宇翔,朱慶華.數字圖書館移動視覺搜索的眾包模式初探[J].情報資料工作,2016(04):11-18.
[4]劉喜球,張興旺.移動視覺搜索:“互聯網+”時代數字圖書館信息檢索新模式[J].情報理論與實踐,2016,39(05):58-63.