陳杰 楊雅君
摘 要:眾包在2006年被提出后,被廣泛地應用在社會的各個領域。國外圖書館也將其應用在圖書館工作中,并取得許多成功經驗,為國內圖書館開展眾包提供了借鑒和有益的啟示。
關鍵詞:眾包;圖書館;服務
DOI:10.12249/j.issn.1005-4669.2020.25.175
眾包(Crowdsourcing)這一概念是在2006年6月的美國雜志《連線》上由記者Jeff Howe在其文章”The Rise of Crowdsourcing”中首次提出的。它的主要含義是指一個公司或機構把過去由員工執行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網絡的做法。簡單地說,眾包就是社會生產。到現在也就是十多年的時間,而眾包服務實現的價值卻是巨大的,并且蘊含著不可估量的潛能。
眾包最初的起源是在互聯網上的應用。網絡上有較為順暢的溝通環境,個人自主參與性開放性更強,跨專業的創新、分布式的人力資源及個體用戶的差異性、多樣性等都為眾包工作的實現提供了可能。如一些開源軟件、操作系統的生產與開發等。而維基百科的出現就是參與人數眾多的群體創作的典范之作。
眾包與其它工作的不同點在于從事眾包的人很多都是出自個人意愿的志愿者,他們一般不收取費用,或是極低的費用來集合在一起共同承擔工作。
隨著互聯網和科學技術的發展,廣大用戶的需求,圖書館也面臨著文獻資源的電子化、數字化的問題,尤其是擁有數量龐大的老舊檔案、古籍善本、原始文件、個人信件等的圖書館,工作繁雜而巨大,要實現這個工作僅僅依靠有限的圖書館員工是不可能的,而眾包的出現和引入為圖書館尤其是在數字資源建設方面提供了幫助。
國外圖書館引用眾包的時間較早,開展的任務也豐富,參與的人員范圍廣數量大,取得的效果也明顯。
英國的國家圖書館——大英圖書館是應用眾包起步較早的圖書館,而且還在不斷地開展著工作。早在2008年,就在Flickr上發布了ambitious項目的一項眾包任務。圖書館官方稱已與微軟進行了合作是,在其幫助下對17-19世紀近三百年中的已過版權期的圖書、書中的圖片、地圖、照片、插圖等進行數字化,但數量巨大,總計100多萬幅,而且大部分沒有進行分類,缺乏相應的文字說明 ,圖書館方希望通過向公眾開放的方式能讓更多的人參與進來,通過瀏覽來幫助描繪這些圖片的信息從而進行分類,對以后的學術研究能有所幫助。
2015年6月,大英圖書館又啟動了有關書目轉換的眾包計劃(LibCrowds)。大英圖書館主要收藏英文文獻資源但對世界上其他語種的文獻也有收藏。對已有的英文資源進行書目數據轉換約有5700萬條,為了推動本館館藏中其他語種文獻資源的目錄數字化進程,這次館方首先選取的是中文和印度尼西亞文的圖書和期刊資源。其中約有10萬種中文圖書,2500種中文期刊,希望通過眾包的方式,可以使社會上更多的人尤其是專業人員參與到數字轉換項目的過程中,全世界的廣大用戶均可在大英圖書館目錄(ExploreBL)中進行信息查詢。
紐約公立圖書館是最大的市立公共圖書館,擁有豐富的文獻資源和數字圖庫及大量的歷史檔案。紐約公立圖書館就擁有數千張關于紐約城的舊照片,但因為年代相隔久遠,照片信息不詳,描述模糊,造成這些老照片無法歸檔及加以利用。從2015年開始,紐約公立圖書館開始一個名為“紐約空間/時間目錄”的眾包的大項目,其中(Surveyor)項目是其中的一個部分,主要是針對上述歷史老舊照片進行的,“勘測員”是一個識別老照片和現代建筑聯系的網站,目的是能讓紐約人的集體記憶和擁有的知識為這些老舊照片找到歷史上的出處,并在現代城市地圖中做出相應的標識。為了能識別城市中的舊建筑,項目組還開發了一個名為“Building Inspector”的眾包識別的在線游戲。“勘測員”從圖書館中抽取了2500張照片,自這個項目開啟以來,已經有 600 多張照片被標記。一旦有多人同時標記同一張照片,系統人員就會查看他們標記的是否在同一個位置。一旦某張照片的地址被確認,它就可以被歸檔,以便今后進行搜索。通過整合照片等資料,可創建交互式地圖,能標記地理照片及館內的各種歷史文件資料,讓所有用戶都能快速方便使用歷史檔案,使圖書館資源和空間都得到利用。
美國國會圖書館(Library of Congress)是世界上最大的圖書館,不僅藏有世界上數量最多的圖書資料,還擁有各類收藏近1億2100萬項之多,尤其是有關美國歷史的各種文獻、檔案資料,甚至個人信件、日記、各類收據、演講稿等等。數量巨大,為了把這些資源加以利用,國會圖書館在2019年發起了一項名為“人民”的眾包項目,招募有電腦并對歷史文獻有興趣的志愿者加入,主要工作就是轉錄19-20世紀內參與各種歷史運動的人士的個人信件、日記、演講稿等檔案資料,使這數字化圖像化,目的是“讓那些沒有完全看到或無法閱讀原始文件和筆跡的人提高搜索和可讀性,并且訪問手寫和打印文檔。”志愿者可以選擇最感興趣的主題進行轉錄工作,或是檢查別人的工作,或者只是閱讀。
澳大利亞國家圖書館(National Library of Australia) 與弗雷克社區建立了聯系,在2006年1月起實施一項名為“圖片澳大利亞”的眾包項目。圖書館把從海內外50多家文化遺產機構收集的數字圖片保存在圖書館的“圖片澳大利亞”中心庫內,鼓勵社會民眾將自己擁有的數字圖片也進行上傳,國家圖書館甚至允許任何一家參與的機構可將其作為自身館藏。這一眾包項目自開展以來,就得到了澳大利亞民眾的熱烈響應,并取得了較大的進展,每年圖片記錄的增長幅度均在萬余條以上。是社會民眾參與圖書館眾包項目的很成功的范例。
在國內,眾包項目開始的較晚,對理論的研究要多于實踐。上海圖書館在2016年率先推出了上海圖書館歷史文獻眾包平臺,主要開展檔案手稿文本化的眾包項目。首先是對本館收藏的盛宣懷家族檔案的抄錄及數字化轉錄。上海圖書館還開放全國首家“家譜知識服務平臺”,供用戶在線查詢自己的姓氏起源以及先祖名人等。2019年5月,“家譜知識服務平臺”新增了上傳家譜(在線捐贈)、在線識譜、在線修譜3種眾包功能。可以實現在全網范圍內征集家譜, 通過加工處理使冢譜世系圖結構化,直接展示和檢索家譜中的成員。
應當看到國內圖書館對眾包實踐開展的還不足,還面臨著許多問題,如眾包項目成立的時間較短,用戶的覆蓋范圍較小,參與人員數量較少,對平臺的可操作性要求不同,對提交內容質量不能保證等等。但隨著眾包平臺構建的逐步完善,更多機構和人員的參與,圖書館眾包能在深化資源開發,滿足社會對信息資源的需求方面提供更好的服務。
參考文獻
[1]馬杰,陳晨.眾包模式在圖書館管理與服務中的應用[J].圖書情報工作,2013(12):118-120.
[2]廖艷萍.國外圖書館眾包實踐及對我國圖書館的啟示[J].福建圖書館學刊,2019(4):12-17.
[3]姚嘯華等.面向數字人文的圖書館眾包平臺構建研究——以上海圖書館歷史文獻眾包平臺為例[J].圖書館雜志,2020(6):105-112.