謝曉萍 胡燕



當今時代是互聯網的時代,互聯網已超越計算機的連接而成為思維的連接。當人類的思維連在一起的時候,人類思維能力的互補、啟發、創造所匯聚的價值將是空前的。本文探討的國外“檔案眾包”就是利用互聯網將群體連接起來,它以發揮群體智慧的特色與優勢在檔案領域受到廣泛關注,為檔案事業在互聯網時代的發展開辟了一片新藍海。
1.“眾包”概念及研究現狀
“眾包”一詞,是近十年來出現的新詞。筆者在美國科學信息研究所(Institute for Scientific Information,ISI)編制的引文數據庫Web of Scienc中,以標題=crowdsourcing為檢索式進行檢索,得到523條題錄數據,并以此為數據源,利用可視化分析軟件citespace,分別得到文獻的author(作者)(圖1)和country(國家)(圖2)的知識圖譜。
從圖1中可以看出自2006年至今,圖中各個作者節點之間出現了千絲萬縷的聯系,表明在這個時間段內,全球范圍內涌現了眾多研究“眾包”的學者,如南加州大學的Daren C.Brabham,卡內基梅隆大學的Aniket Kittur,威斯康星大學的AnHai Doan等。其中,美國《連線》雜志著名資深編輯、“眾包之父”——杰夫·豪(Jeff HOWE)的研究成果在該領域產生了重要影響,“眾包”(Crowdsource)一詞最早就是出現在杰夫·豪2006年的文章《眾包的崛起》中。……據圖2可看出“眾包”問題的研究力量分布情況,圖中最大的圈代表美國,表明美國在眾包領域的研究力量最強,其次是中國、英國、德國等國家的學者在該領域的貢獻。與此同時,利用軟件對題錄數據進行類別分析發現,出現“眾包”頻次較高的依次是計算機科學、工程學、商學、管理學等學科的文獻信息,可見,上述學科在近階段對“眾包”問題的關注度較高。
可見“眾包”的研究及實踐是近10年才逐漸走進學者及行業工作者的視野。因此,關于“眾包”的概念,目前為止尚沒有統一的定義,但這并不意味著學界對“眾包”這一事物的本質特性的認識尚不清晰。“眾包之父”杰夫·豪認為,“眾包”是一個公司或機構把過去由員工執行的工作任務,以開放的形式外包給非特定的(而且通常是大型的)大眾網絡的做法。杰夫·豪的觀點得到了學界較為一致的認可。這一概念包括三個相互聯系的含義:第一,“眾包”是一種在線參與的網絡活動;第二,“眾包”的先決條件是開放格式和大規模潛在的勞動力網絡;第三,“眾包”是一種組織勞動力的全新方式。
2.“檔案眾包”的含義
將“眾包”概念置于檔案行業的具體實踐是國外檔案界最先發起的。根據國外案例,“檔案眾包”是指檔案部門通過互聯網信息共享平臺,為某項需大眾力量完成的檔案業務而組織合適的大規模志愿者群體加入,承擔不同難度和模塊的任務,貢獻個人的智慧與資源,同時獲得成就感、社會參與感及個人技能的提升,并可獲得檔案部門的獎勵,從而達到檔案部門與參與者互利共贏的一項活動。從眾包項目的運作流程來看,“檔案眾包”模型可以用圖3來表示:
模型顯示,從項目發起到完成是一個動態的、多主體過程。首先,“檔案眾包”項目的發起者(一般由檔案部門主導)就某一檔案業務,通過專門的眾包公司建立相應的網絡平臺,通過網絡平臺以公開征集的方式向參與者尋求幫助;然后,參與者基于滿足個人興趣愛好、獲得成就感等動機,通過整合自己的知識、技能以及其他各種資源,將具有潛在使用價值的解決方案提供給發起者,這其中,參與者提供的解決方案對于發起者的使用價值取決于該項目的質量控制流程;最后,發起者將“檔案眾包”項目的成果整合后向檔案用戶提供相應的服務。在此過程中,檔案用戶既是眾包成果的利用者,也有可能成為項目的參與者,檔案部門通過運行“眾包”項目,既匯集了群體智慧完成了檔案部門的某些業務,又豐富了檔案服務途徑,提升了公眾的檔案意識。當然,此模型只是將具體實踐簡單抽象所得,在實際操作中,由于“眾包”項目內容的差異性,涉及到的主體更具廣泛性和不確定性,項目運作更具復雜性和靈活性。
3.國外“檔案眾包”項目
在近十年的時間里,世界各地的文化遺產保護機構,如圖書館、檔案館、博物館等正在探索使用“眾包”模式的潛在可能性并逐步實施。在檔案領域,荷蘭的 “保存肖像”項目與“眾人參與”項目、蘇格蘭的“檔案轉錄”項目和“戰地日記”項目、美國的“公民檔案工作者”項目最具代表性。
3.1荷蘭:“保存肖像”項目和“眾人參與”項目
“保存肖像”項目由阿姆斯特丹城市檔案館發起,與Picturae公司合作,在2013年4月4日正式上線,招募大眾志愿者識別與描述默克爾·巴赫攝影集中的人物肖像。同時,該項目還與相應的眾籌項目結合,鼓勵公眾為保護作品而做出力所能及的捐贈,或者通過付費下載作品的數字化版本等方式支持該項目。項目參與者首先需在項目網站(http://redeenportret.nl/)上注冊賬號,或者直接通過Facebook、Google、Twitter等社交網站賬號登錄,然后可以進行相應的任務操作。根據項目網站的數據,該項目總共有38463個任務,目前,已經有8953個完成編輯。
“眾人參與”項目也是阿姆斯特丹城市檔案館與Picturae公司合作的,該項目開始的更早,規模更大,主要是通過網站平臺鼓勵大眾為數字化檔案著錄與建立索引。公眾首先通過郵箱注冊賬戶登錄項目網站(https://velehanden.nl/),或者通過第三方社交平臺(如Google、Yahoo、Facebook、Twitter等)登錄。網站提供相應的任務操作教程,并實時顯示每個“眾包”專題的任務進度,附上簡介,鏈接到每個專題的網站,鼓勵人們加入到“檔案眾包”任務中。項目參與者完成任務后可以獲得積分,積分最后可兌換中意的檔案復制品。根據網站的數據,自2011年6月6日第一個項目開始至今,已經有6個項目全部完成,共有3263位網民參與。現在,有18個項目正在進行中,已吸引了7381位網民的參與,涉及荷蘭海爾德蘭省出生證明檔案、阿姆斯特丹紀念碑檔案等各種類型檔案的在線收集、著錄、建立索引等工作。
3.2英國:蘇格蘭“檔案轉錄”項目和“戰地日記”項目
蘇格蘭“檔案轉錄”項目由蘇格蘭皇家歷史與古跡協會、蘇格蘭國家文件署、蘇格蘭國家圖書館共同啟動,并得到了蘇格蘭政府和愛丁堡大學地質學院的大力支持。該項目旨在鼓勵社會公眾參與到項目網站上檔案信息資源的轉錄工作中。這些檔案信息資源主要是蘇格蘭歷史檔案中的圖像檔案,包含了許多與蘇格蘭、蘇格蘭人民有關的手寫信息,需要利用大眾的力量發掘出其中的名人名地,從而通過眾人力量極大的改善Scotlandsplaces門戶網站作為在線地圖的檢索功能。參與這個項目的志愿者,通過網站(http://www.scotlandsplaces.gov.uk/)注冊,加入某一個小組,經過培訓,然后就可以根據任務要求開始轉錄工作了。同時,網站上有該項目的論壇與博客,為參與者搭建信息溝通交流的平臺。在該項目中,參與者可免費瀏覽、下載和拷貝原來需要付費的檔案圖片。在項目網站上可以看到,目前有15個專題正在進行,根據任務的難易程度,將每個專題劃分為初級到中級、中級、中級到高級等級別,并標注專題的完成情況。根據網站的統計數據,至今,共有3631個志愿者參與到“檔案轉錄”項目,分為24個小組,在總共181776頁檔案文件中,志愿者已經參與到119517頁中,完成了112100頁。
“戰地日記”項目是2014年初由英國國家檔案館發起,并與帝國戰爭博物館和世界眾包行業領袖Zooniverse公司合作,以保證項目的專業水準和技術保障。英國國家檔案館在2011年就開始將第一次世界大戰中大量的戰地日記數字化。2014年是第一次世界大戰爆發100周年紀念,檔案館將這些已數字化的戰地日記分批放到網站,供大眾檢索、下載。與此同時,該項目通過網站平臺(http://www.operationwardiary.org/ )上線,開展眾包任務,希望通過大眾的力量為戰地日記中涉及到的人物、地點、事件貼標簽,再溯100年前在一戰前線發生的真實故事,通過官方與民眾的力量銘記一戰中每一個生命的故事。該項目覆蓋了150萬頁的戰地日記,對參與眾包的人員沒有特殊的要求,只是提供一個10分鐘的培訓短片,告訴項目參與者如何按步驟完成貼標簽的任務。
3.3美國:“公民檔案工作者”項目
“公民檔案工作者”項目由美國國家檔案與文件署(NARA)于2011年12月23日啟動,并通過其官網宣傳與開展該項目。項目主要有5個專題的眾包工作,包括為NARA保存的文件貼標簽以便優化檔案文件檢索體驗、轉錄歷史檔案以改善其利用、轉錄北極航海日志中的氣象檔案以幫助科學家探索過去的環境狀況、上傳與共享NARA圖像檔案、分享個人關于國家歷史的知識。公眾在參與該項目的過程中,需要使用到相關在線檢索系統、轉錄工具以及網頁交互界面。現在在NARA網站的檢索,就可以根據公民檔案工作者貢獻的“標簽”進行檢索。2012年,美國“公民檔案工作者”項目被評為年度美國政府最佳創新實踐獎,以鼓勵這種使用眾包項目改變政府機構與公眾關系的方式。
4.國外“檔案眾包”項目的特點及啟示
4.1“檔案眾包“的關鍵——開放、共享與協作
從國外“檔案眾包”的實踐中,我們可以看到,開放、共享與協作的理念與實踐已深入到檔案工作的方方面面。首先,開放的檔案信息資源是“檔案眾包”的基礎。如英國“戰地日記”項目的基礎是大量開放的數字化戰地日記檔案;美國更是以90%以上的檔案對公眾全方位開放而著稱,美國五個專題的眾包工作均建立在檔案信息資源全方位開放的基礎上;其次,共享的檔案信息平臺是“檔案眾包”的橋梁。英國的“檔案轉錄”項目就是在蘇格蘭皇家歷史與古跡協會、蘇格蘭國家文件署、蘇格蘭國家圖書館的信息共享平臺上建立起來的;再次,協作的檔案工作方式是“檔案眾包”的保障。從專業化角度而言,檔案部門并不是運行“眾包”這種商業模式的好手,需要與相關公司合作才能保證“檔案眾包”項目擁有強大的技術支撐,荷蘭的Picturae公司與英國的Zooniverse公司是專門從事“眾包”的著名公司,通過與這些公司的合作,荷蘭的“眾人參與”項目與英國的“戰地日記”項目取得了巨大成功,此外,英國的“檔案轉錄”項目還與蘇格蘭皇家歷史與古跡協會、蘇格蘭國家文件署、蘇格蘭國家圖書館等多家機構合作,從而提高了項目的規模與影響力。
4.2把“檔案難題”交給互聯網時代的大眾智慧
《長尾理論》的作者克里斯·安德森曾經說過這樣一句話:“參與生產的人就是最關心生產的人,他們最理解自己的需求。”在檔案信息服務鏈條的末端是檔案用戶,他們最清楚自己需要何種服務。如今,檔案工作者們正在努力探究檔案信息資源共享模式,努力了解檔案用戶的需求,以便更好的提供服務,或許在“互聯網+”時代,把這個難題“扔”一部分給檔案用戶是一個不錯的選擇。國外“檔案眾包”的成功案例說明,讓大眾自發地投入到檔案工作中去以實現自己的價值,并根據自己頭腦中的知識、按自己的興趣對已有的檔案信息進行加工、充實,“這些”大眾在使用檔案部門提供的檔案信息服務的同時,分享了豐富的檔案資源,并完成了檔案眾包項目,與此同時,這些項目對于“那些”大眾而言,又意味著一次升級與優化的檔案信息服務,所有這一切對于公眾來說應該是一件非常樂意參與的事情。有調查顯示,我國70%以上的公眾首選通過網絡利用和了解檔案,這說明,我國的檔案利用者中存在眾多潛在用戶等待開發;另據中國互聯網絡信息中心2015年1月發布的《中國互聯網絡發展狀況統計報告》,截至2014年12月,我國網民規模已達6.49億。如此龐大的網民群體,如果能夠有效開發,那么,能為“檔案眾包”項目帶來的智慧將是不可估量的。
4.3讓檔案用戶成為“檔案工作者”
通過“檔案眾包”的在線平臺,讓檔案用戶成為“檔案工作者”,這是國外“檔案眾包”帶給我們的全新概念。這一概念從人力資源邊界到信息資源邊界,再到檔案工作理念都給傳統的檔案觀念帶來了巨大沖擊,并且通過國外的眾多實踐已經證明,將“眾包”這種商業模式靈活運用于檔案工作中就可以實現這種突破傳統的轉換。就我國而言,雖然這一理念尚未融入我國檔案工作中,但是,筆者認為,理念的引入與理論研究的先行是必要的,對于檔案工作領域而言,“檔案眾包”的開展就是站在一個通向未來世界的轉折點上。
4.4中國“檔案眾包”在路上
“檔案眾包”首先在發達國家興起,并得到積極響應該是有其必然性的。首先是發達國家龐大的檔案用戶群體;其次是豐富的檔案內容及數據庫;再次是強大的網絡技術支撐;最后是充足的資金與靈活的市場運作模式。與之相比,我國確實還存在一定的差距,但這并不意味著中國與“檔案眾包”無緣。國外檔案界較長時間的實踐已經摸索出一些成功經驗,建立了較為成熟的技術平臺,充分借鑒和利用這些成果,可以助推我國“檔案眾包”的誕生與發展。我們要做的工作就是在借鑒他國經驗的基礎上,將“檔案眾包”與本土實踐緊密結合,在充分的理論研究與調研后再試點推行,以使“眾包”這種群體智慧挖掘方式惠及我國的檔案工作。
本文為國家社會科學基金項目《我國普通公眾檔案館利用行為研究》(項目編號:13BTQ065)的階段性成果之一。
(作者單位:蘇州大學社會學院)