朱耀云
(山東大學外國語學院,250100,濟南)
“眾包”是指網絡時代數量較大的一部分人,基于在線參與的便利,自愿為完成某一項任務而貢獻力量。[1]隨著世界進入全球通聯的扁平化信息時代,捐助眾籌、創業眾籌、項目眾籌已成潮流,知識界的網頁共編、翻譯眾包、書籍眾寫也日漸興起,參與公眾的志愿文化日益濃厚而普及。民俗文化數字化采集工作,如能借眾人之力,必可省時省錢、增速發展,從而為文化傳承或移風易俗的研究和實踐做出更有力的貢獻。
“民俗文化資源的數字化是通過文化與科技的碰撞與融合實現對民俗過程的數字化表達。”[2]目前這類工作已經呈現出“從民眾中來,到民眾中去”的發展趨勢,例如芬蘭的“芬蘭·關聯型數據(Linked Data Finland)”[3]開放式平臺,內含多種文化遺產集庫(網站認為其語義民俗項目Semantic Kalevala and Folklore,大概是世界首次將民俗作為鏈接型開放式數據發表),大眾可自由申報發表、編輯不同種類的數據。放眼其他國家,愛沙尼亞民俗檔案館也研發了相關平臺,“眾包”搜集民俗資料。再以非盈利真人故事項目StoryCorps為例,14年間自發錄制的故事資料已逾6萬份,參與者來自美國50個州及多處領地逾10萬人[4],資源共存于美國國會圖書館,對世界開放共享。
在中國,據文化部民族民間文藝發展中心李松、王學文總結,隨著數字技術的發展和聯合國等對文化數字化工作引領,民俗文化數字化工作始于1990年代,興于本世紀初,目前擁有“全國文化信息資源共享工程”“中國記憶——民族民間文藝基礎資源數據庫”等多類大型惠民數據庫,成為紙質民俗和活態傳承的重要替代介質,但總的來說,目前“在體制機制、技術對接、文化標注和解碼等方面還有諸多困難”,存在“對數字化的認識不夠,缺少頂層設計,跨學科人才和研究不足,內容與技術、社會應用脫節等問題”。[5]在“眾包型”民俗文化數字化共建的進程中,我國更為滯后,與當代社會和技術的發展潮流不符,要建設依賴專業民俗工作者自發共建的民俗文化數字化項目,值得借鑒國外先進思路和路徑。當前已有文獻對美國口述歷史數字資源庫進行綜合介紹[6],但缺乏對具體眾包型資源庫的單個案例作縱深考察。
本文擇取美國職業民俗項目(Occupational Folklore Project,簡稱OFP)作為典型案例探究這種運作機制。職業民俗專指特定職業的從業者的文化風俗。美國早期的職業民俗先驅學者聚焦伐木工人、漁民、礦工和牛仔等群體,后來拓展到消防工人、調酒師、泥瓦匠等。2010年為紀念過世的美國民俗生活中心創建先驅Archie Green(1917—2009)而設立了以他命名的研究項目基金,推動學者們走近更為多樣化的群體,例如賽馬場工作人員、馬戲團員工、港口工人、鐵廠工人等,近年拓展對象到物業員工、民族風情店店主、公園巡護員、小學及社區學校等的教師等。[7]隨著時代的發展,美容師、電腦特技師、快遞員、包車司機、網店主人等工作生態也都值得關注。該項目由隸屬美國國會圖書館的美國民俗生活中心創辦,旨在通過訪談全國各行各業的工作者,展示美國勞動力的全面風貌。
下面以該項目網站和網站負責人、美國民俗生活中心專家Nancy Groce和Bertram Lyons對項目介紹為主要參考[8],深入剖析這種“眾包型”民俗文化數字化項目的歷史經驗、隊伍安排、科研風范、技術細節、倫理保障等,進而關聯中國情境,從籌建組織、技術拓展、內容創新、推廣宣傳和成果轉化等環節拓展思考,以期能為未來中國民俗文化數字化工作提供借鑒和啟發。
分析發現,美國職業民俗項目的眾包型訪談采集具有以下五種特色:豐富的歷史經驗傳承、新穎的隊伍設計思路、扎實的科研工作風范、細致入微的技術跟進和嚴謹科學的倫理機制保障。
美國職業民俗訪談項目具有較深的歷史淵源和豐富的經驗積累。
1.1.1歷史傳承
該項目可溯源到1930年代經濟大蕭條時對工人風俗的采訪記錄項目(1936—1940,收集了來自24個州300位作者和采訪者2 000~15 000字不等的近3 000份文檔)。[9]在21世紀初全球化經濟危機背景下,2010年啟動這一項目,推廣延續這種歷史記錄、表達對工人的關注(同時大概也是對剛剛辭世的先驅學者Archie Green的禮敬),不少文檔成為近百年后新項目的范本。
1.1.2研究經驗
職業民俗是美國民俗生活中心多年的關注點。職業民俗先驅學者Archie Green即該中心的創始元老,他于1976年推動美國國會通過法案,承認民俗的重要性和創建美國民俗生活中心的必要性。1994年該中心啟動了為期4個月的工作在帕特森市風俗項目(Working in Paterson Folklife Project),在新澤西州帕特森市(美國最大的絲綢生產中心、重要制造業基地),聚焦“工作如何塑造了社群生活和價值觀,如何與家庭、民族、性別、鄰里等交叉關聯,并隨著時間發生變化的”,項目共收集了近百小時6 000多份照片、700頁音頻圖片筆記、300多頁田野筆記,并在線開放了所收集的近500種種錄音片段和3 000多份照片。[10]近年來,該中心主辦了系列研討會。例如,2007年曾舉辦“勞動民俗對話:記錄職業民俗的今昔”研討會,匯集學者和社區工作者探討勞動/職業民俗記錄歷史的發展,特別是館藏工作文化集庫的建設問題。在2010年舉行的以“工作與轉變:記錄工作中的美國人”[11]為主題的研討會上,也涉及到美國工人文化傳統的社群型記錄項目,并探討了對美國圖書館和博物館作為口述史記錄存儲庫的重要性,和借助個人勞動敘事這一社會研究方法的重要性等。
1.1.3數字化工作經驗
事實上,自1928年美國國會圖書館就已創建民俗文化典藏(Archive of Folk Culture),1940年代以來從最初的歌謠搜集擴展為 各類民俗、口述史記錄,目前規模可謂當世翹楚。[12]1978年美國民俗生活中心作為國會圖書館的下屬單位成立兩年后,該典藏轉由此中心主持,因此該中心的數字化典藏工作經驗積淀豐實,只是數字化手段從錄音帶到磁帶,再到如今的數碼錄音,在不斷演進。中心現有大約2 800種集庫(41種在線開放),其中包括逾20萬份錄音和400萬份資料。[13]近年來,美國民俗生活中心發起或參與了多種重要的集藏項目,例如2000年發起的“退伍軍人歷史項目” 和2003年以來眾包型的“百姓故事”(StoryCorps)存儲庫。
民俗文化保護需要多方合力,眾籌、眾包、眾志成城的方式無疑可以最大力度地發揮群眾的主動性,增強項目的智慧性和靈活性,并盡可能降低運營的成本,同時也能促進受惠面的擴展。美國職業民俗訪談項目顯示,贊助方與訪談人員均陣容強大。
1.2.1管理層面
該項目的聯合贊助方包括美國國會圖書館的美國民俗生活中心、美國博物館與圖書館服務署、美國民俗學會和美國國家傳統藝術委員會,多方聯動。
1.2.2訪談隊伍
訪談隊伍的預設范圍,體現了當今“眾志成城”型的工作潮流、特色。據中心專家Groce和Lyons介紹[14],美國職業民俗項目的目標訪談者隊伍包括民俗學和口述史的學者、圖書館和博物館的工作人員、獨立學者、其他研究者等不同職業和學科的人員,“以推動一個高效、靈活、能發動全美國同行及合作者參與的多樣性收集項目”。預期訪談地點包括“社區圖書館、地方典藏庫、博物館、歷史學會、文化組織、大學及大學圖書館、工會、職業協會”等。在局部開放的兩年試運行期中,共收集了十個州和華盛頓自治區的150份訪談記錄,涵蓋了金礦工人、記者等多種職業的訪談資料,參與者包括來自威斯康辛大學麥迪遜分校、美國西部民俗生活中心、華盛頓特區馬丁·路德·金紀念圖書館等大學師生、藝術文化組織/協會的工作人員、獨立研究者等,進展良好。
從下面職業清單、術語表和主題清單的開發,可見美國職業民俗項目扎實的科研風范。
1.3.1職業清單
在總結美國勞工部和美國國會圖書館的職業清單的基礎上,反復論證提煉,最終確定了一份包含150種專業和子專業的職業清單(允許并鼓勵交叉重疊選擇職業領域/性質),并在其下附了其他職業和其他解釋(如待業或兼職)的填空。
1.3.2術語表
據Groce和Lyons介紹,為避免歧義,作者及其他存儲和分類人員開發了一種詞匯表,提前限定主題詞和術語。[15]借助美國國會圖書館的專題標題數據庫(Library of Congress Subject Headings,簡稱LCSH)的265 000個題目,幾經討論,最終將名單范圍縮小至140條。
1.3.3問題清單
為方便訪談者,項目準備了下面17個參考問題[16],分別涵蓋了個人的職業種類、生涯演變、職業學習、物理環境、職業人事、工作過程、職業傳統、職業技能、職場氛圍、職場心態、職業需求、職業變革等等,設計周全,表述得體。具體問題包括以前做過什么工作、現在做什么工作、參加現在工作的原因、工作以來的情況變化、剛開始/第一天工作的情況、當前工作的學習過程、工作場地、工友/同事情況、工作日典型情景、工作所需的特定知識或者技能、工作軼事/笑話/傳統/綽號、對當前或以往工作滿意之處、希望當前工作發生哪些變化、最喜歡/感覺最有意義的工作、夢寐以求的工作是什么、對自己孩子或者身邊其他人的工作預測、對工作中的新手有何建議等。
據Groce和Lyons介紹,通過定制的甲骨文應用快車(Oracle Application Express,簡稱Oracle APEX) 平臺及相應的效果測試,項目允許合作者們提前分類和描述自己上傳的資料,從而減輕研究者的工作(當然民俗生活中心的分類員也會設置描述區域的參數和值,在一定程度上控制合作者們的自行分類)。[17]這歸功于計算機網絡技術的先進性:“Oracle APEX,除了提供強有力的以對象為導向的數據庫平臺以外,還能為用戶提供工作空間來開發和定制數據庫表格和報告,從而與收集分散型數據的網絡應用組合工作。”[18]
具體來說,美國職業民俗項目網站除了介紹性網頁以外,主要分兩大步驟促成與其合作的公眾參與項目。一是采用開放型網頁:首頁介紹本項目,并設有鏈接,通往核心訪談問題和訪談許可發布表格等,專供方便有意愿的公眾點進; 二是采用特殊型網頁:由于系統處于測試階段,這類網頁僅對少數公眾開放。有合作意向的工作,需征得項目主管同意才能獲取新的URL地址進入相關網頁,從而在線填寫特制的分類模板“訪談數據表格”。 該表格無法下載,但可以實現異地多次填寫和保存,最終閱讀和審核時,采訪者可以下載另存為pdf/word或網頁格式;此外提交的資料可以下載保存為逗號分隔值文件或CSV或可擴展標記語言(XML)格式。[19]
項目為填寫IDF的公眾準備了許多幫助彈窗,每一步都提供了填寫規則、提醒事項或填寫范例等,助力他們完成三個填寫子步驟:第一,登記單位,包括單位名稱、簡介和聯系方式等;第二,登記人物,包括其姓名、年齡、籍貫、聯系方式等;第三,創建新的訪談記錄。最終每位合作者需要填好訪談的時間、地點、簡介(500字以內)、附注(選填)、錄音材料(45~60分鐘,限WAV格式和24 bits/96 kHz清晰度)及/或有時間分段的3萬字以內的訪談記錄(可離線續寫再黏貼)來補充或替代錄音材料。提交后數據庫自動生成分類號碼, 需要合作者在原文件名上附加此號,以便標識統計。 當然,網站也設置方便用戶的頁面導航條等常見功能,此外還配備了更多周全的功能,包括在網站首頁設置快捷路徑,直接鏈接編輯中或已完成、已提交的訪談資料。提交資料成功后,提交者和美國民俗中心的工作人員就會收到電郵形式的提醒。
此外,上述報告顯示,根據項目設計,所有上傳資料先傳到網絡云盤中轉審核,審核通過后再轉存到美國民俗生活中心的服務器;項目最初使用的網絡云盤是ADrive,價格低、方便用,但上傳或下載的速度往往超慢,后來改用了功能更強的DropBox網盤。
美國職業民俗項目謹遵研究倫理,從諸多環節上細化了參與者及受訪者的隱私保護,網站展示的具體措施如下:第一,知情同意手續。首先,在采訪環節上,項目不接受暗地訪談錄音,強調收集資料的標準程序,是告知受訪者,整個采訪過程都在錄音。其次,在發布環節同樣需要知情同意,采訪完畢請受訪者閱讀提前打印好的有關訪談公布表格(其中提到許可國家圖書館收錄該錄音資料入其集庫,以供研究者、相關組織、訪談者合法獲取使用,及滿足圖書館其他非商業用途的附注、傳播、表演、編纂、轉載到其他網站和媒體等需求),然后簽名存檔,一份檔案電郵上傳/傳真/郵寄給國會圖書館,另一份供受訪者自己留存。訪談者本人也需提前閱讀并簽字提交相似用途的知情同意書。第二,致謝受訪者。項目擬建技術協議,自動發送給受訪者感謝信。第三,隱私保護制度。 項目保護個人隱私信息,例如家庭住址、電話、郵箱等個人聯系方式僅對中心人員及創建者開放。第四,中轉數據清理。中轉網盤上數據注意在審核和轉存后即時刪除。第五,求助體制。提交過程中遇到問題可電郵或電話中心工作人員求助。
近年來,中國經濟發展迅速,技術突飛猛進,社會文化不斷進步,如能將其復興昌盛的歷史風俗面貌記錄下來,必是彌足珍貴的館藏資料。鑒于中國人力充沛,無論是職業民俗,還是其他相關民俗,創建類似眾包型電子集庫,有較大的可行性。籌集設計中,除了參考上述項目經驗,還可以從體制籌備、技術跟進、內容拓展、推廣宣傳、成果轉化等幾個方面根據中國的政治、經濟、社會、技術實際情況,強化、補充、改進或創新做法如下。
宜從法律制定、倫理規范和工作機制幾個方面加強對眾包民俗數字化項目的保障護航:一是法律護航。未來的社會是法治的社會。“眾包型”項目涉及人數廣泛,錄音、照相等涉及不少個人隱私或敏感事項,因此做好法律研究和保障工作,將法律保障滲透設計到每一個流程細節,甚至配備法律顧問,都是十分必要的。二是倫理先行。應避免在法律與倫理的灰色地帶出現問題。當前中國科學研究的道德倫理工作存在大量的提升空間,許多科研人員的倫理意識不夠強烈,因此可將培訓工作做充分,例如知情同意機制的強調與落實,處理訪談問題的技巧(避免誤導、規避提醒敏感事項等),或剪輯受訪者話語以保護隱私等等。此外,像聯系信息不開放、美方隨時刪除中轉盤資料、去信感謝訪談雙方的貢獻等,都值得借鑒。三是機制保障。比起美國,中國集體主義價值觀更為強烈,項目的執行少不了涉及方方面面的機構組織,需要理順關系,爭取各類機構最大力度的支持,統一相關采集流程、標注概念和技術規范等,從而盡可能把分散的資源和人力匯聚為合力。
首先,參考美國,明晰化各種步驟,并通過技術手段實現目標。根據中國當前的技術力量,美國該項目的技術應不難實現。此外,可以從以下方面力爭技術創新:音頻格式。統一標準元數據的前提下,拓展元數據類型。截止到投稿前美國職業民俗項目僅限于音頻和圖片資料,音頻僅限WAV格式,造成“街拍”等模式極大不便。根據當前中國在科技的進展,MP4等多種格式兼容應該不存在太大技術問題。同時,兼顧用戶體驗,如能實現視頻格式的訪談(在受訪者同意的前提下),必能充實類別,方便觀眾更好地理解相關民俗。擇選少數典型,開發為立體多維視頻,虛擬現實,滿足不斷增長的立體視眾。做成開放式平臺,審核通過的訪談資料,標示資料的清晰度和可用度等,顯示其點擊量及其排行,并設置個人專區和積分功能,增強參與者成就感和參與意愿。
可以從數據收集標準的開發和數據收集過程的預控兩個環節來夯實理論基礎:首先,收集工具開發。參考美國職業民俗生活等數字化項目及中國的相關數據資料,論證、開發基于嚴謹科學研究的核心概念界定、分類體系、收集問題、主題詞設置等。其次,對“眾包”人員培訓。為保障科學嚴謹的訪談視角和過程,也采取對訪談人員進行資質鑒定 “過濾”手段,還可增設在線培訓的環節,通過靈活并有一定趣味性的動畫視頻培訓、在線參與式閱讀并答問、小型測試等培訓手段,確保他們熟悉專門主題下的訪談問題、對象擇選、訪談倫理、訪談禁忌、訪談技巧等,具有必要的理論知識、技能和意識。
可從社會文化視角,增加推薦、評論、辯論等社會互動環節,也可拓展思路開發衍生產品。例如:第一,增加推薦訪談模塊。鏈接國內外開放視頻網站相關的視頻鏈接,并附上點擊次數排行等,從而可以拓展觀眾眼界,并方便其擇選更典型的音頻/視頻。第二,增設評論版塊。感性、參與性和互動性是新世紀人類的需求亮點。除了記錄歷史,民俗項目往往能協助移風易俗,而增設評論版塊,無疑可以吸引更多參與、強化教育效果,還可能借助評論內容來拓展項目內容(例如讀者分享更多知識資訊,或表示志愿加入等,都是當今評論版塊常有現象)。第三,開設公開的訪談主題。可以增設引人深思的相關問題,甚至辯題,或投票表達意見的項目,從而吸引參與、深化效果。第四,增設衍生產品版塊。擇選訪談雙方允許的典型資料,改編成新的紀錄片等,或撰寫研究文章,或開放選拔教案設計,鏈接到訪談頁面,并將綜合性衍生產品,設專欄鏈接于網站首頁。
保障“眾包”效果,需要找到足量而合適的人員。以下措施可以推廣宣傳,助力人力資源。一是“三微一Q”。發揮社交網絡力量, 通過創建相關微博、微信群聊、微信公眾號和QQ群募集擴大采集甚至編輯的志愿者隊伍,擴展項目宣傳力度。二是競賽/獎勵。設置專項資金,根據訪談資料的點擊量排行,定期評選獎勵田野工作者上傳的或項目組改編/其他衍生產品中知名度最高的,冠以“訪談達人”“感動職場人物”“創新能手”“最佳訪談團隊”“最佳教案設計”等榮譽。對積極參與互動、積分高的讀者觀眾,定期抽獎,送虛擬禮品或象征性禮物。三是采用其他手段,例如微電影、H5等網頁互動技術集合等宣傳手段,也各有其強化或便利的宣傳效果。
“眾包”型數字化資源庫建設過程中收集的的訪談資料成果可以轉化應用到管理決策、科研產出、教育工作與社科普及等方面。比如,可助力管理決策,將成果要點或基于成果的提案,轉送給相關工作單位或決策部門。可助力科研產出,經過知情同意環節,提供獲許可的內容給民俗學、社會學、歷史學、心理學、環保等研究者,作為一手資料產出研究報告、應用或理論型論文,并在合適的時間編著成書,也可建設不同學科類別的語料庫。還可助力教育事業,如上所述,音視頻和圖片、文字訪談資料,可以作為故事改編、歷史探究、社會調查、口語辯論、評論寫作、拓展調研等基礎材料,即便只能部分內容或向部分地點開放,必會惠及師生,為他們提供走近真實生活、深化思辨能力的窗口。另外,一些衍生產品,例如記錄電影或者數字展板等,可以定期或流動播放給需要的人群,擴大社會受惠面。
總之,通過透視分析美國職業民俗項目的優勢和不足,聯系中國的國情特色和需求,對專門類別的數字化民俗資料“眾包”收集的前景和路徑進行了分析展望,為數字化和大數據時代中國及跨國相關民俗數字化“眾包”集采項目建設,在經驗積累、組織籌備、人員安排、科研工作、技術跟進、法理保障、推廣宣傳、成果轉化等諸環節提供了資訊和思路參考,期待中國數字化工程為民族文化傳承復興、人民精神生活改善貢獻更多力量。