華林 譚雨琦 馮安儀
(云南大學歷史與檔案學院 昆明 650091)
文獻遺產的保護源于聯合國教科文組織1992年發起的世界記憶工程,這一記憶工程關注圖書館、檔案館和博物館等保存的手稿、文檔、報刊、文物和其他介質的珍貴文件,以及口述歷史記錄等文獻保護問題,其目標是鼓勵采用適當手段對具有國家和地區意義的文獻遺產進行保護。[1]南僑機工檔案文獻記錄了二戰期間,3200多名華僑汽車司機和修理工應征回國,參加滇緬公路國際援華物資運輸,支持國家抗戰的歷史。隨著歲月流失,南僑機工逐漸為人們遺忘,部分散存相關機構或個人手中的南僑機工文獻也面臨散失的危險。開展南僑機工檔案文獻特色數據庫建設,不僅有利于征集散存文獻,對其進行數字化保護。同時,還可為電子編研,以及微博、微信公眾號、移動客戶端等新媒體和音視頻、VR等新技術南僑機工文獻信息資源開發提供數據支持。這對宣傳南僑機工抗戰事跡,弘揚愛國主義精神,“廣泛團結聯系海外僑胞和歸僑僑眷”,[2]為中華民族偉大復興注入文化動力有現實意義。
南僑機工檔案文獻作為載錄南洋華僑支持中國抗戰歷史的重要文獻材料,其保護與開發長期受到政府和相關文化機構的重視。2002年3月,云南檔案局申報的南僑機工檔案文獻遺產第一批入選《中國檔案文獻遺產名錄》。2018年5月,聯合國教科文組織世界記憶項目亞太地區委員會第八次會議在韓國光州召開,“南僑機工支援中國抗戰檔案”經世界記憶工程亞太地區委員會評審表決,最終入選《世界記憶亞太地區名錄》,成為世界記憶文化遺產。[3]2012年和2015年,中央電視臺和昆明市委市政府等,利用南僑機工文獻,聯合攝制《發現南僑機工》《南僑機工——被遺忘的衛國者》等影視片,宣傳南僑機工抗戰事跡。南僑機工文獻不僅是中國抗戰文獻,同時也是重要“二戰”文獻遺產,具有珍貴的歷史憑證、學術研究和愛國主義教育等多重研究和利用價值。南僑機工檔案文獻數量豐富,類型繁多、結構復雜,其特色數據庫建設就是要利用以數據庫為核心的信息技術,為南僑機工文獻資源構建數字資源整合、管理與共享開發平臺。開發意義如下:
就分布保管狀況而言,南僑機工文獻主要由檔案館、圖書館、紀念館、博物館、研究會、電視臺、報社等機構收藏,此外,南僑機工后人、相關研究學者和網站網頁等都散存有南僑機工文獻。受自然與人為因素的影響,加之保管條件簡陋,部分文化機構或民間散存的南僑機工文獻發黃、粘連、蟲蛀、破損、流失問題普遍存在,許多重要文獻都面臨損壞散失的危險。構建南僑機工檔案文獻特色數據庫,首先可將各單位收藏的,以及民間散存的南僑機工文獻以數字化征集或整合的方式進行集中保護。其次,可避免人為因素和外部環境對文獻造成損毀。再次,可利用庫房保護、異地備份、云存儲等技術,對其數字資源進行長期保管,以更好地保護與傳承這一珍貴抗戰文獻遺產。
抗戰爆發前,全世界約有1000萬華僑,其中,有800多萬分布在東南亞地區,即當時的“南洋”。由于南洋華僑人數最多,財力物力雄厚,南洋又是日軍的一個侵占目標,所以反對日本帝國主義侵略的積極性最為高漲。[4]1938年10月以后,中國海陸交通均被日軍封鎖,國民政府為獲得海外援華軍事物資,于1938年底修建滇緬公路。由于國內汽車駕駛員和修理工匱乏,受國民政府西南運輸處負責人宋子良委托,僑首陳嘉庚于1939年2月7日發布《南僑總會第6號通告》,招募華僑機工。《通告》得到南洋華僑的廣泛響應,數月間,報名回國的華僑機工達3200人。1939年到1942年,南僑機工在滇緬公路共搶運近50萬噸軍需物資和1.5萬多輛汽車。據統計,將近1000多名南僑機工犧牲在滇緬公路上。[5]南僑機工抗戰遺存有大量的歷史文檔、文物、報刊、雜志,以及口述資料等文獻,構建南僑機工檔案文獻特色數據庫,不僅可將這些散存文獻進行數字化整合集中,實現其資源體系化建設,同時,還可更好地發掘利用這一抗戰文獻,重新喚醒這段珍貴抗戰記憶,增強海外華人華僑的國家認同感,凝聚僑心僑力,為國家發展與民族復興提供文化助力。
2015年12月,習近平在主持中共中央政治局第29次集體學習會議指出:“愛國主義是中華民族精神的核心。愛國主義精神深深植根于中華民族心中,是中華民族的精神基因,維系著華夏大地上各個民族的團結統一。”[6]2020年新修訂的《中華人民共和國檔案法》第34條提出,國家鼓勵檔案館開發利用館藏檔案,通過開展專題展覽、公益講座、媒體宣傳等活動,進行愛國主義、集體主義、中國特色社會主義教育。[7]南僑機工檔案文獻真實記錄了南僑機工在中華民族危亡之際,回國參與滇緬公路抗戰物資運輸,支持國家抗戰的光輝歷史,開展南僑機工檔案文獻特色數據庫建設,一是可整合散存云南省檔案館、畹町南僑機工回國抗日紀念館,廣西檔案館,陳嘉庚紀念館,中國臺灣“國史館”,新加坡國家檔案館等機構的南僑機工檔案文獻,建成體系化資源數據庫,為開展愛國主義教育奠定資源基礎。二是可依托南僑機工檔案文獻資源數據庫,通過舉辦線上展覽,編輯電子圖書、期刊和報紙,編制南僑機工抗戰短視頻等方式,宣傳他們的抗戰事跡,廣泛傳播南僑機工義無反顧報效國家、不辭艱辛英勇奮戰、不怕犧牲舍身報國的愛國主義精神。
其一,數字化建設。目前,部分收藏南僑機工檔案文獻的檔案館、圖書館、紀念館、博物館、研究會、電視臺、報社等都已開展數字化建設工作。如為攝制南僑機工抗戰紀錄片,央視紀錄頻道派出專業團隊,赴美國、新加坡、日本、馬來西亞,以及國內8個省區收集南僑機工抗戰文獻,采訪到在世15位南僑機工中14位的口述歷史,征集到60多分鐘的彩色膠片、2000多張歷史照片,并進行數字化建設。[8]云南省圖書館收藏有20世紀30年代刊載有南僑機工回國參戰報道的《云南日報》(1939-1946)、《僑光報》(該報由云南省主辦,僅存有1940年4月)和《民國日報云南版》(1939-1945)等報刊,已進行數字化掃描加工。其二,數據庫建設。如云南省檔案館保存的南僑機工歷史檔案有850卷,為保護檔案原件,專門投入經費對2000千份檔案文獻、300幅歷史照片進行數字轉化,刻盤存貯,并開發出多個專題數據庫向社會公眾提供利用。[9]云南畹町南僑機工抗日紀念館收藏有2000余張南僑機工歷史照片和4000余件頭盔、摩托、扳手、馬燈等遺存文物。為開展數字化保護與開發工作,已對部分重要文物進行數字化加工,建成專題資源數據庫。此外,廣西自治區檔案館、福建陳嘉庚紀念館等,也啟動南僑機工文獻數據庫建設工作,為全面開展南僑機工特色數據庫建設奠定了數字資源基礎。
2.2.1 文獻資源分散性問題
南僑機工檔案文獻保存狀況為:其一,相關機構。如南僑機工文獻除保存在中央電視臺,抗戰紀念館,云南省檔案館、南僑機工歷史研究會、畹町南僑機工抗日紀念館,福建陳嘉庚紀念館和廣西壯族自治區檔案館等單位外,中國臺灣“國史館”,新加坡國家檔案館、口述歷史館等機構都收藏有南僑機工文獻。新加坡國家檔案館、口述歷史館都以錄音、錄像等方式,采集到部分新加坡南僑機工口述文獻。其二,民間散存。主要為南僑機工后人或研究學者保存。如1987年9月,學者林少川深入云南、貴州、四川、福建、廣西、廣東和海南島,對100多位南僑機工及遺屬進行尋訪,征集到大量口述文獻,以及部分南僑機工日記、手稿、紀念章、僑務委員會獎狀和軍事委員會證明書等重要文獻。[10]其三,網站網頁。如云南南僑機工歷史研究會為宣傳其抗戰事跡,在研究會網站上公布了相關視頻15條,專輯特刊6部,以及歷史照片300多張等。南僑機工檔案文獻特色數據庫建設首先要解決的是資源分散性問題,也就是要通過各種方式,征集散存南僑機工文獻,為特色數據庫建設提供文獻資源支持。
2.2.2 數據庫完整構建問題
其一,單一性問題。基于收藏單位文獻保管性質不同,南僑機工檔案文獻數據庫建設的類型也各不相同。如檔案館建設的是南僑機工檔案數據庫,紀念館、博物館等構建的則是其文物數據庫等。由于所收錄的文獻范圍與類型不同,導致了專題數據庫收存南僑機工文獻資源的單一性問題,這就割裂了檔案文獻之間的有機聯系,不利于南僑機工抗戰文獻資源完整保護與發掘利用。其二,簡要性問題。以云南省檔案館為例,2009年8月,由中國國家檔案局、新加坡國家檔案館聯辦,云南省檔案館承辦的“南僑機工抗戰史料圖片展”先后在北京、昆明、新加坡展出。利用這一展覽,云南省檔案館將200余幅館藏南僑機工照片和100余份檔案原件進行數字化加工,構建“南僑機工抗戰檔案文獻”專題數據庫。此外,還依據檔案原件,建成“南僑機工名錄”等數據庫,在云南檔案信息網“專題數據庫欄目”進行公布。[11]這些專題數據庫的建設在傳播南僑機工抗戰事跡方面取得一定成果,但還存在信息量少,建設簡要問題。為此,如何全面規劃、征集、整合與組織南僑機工文獻資源,已成為其特色數據庫構建亟待解決的現實問題。
2.2.3 標準規范統一性問題
其一,數字資源建設標準統一問題。南僑機工文獻主要為檔案館、紀念館、博物館、圖書館、研究會和電視臺等機構保存,這些機構各自資源類型、數據格式,以及著錄標準、元數據標準等差異較大,“多種類型信息資源的著錄標準與元數據標準不統一,必然對順利實施數字資源共享帶來嚴重阻礙。”[12]為此,在南洋華僑機工檔案文獻特色數據庫數字資源建設中,無論是南僑機工文獻數字化征集,或是共建機構文獻數字化建設,首先就要統一文獻資源數字化標準,為特色數據庫規范建設提供條件。其二,特色數據庫建設標準構建問題。構建南僑機工檔案文獻特色數據庫,首先要解決的問題是推薦或制定統一的著錄標準和元數據標準,其標準的制定建議采用國家或國際通用標準,以便于特色數據庫的規范化建設,及其數字資源的共建共享,以更好地開發南僑機工檔案文獻數字信息資源。
3.1.1 資源征集集中
一是機構資源整合集中。黨和國家長期重視抗戰文獻遺產保護工作,許多圖書館、檔案館、紀念館、博物館、研究會、電視臺或報社等都征集搶救了大量的南僑機工文獻。鑒于此,建議依托云南省圖書館,在文化信息共享工程框架下,組建南僑機工數字資源共建聯盟,統一著錄與元數據標準,開展南僑機工文獻數字化建設,為其特色數據庫資源整合與組織提供條件。二是散存資源征集。即采用原件或數字化征集方式,將南僑機工后人或研究學者等收藏的南僑機工紙質、聲像、文物和口述文獻,以及部分網站網頁散存南僑機工照片、視頻等,在知識產權保護條件下,進行征集整合,以豐富特色數據庫檔案資源的收錄內容與類型。
3.1.2 資源內容結構
資源內容結構為:一是紙質檔案文獻,包括南僑機工回國參戰形成的文告、文電、公函、名冊、證書和家書等。二是口述檔案文獻,即相關文化機構、學者或南僑機工后人等,采集整理的口述檔案。三是音像檔案文獻,主要有照片,視頻、紀錄片和音視頻等。四是實物檔案文獻,有勛章、紀念章、駕駛證、手表、頭盔、扳手、馬燈等。其內容記錄了南僑機工招募回國、集中訓練、搶運物資、事故病亡、犧牲撫恤和復員遣返等回國抗戰的真實歷史。南僑機工檔案數據具異構特性,主要有結構化數據,如南僑機工回國人員名冊、車禍病故名單等;非結構化信息,如南僑機工歷史文件、聲像檔案和web內容的HTML、XML格式的網頁信息等,此外還有部分半結構化檔案信息。南僑機工檔案文獻資源體系構建參見圖1:

圖1 南僑機工檔案文獻資源體系構建圖
3.2.1 數據庫軟件
目前,常用的數據庫軟件有Oracle、MySQL、MS SQL Server、Access、Visual Fox Pro、Sybase等。建議采用美國微軟開發的數據庫管理系統MS SQL Server,構建南僑機工檔案文獻特色數據庫。該數據庫軟件的主要特點為:一是客戶服務器體系結構,圖形化界面;二是編程接口工具豐富,可為特色數據庫進行程序設計提供多種選擇余地;三是和Windows NT完成集成,可利用NT諸多功能;四是數據庫開發具有較好的擴展空間性,可跨界運行;五是支持web技術,便于用戶將數據庫中的各種形式的數據發布到web上等。[13]
3.2.2 數據庫類型
數據庫的主要功能是存儲所有的南僑機工文獻數字資源,結合數據庫相關的管理軟件,實現南僑機工文獻的著錄、管理、檢索和應用等功能。建議構建四個數據庫:一是資源存儲數據庫,用于存儲基礎數字資源內容信息;二是元數據庫,用于存儲數字資源元數據信息;三是索引數據庫,用于存儲索引信息;四是資源預存庫,用于對數字資源進行規范。
3.2.3 數字資源規范
可以在后端數據庫和原生數字資源、前端數據端口之間設置數字資源預存庫,對輸入的南僑機工文獻數字資源進行數據加工和數據標引,實現數字資源的規范化建設。其一,數據加工。即通過數據清洗和轉換,使多元來源、格式不一的南僑機工文獻數據形成規范通用格式。其二,數據標引。依據一定的元數據結構和著錄規則,整合異構信息資源,便于規范保存和后期檢索利用。建議采用DC元數據標準,結合南僑機工文獻特性,對題名、主題、創建者、類型、描述、格式、來源、關聯、權限、覆蓋范圍等項著錄數字資源元數據,并通過關鍵詞、摘要等項目著錄對象數據。[14]
3.2.4 數字資源存儲
南僑機工檔案文獻特色數據庫結構依據其資源規劃,建議劃分三級層次:一級可劃分為“紙質檔案文獻”、“口述檔案文獻”、“音像檔案文獻”、“實物檔案文獻”等類目。二級層次依據不同標準劃分,如紙質檔案文獻可按其性質劃分為文告、文電和名冊等公務文檔,以及證書、家書等私人文書;音像檔案文獻按其信息記錄方式可分為歷史照片、錄音材料、影視片和相關視頻等;實物檔案文獻按其形式劃分為勛章、紀念章、駕駛證、手表等。三級層次則可根據主題,呈現具體文本、圖片、音視頻等南僑機工文獻信息內容。索引數據庫由文本信息和語義信息構成。文本信息是基礎,語義信息是在文本基礎上實現的更深入的帶有交互色彩的檢索和定位。元數據庫則包含文檔元數據、照片元數據、錄音元數據和音像元數據等對象內容。[15]
南僑機工檔案文獻特色數據庫開發性資源利用就是通過網頁信息服務、數據多向開發和融媒體通道多形式推廣等方式,提供利用其數字信息資源。開發性資源利用參見圖2。
前端網頁設置的功能是通過構建整合的南僑機工文獻數字資源平臺,通過主題、時間或類型等檢索途徑,向公眾提供原始文獻數據,實現數據資源共享。一是欄目設置。為更好地呈現南僑機工文獻數字信息資源,建議網頁設置三級目錄,同時,在網頁主頁和各級目錄之下設置檢索入口,提供欄目內和跨欄目通檢南僑機工文獻數字資源檢索功能。根據南僑機工文獻數字資源實際,設置分類檢索、全文檢索、關鍵詞檢索和和二次檢索等多類檢索工具。此外,在二、三級頁面左側可設置目錄層級下拉菜單,便于向利用者呈現南僑機工文獻數字資源層次,方便快捷地查找到所需要的文獻信息。二是信息呈現。其一,可通過基于標簽和關鍵詞等的關聯聚合,實現特定南僑機工文獻信息相關內容分布式異構數據的全方位集中,便于公眾深度了解南僑機工數字文獻。如檢索南僑機工滇緬公路運輸,頁面會集中顯示不同來源的關于滇緬公路運輸的文件、圖片、視頻或影視片等文獻數據。同時,基于關聯聚合,利用tableau、geoda等專業軟件還可進一步實現數字資源的可視化,使呈現方式更為生動具體。其二,可探索全新形態的信息呈現方式。除文本、圖片等傳統文獻載體外,部分南僑機工文獻數字資源如實物、抗戰場景等可采用3D建模、VR、AR等技術進行數字修復、數字還原等,訪問者可在虛擬的網絡空間實現沉浸式文化體驗,[11]感受南僑機工抗戰歷史畫面。
這是指依托南僑機工檔案文獻特色數據庫,全面挖掘文獻數據資源,開發南僑機工文獻信息。主要方式有:一是利用利用Cult3D、viewpoint 360度環視等VR技術,整合南僑機工文獻數據資源,舉辦南僑機工抗戰文獻專題虛擬展覽或構建可視化服務平臺,使公眾通過觸覺、視覺、運動等多種感知,[13]感受和體驗模擬南僑機工抗戰歷史空間。二是利用南僑機工數據資源,將同一主題的歷史文件、照片、錄像、錄音或實物檔案文獻等進行編輯加工,編制電子圖書、電子期刊和電子報紙等,向公眾提供多文本、形象生動的南僑機工專題文獻信息服務。三是利用南僑機工音像資源,剪輯制作南僑機工抗戰短視頻,通過微博、微信公眾號等新媒體,廣泛傳播南僑機工抗戰事跡。四是依托特色數據庫,打造南僑機工抗戰文獻APP,以多媒體、超文本形式,定期推送抗戰專題,增強南僑機工抗戰事跡宣傳效果。
南僑機工檔案文獻特色數據庫的應用還可從學術界和社會公眾兩個方面,借助融媒體通道擴大宣傳推廣范圍。在學術界,可通過召開云論壇,在線直播座談會,刊登數字學術報告、專業論文等手段,向相關研究領域的學者推廣宣傳南僑機工檔案文獻特色數據庫,提高這一數據庫在專業學者中的知名度和使用程度。此外,通過學者的使用反饋也可以進一步改進南僑機工檔案文獻特色數據庫的項目設計形式和數據庫內容,提高用戶滿意程度。在社會推廣方面,可以利用融媒體宣傳通道,將廣播、電視、手機等可視終端融合起來,借助廣播、報刊、雜志、微博、微信公眾號等多通道對南僑機工檔案文獻特色數據庫進行宣傳,提升民眾對南僑機工檔案文獻數據庫的認識程度,借此提高數據庫的利用效率,擴大社會影響力。
綜上所述,南僑機工檔案文獻作為記錄南洋華僑參與滇緬公路運輸,支持中國抗戰歷史的傳承媒介,不僅是記錄歷史事實的重要資料,更是當時全球華人華僑民族認同感、救亡圖存、齊心抗戰的歷史憑證。因此,構建南洋華僑機工檔案文獻特色數據庫,借助現代信息技術對其進行數字化開發和挖掘,不僅有利于對南僑機工檔案文獻進行數字化保護,還有利于解決紙質資源發掘時空局限性問題,提高南僑機工檔案文獻的利用率和知名度。此外,還可通過對南僑機工檔案文獻的數字化推廣,增強全球華人僑胞的國家認同感和歸屬感,這對弘揚愛國主義精神、增強民族自信心和民族凝聚力有重要現實意義。