【摘要】西南少數民族古籍面臨流失、破損、失傳等危機,其數字化工作存在進展緩慢、數據共享平臺缺乏、數字化技術手段單一等不足。為加快西南少數民族古籍數字化速度,應建立數據聯動機制,運用GIS時空分析、知識圖譜等新型技術手段對少數民族古籍進行深層次開發和可視化展示,促使少數民族古籍建設邁向智能化,以更好地保護與傳承中華優秀傳統文化。
【關? 鍵? 詞】少數民族古籍;數據挖掘;共享平臺;文化建設
【作者單位】牛凌燕,云南師范大學傳媒學院,四川大學道教與宗教文化研究所。
【中圖分類號】G255.1;G239.2【文獻標識碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.07.011
數字化技術及其應用方興未艾,已深入諸多領域,并且向智能化迭代,這對古籍價值再造影響深遠。《國家古籍整理出版“十五”(2001—2005年)重點規劃》(2001年)、《關于推進新時代古籍工作的意見》(2022年)等文件明確提出,要與時俱進地推動古籍電子版出版,開展古籍影印出版和縮微工作,統籌古籍的數字化建設,挖掘古籍的時代價值,促進古籍的有效利用。
中華古籍浩如煙海,少數民族古籍屬于其中不可或缺的有機組成。包和平[1]、張次第[2]、朱宗曉[3]、李雯[4]等學者分別探索了新興數字技術對少數民族古籍整理保護、傳承利用的作用。此類研究盡管有助于引發人們對少數民族古籍保存、利用的關注,但大多側重于宏觀現象描述,有時容易導致研究結論泛化。李小平等雖進行了諸如“西南地區少數民族古籍醫藥文獻數字化建設”的類型研究,但受特定分類所限,影響了跨學科、跨地區、跨平臺等數據共享機制的建構。鑒于此,本文聚焦“西南少數民族古籍數字化”議題,探究如何更好地推進其數字化進程、達成資源共享、實現價值重構的優化路徑,為古籍開發實踐提供參考。
一、西南少數民族古籍的特征、現狀及存在問題
對古籍的區域性研究可以系統地反映該區域內自然、政治、經濟、文化等歷史,揭示區域文化的源流走向。云南、貴州、四川、西藏、重慶等5個省區市所在西南地區,共有30多個少數民族,其地理環境獨特,歷史文化、風俗習慣相較中原地區有較大不同,對應古籍種類繁多、資源豐富。這些典籍見證了中華民族相互交融、和諧共處的歷史與智慧。只有明確西南少數民族古籍的特點與問題,才能更好地強化研究的針對性,達成對其進行數字化開發、利用的目的。
1.載體的不可再生性
西南少數民族地區存世古籍的載體形制包括書冊、碑刻、摩崖、木刻、皮書、布書等,以紙書為絕大部分,但制造技藝各有不同。藏族古籍的紙張以狼毒草、沉香等為主要原料,防蟲防潮,存儲時間長,但由于制造工藝繁雜,且對人體有一定的毒害作用,傳承藏紙工藝的匠人屈指可數。納西族先民留下了數以萬計的古籍文獻——《東巴經》,但制作《東巴經》的東巴紙制造成本高且生產效率低,造紙技術大多只傳授給東巴家族內的男丁,東巴古籍的傳承極其可貴。傣族的古籍大部分是貝葉經,由于存世稀少,也被譽為“佛教熊貓”。除有文字記載的文獻典籍之外,西南少數民族也留存下大量口頭文獻,如彝族的《勒俄特依》、藏族的《格薩爾王傳》、景頗族的《目瑙齋瓦》等。口傳古籍的傳承往往受社會變遷、文化沖擊、傳承者個人能力差異的影響較大。
西南少數民族古籍載體豐富多樣,極具地域特色,因各種原因限制,對少數民族古籍的開發利用不足。一方面,古籍因本身的文物性、脆弱性需要好好對待和保護,很多少數民族古籍由于年久失修或得不到妥善保管,出現了蟲蝕、脆變、污化等情況,需要進行保存技術處理、嚴格管理,甚至需要花大力氣改善收藏條件。另一方面,西南各地的民間博物館、民俗博物館、民族文化傳習所等對少數民族古籍文獻的保管缺乏專業性、技術性的條件支持,少數民族古籍文物保護責任落實不到位,古籍保護形勢嚴峻。
2.古籍解讀的門檻條件
西南少數民族古籍大多用少數民族語言載錄,在書寫、解讀、傳承上都有一定的門檻條件。彝族的語言文字歷史悠久、影響深遠,但其內部分為多個具有方言、地域特色的流派,且相互之間差異較大,如同義字寫法不一、常用字與異寫字區別不一、同形字讀音表義不一等,相互交流困難,相互查閱文獻亦不易。納西東巴在念誦古籍經典時需要在東巴文的基礎上加工整理,形成韻律協調、抑揚頓挫的口語,與書面語有一定的脫離。每一代東巴在解讀經書時,不僅保留了納西古語中有深刻內涵和宗教概念的詞匯,還加入了一些具有時代特色和地域特色的語言表達,再加上以東巴文為雛形的象形文字具有單義、多義、引申義、比喻義等,導致大多數人都不具備解讀東巴經籍的能力。
《中國語言生活狀況報告(2020)》顯示:2017年,獨龍族掌握本民族語言的人數占比由2010年的92.5%下降至59%,普米族掌握普米語的人數由2010年的75.4%下降至59.9%,藏族掌握藏語的人數由2010年的91.6%下降至67.4%[5]。在少數民族大學生中,能讀寫本民族語言文字的人寥寥無幾。藏族的格薩爾說唱藝人、普米韓規、納西東巴、彝族畢摩、苗族師公等民間藝人、學者,有的年事已高、后繼無人,有的因謝世而“人”“文”俱亡。少數民族古籍解讀的難度本身就大,再加上掌握少數民族語言文化人才的減少,少數民族文化傳承面臨嚴峻危機。
3.多類收藏的復雜性
西南少數民族古籍的收藏可以分為官方有組織的收藏、民間收藏以及海外收藏3種類型。隨著國家各級機關、部門積極開展少數民族古籍整理工作,古籍整理工作取得了豐碩的成果,但隨之而來也呈現古籍收藏整理機構較多、古籍藏品分散的特點。如:西藏自治區圖書館收藏藏文古籍10萬余冊,西藏自治區檔案館、西藏自治區博物館、西藏自治區文物管理委員會、西藏自治區黨校圖書館、西藏大學圖書館等也收藏有部分藏文古籍;云南省少數民族古籍整理出版規劃辦公室收藏傣族貝葉經100余冊,云南省博物館收藏貝葉經64冊,西雙版納傣族自治州檔案局收藏貝葉經174部507冊。
西南少數民族古籍的民間收藏途徑主要為寺廟收藏和群眾收藏。布達拉宮收藏有大量藏文古籍,其中尤為珍貴的是金字修繕的《甘珠爾》《丹珠爾》和藏文的《大藏經》。云南民間的藏文古籍大多收藏在松贊林寺、東竹林寺等寺廟中。西雙版納傣族自治州勐罕鎮曼春滿古佛寺、芒市鎮奘罕佛寺中也收藏了傣族古籍。散存在云南民間的彝文古籍、東巴古籍、藏文古籍等有10余萬冊(卷)[6]。
此外,還有大批少數民族古籍流散海外。“約有三萬冊東巴經典收藏在世界各國,其中國外約一萬五千冊分別收藏在美國、法國、德國、意大利等國,哈佛大學收藏598冊。”[7]“流散歐美的瑤族文獻約有4300余冊,日本南山大學圖書館也藏有163冊。”[8]
完整性和系統性是我國古籍整理的重要規劃和戰略部署。條塊分割的少數民族古籍收藏現象不利于對民族知識全面深入地傳承和理解,不利于構建完善的知識體系,這在一定程度上影響了少數民族古籍的系統化整理。
4.古籍整理成果應用的簡單化
西南少數民族古籍搶救保護工作自20世紀80年代開始,通過復制、影印、譯注、修復等手段全面開展少數民族古籍的搶救、整理、出版及研究工作,成果迭出。諸如《云南少數民族繪畫典籍集成》《云南少數民族古籍珍本集成》《紅河彝族文化遺產古籍典藏》等古籍的影印整理、復制再造,能夠減少對古籍原件的損壞,達到保護古籍的目的。為了便于解讀及研究,西南地區已完成《納西東巴古籍譯注全集》《彝族畢摩經典譯注》以及《中國貝葉經全集》等的注音、字譯及意譯。數十年來,云南省古籍保護中心經過不懈的努力,搶救性地修復了彝文古籍14080余頁、藏文經籍3066頁、東巴古籍490頁、傣文古籍360頁。
遺憾的是,雖然國家各級機構投入了大量的資金、人力、物力對少數民族古籍進行搶救和整理,但許多成果束之高閣,收藏在古籍保護機構、檔案館、博物館、研究所,不為普通大眾所接觸。部分整理出來的古籍成果雖然存放于圖書館,但借閱人員多為專業人士、研究人員,其價值發揮非常有限。可以說,少數民族古籍并沒有因為整理而煥發應有的“活態”。
二、西南少數民族古籍數字化開發的進展與局限
古籍的數字化開發共享是新時代背景下古籍工作的一個重要舉措。利用現代信息技術,將古籍文獻轉化為數字信息,經過加工、處理以便對古籍進行檢索、利用和深入開發,從而展現古籍中所包含的豐富信息及資源,實現古籍的價值,是題中應有之義。但目前西南少數民族古籍的數字化開發存在一些局限。
1.有數字化意識但進展緩慢
2017年,文化部關于印發《“十三五”時期全國古籍保護工作規劃》的通知要求加快推進少數民族文字古籍文獻的搶救保護和整理研究,加大對少數民族文字古籍文獻的普查登記、修復、影印出版、數字化等工作力度,促進少數民族文字古籍文獻的傳承和利用。西南地區紛紛開展少數民族古籍數字化建設工作,尤其是少數民族古籍的普查和目錄整理、識別和掃描上網、數據庫建設等工作。目前,云南已登記藏文古籍2285部、傣文古籍1874部3376冊、彝文古籍127部230冊,其中81部少數民族文字古籍入選國家珍貴古籍名錄。貴州少數民族古籍數字化平臺收錄了超過2萬條少數民族古籍總目提要,西南民族大學少數民族古籍文獻研究中心收集整理少數民族古籍電子圖書548冊、電子音像制品350余種,內容涉及哲學、宗教、醫藥、建筑工藝、天文歷算、地理歷史、文學藝術等30多個學科領域。
我國的少數民族古籍卷帙浩繁,數量龐大,其中不少珍貴古籍因年代久遠已破損嚴重,不少口傳古籍因傳承人年紀大面臨失傳的危險。西南地區對少數民族古籍數字化建設雖然取得了一定成效,但是其數字化速度仍然較為緩慢,少數民族古籍數字化的任務艱巨。
2.有數據庫平臺但缺乏聯動與共享
我國自2007年實施“中華古籍保護計劃”,對全國各個領域的古籍收藏和保護情況進行全面調查,建立古籍數字資源庫和中華古籍聯合目錄。其中較有影響力的是國家圖書館(國家古籍保護中心)的“中華古籍資源庫”“中國古籍影印叢書查詢數據庫”“中華再造善本數據庫”,中華書局推出的“中華經典古籍庫”,上海古籍出版社開發的“尚古匯典·古籍數字服務平臺”等。
西南地區近年來也紛紛建設自己的民族古籍數據庫。云南少數民族古籍整理出版與規劃辦公室建設“云南少數民族古籍數據庫平臺”,收錄了傣、彝、藏、白、傈僳、納西、佤、怒、拉祜、基諾等多個少數民族的古籍。云南省文化和旅游廳創建了15個展示少數民族特色的多媒體資源庫,如傣族文獻信息專題數據庫、東巴文獻專題資源庫等。國家社會科學基金資助建設“東巴經典傳承體系數字化國際共享平臺”,運用數字化網絡化等現代信息科技手段對東巴經典文化進行信息的采集、處理、存儲及傳播。
雖然各機構完成了少數民族古籍數字化資源庫的建設,突破了時間、空間、專業、行業等壁壘和界限,實現了少數民族古籍資源的保護、整理、查閱等功能,但同時也存在一些亟須處理的問題,如不同資源平臺有不同的端口、文獻格式和版本不一、搜索引擎和搜索關鍵詞各異等,這需要各數據庫建設單位間統籌協調。
3.內容呈現手段較為單一
就如何開展古籍數字化工作,《關于推進新時代古籍工作的意見》《國務院辦公廳關于進一步加強古籍保護工作的意見》《“十四五”文物保護和科技創新規劃》等文件指出,要制定古籍數字化標準,規范古籍數字化工作,開展古籍文本結構化、知識體系化、利用智能化的研究和實踐,加速推動古籍整理利用轉型升級。
西南少數民族古籍門類繁多,數字化形式也呈現多樣性。云南少數民族古籍數據庫平臺建設分為文字古籍庫、口傳古籍庫、整理研究庫,成果包括《滇南彝族指路經》《彝族打歌調》《求取占卜經(納西族)》等。云南省非物質文化遺產數據庫共完成云南8個人口較少民族的原生音樂和9個少數民族11部口頭傳唱史詩的拍攝和出版,組織拍攝了以傳統音樂、舞蹈、技藝為主的影像資料1047條。貴州省初步完成了少數民族古籍數字化平臺的建設,將2萬多條少數民族古籍總目提要錄入系統。西南民族大學少數民族古籍文獻研究中心打算建立國內規模最大的少數民族古籍文獻電子閱覽室和數據中心,涵蓋彝學、藏學、民族古籍綜合文獻等多個領域。
從整體上看,西南少數民族古籍的數字化建設仍然停留在簡單的數字化錄入階段,其基本形式仍以圖文的掃描上傳和口傳文本、史詩的攝影攝像為主,古籍數字化形式較為單一。而且各少數民族古籍數據庫檢索形式單一,大多按民族進行分類,或按傳統古籍的標題、責任人、題名卷數等進行分類,沒有進一步細化檢索,再加上各數據庫網站不支持圖片檢索,因此,古籍的數字化資源開發利用較為有限。
三、西南少數民族古籍的數字化創新路徑
數字時代是以信息技術為核心,以數字化為特征,以網絡化為基礎,以智能化為方向的新時代。先進的數字技術手段促使海量的數據和信息產生,但業內對信息的存儲、處理、傳播和利用提出了新的需求和挑戰。
1.以數字化技術手段加速少數民族古籍數字化進程
隨著科技水平的不斷發展,在計算機、人工智能的輔助下,古籍的整理工作獲得了長足的進步。目前國內應用在古籍數字化上的技術手段主要為OCR(Optical Character Recognition,光學字符識別) 和NLP(Natural Language Processing,自然語言處理)技術。OCR是指利用電子設備,如數碼相機或掃描儀,捕捉各種載體上的字符,然后用字符識別方法將其轉換成計算機文本的過程。OCR對印刷體文本的正確識別率高、出錯少,大大提升了數字化古籍從圖片掃描到文本處理的速度。但在運用過程中,也要注意突破“版式多樣(橫版、豎版、小字雙行等)、格式各異(除文字外還有碑帖拓片、輿圖等實物、圖像類)、異體字眾多、字形字體多變、字符集大而標注樣本少等困難”[9]。NLP主要用于古籍文本內容的自動標點,自動斷句標點技術的出現可以提高古籍整理效率,為古籍的推廣使用帶來便利。北京大學“吾與點”古籍智能處理系統就集成了多種深度學習AI模型。
除與新興技術的深度融合之外,古籍數字化還需化面為點,強化深度加工、標引,實現知識單元的顆粒化、關聯化,構建古籍數字內容知識庫,完善個性化的知識服務,從整體上實現古籍的價值再造[10]。
2.整合古籍資源,搭建完備的數據共享平臺
建設完備的古籍數據共享平臺,除加強對現有古籍數據庫的聯動共享之外,還要做好對散落在外古籍的收集、復制、整理、利用等工作,推動少數民族文字古籍文獻的搶救性保護。
新中國成立以來,西南少數民族古籍文獻不斷回歸。目前,云南完成了美國國會圖書館所藏3038件納西族東巴文獻的考訂編目工作;2004年,美國國會圖書館亞洲部數字化小組將所藏納西文獻進行掃描后在國會圖書館網上推出,實現全世界共享[11]。國家科技部充分發揮大批派往各國留學人員的作用,以多種方式進行少數民族古籍的代理調研,制作目錄,有針對性地拷貝復制品。
民間收藏少數民族古籍的數字化回歸是一種較為經濟實用且易于實施的辦法。少數民族古籍的民間個人收藏,有的是祖輩傳承下來的家族藏品不輕易外露,有的現在還在各種宗教或文化活動中傳承使用,較難實現原生性回歸。這部分少數民族古籍的回歸可以在得到收藏家庭許可的基礎上,以現場整理、拍攝,通過縮微、復制、翻錄等形式回歸。
除實現收藏在外少數民族古籍的數字化回歸與共享之外,我們還需要全面了解全國古籍存藏情況,建立古籍總臺賬,加強管理與規劃,避免重復建設,實現數據間的互聯互通,以便進一步開發利用少數民族古籍。
3.推進古籍內容的深度加工與多重開發
目前西南少數民族古籍數字化開發仍停留在淺表性的識別、校對、注釋上,應通過智能化手段,對少數民族古籍進行深度加工、挖掘、提煉,以達到更好的古籍推廣與使用目的。
對西南少數民族古籍的數字化開發應是學科融合基礎上的數字化和技術化,可以通過三維建模、人工智能、音視頻技術、虛擬現實等相關技術實現古籍的可視化,將抽象的符號文本轉換為直觀的視覺空間,降低轉化解讀少數民族古籍的門檻,使少數民族古籍真正“活”起來。也可以打破學科壁壘和專業局限,采用文本聚類、數據挖掘、本體構建、社會網絡分析、GIS時空分析、知識圖譜等方法,加強對少數民族古籍的符號數據的深層次知識加工。比如,臺灣地區利用GIS技術和遙感影像技術在《中國歷史地圖冊》的基礎上整合明清地方志目錄資料等數據,構建了以中國為空間范圍,以原始社會至現在的中國歷史為時間范圍,以中國文明為內涵資源的整合性應用環境,用戶可以古代地圖為入口了解當時的地名設置、區域大小、重要道路以及其他重要文化信息”[12]。類似技術手段的使用為西南少數民族古籍的深層次開發和使用提供了借鑒。
西南少數民族古籍作為中華優秀傳統文化的重要組成部分,其數字化進程是一個系統性的漫長過程,對其進行開發利用和價值再造,不僅需要久久為功,完成搶救性發掘與保存工作,還需借助先進的技術手段進行開發和挖掘,更好地彰顯其歷史和文化價值,促進民族文化的發展傳播,弘揚中華民族的優秀文化,提升國家的軟實力。這是適應數字時代和文化創新的必然選擇,也是實現中國式現代化建設的必然要求。
|參考文獻|
[1]包和平. 關于我國少數民族古籍資源數字化建設探討[J]. 圖書館建設,2003(4):25-26.
[2]張次第. 少數民族文獻資源建設研究[J]. 中國圖書館學報,2011(5):115-119.
[3]朱宗曉,王江晴,田微,等. 少數民族古籍的數字化傳播[J]. 圖書館建設,2013(3):23-26.
[4]李雯. 略論云南少數民族歷史檔案數字化建設活態研究[J]. 檔案學研究,2018(6):64-69.
[5]國家語言文字工作委員會. 中國語言生活狀況報告(2020)[M]. 北京:商務印書館,2020.
[6]普學旺,李克忠. 云南民族古籍與歷史文化研究[M]. 昆明:云南美術出版社,2013.
[7]中國社會科學院民族學與人類學研究所,麗江市東巴文化研究院,哈佛燕京學社. 哈佛燕京學社藏納西東巴經書[M]. 北京:中國社會科學出版社,2011.
[8]徐菲. 論海外瑤族文獻的保護與利用:以牛津大學圖書館館藏瑤族文獻為例[J]. 鄭州輕工業學院學報(社會科學版),2020(5):43-49.
[9]王麗麗,張寧. 數字人文視角下的古籍知識關聯探析[J]. 農業圖書情報學報,2022(9):51-59.
[10]歐陽劍. 數智時代古籍數字出版中的價值再造[J]. 出版科學,2023(4):17-25.
[11]何紅一. 海外中國少數民族文獻的保護與搶救:以美國國會圖書館中國少數民族文獻收藏為中心[J]. 江西社會科學,2010(12):168-173.
[12]余傳明. 基于GIS的數字圖書館:原理及應用[J]. 情報理論與實踐,2004(6):651-653.