鍋艷玲



摘 要:貝葉經是人類珍貴的文化遺產,目前數據庫、VR、GIS等數字技術在文化遺產保護中已得到了普遍應用,為貝葉經的數字化開發利用提供了一定的技術條件和社會條件。通過元數據能夠形成對數字貝葉經生成、捕獲、處置、保管的全流程監管,元數據元素集設計是貝葉經數字化建設的關鍵和基礎。文章基于本體理論和方法,以本體概念模型為框架,提煉貝葉經的核心元素以及各子元素,分析元素關聯,構建起貝葉經元數據核心元素集,目的在于為貝葉經的描述提供統一標準,為不同機構貝葉經的數字化建設奠定基礎。
關鍵詞:貝葉經;元數據;本體
分類號:G273
Research on Metadata Design of Palm-Leaf Scripture based on Ontology
Guo Yanling
(School of Management of Hebei University, Baoding, Hebei, 071000)
Abstract: Palm-leaf scripture is a precious cultural heritage of mankind. At present, digital technologies such as databases, VR, GIS, etc., are widely applied in cultural heritage protection. The digitalization and utilization of palm-leaf scripture has certain prerequisite. The whole-process supervision including creation, capture, disposal, and storage of digital palm-leaf can be formed. Metadata standard is the key and foundation of the palm-leaf scripture digital construction. Based on the ontology and related methods, this paper extracts the core elements and their sub-elements, analyzes the elements and their interrelationships, constructs the palm-leaf scripture conceptual model, and designs its metadata specification based on the model. The research aims to provide a unified description standard for different organizations during their digitalization and utilization.
Keywords: Palm-leaf Scripture; Metadata; Ontology
貝葉經是一種以貝葉(棕櫚科植物的葉片)為載體,以刻寫為主要記錄方式,以梵文、藏文、巴利文、傣文等語言拼寫,以佛教典籍為主要內容的文獻遺產。大部分貝葉經形成于公元8世紀至14世紀,其獨特價值受到宗教、圖書情報檔案、民族、語言、美術等多學科領域關注。2021年3月,以CNKI為平臺,以“貝葉經”為主題進行檢索,得到結果為111條,經過人工分析,去除重復性、主題相關性較弱的非學術性記錄34條后,對77條檢索結果進行了分析。發現學者們對貝葉經的研究主要集中在以下幾個方面:第一,貝葉經的多元價值,焦云宏、王明姣研究了貝葉經的宗教、文化、生態、教育和經濟價值在傣族社會中的具體體現[1];王明嬌在其碩士學位論文中通過問卷與訪談調查傣族地區民眾對貝葉經價值的認知狀況,詳細闡釋了貝葉經的多種價值形態,并對價值影響因素進行分析[2]。第二,貝葉經實體保護與修復,如黃曉霞、張美芳針對貝葉經手工修復較為粗放的現狀,提出對修復行為開展風險評估,避免破壞性修復[3];唐龍以西安大雁塔慈恩寺貝葉經的保存為例,研究真空技術在有機質文物保護領域的應用[4]。第三,貝葉經制作技藝傳承,解夢偉、侯小鋒實地調查了西雙版納勐罕鎮傣族貝葉經的制作技藝,詳細介紹包括取材、煮洗、晾曬貝葉、修整貝葉、壓平、彈線、刻寫、上色與保存在內的整個制作流程,并提出制作技藝傳承人培養、檔案化管理、數字化保存等建議[5];黃琴從非物質文化遺產保護的角度研究了貝葉經制作技藝的建檔工作[6]。第四,貝葉經信息編目及圖像處理,鐘卿等針對貝葉經圖像背景不均勻及字符與背景顏色對比度較低的問題,提出圖像增強與Sauvola算法相結合的方法,以得到清晰的二值化結果[7];羅平嘗試利用RDA(Resource Description& Access資源描述與檢索)標準對傣文貝葉經編目[8]。
可以看出,學界對貝葉經的研究是持續且穩定的,但互聯網時代涌現出來的信息技術及互聯網思維尚未“造福”貝葉經,貝葉經在宗教研究、歷史研究、生態保護、教育、文化傳承、和諧社會維護、對外交流、旅游發展等多方面的重要價值尚未充分彰顯。從實踐上看,圖書館、檔案館、博物館等館藏機構將貝葉經視為“鎮館之寶”,出于實體保護的需要,藏而不用現象普遍存在。數字環境下,開放、協同、多樣的新技術和新理念為數字貝葉經資源建設提供了新的思路和范式,即通過現代數字技術、網絡技術揭開貝葉經“神秘的面紗”,使其走出特藏室,走進數據化新時代。元數據設計是貝葉經走進“新時代”最為緊迫和基礎的任務,文章基于本體的理念和方法,嘗試設計貝葉經元數據元素集,為貝葉經數字化及數字資源整合、開發、利用奠定基礎。
1.1 元數據是貝葉經數據庫建設的關鍵
元數據即“關于數據的數據”,是對數據進行組織和處理的基礎,由于其包含關于數據結構、內容、管理等方面的信息,被作為數據生成、捕獲、處置、保管等全程監管的重要工具。數據庫具有強大的存儲、管理、查詢功能,也是未來貝葉經信息存儲與管理的最佳選擇。目前學界對貝葉經的研究大多基于實體,有關數字化建設的研究較為有限(僅限于拍照及掃描)。隨著數字技術的成熟,將貝葉經以拍照、掃描等方式進行數字化采集,通過圖像處理、OCR等技術對貝葉經數字信息進行加工、處理,轉換成計算機可讀、可存取、可利用的信息已不存在技術上的障礙,這些貝葉經數字信息將成為數據庫建設的原材料。數據庫不是將某一館藏機構貝葉經信息簡單地組織和羅列,而是在更大范圍內形成一個有序的、統一管理的集合體。貝葉經內容豐富、語言多樣、制作工藝流程復雜、形成以及流傳地域廣泛,存儲、管理紛繁復雜的貝葉經信息,需透過復雜表象,厘清其基本概念和相關屬性,提煉核心元素集,為貝葉經著錄、存儲、處理制定統一規范,這是數據庫建設和貝葉經信息利用的關鍵。
1.2 元數據元素集是貝葉經信息整合的基礎
我國珍藏的貝葉經數量較多但較為分散,云南省博物館及圖書館、西雙版納州、德宏州等地的檔案館、西藏布達拉宮、西藏文化博物館、國家圖書館、北京民族文化宮、中國佛教協會等機構以及收藏家手中均有一定數量的收藏 [9]。各機構都非常重視對所藏貝葉經的管理和保護,甚至將其視為本機構的“鎮館之寶”,由于所處地域及氣候特點、機構性質不同,館藏貝葉經數量及狀況、對貝葉經的管理及采取的保護措施各不相同。因此,在貝葉經數字化尚未完全展開的情況下,設計元數據元素集保障各主體按照統一的框架對貝葉經進行描述和管理,可為不同主體資源整合提供基礎,避免重復勞動和無效勞動,提高數字資源建設的質量。在統一元數據元素集的支持下,各主體既是貝葉經信息的建設者,也能無障礙識讀、解析、利用其他機構的貝葉經信息,進而不同來源、不同語言、不同形態的貝葉經可突破機構和地域限制,在跨平臺、跨數據庫的情況下形成集成數字資源體系,實現對貝葉經信息的整合。
1.3 元數據元素集規范是貝葉經信息開發利用的保障
貝葉經雖最早產于印度,但由于當地氣候及保存不當等原因,大部分已經破損或丟失。西藏是我國貝葉經流入的重點區域,西藏常年低溫、干燥的有利氣候條件加之館藏機構的重視,至今保存有千余函(種)、近6萬頁的貝葉經。貝葉經傳入傣族地區后,加入了“此土著述”部分和一些世俗文書,使其成為世界范圍內佛教的獨特個案[10],傣族人民受貝葉經啟發,還用貝葉來記載傣族人民生產生活的方方面面,成為傣族人民的“百科全書”[11]。貝葉經是一種跨國、跨地區、跨民族的文化遺產,通過對貝葉經的開發利用,能夠拉近我國與鄰國的距離,開展更廣泛的國際合作與文化交流。貝葉經元數據元素集設計,為各主體提供統一的數字化建設規范,借助數字技術、網絡技術的支持,貝葉經信息以數字化形態公布于眾,保護實體不受傷害的同時充分發掘其在傳統文化、藝術、歷史等方面的重要價值,突破空間、民族、宗教信仰等方面的界限,拓展開發利用的范圍和深度。
2.1 反映貝葉經的特質
貝葉經與其他類型文獻遺產相比,在其內容、制作過程、載體材料等方面有特殊之處,貝葉經元數據的元素集設計需從貝葉經特質出發,析出關鍵要素,形成貝葉經元數據獨有的核心元素集,將其用于貝葉經信息的著錄、存儲、處理和交換之中。作為一種依據性、基礎性的編碼體系,元數據的元素集并非無所不包,也并不過于強調個性化,而是從復雜的表象中抽離出能反映貝葉經自身以及管理特征的要素(包括描述其內容、內在屬性及外部特征的描述元數據,描述其加工、結構、技術處理、權限管理等情況的管理元數據),以反映貝葉經特有的內在、外在屬性及管理需求,為不同主體提供統一的、可操作性的框架,形成標準化資源庫,便于今后的數據交換和共享。
2.2 適當復用已有元數據標準
目前國內外已經產生并得到實際應用的元數據標準較多,每個元數據標準都有各自的特色和優勢。如DC(都柏林核心元素集)以簡單明了、可擴展、語法獨立、語義互操作性較強得到了廣泛的國際認同,VRA可視資源核心以描述可視文化作品及其圖像資源而見長,FGDC數字地理空間元數據為數字地理空間數據文件提供通用的術語和定義集。貝葉經作為信息資源體系的一部分,是一類較為特殊的文獻遺產,從資源描述、組織、管理的角度而言,與其他資源也有相通之處,因此元數據設計應理性分析貝葉經特色及管理和利用需求,適當吸收、應用、兼容目前流行的元數據標準,一來盡量提高元數據設計的效率,二來有助于將貝葉經信息納入整個信息資源體系,融入社會信息資源建設之中,提高信息資源在社會經濟、文化建設中的貢獻力。
2.3 與利用者和技術發展協調一致
作為信息整合的基準、工具和方法,貝葉經元數據包含較多元素,但人們對貝葉經的認識和利用角度不是一成不變的,數據加工、分析的技術也是與時俱進的,因此元數據的元素集設計也不是一勞永逸,而是要具有一定的彈性,與用戶需求和技術的發展水平協調一致。貝葉經元數據的利用者包括貝葉經信息的組織與管理者(大多為機構工作人員),他們需要利用元數據對館藏貝葉經進行存儲、管理與保存,也包括基于科研、文化傳承、興趣愛好等各種原因而獲取、利用貝葉經信息的主體,他們需要按照友好、簡單的檢索途徑查找貝葉經信息和知識,而這些檢索途徑離不開元數據的支持。元數據設計既需立足于利用者當前的操作水平,又要考慮到未來利用者操作能力和信息需求的縱深發展。元數據功能的實現是離不開信息組織、內容揭示、數據檢索等技術的支持的,而這些技術的發展是迅速且難以準確預計的,元數據規范需具有較強適應性,否則會影響到長期使用效果。
2.4 能夠關聯相關信息
從內容上看,貝葉經不僅限于佛教經文,也包括天文地理、民情風俗、醫藥衛生、社會生活等方面,因此貝葉經具有多重屬性,是真實的社會記錄(檔案學的角度)、珍貴的古籍(圖書館學角度)、難得的史料(歷史學的角度)。除一些貝葉經被私人收藏家收藏外,大量貝葉經被保存在博物館、圖書館、檔案館等機構。而這些機構同時還保管有大量的古籍、文獻、檔案等資源,以履行其社會職責,貝葉經是這些機構館藏資源的一部分。從用戶需求角度看,一部分用戶會將需求限定在某種特定的文獻類型,而大量用戶會基于內容,并不拘泥于某一種文獻類型。因此需要以貝葉經信息為基礎,以用戶需求為導向,一方面建設貝葉經資源庫,另一方面運用數據關聯技術將貝葉經資源庫與本館的目錄數據庫、文獻數據庫、圖像數據庫關聯,以形成集成、立體的知識體系。為此,在設計貝葉經元數據的元素時,需充分利用元數據映射資源與資源之間、概念與概念之間、元素與元素之間的關聯,優化機構信息資源建設的質量。
本體論(Ontology)最初是研究存在本質的哲學問題[12],自引入到信息組織領域以來,因其對概念的準確表達和對隱含關聯的邏輯推理能力,得到廣泛應用,如人工智能、知識工程、數字圖書館等[13]。貝葉經元數據設計的目的不僅在于保護貝葉經實體,更重要的是揭示其知識內容和彼此之間的相互聯系,構建一個具有關聯性的知識體系。因此,貝葉經元數據設計需要利用本體的理論和方法,對貝葉經所涉及的概念及其之間的關系進行剖析,構建貝葉經信息本體概念模型,為知識組織奠定基礎。
3.1 貝葉經本體的概念分析
概念分析是元數據元素確定的基礎,貝葉經涉及的概念主要包括貝葉經實體、主體、客體和文獻。其中主體指與貝葉經信息相關的人物與機構。人物指在貝葉經的生成、管理、保護、利用過程中所涉及的個人,包括刻寫者、捐贈者、收集者、保存者、保護者、數字化加工處理者、利用者、研究者等。機構主要指與貝葉經的生產、管理、研究、保護、利用等相關的責任部門,主要有館藏機構、管理機構、研究機構等。客體指與貝葉經生成、保護、傳承密切相關的固態實物以及在貝葉經生成、保護、傳承過程中動態發生的事件。固態實物主要指貝葉經生成、管理、數字化中所需的原材料、工具、裝具等。動態事件主要指圍繞貝葉經進行的制作、保護、傳播、傳承、教育、展示、研究等活動,這些事件伴隨貝葉經生命周期動態進行,需以文字、音頻、視頻等多種媒體形式加以記錄。文獻指以貝葉經為對象撰寫的各種文獻,既包括研究性文獻,也包括管理性、科普性、報道性文獻,如圖書、期刊論文、會議論文、學位論文、專利、報紙、政策、網站、網頁、新聞報道等。

3.2 貝葉經本體概念模型
貝葉經本體概念模型的構建是以概念分析為基礎,以圖形的方法表示概念和概念間的主要關系,能夠更加直觀、清晰地展示貝葉經的知識網絡,如圖1所示。
圖1中貝葉經本體概念模型對貝葉經、主體、客體、文獻四個概念進行細化,體現了各概念之間的關系。主要包括各主體產生、管理、研究、利用貝葉經,形成、利用文獻,組織、參加、使用相關客體;客體以實物或動態的方式作用于、使用于貝葉經,被主體使用或需要主體參加;文獻由各主體形成或利用,記錄、反映或作用于貝葉經及客體。這些概念及彼此之間的相互關系生成了以貝葉經為核心的知識網絡。
3.3 貝葉經元數據核心元素集的結構設計
核心元素集是貝葉經元數據的核心,設計核心元素集首先要以貝葉經本體概念模型為基礎,梳理出貝葉經涉及的相關要素,這些要素將作為核心元素的備選,包括貝葉經的名稱、收藏機構及相關責任者、制作時間和入藏時間、收集方式、加工處理情況、公開展覽或影印情況、貝葉測量數據、貝葉裝訂情況、夾板裝幀情況、貝葉殘損及修復情況、相關器具等。

其次,確定元素集的構成。元素集是元素的集合,一個元素名稱可能被用于不同的概念,但含義和用法會有所不同,通過釋義對語義進行修飾、解釋,確保元素的準確性和專指性。DC具有較強的復用性、可擴展性、可選擇性、可修飾性,作為目前主流的跨學科、跨領域的元數據格式,被廣泛應用到電子資源領域。貝葉經元數據核心元素集可在復用DC元素的基礎上,結合貝葉經特質對各元素進行必要的刪減、注釋或擴展,見表1。需要說明的是,表1是以貝葉經本體概念模型為基礎,針對貝葉經、客體、主體、文獻及各自包含的子概念進行分析設計而成,其中客體中的動態事件(包括保護、科研、傳承等活動)是需要通過文本、音視頻等形式的文獻記錄下來的,因此將“動態事件”這一概念的元素與文獻的元素進行合并,可減少重復。
貝葉經是珍貴的文化遺產。一千多年前,貝葉經傳入中國后不僅用來記載佛教經文,還逐漸發展成傣族等少數民族獨特的記錄方式,可謂“一葉飽含千年史”。在文化遺產保護日益成為共識的社會環境和數據庫、VR、GIS等普遍應用的技術環境中,貝葉經數字化開發利用勢在必行。基于本體探索其元數據元素集設計,不僅從信息組織、序化的層面解決數字環境下貝葉經信息描述什么、如何描述的問題,揭示貝葉經所包含的知識以及相關概念之間的關聯,從而將零散的、孤島式保存的貝葉經通過數字技術、網絡技術有效聯結,形成一體化的資源體系、知識體系,在逐漸縮短與用戶距離、與用戶互動的過程中彰顯魅力,促進文化遺產“走出廟堂,回到民間”。

*本文系2019年度教育部哲學社會科學研究重大課題攻關項目“布達拉宮古籍文獻(貝葉經)搶救性保護研究”(項目編號:19JZD040) 階段性研究成果。
注釋與參考文獻
[1]焦云宏,王明姣.貝葉經典籍在傣族社會生活中的作用與價值[J].云南開放大學學報,2016 (11):62-66.
[2]王明姣.傣族地區民眾對貝葉經典籍的價值認知現狀及影響因素研究——以西雙版納州景洪市為例[D].昆明:云南大學,2016.
[3]黃曉霞,張美芳.古籍貝葉經手工修復的風險評估和應對策略[J].大學圖書館學報,2020(4):106-111+126.
[4]唐龍.真空技術在有機質文物保護領域的應用[J].文博,2014(8):72-74.
[5]解夢偉,侯小鋒.西雙版納勐罕鎮傣族貝葉經制作工藝調查研究[J].名作欣賞,2019(4):77-78.
[6]黃琴.貝葉經制作技藝建檔現狀與對策[J].蘭臺世界,2017(11):51-54.
[7]鐘卿,余鵬飛等.傣文貝葉經的圖像增強與二值化方法研究[J].云南大學學報(自然科學版),2017 (5):747-752.
[8]羅平.資源描述與檢索(RDA)與傣文貝葉經編目研究[J].佳木斯職業學院學報,2016(8):486-488.
[9]陳子丹.傣族貝葉檔案略論[J].檔案學通訊,2004(2):92-95.
[10]巫詠紅.民族檔案之瑰寶——傣族貝葉檔案[J]. 西南民族大學學報(人文社科版),2004(4):395-397.
[11]陳園園.論傣族貝葉經檔案的發掘利用[J].云南檔案,2011(5):25-26.
[12][13]蔡璐,熊擁軍等.基于本體和元數據的非遺資源知識組織體系構建[J].圖書館理論與實踐,2016(3):39-43.