●粟 靜 張文馨 黃書悅
(1.中山大學 廣州 510006;2.西北大學 西安 710127)
2012年,國家民族事務委員會(以下簡稱“國家民委”)發布了《少數民族特色村寨保護與發展規劃綱要(2011—2015年)》,將少數民族特色村寨界定為“少數民族人口相對聚居,且比例較高,生產生活功能較為完備,少數民族文化特征及其聚落特征明顯的自然村或行政村”[1]。截至2020年1月,國家民委共命名三批總計1 652個村寨為中國少數民族特色村寨[2-4]。少數民族特色村寨擁有悠久的歷史和獨特的文化遺產,是各族人民智慧的結晶,蘊含著豐富的民族文化元素。近年來,隨著我國自然村落的數量銳減,國家推出了一系列保護和發展政策,其中少數民族特色村寨的建檔和維護為一大重點。
當前,少數民族特色村寨建檔工作還存在信息利用程度低的問題:第一,尚無成型的少數民族特色村寨信息系統可供用戶檢索,各村寨的檔案或調查簡報記錄分散,用戶難以進行更高層次的語義檢索和內容揭示。第二,不同地區對少數民族特色村寨資料的描述存在形式和內容上的差異,用戶難以快速進行不同少數民族特色村寨間信息的橫向比對。
為應對挑戰,本研究提出構建少數民族特色村寨本體模型。本體是“概念化的具體說明,是描述概念及概念之間關系的概念模型”[5],具有良好的概念層次結構,能夠對已有的少數民族特色村寨檔案信息資源進行形式化的知識表達。使用本體對少數民族特色村寨的內容進行加工與揭示,可以更好地發揮少數民族特色村寨信息資源的價值。
為構建少數民族特色村寨本體,推進少數民族特色村寨的保護工作,本研究以相關本體建設的研究成果為基礎,預先探索可復用的本體模型。根據具體研究對象的不同,本研究將已有的相關本體分為文化遺產本體、非物質文化遺產本體、文獻遺產本體和聚落記憶本體四類,分別進行綜述。
文化遺產是“人類創造并遺留、流傳下來的具有歷史、藝術和科學價值的文化財富,包含物質文化遺產和非物質文化遺產兩大類”[6]。本體作為文化遺產數字資源語義組織的核心技術,主要用于揭示數字資源的內容及其與領域知識概念之間的關系[7]。在文化遺產領域,已有CIDOC CRM、AAT、ABC Ontology等頗具影響力的本體方案。
其中,CIDOC CRM模型是一個基于面向對象的領域本體模型,構建的信息內容更為全面[8]。劉曉娟等通過復用CIDOC CRM模型設計古建筑描述模型,并運用詞表等信息組織工具豐富模型[9];吳瓊等提出融合CIDOC CRM和地理本體兩個元數據模型的方法,構建面向不可移動文物的信息參考模型[10]。也有學者基于其他本體模型來構建特定本體,如武漢大學的敦煌壁畫主題詞項目參考SKOS模型與蓋蒂詞表本體模型,建立敦煌壁畫主題詞表本體模型[11]。
少數民族特色村寨的文化遺產是世界文化遺產的子集,因而發展較為成熟的CIDOC CRM模型能夠為少數民族村寨本體的構建提供框架借鑒,其他成熟的本體模型或者敘詞表也有一定的參考價值。
非物質文化遺產指“被各群體、團體或個人視為其文化遺產的各種實踐、表述、表現形式、知識體系技能及有關的工具、實物、工藝品和文化場所”[12]。在非物質文化遺產本體模型的構建中,大多數學者同樣選擇復用CIDOC CRM模型。如董坤等在CIDOC CRM本體模型的基礎上,結合vCard、GeoNames等本體詞匯庫進行擴展,實現了非物質文化遺產的語義化組織,以期解決傳統的單線索分類組織方法所造成的內容流失、信息孤島等問題[13];侯西龍等借鑒CIDOC CRM、FOAF等本體模型及都柏林核心元數據標準構建了非遺知識本體模型,在實體關聯階段,將非遺項目實體與DBpedia關聯,地理位置實體與GeoNames關聯,實現本體模型的拓展應用[14]。
總體來看,由于非物質文化遺產具有地域性,非遺本體模型通常會定義地理位置類,并將地理位置類與已有的地理數據庫相關聯,這對于同樣具有鮮明地域特色的少數民族村寨的本體構建具有重要的借鑒意義。
文獻遺產指“各種以文獻為主要表現形式,以文獻內容為主要價值體現的文化遺產的總稱”[15]。當前,由于缺乏統一的數字化標準規范,文化遺產保護機構之間難以共建文獻遺產數據庫[16]。文獻遺產本體構建的相關研究較少,且未從真正意義上實現本體的構建,主要研究仍處于元數據方案的搭建階段,能夠借鑒的復用方案有限。
對比其他圖書情報領域類似的本體構建成果,文獻遺產本體在盡可能復用已有文獻標準的基礎上,強調了保護屬性的引入[17]。如鍋艷玲引用本體的理論和方法,構建了貝葉經的本體概念模型和元數據核心元素集[18];周耀林等使用E-R模型設計了嵌入保護屬性的少數民族檔案文獻遺產數據庫,并使用Access實例化概念模型[19]。
總體來看,引入保護屬性思路以定期評估和維護文獻載體的狀態,是文獻遺產本體構建的一大特色。它有利于實現數字化保護與實體保護的一體化發展,為本研究搭建少數民族特色村寨本體提供了參考思路。
聚落是“一個族群的空間分布及配置”[20]。它不僅是居民住宅建筑的總和,也包括空間環境、生產設施等內容,是一個具有社會、空間、生態、文化多重屬性的集合體[21]。按照聚落的系統構成要素設計聚落本體,能夠在較大程度上保證聚落記憶的完整性。
目前,針對聚落本體的探索較少,復用模型同樣基本以CIDOC CRM模型為主。如羅藎等利用CIDOC CRM模型構建雙重本體語義模型數據,實現了“數據采集與模型重現—數據處理—類型提取—解釋分析—路徑應用”的傳統村落保護工作路徑[22]。此外,也有研究基于聚落的代表性建筑構建聚落本體,如“北京記憶”老照片時光機平臺運用GIS定位并將坐標標注于地圖中,形成了資源與地理位置、資源及資源間的關聯[23]。
綜合來看,盡管CIDOC CRM模型是針對文化遺產所開發的領域本體模型,但仍有學者嘗試將其應用到聚落本體構建上。而“北京記憶”老照片時光機平臺基于代表性建筑保持異構資源間地域聯系的方法,也為本研究構建少數民族特色村寨本體提供了參考思路。
綜上所述,少數民族特色村寨的本體建設可借鑒當前文化遺產本體的研究成果,如復用發展成熟的CIDOC CRM模型搭建本體框架、引入地理位置類從空間上關聯各類聚落資源、引入保護屬性對聚落資源進行狀態評估和維護。然而,目前文化遺產數字化本體主要針對不同類別的遺產而構建,缺乏對特定聚落單元的本體構建。
我國少數民族特色村寨作為一種聚落,包含多種不同門類的遺產資源,具有鮮明的民族特色,現有的研究方案并不完全適用于少數民族特色村寨本體的構建。因此,本研究在現有成果的基礎上,結合少數民族特色村寨的特點,探索少數民族特色村寨本體的構建方法,以期為村寨數字化提供新思路。
本研究調研貴州苗族村寨[24]、湖北省恩施土家族苗族自治州[25]、石阡縣坪山鄉堯上村[26]等一系列少數民族特色村寨,并借鑒《中國傳統村落檔案制作要求》[27](以下簡稱“《要求》”)的知識組織方式,深入了解少數民族村寨的地理環境、歷史傳說、空間結構、人群構成、產業經濟、風俗習慣、宗教信仰等內容。
《要求》旨在保護傳統村落、建立中國傳統村落檔案,其內容涵蓋了傳統村落的各類傳統資源,呈現了不同聚落組成要素間的關系,但對于少數民族特色村寨而言,《要求》的描述尚不全面。一方面,《要求》對“非物質文化遺產”的描述較為籠統,僅包含了項目名稱、圖片、音頻等要素,缺少類目劃分、傳承人和監管人、相關活動和習俗等其他關聯實體的表達,資源揭示程度和關聯性有待加強;另一方面,少數民族特色村寨與傳統村落相比,既有選址布局、村域環境、傳統建筑等共通內容,也具有突出的民族文化特征,《要求》的面向對象主要為傳統村落,僅參考《要求》并不能充分描述少數民族特色村寨的內涵與外延。基于上述原因,從以下三個方面展開對少數民族特色村寨本體搭建的研究設計。
(1)根據文獻調研與綜述研究提供的理論支撐,復用包括CIDOC CRM在內的本體模型來搭建本體,對少數民族特色村寨進行更細致的描述,加強各實體之間的關聯性。CIDOC CRM提供了一個“通用、可擴展的語義框架”,有利于統一各類數字文化遺產信息,增進相互交流和共同理解。少數民族特色村寨具有外部的統一性,同時其內部結構具有多元性和復雜性,可借助CIDOC CRM和其他本體模型構建一個專門框架,厘清各元素之間的關系,加強資源之間的相互關聯,推動文化遺產的保護和傳播工作。此外,還可以引入保護屬性并強調地理類的關聯屬性。
(2)結合文化空間理念,搭建少數民族特色村寨的文化空間。根據聯合國教科文組織的定義,文化空間是“一個可集中舉行流行和傳統文化活動的場所,或一段通常定期舉行特定活動的時間,這一時間和自然空間是因空間中傳統文化表現形式的存在而存在的”[28]。文化空間是文化生存與延續的土壤,保護文化空間是保護少數民族特色村寨文化的前提[29]。在本體搭建過程中引入文化空間這一理念,可以更好地梳理少數民族特色村寨的構成、特征與變化,保證其完整性和原真性。對少數民族特色村寨本體的搭建不僅需要從整體上描述村寨內容,還需要突出“文化空間”這一描述對象。
(3)根據斯坦福大學醫學院提出的“七步法”[30]來構建少數民族特色村寨本體。七步法是搭建本體的重要指導方法,可以按步驟將零散的知識整合并進行結構化的表達。由于七步法具有科學性和適用性,許多學者將其應用到各類領域本體模型、知識庫、知識圖譜的搭建過程中,如民樂領域本體[31]、中醫辨證推理知識庫[32]、科技信息知識庫管理系統[33]等。本研究以七步法為本體構建方法,以貴州榕江縣岑最村為研究對象,使用開放源代碼軟件Protégé來創建本體實例,并進行邏輯檢驗。
本節將根據七步法分步論述搭建少數民族特色村寨本體的過程。考慮到在七步法中,“列舉重要術語”和“定義類”這兩步相互對應,為了便于表達,本研究將這兩步合并為一步,通過以下六個步驟來搭建本體。
少數民族特色村寨不僅是一個聚落,其“產業結構、民居式樣、村寨風貌以及風俗習慣等方面都集中體現了少數民族經濟社會發展特點和文化特色”[1]。在少數民族特色村寨本體的構建中,少數民族人口的相對聚居是一大前提,本體應體現少數民族特色。
本研究構建少數民族特色村寨本體,旨在使少數民族特色村寨知識結構化,形成知識圖譜,從而使少數民族特色村寨宣傳展示平臺的內容結構更加規范,業務數據得到有序的整理與存儲。
根據綜述內容,本研究選擇以發展較為成熟的CIDOC CRM為基礎框架,結合CDWA、vCard等本體詞匯庫,構建少數民族特色村寨本體,并以《要求》為參考檔案,充分考慮少數民族特色村寨的特性,自定義獨有的類和屬性。
少數民族特色村寨有著“事物”“人”“地點”等基本組成要素,它們都可以在CIDOC CRM等本體模型中找到對應的表示。本研究共復用已有模型中的8個核心類及其相關的9個屬性搭建少數民族特色村寨本體。表1展示了復用的核心類和它們的來源。

表1 少數民族特色村寨本體復用的核心類
這些類和屬性以《要求》為參考文件進行選擇,對類層次的組織和解釋將在第四節作具體說明。在此主要基于CIDOC CRM官方文件,解釋關于少數民族特色村寨本體的核心類,形成CIDOC CRM框架下《要求》與少數民族特色村寨本體的基本映射。
(1)事物(Thing):包含離散的、可識別的持久項(Persistent Item)實例以單個單位記錄,由物質組成或由物質攜帶,具有相對穩定的特點。可能存在固態的物理形式,也可能是一個邏輯概念或結構。在少數民族特色村寨中,既具有民俗、民謠等非物質對象,也具有少數民族傳統建筑、用具實物等人造物質對象。它們都屬于事物,且有著各自的細分類別和屬性表示。
(2)人(Person):人是少數民族特色村寨的重要組成部分。在本模型中,Person類是指少數民族特色村寨中的常住人口,他們是村寨內主要事件的參與者(如舉辦民族節日活動、討論村內大小事宜、經歷某個歷史事件)和各類事物的使用者(如游覽建筑、使用器具、傳承習俗),具有姓名、生卒等基本屬性。
(3)時間跨度(Time-Span):指特定實體所表征的時間范圍,主要用于描述少數民族特色村寨及其相關實體在時間維度里演變和發展的跨度,具有開始時間、結束時間等基本屬性。
(4)條件狀態(Condition State):指某段時間內具有一定條件的對象的狀態。少數民族村寨發展的數百上千年中,創造出了獨有的文化遺產,而這些文化遺產在每一段特定的時期都可能呈現出不同的狀態。在本模型中,Condition State指代事物現存的條件狀態,不同類別的事物的評估標準不同,其所對應的條件狀態的基本屬性也不同。
(5)活動(Activity):指由Person類實例有意執行的行動,這些行動會導致少數民族特色村寨所記錄的文化、社會或物理系統產生狀態變化。既可能是發生在當下或者未來的行動,如定期舉行少數民族特色村寨特有的節日活動;也可能是發生在過去的行動,如建造一個定居點,發明并推廣一種用具。
(6)類別(Type):指少數民族特色村寨及其相關實體根據現有的分類標準進行分類,從而搭建起少數民族特色村寨本體的分類體系,如根據《國家級非物質文化遺產代表性項目名錄》[34],可以將少數民族特色村寨里的非物質文化遺產分為民間文學、傳統戲劇、曲藝、民俗等十大門類。
(7)當前位置(Current Location):指事物、人、村寨等實體對象的現存地址,主要用于描述少數民族特色村寨及其相關實體在空間維度上的表達,從而更好地體現村寨的空間布局和文化資源的分布。
(8)個人/法人團體(Person/Corporate Body Authority):主要指代少數民族特色村寨的權威個體或者團體,與Person類不同,他們不一定居住在村寨里,而更可能是與其相關的政府部門、個體收藏家等,以村寨政策的制定者或者推廣者、村寨內某個事物實體的持有者或者監管者等角色參與少數民族特色村寨本體。
表2對這些類的相關屬性進行了歸納解釋,屬性用于定義兩個類之間特定類型的關系。定義域(Domain)是為其正式定義屬性的類,可類比成句子的主語;值域(Range)是包含屬性的所有潛在值的類,可類比成句子的賓語。其中,實體(Entity)指任意實體類。

表2 少數民族特色村寨本體復用的屬性
根據少數民族特色村寨的基本內容,本節將對具有少數民族特色的重要術語進行闡述,并基于此自定義少數民族特色村寨本體中獨有的類和屬性。
作為本研究的重要參考來源,《要求》的總目錄共包括以下九個題項:村落基本信息、村域環境、傳統村落選址與格局、傳統建筑、歷史環境要素、非物質文化、文獻資料、保護與發展基礎資料、其他補充資料及說明。其中,傳統建筑和文獻資料統一作為事物(Thing)的部分子類存在于已復用的模型之中,當前位置(Current Location)的屬性映射了傳統村落選址與格局。為了表達《要求》中的題項內容,本研究自定義環境(Environment)和政策(Policy)兩大類。
(1)環境(Environment):指少數民族特色村寨的村域環境和所包含的歷史環境要素。少數民族特色村寨有著獨特的自然風光和良好的生態環境,基于保護的目的,一些少數民族特色村寨被建設成為生態博物館、民族文化生態村。如花溪鎮山布依族生態博物館、石林彝族自治縣北大村、貴州六枝梭戛生態博物館等。
(2)政策(Policy):指針對少數民族特色村寨所提出的各類政策文件,表示為發展保護規劃、特殊政策、管理制度、村落基礎數據信息的集合。面向少數民族特色村寨發布的政策有其獨特性和受保護性,基本圍繞建設特色民族村寨、傳承民族文化、推動經濟社會發展、保護生態環境四個方面展開,為少數民族特色村寨的建設提供政策保護,如國家民委印發的《少數民族特色村寨保護與發展規劃綱要(2011—2015年)》、黔西南州民宗委編制的《黔西南州“十四五”民族特色村鎮發展規劃》等。
同時,考慮到《要求》的描述對象為傳統村落,而除去傳統村落的共性之外,少數民族特色村寨有著獨特的“民族小聚居”聚落環境和民俗文化、宗教信仰、民族節日等諸多民族文化特產[35]。在參考模型框架下的《要求》與少數民族特色村寨本體的基本映射中,這些特色未能完全得到表達。因此,本研究引入了文化空間這一概念,自定義文化空間(Cultural Space)類,用于表示少數民族特色村寨的民族文化集成。
根據條例[28],文化空間是非物質文化遺產的重要形態,兼具空間性和時間性,往往表達為固定時間內的特定場所。本研究以已有研究為基礎[29][36],將少數民族特色村寨的文化空間劃分成物質、精神和行為三個方面,自定義文化空間(Cultural Space)的三個子類:行為文化(Behavioral Culture)、精神文化(Spiritual Culture)和物質文化(Material Culture),融合物質空間和文化內涵,以體現少數民族特色村寨的民族文化特征。其中,行為文化(Behavioral Culture)主要包括行政體系、社會組織、風俗習慣等方面的內容;物質文化(Material Culture)主要包括建筑、服飾、飲食、技藝、醫藥等方面的內容;精神文化(Spiritual Culture)主要包括宗教信仰、語言文字、節事節慶等方面的內容。
基于《要求》和少數民族特色村寨自身的結構特征,本研究所定義的少數民族特色村寨本體包括條件狀態(Condition State)、活動(Activity)等17個核心類,最終得到的類和類層次結構如表3所示。
本研究定義了少數民族特色村寨項目(Ethnic minority characteristic Village Project,簡稱EMCV-project)作為頂層類,而其余核心類主要作為二級類存在。人(Person)、時間跨度(Time-Span)、當前位置(Current Location)、活動(Activity)分別表示少數民族特色村寨內的人、時、地、事。條件狀態(Condition State)獨立卻服務于事物(Thing),用于描述事物的條件狀態,體現對少數民族特色村寨部分事物的保護屬性。個人/法人團體(Person/Corporate Body Authority)區別于人(Person),并不表示自然人而表示權威個體,通常具有特定的社會身份和經濟、政治上的意義。文化空間(Cultural Space)涵蓋行為、物質、精神三個方面,有著對應的三個子類,是物理空間中的事物(Thing)和活動(Activity)在文化空間里的表示,著眼于事物和活動背后的文化內涵。

表 3 少數民族特色村寨本體類層次結構
事物(Thing)的結構相對較為復雜,共包括兩個三級類和四個四級類。根據人造與否,本研究將事物(Thing)分為人造事物(Human-Made Thing)和環境(Environment)兩類。其中,人造事物(Human-Made Thing)主要涵蓋了人為制定的政策(Policy)和類別(Type)、非物質文化遺產(Intangible Cultural Heritage)、物質文化遺產(Physical Human-Made Thing)這四個方面的內容。
劃分好類層次以后,需要使用屬性將類與類連接起來。本研究共自定義了5個屬性:文化空間揭示了少數民族特色村寨的民族文化內涵,自定義揭示(reveal)屬性將文化空間(Culture Space)與被揭示的對象類相連;考慮到規劃政策的全局性和保護性,自定義計劃和保護(plan and protect)屬性將政策(Policy)直接與少數民族特色村寨實體(EMCV-project)相連;個人/法人團體制定了少數民族特色村寨的相關政策,自定義制定(constitute)屬性將個人/法人團體(Person/Corporate Body Authority)與政策(Policy)相連;環境和人都是少數民族特色村寨內的客觀存在,分別自定義存在(was in)和居住(live in)屬性將環境(Environment)和人(Person)與少數民族特色村寨實體(EMCV-project)相連。
本研究使用實體—關系圖(見圖1)來可視化表達這些屬性和關系。圖中的各類要素釋義為:類表示為圓形,框內寫類的名稱;屬性表示為有向箭頭,箭頭起點對應的是屬性的域,終點對應的是屬性的范圍;來源用縮寫標示于屬性和類之前,cc表示為復用自CIDOC CRM,cdwa表示為復用自CDWA,vcard表示復用自vCard,emcv表示為自定義。
最終搭建的少數民族特色村寨知識本體模型如圖1所示。

圖1 少數民族特色村寨本體實體—關系圖
本研究以貴州榕江縣岑最村為對象,使用Protégé軟件進行少數民族特色村寨本體實例的構建。
首先,本研究根據前文的表格添加了少數民族特色村寨本體的類與屬性,如圖2所示,在“Classes”欄中設定包括Activity、Person、Policy等17個大類。其次,通過對象屬性確定類與類之間的關系,如活動(Activity)被人(Person)舉辦(carried out by)。再次,通過數據屬性完善類的信息,如EMCV-project有著村落名、戶數、人口數、村落基本信息等屬性,當前位置(Current Location)有著省、市、縣等屬性,物質文化(Material Culture)有生產、生計、建筑、服飾、飲食等數據屬性。

圖2 少數民族特色村寨知識本體基本大類
在本體模型的基礎上,本研究選取貴州榕江縣岑最村的相關信息作為實例信息加入模型,并為其添加了數據屬性和對象屬性,具體內容如圖3所示。

圖3 少數民族特色村寨知識本體實例部分
最后,經過Protégé軟件中推理機的邏輯檢驗,得到本體構建并無邏輯錯誤,測試通過。
本研究針對目前我國少數民族特色村寨保護現狀中的問題與挑戰,通過七步法構建少數民族特色村寨本體,深度揭示少數民族特色村寨的內容特征,使其可以被機器理解和處理,成為多源異構數據整合、語義檢索、領域知識圖譜構建的研究基礎,并進一步應用于少數民族特色村寨的保護與發展建設中。同時,基于構建好的少數民族特色村寨本體,可以在未來展開更多具有現實意義的嘗試,如搭建統一的少數民族特色村寨檔案數字化平臺,讓公眾能夠便捷檢索和利用少數民族村寨的相關信息資源,在形成范例后進行推廣,以進一步提高我國民族文化歷史研究的整體性與連續性。
此外,本研究還存在一些不足。第一,對于少數民族特色村寨的本體構建需要根據本體模型的更新來不斷完善。截至2021年10月,CIDOC CRM已更新到7.2版本,由于該模型的架構具有靈活性和可擴展性,存在未來對類和屬性進行新增或刪改的可能,因此,使用當前7.2版本的CIDOC CRM構建少數民族特色村寨只是現階段的構建成果,后續根據CIDOC CRM的版本迭代,還需要在已有本體的基礎上進行修訂。第二,目前針對少數民族特色村寨本體,本研究只進行了初步的嘗試,作為主要資料來源的少數民族特色村寨調查簡報并不一定能完全涵蓋少數民族特色村寨的核心內容。未來可以通過實地調研、政策研究等方式完善補充現有本體。第三,本體使用關聯數據技術的目的在于實現整個領域內的知識共享,少數民族特色村寨僅是領域資源中的一部分重要內容,未來若進行全局性的應用,需要探索建立起與已有本體的關聯并形成數據接口,使少數民族特色村寨本體既可以被其他本體復用,也能夠引用已有的成熟本體,從而具備更高的研究價值與更強的現實意義。