


摘要:通過構建中國傳統戲劇領域本體,實現對傳統戲劇非物質文化遺產的數字化表示,為中國傳統戲劇的數字化保護提供可參考的解決方案。首先,聚焦傳統戲劇領域,廣泛收集概念術語,采用自下而上的方式進行整理與歸納;其次,定義本體的類結構與屬性;最后,以劇目為核心整合相關數字資源,添加實例?;谠摫倔w關系屬性,以百度百科為師承關系數據源,運用Neo4j構建知識圖譜展示演員師承派別譜系,實現傳統戲劇派別發展、師徒傳承的可視化查詢。構建傳統戲劇領域的知識本體,能夠有效整合傳統戲劇領域資源,實現非物質文化遺產的數字化表示、檢索和利用。
在2022年,中共中央辦公廳、國務院辦公廳印發了《關于推進實施國家文化數字化戰略的意見》,明確提出需整合已建及在建的文化數字化工程和數據庫所形成的成果,關聯形成中華文化數據庫和數據服務平臺,計劃到2035年建成物理分布、邏輯關聯、快速鏈接、高效搜索、全面共享、重點集成的國家文化大數據體系,實現中華文化全景呈現,中華文化數字化成果全民共享。在這一背景下,傳統戲劇作為我國的文化遺產,其保護與傳承應當愈發受到重視。
在數字化時代,保護傳統戲劇需要構建嚴密規范的資源表示和存儲體系。然而,傳統戲劇資源種類繁多、分布廣泛、起源多元、類型多樣等特點,導致其數字化表示和存儲面臨諸多困難。領域本體作為表現特定領域內知識結構、體現概念關系的結構化模型,可以從知識組織視角對戲劇資源進行數字化表示、存儲、關聯和應用。在數字化時代,構建傳統戲劇領域本體便于進行資源的查詢和檢索,提升資源的可訪問性和利用效率,從而促進傳統戲劇的保護與傳承。
研究現狀
非遺知識組織及挖掘研究
在信息資源管理學科領域,非遺資源的組織與挖掘已成為研究熱點。在非遺資源組織方法方面,基于規則的知識元屬性,抽取法已被應用于構建非遺資源知識庫,構成語義網絡的基礎。隨著人工智能技術的發展,依據五維數據模型,通過本體和詞表生成的知識圖譜,能夠建立高質量非遺智慧數據底座,其適用于多模態非遺資源處理。此外,更具兼容性、互操作性和非遺特色的元數據規范體系正在逐步完善,旨在將非遺特性及其關聯實體納入非遺元數據模型構建,適應國內非遺數據庫現狀。國際上,Europeana等數字資源服務平臺通常采用“收割整合后的元數據”資源采集方式,確保資源的規范性、有效性和一致性,并與都柏林核心高度匹配。在非遺資源挖掘方面,自然語言處理技術被用于從非結構化數據中抽取知識,實現數據的提取、表示、融合與推理,為知識圖譜構建與補全提供技術支持。諸多學者也嘗試將語義網和本體技術應用于非遺領域資源挖掘,并取得了較多成果。例如,郝挺雷構建了民族節日領域本體,隗昊則以潑水節為例建立民俗活動知識本體。此外,有研究采用布拉德福定律分析昆曲非遺數據,識別核心內容及研究態度分布。這些成果不僅促進了非遺資源的有效管理和利用,也為保護和傳承文化遺產提供技術支持。
傳統戲劇資源相關研究
傳統戲劇作為我國非遺的重要組成部分,相關研究橫跨藝術學、社會學、新聞傳播學、管理學等領域。新媒體視角下,學者針對傳統戲劇的數字化采集、保存、修復、展示和傳播問題,倡導重塑其文化生態。在文化遺產保護方面,學者探索政府支持、社會參與和技術應用等途徑的保護與傳播策略,為傳統戲劇的傳承提供理論與實踐指導。而文化藝術管理學科強調藝術和商業的平衡,提出通過專業的策劃和組織,如演出、培訓、研究等方式,保護和傳承傳統戲劇,促進文化產業的良性發展。信息資源管理領域則引入關聯數據的理念與技術,實現對傳統戲劇資源的規范化描述、語義化揭示、多維度關聯,大幅提高非遺資源聚合與保護水平。
針對傳統戲劇這一非遺的重要類目,目前的傳統戲劇本體存在元數據不夠全面、子類不夠完備的問題。故本文旨在構建并完善中國傳統戲劇領域本體,拓展復用元數據,實現中國傳統戲劇資源聚合和結構化表示,這一工作為中國傳統戲劇資源的數字化保護開辟新思路,具有重要的理論意義和實踐價值。
中國傳統戲劇領域本體模型構建
構建方法與流程
在傳統戲劇領域本體構建方法的選擇上,七步法可適用于多個領域的本體開發,滿足非遺領域本體的開發需求,且開發過程清晰、成熟度高、通用性強,綜合考慮后,本文采用七步法進行傳統戲劇領域本體模型的構建。
七步法的步驟包括確定本體領域和范圍、考察可復用本體、獲取領域概念、定義類和類的層級關系、定義類的屬性、定義屬性的分面以及添加實例。文本所構本體領域為傳統戲劇,范圍涵蓋自2006年起被列入我國非物質文化遺產的所有傳統戲劇種類??疾飕F有本體,確定可復用的本體和詞表有DCMI、CIDOC CRM等,此外,參考國內文化行業標準和各類標準規范,確保復用屬性的通用化和本土化。在獲取領域概念階段,主要從百度百科、非物質文化遺產網等平臺,通過網絡爬蟲技術收集相關數據和資源,包括劇種信息、領域概念、音頻視頻、相關資訊等。例如,從非物質文化遺產網獲取傳統戲劇類項目的詳細信息共473條,收集數據包括名稱、項目編號、申報內容、申報地區(單位)等,并通過自下而上的方法歸納整合領域詞表。在定義類和類的層級關系階段,參考可復用本體并根據領域詞表對傳統戲劇領域數據進行分類。在定義類的屬性階段,除了可復用屬性,根據傳統戲劇的文化特色、資源形式、傳承發展自定義數據屬性和對象屬性,以滿足本體對各類資源聚合及師承派別關系梳理的需求,根據需要進一步完善屬性分面,最后使用Protégé軟件對傳統戲劇領域本體進行構建并添加實例。
定義類與類的層級關系
通過對傳統戲劇領域的調查與數據收集,對領域概念進行分析和歸納,可以發現傳統戲劇領域具有豐富的藝術特征,如行當、臉譜等。此外,傳統戲劇與演出人員、保護單位、承辦機構等具有緊密的社會關系。參考CIDOC CRM與《中國圖書館分類法》(以下簡稱《中圖法》)等標準規范,構建傳統戲劇領域本體層次結構如圖1所示,本體共定義11個一級概念類,較為全面地概括了傳統戲劇領域的文化特征、社會關系和數字資源。
1.劇目類
劇目是凝聚劇種藝術特征和文化精髓的傳播載體,是傳統戲劇的名目。戲劇演出多以劇目為單位進行,因此,本體以劇目為核心對傳統戲劇資源進行描述和存儲,以版本為劇目的最小分類單位,即將同一劇目的不同版本視為不同劇目,以體現劇目類“一劇多版”的特性,且戲曲劇目具有一定的創新潛力,其內容可以隨時間不斷擴張。因此,將“劇目”作為本體的一級概念類。
2.劇種類
劇種與劇目直接產生聯系,任何劇目都屬于唯一的劇種。我國已申遺的傳統戲劇類目有四百多種,每個劇種都擁有獨特的藝術形式與歷史淵源。因此,定義“劇種”為一級概念類。
3.數字資源類
對傳統戲劇領域的數字資源進行細分,相關資源的載體以文獻、劇照、視頻、音頻為主,此外劇評、新聞等網頁資源數量眾多。因此,本文定義“文本”“圖像”“音頻”“視頻”“網頁”五類資源,這五種資源類型能夠囊括網絡上絕大部分相關資源。
4.角色類
此處指劇目中出現的戲劇角色。通過對傳統戲劇領域概念的歸納與研究,可以發現行當、唱腔、臉譜等藝術特征大多依靠角色進行展現,且一個角色往往會被多個演員演繹,角色和多個概念類之間存在直接關聯。因此,定義“角色”作為一級概念類。
5.行當類
行當是戲曲人物藝術化、規范化的形象類型,傳統戲劇最普遍、最廣泛的分類是生、旦、凈、丑,任意細分行當都能被劃分為這四類。行當的細分有老生、小生、花旦、彩旦等幾十種,不同的行當類別具有不同的性格特征和外貌特征。為對角色的身份、特點、性格進行生動形象的描述,定義“行當”為一級概念類,并下設“生”“旦”“凈”“丑”四個二級類。
6.音樂類
從戲劇演員出發,本體需要描述演員的唱腔和唱詞特點。從演出效果出發,本體需要描述劇目演出時使用的樂器,因此,在“音樂”類下設“聲樂”子類和“器樂”子類,其中“聲樂”類又分為“唱腔”和“念白”,“器樂”類分為“管弦樂”和“打擊樂”。
7.臉譜類
傳統戲劇中的臉譜藝術種類繁雜,因此,將“臉譜”單獨作為一級概念類。絕大部分臉譜擁有明顯的顏色或形態特征,因此,下設兩個二級類。將具有顏色特征的臉譜歸納為“譜色”,具有形態特征的臉譜歸納為“譜式”。其中,有些臉譜并非完全覆蓋人臉,如三塊瓦臉、六分臉等,有些臉譜卻以整臉形態命名,如歪臉、元寶臉等,因此,“譜式”類下設“整臉”和“局部”子類。
8.舞臺美術類
根據《中圖法》,“京劇藝術”有子類“舞臺美術和技術”“化裝、服裝和服飾”,而“舞臺美術和技術”又有子類“人物、景物造型”“燈光技術”等,參考《中圖法》,本體定義“舞臺美術”作為一級概念類,并下設“布景”“燈光”“道具”“服飾”四個二級類。
9.事件類
傳統戲劇相關的社會事件是領域資源的重要組成部分,包括劇種申遺、劇目演出、演員通告、突發事件通知或報道等。參考CIDOC CRM的“Event”類,建立“事件”為一級概念類,并下設“活動”“出現”“消失”三個二級類,用于描述與劇目、劇種等概念類相關的社會事件。
10.人員類
描述與傳統戲劇相關的社會人員,參考CIDOC CRM的“Person”類建立“人員”類,并細分為“演員”“管理者”“工作人員”“其他人員”四個二級類。
11.機構類
用于描述承辦劇目演出的機構和非遺保護單位等。參考CIDOC CRM的“Group”“Actor”類建立“機構”類,并分為“個人”和“組織”兩個子類。
定義類的屬性
類的屬性分為數據屬性和對象屬性,數據屬性描述某個類的內部特征,對象屬性則用于描述類和類之間的關系。在數據屬性的定義上,劇目類、劇種類、角色類、行當類、音樂類、臉譜類以及舞臺美術類是基于傳統戲劇領域特色而定義的類,由于其擁有獨一無二的概念與特征,選擇DC CORE標準描述這些類的數據屬性,使這些內容的數字化存儲盡可能標準化、通用化,復用的數據屬性包括title、identifier和description等。事件類的定義主要用于描述傳統戲劇的發展以及變遷,復用DC CORE描述事件基本信息,復用CIDOC CRM中的timespan和place描述事件發生時間和地點。人員類分為演員、管理者、工作人員和其他人員,其數據屬性基本等同于機構類中的個人子類,但人員中的演員子類自定義了派別屬性,用于描述戲劇演員的派別譜系。機構類由個人和組織兩個子類組成,其數據屬性分別復用了《電子名片交換格式通用規范》(GB/T 28822-2012)和《信息與文獻 組織機構元數據》(GB/T 42108-2022)描述個人信息和組織信息。數字資源類包括文本、圖像、視頻、音頻、網頁,使用DC CORE描述各類數字資源共有的內部特征,包括資源名稱、主題、日期、格式、標識符和來源。此外,資源類的屬性定義參考《國家圖書館音頻資源元數據規范》等,針對不同資源類型對其特有的數據屬性進行自定義,如視頻子類定義聲道語種和字幕語種。
在對象屬性的定義上,重點關注劇目主體與其他概念
類之間的關系,通過自定義“belongTo”“hasRole”
“hasActor”等對象屬性,將劇目類的實例與劇種、角色、演員等其他類的實例關聯。其中,在演員派別譜系的構建方面,定義“isTeacherOf”“hasTeacher”
“fellowStudents”三個對象屬性刻畫戲劇演員間的師承關系,分別表示“是某人的師傅”“是某人的徒弟”“和某人是同門”。其中“isTeacherOf”和“hasTeacher”互為逆屬性,即如果“a isTeacherOf b”則“b hasTeacher a”。此外,“fellowStudents”屬性具有對稱性,即a對b來說是同門,那么b對a來說也是同門。而根據這三個對象屬性可以推理出,任意具有“isTeacherOf”“hasTeacher”“fellowStudents”中某一屬性的兩人大概率擁有相同的派別。
昆曲劇目《牡丹亭》實例展示
昆曲是漢族傳統戲曲中最古老的劇種之一,歷史悠久且影響廣泛而深遠,是戲曲表演的典范,而《牡丹亭》為明朝湯顯祖所作昆曲傳統劇目,更是中國戲曲史上的一朵奇葩。本文選取領域內知名度較高的“2019春風上巳天”精華版《牡丹亭》作為示例,圍繞該實例收集相關信息和資源,并以百度百科的人物關系為參考,獲取戲劇演員的人物關系。
觀察圖2的實例關系圖可以發現,各概念類的實例之間具有復雜且緊密的關系,劇目類實例“‘2019春風上巳天’精華版《牡丹亭》”與劇種類實例“昆曲”、角色類實例“柳夢梅”、演員類實例“石小梅”“施夏明”、數字資源類實例“我們的春風上巳天——石小梅的昆曲世界”等直接關聯。此外,數字資源不僅與劇目實例有直接聯系,也可能關聯機構、人員、事件等,角色類實例“柳夢梅”與行當類、聲樂類、臉譜類、演員類實例均直接關聯,劇種類實例“昆曲”還與事件類實例“上海昆劇團申報非遺:昆曲”、組織類實例“上海昆劇團”直接關聯。圖2的示例充分說明所構本體在聚合領域資源、梳理概念關系上有較好的效果,領域本體不僅能實現傳統戲劇領域的資源整合,也為資源的查詢和檢索等應用提供了框架支持。
演員師承派別譜系構建
在傳統戲劇領域,演員往往擁有多位老師,而不同演員之間的師承關系普遍存在交叉、隔代等情況,導致演員師承網絡具有復雜性和高度關聯性,但這也是傳統戲劇百花齊放的關鍵因素。為了更有效地管理和分析這些復雜且高度關聯的師承關系數據,Neo4j提供了一種科學的解決方案。Neo4j是一個高性能的NoSQL圖形數據庫,適合存儲高度關聯的師承關系數據集,同時具有優越的可查詢性和可擴展性。
本文基于百度百科提供的人物信息,以昆曲、京劇梅派和京劇程派的戲曲大家為研究對象,通過網絡爬蟲技術收集相關人物的社會關系,進而以lt;人物1,人物2,關系gt;的格式構建人物關系三元組數據集,基于關系屬性“isTeacherOf”“fellowStudents”對演員之間的師承與同門關系進行描述,并構建演員師承譜系知識圖譜,如圖3所示。該圖譜以傳統戲劇領域本體中的演員實例作為節點,聚焦師徒、同門關系,忽略親屬關系,重點展現戲曲演員的師承網絡。觀察師承圖譜可以發現演員與哪一派別的聯系更加緊密,據此大致推測演員所屬派別或劇種,由此得出“演員”類實例的派別屬性。利用Neo4j構建演員師承圖譜不僅能夠高效地整合和展示傳統戲劇領域復雜的師承關系,還為深入研究和傳承傳統戲劇文化提供了先進的技術和方法支持。
本文面向非物質文化遺產戲劇資源的數字化表示與保護,構建中國傳統戲劇領域本體,聚合該領域的文本、圖像、視頻、音頻、網頁等數字資源,并聚焦中國傳統戲劇領域師承關系和派別譜系,探討非物質文化遺產的傳承與發展。中國傳統戲劇領域本體有助于將非遺資源進行規范化整合和分類,以便進行問答查詢、知識圖譜構建等任務,為中國傳統戲劇這一非物質文化遺產的數字化保護提供了理論基礎和參考方案。未來研究可以進一步豐富本體實例,繼續對師承關系等社會關系網絡進行可視化。此外,不斷擴展數字資源,尋找最佳的存儲方式和規范標準,嘗試和外部資源進行數據層面的交換。
江蘇省大學生創新創業訓練計劃項目“多源異構公共數字文化數據語義描述及領域本體模型構建研究”(編號:202310288188Y)。
(作者單位:南京理工大學網絡空間安全學院)