苑永琴
山西文化底蘊深厚,戲曲藝術歷史悠久、種類繁多。晉劇、蒲劇、北路梆子和上黨梆子組成了山西地方戲曲的四大劇種。20世紀80年代,山西的地方戲曲劇種多達50個。2006年,晉劇被列入第一批國家級非物質文化遺產保護名錄。山西有現存元代以前戲臺11座,其中包含2座遺址,一座金代戲臺,明清戲臺的數量更是難以統計。這些現存的戲曲文物都印證了山西作為文化大省、戲曲大省的地位。然而,2016年全國地方戲曲劇種普查數據顯示,山西現存劇種38個,已有十余個消亡或離開舞臺。傳統的戲曲藝術正面臨著信息社會所帶來的多媒體與自媒體傳播的挑戰。
習近平總書記指出,要推動中華民族優秀傳統文化創造性轉化和創新性發展,要傳承中華優秀傳統文化,不斷提升國家文化軟實力和中華文化影響力。世界許多國家都在加緊構建全新的數字經濟體系,利用人工智能、互聯網等技術進行產業轉型升級、行業創新發展。在“互聯網+”時代,戲曲的信息化、數據化對整理、傳播和創新戲曲文化有重要的意義,而數據庫技術為傳統藝術的規范化、網絡化發展提供了技術支持和保障。
政府支持文化傳承。隨著人民日益增長的對美好生活的需求,政府越來越重視傳統藝術的傳承和發揚,一方面大力推進非物質文化遺產保護名錄的構建和完善,另一方面制定出臺了一系列保護傳統文化的政策。黨的十九屆五中全會通過的《中共中央關于制定國民經濟和社會發展第十四個五年規劃和2035年遠景目標的建議》中提出:傳承弘揚中華優秀傳統文化,加強文物古籍保護、研究、利用,強化重要文化和自然遺產、非物質文化遺產系統性保護。2020年,由張宗偉教授擔任首席專家的國家社科基金重大項目《中國電影文化競爭力與海外市場動態數據庫建設》,就成功實現了文化與數據庫建設的聯姻,提供了文化與數據庫建設范本。
技術保障資源傳播。目前,官方Web網站、微信、微博、手機App是大眾通過網絡接觸戲曲的主要途徑。山西戲劇網的信息化渠道較為全面,運營有網站、微信公眾號、視頻號、官方微博,較全面及時地收集整理了山西各劇種的演出資訊和發展現狀,但與用戶的動態交互方面還需進一步完善。另外,筆者在華為手機應用市場選取了與山西戲曲相關且下載量在一萬次以上的戲曲類App進行比較,這些App大多包含京劇、評劇、豫劇、秦腔、晉劇、蒲劇、昆曲、川劇等劇種,具有看戲、唱戲、發布戲曲、直播等功能。下面兩幅雷達圖分別反映了戲曲類App的用戶評分和下載量,可以發現,以山西地方戲曲為主的蒲劇大全在下載量和用戶評分水平上還有很大的進步空間。

綜上可見,戲曲數據建設的孤立化、分散化和靜態化必然導致相關應用在功能完善、增值服務方面的欠缺。數據庫建設不是無本之木,它有著深厚的應用土壤和廣闊的應用空間。
網絡推動形式創新。第51次《中國互聯網絡發展狀況統計報告》顯示,截至2022年12月,中國互聯網普及率達75.6%,其中城鎮地區互聯網普及率為83.1%,農村地區為61.9%,城鄉地區互聯網普及率差異較2021年12月縮小了2.5個百分點。網民規模達10.67億,手機網民規模為10.65億,網民中使用手機上網的比例達99.8%。從年齡結構來看,50歲及以上網民群體占比由2021年12月的26.8%提升至30.8%,互聯網進一步向中老年群體滲透。
網民規模的穩步增長、城鄉差距和年齡差距的縮小,帶動了農村及老年群體加速融入網絡社會,這對于傳統戲曲的傳播既是機會也是挑戰。傳統文化的創作者和愛好者往往不是走在互聯網前沿的主力軍,戲曲的發展容易進入固守不變、曲高和寡、進退維谷的境地,而與之相對的互聯網思維和大數據思維卻可以讓觀眾、演員和作品突破時空與數量限制,虛擬技術和VR技術也可以給觀眾全新的舞臺感受與互動。
從數據庫的概念本體來看,戲曲藝術數據庫是長期儲存在計算機內、有組織的、可共享的大量戲曲數據的集合。因此,數據庫建設的過程就是對戲曲資源的全面化獲取、有序化整合、規范化存儲、多角度傳播、深層次挖掘、科學性保護的過程。
1.信息采集。戲曲作為一種非物質文化遺產,包括文本、圖片、音頻、視頻等多種形態。有關戲曲研究的專著、古籍、期刊論文、圖冊畫報、視頻錄像、采訪音頻等能夠提供較為準確的信息。主管單位如戲劇研究所、非物質文化遺產保護中心的相關檔案亦是主要的采集對象。信息采集過程一定要注意戲曲信息的真實性問題,必須保證數據的嚴密性、完整性和可靠性,這就要求采集主體在規范化的管理范圍之內,避免采集過程的隨意化、主觀化。在內容上,本省戲曲數據庫的建設應彰顯地方特色,只有建立起具有鮮明地方特色的戲曲藝術數據庫,才能夠更好地突出地域文化特色。
另外,針對一些瀕臨失傳的民間小劇種,戲曲信息的采集可采用眾包的方式。眾包是指一個公司或機構把過去由員工執行的任務,以自由自愿的形式外包給非特定的網絡大眾的做法,可用于識別照片中的人物和地點、糾正數字化報紙館藏中的光學字符識別錯誤、為歷史圖像添加標簽或字幕、在地圖上添加圖片內容、記錄口述歷史等。基于Web3.0去中心化的發展趨勢,借助用戶、戲曲愛好者、網絡社群等提供和修正戲曲資料,能夠較大程度地擴展、豐富和完善戲曲信息。
2.信息編碼。戲曲資源在上傳和編輯之前,為了達到有序化管理和系統性維護的目的,需要對多種形態的數據進行規范化的編碼。明確的內容分類和統一的格式標準,是數據檢索易用性的保障。編碼設計應遵循唯一性、標準化、可擴充性、簡潔性的原則。對于經常需要被用來檢索或排序的數據項,如戲曲名、非遺申請編號等,可為其建立主索引,關于該字段的編碼尤為重要。一般來說,編碼分為順序碼、區間碼、層次碼、十進制碼等,根據數據項在計算機中的主要處理方式選擇合適的編碼體系。最后,數據庫開發人員應同時編制代碼對應表和使用制度,對編碼做詳細說明以便于程序的更新和維護。
3.信息存儲。戲曲在用戶端被看到時,常常需要伴有解釋性的說明,表現在數據庫中就是要有面向語義的描述框架。例如,一副專業性較強的戲曲圖像,數據庫存儲時應該有一種能夠提高圖像檢索性能的圖像描述和組織體系,優化展覽交互界面,提升數據庫中圖像資源存儲的準確性,從而便于檢索使用、網絡共享、用戶交互和計算機管理。戲曲資源歷史悠久、形態多樣,具有較強的異構性和關聯性,可通過知識圖譜構建多層體系。借鑒本體論概念建立模型,抓取實體、屬性、聯系,例如時間、地點、戲曲名、表演者、責任機構、傳承人,以及申請非遺項目的題名、編號、等級、批次、介紹等。實體可分為主體類、位置類、時間類、事件類等,每一類之間可能存在一對一、一對多、多對多的聯系。然后建立概念模型、邏輯模型、物理模型,通過外模式到模式、模式到內模式的映射,最終完成數據庫的物理存儲。
4.信息整合。通過攝影、錄音、掃描等方式收集的戲曲資源具有活態性、無形性、多變性、非結構化等特點,孤立的數據庫不足以將其復雜的關系表達出來。圖書館和檔案館可以利用其豐富的館藏資源,對分布在各種數據庫、光盤、云端的各種形態的戲曲數據進行整合,為后續多元數據融合、多平臺多系統對接打好基礎,改善其孤立和僵化的狀態。這種整合不僅僅指收集和存儲過程,還包括管理和維護工作,融合人工智能和大數據技術,建立戲曲藝術多維度評價指標,據此構建戲曲智能查詢系統,捕捉戲曲市場的供需情況,分析用戶的偏好和習慣。通過使用大數據統計計算,挖掘資源背后的訊息,獲取山西省戲曲藝術的文化內涵與傳承脈絡,為優化和傳播戲曲藝術提供決策依據。
5.信息利用。考慮到戲曲愛好者很多不是年輕群體,戲曲藝術數據庫系統在界面設計上應特別注重友好性、易用性。數據庫收錄的戲曲信息如果缺少高效的信息檢索工具,就很難被大眾所熟悉。后臺數據庫為前臺信息利用提供保障,支持用戶通過劇種、名稱、藝術家、非遺傳承人、非遺發源地、申遺時間等多入口進行檢索,對于較長字符的,應能夠進行模糊匹配,同時提供資料上傳下載、社區分享、評價反饋等功能。需要特別考慮的是,戲曲數據庫的異構性和區域性明顯,實現用戶語義檢索、自動問答、個性化信息需求是難點。知識管理可提供一定思路,從戲曲數據的內容、類型、表現形式、區域特點等角度構建知識圖譜,形成結構化存儲、標準化清洗、規?;治龅膽蚯R庫,以便為多源信息的高效利用打好基礎。
6.信息保護。信息保護包括兩方面,一是在戲曲的數字化展示中保護資源的真實性和完整性;二是在戲曲的網絡化傳播中保護其版權和產權的合法性。數字資源的長期保存會受到存儲介質故障、技術迭代頻繁、環境因素等影響,容易出現舊格式與新軟件不兼容、畫面模糊、有噪音等問題,需要定期遷移和仿真修復。新興數字技術如3D掃描與重建、虛擬現實、增強現實、動作捕捉等技術正逐漸應用在這些數字化建設中,其中高分辨率模型可以用于形式特征研究和遺產保護,有助于信息丟失或損壞情況下的恢復,使其在傳播的同時受到保護。
同時,保護不等于限制傳播,恰當的技術手段和管理體制為數據庫建設提供了有益的構想。新媒體的快速發展使信息傳播方式發生了很大變化,信息源的下沉提升了影響力和互動性的同時,也容易出現信息失真的問題。首先應該明確主體責任,非物質文化遺產保護相關地政府部門、藝術研究院、劇院、行業協會作為主體,應組織專家學者定期對數據庫資源進行審核,數據庫管理員則要做好技術維護和更新。另外,有些戲曲作品由于年代久遠,存在版權不明、知識產權主體不清楚等問題,這是光靠技術無法解決的問題,應通過建立權限分級、版權加密、出臺適合本地區的保護條例和實施辦法等舉措為戲曲數據庫資源保駕護航。道阻且長,數據庫助力戲曲的傳播與保護是一個需要長期研究的問題。
山西作為文化大省,戲曲藝術在講好山西故事、傳播好山西聲音、推進山西文旅融合方面發揮著積極作用。山西戲曲藝術應當優化數據庫建設,讓更多群體能欣賞到更優質的作品并參與其中。數據庫技術和傳統文化相互碰撞,二者在深度融合中推進市場化發展,傳承和保護雙管齊下,無疑會讓山西錦繡梨園更加絢爛多彩。