李慶華?楊俊杰
摘 要:隨著國民經(jīng)濟(jì)的快速發(fā)展,人們生活水平的提高,文化消費需求持續(xù)增長,為文化產(chǎn)業(yè)帶來發(fā)展機(jī)遇。但傳統(tǒng)民俗資源利用效率低,文化服務(wù)形式落后,無法滿足群眾對文化服務(wù)消費升級的需求。本文以傳統(tǒng)民俗文化為研究對象,以傳統(tǒng)文化知識體系作為研究范圍,探索基于大數(shù)據(jù)處理技術(shù)的傳統(tǒng)民俗文化數(shù)字化方法和手段,從而實現(xiàn)民俗數(shù)據(jù)的可視化。民俗文化地圖的構(gòu)建能夠為挖掘豐富的民俗文化資源、實現(xiàn)文化領(lǐng)域的供給側(cè)改革提供技術(shù)支持,因此,本文的探討具有重要的理論和現(xiàn)實意義。
關(guān)鍵詞:大數(shù)據(jù);民俗文化;數(shù)字化;數(shù)據(jù)可視化
0 引言
民俗文化的數(shù)字化水平已經(jīng)成為一個國家信息基礎(chǔ)設(shè)施完善程度的一個重要標(biāo)志。[1]當(dāng)前,一些國家無不以國家政策為主導(dǎo),以公共資金為啟動資源,來建設(shè)民俗文化的數(shù)字化平臺。民俗文化的數(shù)字化保護(hù)工作也隨著信息基礎(chǔ)設(shè)施的建設(shè)而逐步展開。民俗地圖作為民俗文化研究的可視化表現(xiàn)方式和手段,在民俗學(xué)的研究中具有較好的應(yīng)用。因此,利用當(dāng)下熱門的大數(shù)據(jù)等現(xiàn)代信息技術(shù)手段,構(gòu)建數(shù)字化的民俗文化地圖,可有效地促進(jìn)民俗文化的大發(fā)展、大繁榮,有利于民俗文化的發(fā)展和傳承。
1 傳統(tǒng)民俗文化資源的知識化
民俗文化地圖的構(gòu)建過程,涉及民俗文化原始素材的采集和整理、民俗文化的知識化和數(shù)字化、民俗知識的大數(shù)據(jù)爬取以及民俗數(shù)據(jù)的可視化等多個方面。其中,民俗文化的知識化是民俗地圖構(gòu)建的基礎(chǔ),民俗知識的大數(shù)據(jù)爬取是關(guān)鍵,接下來我們首先探討民俗文化的知識化過程。
中華傳統(tǒng)民俗文化豐富多彩,形式多樣,不同地域、不同姓氏的遺產(chǎn)素材會略有差別。在素材的收集和整理過程中,可以首先對素材按形成因素進(jìn)行分類,如語音類民俗可以采用電子錄音等形式采集。而對歌舞類動態(tài)素材則采用視頻收集以及傳承人口傳身受的方式采集;然后再按人文特征、地域特征、倫理特征以及因果特征等因素進(jìn)行分類,以便后續(xù)民俗文化本體建模。民俗文化展示形態(tài)多樣,包括歌舞、音視頻、器物擺設(shè)以及田野調(diào)查的圖片等,民俗文化豐富的表現(xiàn)形態(tài)與數(shù)據(jù)庫建設(shè)單一的數(shù)據(jù)編碼形成了一對天然的矛盾。因此,我們根據(jù)本體模型構(gòu)建的一般原則和思路,民俗本體構(gòu)建遵循本體完整性、真實性、實用性、可維護(hù)性和可擴(kuò)展性等原則;根據(jù)民俗領(lǐng)域?qū)<液椭R專家的建議在民俗文化建模,在民俗本體模型的基礎(chǔ)上,再對領(lǐng)域本體細(xì)化,構(gòu)建領(lǐng)域本體的概念屬性及分面定義,為表現(xiàn)形態(tài)豐富的民俗文化創(chuàng)建民俗知識庫。
2 民俗文化知識抓取、存儲及抽取策略
現(xiàn)有的傳統(tǒng)民俗文化除了一些基本的文字材料外,其他的結(jié)構(gòu)化知識很少,大部分的民俗文化體現(xiàn)在各種WEB頁面和自媒體文檔中,難以直接應(yīng)用于民俗地圖研究。前述民俗本體模型相當(dāng)于系統(tǒng)中的元數(shù)據(jù),分散在各個系統(tǒng)中的民俗文化資料才是本項目研究所需要的數(shù)據(jù),可用于民俗地圖應(yīng)用的數(shù)據(jù)獲取涉及數(shù)據(jù)的爬取、存儲以及抽取等技術(shù)環(huán)節(jié)。在后面的研究中,我們將基于大數(shù)據(jù)技術(shù),在眾多的URL數(shù)據(jù)源中,采取多線程網(wǎng)絡(luò)爬蟲,基于改進(jìn)的廣度,優(yōu)先搜索策略爬取相關(guān)數(shù)據(jù),并完成民俗知識庫的存儲設(shè)計。在知識庫基礎(chǔ)上,設(shè)計基于民俗文化本體的本體屬性關(guān)系抽取算法,研究關(guān)系描述模式挖掘、上下文模式規(guī)則庫生成以及字符匹配規(guī)則庫生成;從而完成基于字符的匹配和基于規(guī)則的上下文模式識別,完成原始爬取數(shù)據(jù)的解析和抽取,從而為民俗地圖的構(gòu)建提供有效數(shù)據(jù)。
3 民俗文化數(shù)據(jù)的可視化
基于民俗文化知識圖譜集成平臺,運用分布式處理系統(tǒng)將海量傳統(tǒng)文化資源數(shù)字化、結(jié)構(gòu)化和知識化,為實現(xiàn)數(shù)字文化提供技術(shù)支持和平臺支持。此外,為實現(xiàn)信息共享和提高平臺可用性,該平臺以知識抽取層為核心、以數(shù)據(jù)存儲層為基礎(chǔ)、以數(shù)據(jù)控制層為保障、以查詢處理層為業(yè)務(wù),研究民俗文化中的地名地理數(shù)據(jù)與GIS系統(tǒng)中的地理數(shù)據(jù)匹配。其實現(xiàn)了數(shù)據(jù)獲取、處理和民俗地理數(shù)據(jù)與GIS系統(tǒng)的無縫銜接,從而完成傳統(tǒng)民俗文化信息的可視化展示與應(yīng)用,為粵西民俗文化的傳承與保護(hù)提供新的技術(shù)手段,為其他民俗文化和非物質(zhì)文化遺產(chǎn)的保護(hù)與傳承提供借鑒。在民俗數(shù)據(jù)可視化階段,我們以民俗知識圖譜和GIS模塊為基礎(chǔ),研究民俗地理數(shù)據(jù)與GIS地理數(shù)據(jù)的整合,以示意圖的方式將不同地域特征的民俗事件顯示在地理信息系統(tǒng)之上。同時,將不同時間段不同民俗事件的出現(xiàn)頻率保存在相關(guān)數(shù)據(jù)項中,為民俗文化工作者判斷民俗事件的發(fā)展傳承規(guī)律,提供一手?jǐn)?shù)據(jù),從而促進(jìn)民俗文化的大發(fā)展和大繁榮。[1]
4 結(jié)語
隨著大數(shù)據(jù)、云計算以及物聯(lián)網(wǎng)技術(shù)的發(fā)展,民俗文化的數(shù)字化有必要從原始的保存最基本的文字資料和音視頻資料的低水平數(shù)字化提升到民俗文化的知識化、大數(shù)據(jù)化,從而為文化數(shù)字平臺建設(shè)提供海量數(shù)據(jù)資源。民俗文化地圖的構(gòu)建,能夠為挖掘中華民族豐富的民俗文化資源、實現(xiàn)文化服務(wù)形式創(chuàng)新和文化資源共享提供技術(shù)支持,因此,本文的探索具有重要的理論意義和現(xiàn)實意義。
參考文獻(xiàn):
[1] 彭冬梅,潘魯生,孫守遷.數(shù)字化保護(hù)——非物質(zhì)文化遺產(chǎn)保護(hù)的新手段[J].美術(shù)研究,2006(1).