(云南省電子計算中心, 云南 昆明 650223)
摘 要:闡釋了文化遺產數字化的含義,描述了計算機技術在文化遺產數字化中的應用,提出了少數民族文化遺產數字化平臺技術構建方法,以及適合遺產數字多媒體資料管理的元數據編目方案,并就多媒體數據庫、存儲、檢索和網絡發布技術的集成應用作了詳細說明。
關鍵詞:文化遺產; 數字化; 多媒體數據庫; 少數民族
中圖法分類號:TP391文獻標識碼:A
文章編號:1001 3695(2006)08 0041 04
Technology Construction of Culture Heritage in Digital Application Platform
WU Jian ping, WANG Yao xi, DAI Hong bing
(Electron Computer Center of Yunnan Province, Kunming Yunnan 650223, China)
Abstract:The paper explains the meaning of digitization of cultural heritage, and describes the computers technology application in the digitization of cultural heritage, proposes the establishing method of digitized platform technology of minority cultural heritage, presents the metadata catalogue method of digital asset multi media information management, and describes in detail the key technique application of multi media database technique, storage, index and network publish in the digital cultural heritage.
Key words:Culture Heritage; Digital Technology; Multi media DB; Minority
1引 言
中國具有光輝燦爛的悠久歷史,數千年的文明發展史為中華民族乃至世界人民留下了許多彌足珍貴的文化遺產。其中有以珍稀文物和名勝古跡為代表的有形物質文化遺產,也有以詩歌、史詩、神話、傳說、舞蹈和儀式等為代表的無形非物質文化遺產,這些文化遺產博大精深,具有濃郁的中華民族特色。云南少數民族是中國多民族的一個縮影,其文化是中國文化的重要組成部分,其中“麗江古城”已成為世界文化遺產,云南的哀牢山脈梯田、納西族摩梭人母系制社會、云南文山的巖洞住宅村等,都具備了申報世界文化遺產的條件。云南有五座城市是國家級歷史文化名城,云南元謀人遺址、澄江出土的古文物和石林出土的80萬年前的舊石器等都是研究人類文明的活化石。這些文化遺產是世界上罕見的民族文化寶庫,備受世界關注,具有世界性特征。利用現代數字技術保護、搶救、挖掘、制作、展示和傳播文化遺產是目前國內外研究的熱點,也是加快我國文化產業建設的重點。
伴隨著信息技術的迅猛發展,文化遺產的數字化提到了推動社會經濟發展的重要議事日程。其概念就是將文化遺產通過技術手段轉換成數字化形態,充分應用IT技術對其進行數字勘探、挖掘,使其重現和再生,并通過多媒體數據庫技術得以永久保存后,利用互聯網向世界傳播。近年來,國內外世界遺產和世界文化遺產數字化已有了較大發展,研究思路和技術隨著當今計算機技術特別是數字音/視頻、互聯網技術和虛擬現實技術不斷進步而發展。例如美國的“American Memory”計劃將主要歷史檔案資料,轉換為數字格式,包括各種類型的信息資源,如圖書、冊子、手稿、特殊印刷品、音樂、聲音記錄、照片、動畫等。法國的虛擬盧浮宮實現了對展室的虛擬漫游。中國的“數字敦煌”、“數字故宮”采取了數字虛擬現實技術,對文物、壁畫、建筑、藏品和檔案等遺產進行模擬與復原,達到深入研究和生動展示的目的。可以說,數字技術通過“比特”描繪出某一民族的“文化基因圖譜”,以數字技術整理文化遺產就如同建立其“文化特征基因庫”,從而形成一個民族文化的虛擬世界,其語言、文字、風俗、宗教、性格、氣質和心態、遺址和建筑物、裝飾和服裝、生產和生活習慣等都能生動、形象和細致地反映出來,并可融入到現實文化生活中。目前,文化遺產數字化建設、管理和發布的技術條件日趨成熟,諸如激光測量與三維掃描、三維虛擬場景的人機交互、計算機圖形學、數字音/視頻、基于內容的多媒體檢索、多媒體數據庫存儲、IP網絡流媒體、多媒體加密與數字水印技術等。數字化應用技術是實現文化遺產數字化的有效途徑,但由于文化遺產規模大,技術要求高,而相關標準建設相對滯后,因而國內在這方面的應用實際上還處于探索階段。基于以上思考,本文結合承擔云南科技計劃項目的同時,重點就少數民族文化遺產數字化應用中的平臺構建等關鍵技術問題進行研究和探討。
2遺產數字化平臺的構建
少數民族文化遺產數字化平臺的構建,是依托數字信息網絡環境,通過以特定的數字技術進行采集、制作、存儲、傳輸和發布方式,對現有和潛在的少數民族文化遺產進行組織、利用、管理的實現過程。具體可劃分為少數民族文化遺產的采集和數字化技術應用兩個方面。圖1是應用平臺的結構及流程。
少數民族文化遺產的采集將從歷史的回溯、文化類型聯系的縱橫向比較、區域范圍的內外關系、文化遺產影響力等方面去探尋信息源,經過科學比較、鑒別、選擇而確立少數民族文化遺產的代表性信息,再通過分類、核實、過濾、分析和匯集為立體數據系統提供數字化制作的素材。對于云南少數民族文化遺產的分布規模涉及省內25個少數民族共14499萬人,其中白、哈尼、傣、傈僳、佤、拉祜、納西、景頗、布朗、普米、怒、德昂、獨龍、基諾等15個民族為云南所特有,覆蓋了歷史、源流、民俗、文學、藝術、民居、文物、名勝、象形文字、方言等方面,有活態和遺存兩種形式的文化遺產。采集資料包括各方專家對文化遺產的研究成果,反映遺產產生,使用等學術的、藝術的、感覺的、甚至感情與宗教的非實體性資料,還包括對云南原始生態村落進行的專題研究資料。少數民族文化在冊文物數以萬計,已經公開展出的文物只占其中的極少數,由于溫度、濕度和場地等條件的限制,大多數文物可能永遠不能與普通觀眾見面,有些文物由于保護的需要不能安裝照明設備,即使能展示,觀眾也無法看清楚細節。還有些搶救出來的經書檔案已經部分焚毀,不能被翻閱。前期大量的工作還包括數字化、非數字化信息以及相關知識的信息分類、索引和管理策略等。
數字化應用技術首先對文化遺產的各類信息進行數字化記錄,通過模擬、制作和創建使文化遺產的內容復原并重現,因此而形成大量的文字資料、圖像資料、聲音解說、配樂、視頻和2D,3D模型等信息集,應用多媒體數據庫對數字化的資料進行永久和高效的管理,最后通過網絡多媒體發布技術實現文化遺產的廣泛傳播和利用。虛擬現實技術是用聲、光、電一體化的信息產品形式表現出來的,利用信息技術、三維掃描技術和高精度攝像系統,可大量地獲取文物和景觀遺址的三維圖像與數據,并生成物體與場景的三維全景模型,造就一種虛擬現實或虛擬環境,實現交互式觀賞功能,滿足用戶主動參與的要求,是少數民族文化遺產保護中重要的數字化技術。文字資料的數字化由于文字的復制性較強并可應用OCR識別技術,實現技術相對簡單。圖像資料的數字化采用數字圖像壓縮技術可以較好地實現,如JPG和JPEG2000格式等,用數碼相機進行實物實景拍攝,或采用掃描儀從印刷精美的文物類書籍圖冊中獲得數字化圖片。聲音解說、配樂等音頻資料采用數字音頻壓縮格式數字化采集制作。視頻采用最新運動圖像數字編碼MPEG4進行壓縮和保存,主要使用數字攝像機和全景攝像機實地拍攝,后期制作使用非線性編軟件進行,或由計算機2D,3D生成文化遺產原始風貌和人文景觀,特別在重現和展示非物質形態的文化遺產中有不可替代的作用。在虛擬現實制作過程中產生的圖片、音/視頻素材也納入多媒體數據庫的管理范疇,建模產生的數字文件采用工具本身的格式保存。文化遺產數字化資料的利用主要由具有資料的存儲管理和檢索導航功能的多媒體數據庫管理系統來實現,與一般的文本數據庫不同的是多媒體數據庫要解決多媒體數據編目和多媒體數據的元數據描述規范。由互聯網的多媒體信息發布系統來完成文化遺產的內容傳播。
3應用平臺構建中的關鍵技術
文化遺產數字化應用平臺的構建涉及的關鍵技術有多媒體信息數據采集、VR制作、元數據、編目、檢索、存儲管理與發布等,這里介紹的是多媒體數據庫設計、元數據設計、存儲管理和發布應用。
3.1文化遺產多媒體數據庫設計
數字化技術的應用把各種文化遺產資料統一為計算機數據,形成的文化遺產多媒體數據資料具有方便存儲、檢索、低成本、無差錯和方便傳播的優點。目前有數據倉庫、數據集市及數據挖掘等數字化處理方法,采用數據庫管理數字資料需要從多媒體信息編目、著錄、標引、元數據和索引的設計入手,研究適合文化遺產的電子文檔、圖像和音/視頻的多媒體數據庫管理方案。數據庫構建是數字資料管理的核心,提供多媒體信息的錄入、檢索、修改以及輸出等基本功能,為文化遺產展示虛擬場景漫游和信息發布網站提供數據支持。少數民族文化遺產的數據庫設計分為后臺數據庫和前臺數據庫。
圖2說明了前、后臺數據庫系統所包含的模塊。后臺數據庫由圖形數據庫、音/視頻數據庫和文檔數據庫三者構成。這是數字化的后臺中心數據庫,由圖形部分、二維平面圖像、三維立體圖像信息和音/視頻文件組成。后臺數據庫面向整個內部局域網,與數字采集、編輯和制作共享資源。基于數據庫的圖片管理,除了圖片瀏覽功能,還支持元數據著錄項的各種屬性檢索;由于基于數據庫管理,因此可以進行大量的圖片管理,檢索速度快;基于縮略圖的組織管理,可快速瀏覽。基于數據庫的音/視頻管理包括少數民族文化遺產的音/視頻資料和數字化作品的數據庫管理。其功能有保存、注釋、視頻索引查詢和原始資料回放等。利用元數據的“關聯數字資源”字段對于視頻資料存儲小尺寸、高壓縮率的MPEG 4視頻索引作為視頻內容簡介,提供了音/視頻瀏覽功能,支持幀定位。這樣就建立了面向遺產對象的音/視頻管理模式,從而將相關的圖像、解說詞、字幕、同期聲文件、內容介紹、關鍵幀等,通過附件方式關聯到節目對象中,方便內容的檢索和利用。
前臺數據庫是后臺數據庫的簡化,分別響應不同的用戶訪問,負責遺產數字資料的分發和發布應用,包括將數據庫中原始圖像和音/視頻素材進行處理后的珍品動態庫,存放當前服務功能信息的服務動態庫,音/視頻索引庫以及少數民族文化專題動態庫等。前臺數據庫的設計既提高了檢索處理的響應速度,又加強了后臺數據庫的安全性。
3.2文化遺產數字資料元數據設計
元數據作為一個在信息組織、管理和服務領域的重要概念與工具,已經日益得到關注和應用。國際上先進的有關元數據的一些理論與方法,目前正在從接受、學習和研究走向實際應用,在國內數字資源建設的實踐中,有些系統內置了不同完善程度的元數據方案,但針對音/視頻資源的元數據方案并不多見,而少數民族文化遺產數字化資料主要是大量的多媒體數據。表1作為針對文化遺產的元數據方案,以DC標準為基礎,保持與DC的15個核心元素對應的同時作了元素集的擴展,增加了4個管理性元數據,合計19個元素以及接近70個修飾詞組成。擴展的管理性元數據主要是解決文化遺產的數字資料制作的復雜性和結果數據的多樣性。本方案建立在文化遺產的電子文獻、數字圖片、計算機2D和3D制作、數字音頻、數字音/視頻的節目、片段、場景和鏡頭等九種電子資料的基礎上。為了使用簡便,設計不同資源有不同的元數據模板,每一種元數據模板的界面只包含這一種類型資源所需要的修飾詞,在滿足各種類型數字資料描述需要的同時易于實現。
元數據編目和著錄遵照DC、電子資源格式代碼(Internet Media Type,IMT)、統一資源標志URI(RFC 2396)、DCMI Pe riod、日期與時間格式(W3CDTF)、《廣播電視音像資料編目規范》和《廣播電視節目資料分類法》。數字資料的標引數據可以通過多種途徑(系統自動獲取、手工錄入)、分階段(數字化時立即標引、數字化后添加、入庫再編輯)實現。編目按功能可劃分為自動和手動兩種。自動編目定義編目模板,具有編目匹配功能,通過提高編目程度來提高編目速度,此外提供音/視頻關鍵幀檢測和整理功能,基于XML文件格式標準的設計對編目信息數據交換。例如,對于較為復雜的數字音/視頻資料,通過文字標引、著錄和附件信息,結合視頻低碼流和關鍵幀技術,實現數字音/視頻資料元數據的描述。圖3說明音/視頻資料著錄項目分割為節目層、片段層、場景層和鏡頭層四層結構,分不同的元數據項進行編目。其中,描述節目層和片段層的數據元素就是表1的所有列項,描述場景層和鏡頭層的數據元素用數字資料題名、主題、數字資料說明、數字資料制作日期、數字資料數據格式和關聯數字資料六個元素來進行編目即可。
上述設計的優點是:①采用DC元數據集為基本框架,符合國際元數據標準化發展趨勢;②格式設置HTML語言的標簽,為每個單元增加著錄標志,從而實現輸出結果為網絡產品,保留資料著錄標志系統的功能,適用于互聯網環境;③采用模板設計極大地簡化了數字資料的著錄和標引,非專業編目人員也能掌握使用;④符合國內外有關編目規則的規范,對內容的標引深度沒有限制,并全方位支持中文全文檢索;⑤具有可擴展性,可以與其他元數據單元連接使用。
3.3存儲管理設計
文化遺產數字資料存儲管理首先是設計具有管理各種類型的數據格式的能力,其次存儲設計采用基于SAN的存儲網絡環境下,以在線存儲、近線存儲、離線存儲共同構成三級存儲模式,并在數據庫中對數字資料在存儲模式中的位置進行記錄和提示,存儲管理模塊集成到多媒體數據庫中,實現靈活快速、大容量、可平滑升級的存儲機制。
存儲管理由存儲服務器和索引服務器組成,包括上載模塊(負責對多媒體數據進行管理,將音/視頻文件和元數據信息上載到存儲服務器),存儲管理模塊和索引管理模塊。在提供高性能的數據訪問和集中管理能力的同時,降低了存儲系統的單位存儲成本。在實際應用中較好地滿足大規模文化遺產數字視頻資料海量存儲的需要,又可隨著信息量的增長保證系統的可擴充性和拓容性。常用的資料可以從磁帶、光盤遷移到硬盤中,再由應用系統將數據傳送到目的地;同時要將硬盤上不常用的數據遷移到磁帶中。
3.4網絡發布設計
文化遺產數字資料發布階段是再利用過程,在前面各階段的基礎上通過查詢手段,將文化遺產數字資料提取出來,通過網絡渠道進行傳播。網絡發布由內容分發系統和發布系統構成。
內容分發系統是存儲與發布系統之間的橋梁,由分發服務器和管理服務器,以及內容分發模塊和分發管理模塊組成。支持多級或多個邊緣發布點,在分發管理模塊的控制下,通過Web創作將文化遺產的數字化資料分發到各發布點上。分發管理模塊將依據分發策略,智能、自動、手動、定時地向各發布點的檢索服務器復制相關索引信息,并同步控制內容分發模塊將相關文化遺產數字資料分發到各發布點上,同時把得到的元數據保存到相應種類元數據的數據庫中。
發布系統由索引服務器、播放服務器和Web服務器,以及相應模塊組成,采用J2EE架構和XML標準,以及IP流媒體發布技術。功能包括元數據檢索、全文檢索、文化遺產內容檢索(如圖片、視頻的文化內容檢索),動態抽取視頻關鍵幀圖片和索引視頻等。用于發布的信息可以是直接從多媒體數據庫中提取的內容,也可以是利用所提取的資料再次組裝后而發布的,形成具有可定制的專題資料庫,多個數字資產邏輯集合就形成文化遺產的復合資產。在服務器上對視頻文件進行搜索操作與真正的視頻流發布不完全相同,一旦許多用戶同時選擇了在線點播視頻節目,那么服務器將面臨巨大的資源占用壓力。解決方法是采用專用的存儲機制來處理系統的視頻數據,并對服務器的I/O性能進行優化,使得系統具有處理多路視頻流并行發布的能力。視頻服務器提供基于URL訪問視頻數據的服務時,服務器可在指定時間偏移處開始播放視頻,其基本原理是采用元數據中所包含的時間戳信息來指定需要播放時間的偏移量,也就是在URL地址中指定視頻信息的邏輯位置,在搜索系統中形成一個包含有視頻數據的URL地址,以及關于時間偏移量的附加信息。
4結束語
文化遺產是一個民族的精神財富,用數字化來保存各種形態的少數民族文化遺產,目的在于解決少數民族文化遺產缺乏長久保存,缺乏重現,缺乏跨區域、跨國界的交流和展示,缺乏系統性全息表現,缺乏從作品上升到具有知識產權商品等諸多方面的問題,通過網絡技術,可以將所有的文物資源統一整合起來,實現文化“一次加工,多次利用”,全面地向社會傳播,達到教育、研究和欣賞的目的。除本文所探討的應用技術外,還有一些其他技術可應用于文化遺產的數字化,例如,在少數民族文化遺產信息系統基礎上,利用3G技術構建文化遺產地理空間分析模型,可更精確并且動態地掌握少數民族文化遺產的規模、分布和保護等信息。對于很多特殊文字,字庫里沒有,造成客戶端瀏覽困難,需要結合圖形技術一并處理。對于內容的檢索需要不斷集成最新的數字圖像、數字音/視頻壓縮和檢索方面的技術,以提高對整個文化內容管理的性能,使在線資料最大化,檢索、響應時間最小化。由于各種數字資料的編輯軟件更新速度非常快,因而原始資料的保存不宜對某一軟件依賴性太強,否則大量數據會因軟件的淘汰而無法使用,這將造成巨大的損失,要盡可能兼顧到以后的適容性。基于文化遺產數字化的開放性傳播,使得從網絡上下載文化遺產數字化信息十分方便,這是少數民族文化遺產數字化應用的一大特點,但同時也帶來了版權等問題,應用數字水印技術可以加強文物的版權保護。另外,互聯網上的文化傳播是面向世界用戶的,其相關的作(產)品在設計時,應考慮到中文版、英文版兩種及更多語言的版本,以利于最大限度地實現文化產品的學習、旅游、欣賞、科研、教育的社會傳播屬性。
參考文獻:
[1]中國文物研究所.歷史文化遺產保護領域科技平臺[EB/OL]. http://kj.sach.gov.cn/, 2004.
[2]國家圖書館.中文元數據方案[EB/OL]. http://n1c.n1c.gov.cn/, 2004.
[3]中山圖書館.數字式中文全文文獻通用格式[EB/OL]. http://www.zslib.com.cn/, 2005.
[4]王佳梅.廣播電視音像資料編目規范[S]. 國家廣播電影電視總局, GY/T 202.1 2004.
[5]王佳梅.廣播電視節目資料分類法[S].國家廣播電影電視總局標準化研究所, GY/Z 199-2004.
作者簡介:吳建平(1965-),男,高級工程師,碩士,主要研究方向為多媒體技術、數據庫等;王耀希(1954-),男,研究員,碩士,主要研究方向為項目管理、電子商務等;代紅兵(1963-),男,正高工,碩士,主要研究方向為嵌入式數字系統、數字電視等。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。