摘 要:文物保護單位對文物本體及相關資料數據采集的逐漸完善,產生了大量零散、無序的文物數據資源。隨著計算機、網絡技術、大數據和人工智能技術的發展,數據資源的管理和利用對文物研究、保護和管理的發展越發重要,如何管理利用好這些數據資源成為是否能夠提升文物保護單位信息化建設的關鍵。文章以云岡石窟文物數據資源管理和利用為例,闡述了石窟寺文物數據資源的管理和利用方式,為文物保護單位數據資源管理和利用提供借鑒。
關鍵詞:石窟寺文物;數據資源;管理;利用
DOI:10.20005/j.cnki.issn.1674-8697.2025.05.039
1 我國數據資源管理與利用現狀
我國數據資源管理和利用總體處于起步階段,2024年2月,國家數據局聯合中央網信辦、工業和信息化部、公安部組織開展全國數據資源調查,形成《全國數據資源調查報告(2023年)》。該報告指出,我國數據產量、存量、算力規模大,數據流通、交易變化快,數據資源“產—存—算”規模優勢基本形成,數據“供給—流通—應用”主體逐漸豐富,海量數據和豐富場景優勢潛力亟須釋放。在文物領域,我國現有1.08億件(套)可移動文物、76.7萬處不可移動文物和1372項非物質文化遺產,2000年以來,文化遺產數字化保護工作在全國廣泛開展,采集存儲了體量巨大的數據資源。但存在數據生產總量大,有效供給不足;數據流通交易需求旺盛,流通模式不完善;海量數據源頭即棄,數據價值有待釋放等問題。
2 石窟寺文物數據資源現狀
2.1 石窟寺文物數據資源類型
石窟寺文物保護管理單位在進行文物保護工作的過程中積累了大量的、多種類的、時間跨度大的數據資源,具體如下:
一是文書類數據資源。文書類數據資源是所有機構中最基礎的一類數據資源,石窟寺管理機構也不例外,石窟寺文物保護管理單位文書類的數據資源涵蓋了洞窟介紹、保護修復過程、數字化采集、文旅弘揚、科研、歷史資料、安全防范、設備儀器、財務管理、人事管理等文書類數據資源。
二是圖片類數據資源。由于文物具有時間跨度長的特殊性,圖片類數據資源是反映文物發展變化過程的重要資料,石窟寺文物保護管理單位圖片數據資源主要有石窟照片、歷史名人照片、手稿、拓片、書法及日常工作活動等照片。這些照片直接應用于文物保護、文旅弘揚、科研出版等各項業務工作,具有十分重要的價值。
三是流媒體數據資源。與圖片數據相同,流媒體數據資源也是反映文物發展變化過程的重要資料,石窟寺文物保護管理單位流媒體數據資源主要有文物視頻、講解、學術會議錄音等,這些流媒體數字資源可以數字化形式進行展示與文化傳播,豐富了石窟寺文物保護管理單位傳承中華優秀傳統文化的形式。并且流媒體資源越來越多地運用于石窟寺文物的陳列展覽、保護修復、社會教育等各項活動中。
四是三維數據資源。文物三維數據是指通過三維掃描技術將文物的幾何和紋理信息進行采集,構造一個與真實文物盡可能一致的三維數據。石窟寺文物保護管理單位現有的三維數據資源主要有點云數據、文物三維模型數據等,此類型的數據資源可以用于文物虛擬修復、文物3D打印復制和宣傳展示等工作中。
五是其他數據資源。近年來許多新技術應用到云岡石窟的保護研究領域,諸如高光譜、多光譜、人工智能算法等,這些新技術的應用也會產生大量的數據,對這些數據進行管理及利用,可以發現使用傳統方法發現不了的信息,有利于文物的進一步保護研究和利用。
2.2 石窟寺文物數據資源的來源
石窟寺文物的文本類數據資源一般是通過手寫版輸入、鍵盤輸入、互聯網下載、OCR掃描識別、語音錄入等方法進行采集。
石窟寺文物的圖片類的數據資源一般是通過數碼相機拍攝、掃描儀掃描、互聯網下載、攝像頭拍攝、三維模型輸出等方法進行采集。
石窟寺文物的流媒體類數據資源一般是通過數碼相機拍攝、互聯網下載、攝像機拍攝、攝像頭拍攝、電腦制作、錄音機錄制等方法進行采集
石窟寺文物的三維數據目前主要是通過三維激光掃描和攝影測量的方式進行采集和制作。
其他數據資源主要使用專門的儀器和設備進行相應特殊數據的采集。
2.3 石窟寺數據資源管理與利用問題
諸如圖片數據、流媒體數據、三維數據等數據資源組成了石窟寺文物保護管理單位的基礎數據要素,具有分布性、自治性、變化性、持久性、共享性、多樣性等特點,在管理與利用上存在以下一些問題:
2.3.1 文物數據生產總量大,但供給不足
石窟寺文物數字化工作已經實施多年,各個石窟寺文物保護管理單位積累了大量的數據資源,數據資源的類型豐富,但存在源頭即棄的問題,即采集到的數據只存儲在存儲設備中,沒有得到有效地開放利用。
2.3.2 數據質量問題影響利用成效
石窟寺文物保護管理單位想要利用數據必須保障數據的準確性、完整性、一致性、及時性、可靠性,由于石窟寺管理單位技術力量的差異,采集到的數據質量參差不齊,若數據質量差,石窟寺文物數據資源的利用成效必然不高。
2.3.3 數據安全性保障相對較低
除個別較大型的石窟寺文物保護管理單位有相對健全數據安全保障措施,其他的石窟寺文物保護管理單位存儲設備和管理制度等設置相對不足,數據安全性保障不足,存在泄漏風險。
2.3.4 數據應用場景落實加快,數據價值有待釋放
石窟寺文物數據的應用場景呈現爆發式的增長,在文物展覽、游戲設計、服裝設計等方面應用加快,成為引領數據開發利用的催化劑,文物數據的開放量增長速度較快,但數據的多場景應用、多主體復用的難度較大,數據價值有待釋放。
2.3.5 開放動力不足削弱共享意愿
目前石窟寺文物保護管理單位缺少行之有效的激勵機制,影響到數據利用的積極性,同時職稱晉升多以期刊論文為主,產出的科研數據會被忽視,第三數據的產權歸屬問題不明確,石窟寺文物保護管理單位、資助單位及文物數據生產、管理相關單位的數據所有權爭議較大,造成共享意愿相對較低。
2.3.6 數據管理、使用需求旺盛,流通模式待完善
石窟寺文物數據交互活躍度較高,但是由于數據質量、數據產權、效益分配等諸多因素的影響,數據的供給難以滿足大量的需求,亟須建立和完善多元的流通模式。
3 云岡石窟數據資源的管理
云岡石窟數字化工作起步于2003年,數字資源管理歸口云岡研究院數字化保護中心。
在三維數據方面,經過多年的實踐積累和長期的研究與探索,突破了三維數據采集、運算、存儲與應用等關鍵技術,形成了以三維激光掃描技術、攝影測量技術為主的適用于高浮雕文物的數字化方法,為石窟保護、研究和展示工作提供了科學精確的數據支持。目前已完成云岡石窟三分之二洞窟的數字化工作,成功完成云岡第3窟、第12窟、第18窟等比例3D打印復制,在世界上首次實現大型不可移動文物的可移動展示,在文物變形監測方面達到世界領先水平。
在其他類型數據方面,通過數字化手段,將云岡研究院收藏的大量珍貴書籍、歷史檔案、照片、流媒體數據等資料進行數字化加工,以永久保存和利用。同時積極協助其他文物單位開展數字化工作,先后完成包括5處世界遺產地的30多項文物數字化工程,涉及石窟寺、古建筑、墓葬、壁畫、雕塑、碑刻等。經過多年的數據積累,云岡研究院數據中心形成了近2PB的多類型的文物數據資源。
3.1 云岡石窟數據資源的軟硬件建設
3.1.1 硬件建設
2020年投資2400萬建立云岡石窟計算中心,具有峰值算力234 TFLOPS(萬億次每秒),圖形圖像峰值計算能力為179 TFLOPS,存儲容量2.3 PB,共計1120個物理內核,存儲聚合帶寬9.6 GB/s,綜合性能相當于5000臺普通PC的計算能力。同時綜合配套網絡交換設備、安全設備和備份設備,目前云岡石窟計算中心已投入使用,是全國文物系統首個計算中心,具備強大的文物數據存儲、運算、利用、展示能力。云岡石窟計算中心建成之后相當于人類的大腦,要想讓云岡石窟這個“人”發揮最大的作用,還需要強大的神經系統,這個神經系統就是網絡。2023年我們在云岡研究院建設了萬兆網絡覆蓋,網線直通桌面,完成了全院內網的建設,為了實現在院外安全訪問云岡石窟計算中心,我們使用中國移動5G專網,通過移動手機號碼白名單控制訪問計算中心數據,達到數據高安全性的訪問。
3.1.2 軟件建設
硬件平臺建設完成后需要相應的軟件平臺才能發揮高性能計算中心的效能,為云岡石窟文物保護工作提供支持,為此我們建設了“云岡云文物數字資源管理平臺”(圖1),在該平臺下根據云岡石窟文物數字化工作建設了8套系統,分別為文物數字化與應用系統、文物信息識別軟件、數據集成管理軟件、文物信息發布系統、文物數字導覽系統、三維模型遠程渲染系統、高清播放平臺、文物色彩還原管理系統。
數據資源管理實現了個人數據和團隊數據的雙重管理,每個用戶都有自己獨立的賬號和密碼,個人資源管理空間實現了個人數據的單獨空間。團隊空間實現了團隊賬戶的協同管理,每個團隊成員發布的數據整個團隊都可見,并且設置團隊資源的下載審批流程,由平臺管理員審核團隊成員下載數據的合法性,經過審批后的數據才可下載使用,從而保證了文物數據的安全。知識圖譜將洞窟信息與其他知識發生關聯,實現洞窟信息與其他知識的無限關聯,最終形成知識網絡,將所有的信息關聯起來。研究和保護人員可以通過本知識圖譜實現對相應洞窟的全方位了解。
云渲染展示平臺可實現面向公眾的云岡石窟超大模型互聯網展示,無須安裝任何軟件實現可交互、可多人協同、跨平臺、跨設備終端的展示功能,同時顯示效果不受客戶端的限制。展示平臺可以720度展示彩色三維模型和三角面片,同時可以模擬不同類型(自然光、火把、蠟燭、手電筒)、不同強度光照下的石窟場景,實現距離與面積的測量,一鍵輸出視圖的功能。結合數字化石窟病害管理分析系統,提供基于三維數字化模型為底圖的病害、論文、工程檔案的管理、標注、可視化,讓石窟的每一個位置、每一次變化都能夠得到有效的記錄,同時,關聯記錄石窟內的各種監測數據,為未來的石窟本體保護研究提供充分的數據支撐,為文物保護研究人員提供數據即時輸出功能。
3.2 云岡石窟數據資源的組織
面對云岡石窟近2 PB的數據資源,數據的組織方式就顯得尤為重要,在數據組織上遵循按時間、洞窟和數據提供者進行分級、分類、分權限組織、管理和使用的原則。
3.2.1 圖片數據
云岡石窟目前擁有近50萬張照片,這50萬張照片分為五種精度級別,分別為100 MB以上、50 MB~100 MB、10 MB~50 MB、3 MB~10 MB、3 MB以下,以滿足不同場景的使用要求,使用唯一編號關聯不同級別數據,并對每張照片進行分時段、分拍攝者、分窟、分壁面、分層進行命名(圖2),在“云岡云文物數字資源管理平臺”進行搜索使用。
3.2.2 三維數據
云岡石窟三維數據的采集精度可以到達8 K、0.03 mm,單個洞窟數據最大30 TB左右,單個模型數據最大560 GB左右,面對如此龐大的數據量,普通的計算機無法進行流暢的運行,同時模型數據的使用量又很大,為了解決這一問題我們使用模型輕量化技術,在不改變模型視覺效果的前提下對模型輕量化,實現高精度數據展示。
3.2.3 結構化數據
云岡石窟將大量的紙質資料進行了數字化掃描,并且對紙質資料的相關信息進行錄入,形成了大量的結構化數據資源。在文獻資料方面形成了以編號、書名、作者、時代、出版社、出版日期、頁數、文獻類別、語言類別、ISSN、ISBN、密級、是否開放為主的結構化數據表。在檔案資料方面形成了“案卷目錄+卷內目錄”的結構化數據表,案卷目錄數據表主要包括卷檔號、年度、案卷題名、檔案類別、件數、總頁數、起始時間、終止時間、保管期限等,卷內目錄數據表主要包括:件檔號文件題名、責任者、文件編號、頁號、年度、頁數、文件時間、保管期限、密級等。在環境監測方面形成了溫度、氣象、降雨量、溫濕度、泉水、大氣測定、日照、風力等結構化數據表。這些結構化數據表在云岡石窟保護與修復、學術研究、管理與決策、文化傳承與教育、數字化應用等方面都發揮著不可或缺的作用。
3.3 云岡石窟數據資源的利用
數據資源有三個重要方面:一是數據資源的來源;二是數據資源的管理;三是數據資源的利用。這三個方面相輔相成,但最為重要的還是利用,數據只有用起來才能發揮其所蘊藏的巨大價值。在數據利用上我們制定了《云岡研究院數字資源資產管理辦法》,使數據利用做到了有規可依,每一條數據的使用都做到層層審批。我們實現了“云岡云文物數字資源管理平臺”的單位內網訪問,對外我們使用中國移動5G雙域專網訪問,這樣既保證了數據傳輸的效率,同時也保證了文物數據的安全。
4 結語
文物數據資源的管理和利用應該有三個階段:第一階段,數據積累;第二階段,數據標注、算法開發及數據中臺建設等;第三階段,人工智能的引入。云岡石窟的數字化工作起步于2003年,經歷了20多年的發展歷程,積累了2 PB多的數據資源,計劃到2030年完成全部洞窟的數字化采集工作,數據積累階段完成。目前也進行了諸如圖片數據標注、三維數據標注、虛擬修復算法開發等第二階段的一些工作,未來云岡石窟的數字化工作將集中在此,為第三階段的工作打下堅實的基礎。
目前大多數石窟寺文物保護管理單位還處在第一階段,個別領先的單位正在進行第二階段的探索,隨著數據積累的完成和數據標注、算法等的逐步完善,最終將會實現人工智能在文物保護領域的應用,從而實現文物數據的高效利用。文物數據資源的管理與利用,是以數字化技術手段活化文化遺產資源,重構文化遺產的存在方式、弘揚方式,對于數字時代發揮文化遺產的科學、宣傳等方面的價值具有十分重要的作用。隨著文物數據資源的進一步利用,將來文化遺產單位將更具知識化、智能化、趣味化和開放性,為社會不斷供給所需的文化信息,未來必將突出以人工智能為主要管理手段的文物數據資源平臺,這樣文物數據資源的管理與利用將更加科學、高效,更能滿足人民日益增長的文化生活需求,成為弘揚中華優秀傳統文化的重要力量。
參考文獻
[1]趙海榮,周世菊,賈瑞雪.北魏方山永固陵數字化復原和傳播探究[J].新媒體研究,2021(19):29-33.
[2]盧民,邵云.博物館數字資源的管理與共享[J].中國博物館,2015(2):16-25.
[3]祁慶國.從行業數字資源建設邁向公共數字文化建設:文物博物館行業信息化建設的實踐與思考[J].博物院,2017(1):46-52.