劉海 李昱鋒 王曉鈺 劉明陽 石釗宇 王宗超
摘要:隨著信息技術的發展,互聯網技術擴展了人們了解博物館相關信息的途徑,同時也為智慧博物館的建設提供了更多的可能性。但是由于不同種類博物館之間屬性不同,側重點不同,繼而智慧化建設過程中面臨的問題也存在較大差異,但是歸根到底,智慧化博物館的建設都是要以數據為基礎的,并且要以受游客歡迎為目標的,因此還是要回歸到對博物館數據的規劃和處理方面。該文以紅旗渠紀念館為例,利用大數據技術就智慧化紅旗渠紀念館建設進行數據來源、數據分類和數據特點的調查分析,在此基礎上確定了符合大數據技術處理規則和符合功能需求的紅旗渠紀念館數據處理原則。
關鍵詞:智慧博物館; 大數據技術; 紅旗渠紀念館; 數據規劃; 數據處理
中圖分類號:TP311? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)06-0013-03
開放科學(資源服務)標識碼(OSID):
1 背景介紹
信息技術的發展誕生了很多新生的行業,也在促使新的行業不斷發展和壯大,例如短視頻行業、電商行業、編程行業。新行業的發展一方面在沖擊著傳統行業走向沒落,例如傳統的紙質書和紙質報紙等信息載體正在逐漸從市場中消退;但在另一方面,新行業的發展也給傳統行業實現變革提供了無限生機,例如隨著紙質信息載體的沒落,新興的微博、抖音等信息技術載體反而給信息的衍生和傳播提供了更強大的活力。
博物館是征集、典藏、陳列和研究自然和人類文化遺產實物的場所,對館藏物品分類管理,為公眾提供知識、教育和欣賞的文化教育機構、建筑物、地點或者社會公共機構[1]。紀念館是博物館的一種特殊類型,它具有一般博物館的基本性質,即“博物館是科學研究機關,文化教育機關,物質文化與精神文化遺存或自然標本的主要收藏所,基本任務——為科學研究服務,為廣大人民服務”[2]。作為傳統文化中最為精髓的一部分,博物館在文化傳播與文化養成方面具有十分重要的作用,然而通過作者對身邊人員的簡單調查卻發現,在調查的117人中,有61人近一年沒有去過博物館(包括紀念館),占比為53.51%,調查結果如圖1所示。而在去過的53人里,去過1次的是18人,占比33.96%,去過兩次的是19人,占比35.85%。一年大于四次的僅僅為7人,占比13.21%,調查結果如圖2所示。由上述調查結果可知,在作者的調查人群中每年參觀博物館的人數不足50%,參觀次數以1次和2次為主,由于調查樣本過小,調查結果可能存在一定的誤差,但是這也能在一定程度上反映出博物館目前還存在很大程度的改進空間以進一步吸引更多的人群參觀。
接著作者又對近一年除博物館(包括紀念館)外,主要通過何種途徑了解到相關博物館(包括紀念館)館藏品進行了簡單的調查,在調查的114人中,通過抖音、快手、微視等短視頻平臺了解的占42.11%,通過微博、朋友圈和QQ空間等共享數據平臺了解的占35.09%,調查結果如圖3所示。由上述調查結果可見,隨著信息技術的發展,相比較傳統而言,人們獲取博物館相關信息的方式已經發生了很大的變化。
雖說信息技術所衍生的多媒體技術可以讓更多的人通過更加便捷的方式獲取相關博物館(包括紀念館)館藏品信息,但并不是所有的館藏品信息都能通過多媒體技術進行傳播和展示,很多館藏品由于歷史和特定事件所賦予的“痕跡”,只有通過現場觀看才能直面文化的魅力,例如出土于安陽的后母戊鼎,無論是視頻、圖片和文字怎么樣去描述其宏大,都不如站在旁邊切切實實地感受。
綜上所述,作為傳統行業的博物館,要想在信息化時代吸引更多的游客進行參觀,就需要結合信息化時代的多媒體特征和相關的信息化技術,建設更加符合時代特色、符合游客需求、符合信息化特征和符合自身特點的智慧博物館。
2 現狀分析
近年來,已經有很多博物館結合先進的信息化技術開始了智慧博物館的構建工作,并且也已經積累了大量的經驗和數據,例如經作者調研,紅旗渠紀念館中就建設有智能振動平臺1組,其可以根據振動平臺前方視頻中播放的火藥爆破山體場景產生振動效果,給人以視覺、聽覺和感官的多重體驗。但是擁有經驗和數據并不代表就能充分地發揮博物館自身的價值,只有把博物館目前的數據進行科學統一的規劃和處理,才能最大限度地發揮數據自身的價值。例如經作者調研,紅旗渠紀念館中的智能振動平臺,其作用目前就是振動,沒有其他的作用,但是如果能在其上面加入一些傳感器,例如壓力傳感器,那么就能根據人體腳面的尺寸和重量等數據進一步分析其受歡迎的人數,乃至于其受歡迎的性別和年齡情況等數據,同時也可以檢測到振動平臺自身的承載和安全情況。
而在實際的智慧博物館運行中,博物館數據規劃和處理還存在一些較大的問題。首先是數據的多樣性問題。圖片數據、視頻數據、文字數據和數字數據并存,類型多樣化,規劃和處理難度較大;其次是數據的重要性問題。館藏品數據價值密度高,其價值隨著時間流逝而降低的可能性較低,而每日的游客訪問數據價值密度低,其價值隨著時間流逝而降低的可能性較高;最后是數據的側重點問題。因為博物館(包括紀念館)屬性不同,因此其在數據的側重點方面也存在較大差異,對于一些文物類博物館,其側重點應該在重點文物的保護、重點文物的突出以及重點文物的歷史價值等方面,也就是說其側重的是文物本身。而對于一些紀念類博物館(即紀念館),其側重點應該在展品所延伸出來的歷史事件方面,通過展品讓參觀者了解歷史事件、感悟事件精神。不同的紀念館歷史事件的屬性不同,其在數據方面的側重點也是不同的。
3 紅旗渠紀念館大數據調查分析
3.1 整體分析
綜上所述,智慧博物館的建設要從博物館(包括紀念館)自身的定位和特色出發,結合目前先進的互聯網技術,經實地調研,參考國內外智慧博物館的先進建設經驗展開,這樣才能設計出更符合自身特色、受群眾歡迎,具有較大影響力的博物館。本章節主要從博物館運行的各個環節出發,以博物館運行過程中產生的海量數據為導向,結合目前先進的大數據技術,就海量數據的規劃和處理展開智慧博物館的研究。在具體研究方面,本章節以紅旗渠紀念館為研究主體,經實地調研、調查問卷和文獻資料匯總得出了紅旗渠紀念館的數據來源、數據分類和數據特點,在此基礎上確定了符合大數據技術處理規則和符合功能需求的紅旗渠紀念館數據處理原則。
3.2 紅旗渠紀念館數據調查
該文的目的在于利用大數據技術對紅旗渠紀念館的相關數據進行統一的規劃和處理,首先要做的工作就是確定紅旗渠紀念館的數據來源和組成,經作者實地調查和研究,與紅旗渠紀念館相關的數據目前大致可以分為以下兩類:
(1) 紅旗渠紀念館自身在運行過程中產生的數據,例如館藏品數據、游客數據和售票數據。
(2) 通過紅旗渠紀念館衍生出來的數據,比如抖音上有關紅旗渠紀念館視頻的點贊、觀看和評論數據;微博上有關紅旗渠紀念館文字和圖片的點贊、觀看和評論數據。
經作者對紅旗渠紀念館數據來源進行實地調查、文獻查找和多次深入討論研究后,得出紅旗渠紀念館的相關數據來源存在以下三個特點:
(1) 數據格式多。在所有已知的數據中,存有文字數據、數字數據、圖片數據、視頻數據,還有相當數量的紙質數據。
(2) 數據相關性差。每一部分數據都屬于一個獨立的系統,彼此關聯性較差,例如紅旗渠紀念館的館藏品數據和游客數據幾乎是毫不相關的,這對于研究和分析游客對館藏品陳設的喜愛程度非常不便。
(3) 數據價值密度低。網絡上每天關于紅旗渠紀念館的各類視頻、圖片和評論等數據非常多,并且來源也非常廣,但是能從中分析得到的對紅旗渠紀念館智慧化建設的有用信息不一定最多。
對來源復雜、特點眾多的紅旗渠紀念館數據進行統一的數據規劃和處理,需要滿足以下兩個條件:
(1) 符合大數據技術的相關處理準則。就目前的大數據技術而言,對于結構化數據,例如存儲于紀念館中結構化數據庫中的數據,因為其在格式上和字段上都符合計算機的數據處理規則,因此在大數據分析前的數據清洗方面無須太多工作。但是就紅旗渠紀念館的數據來源和數據特點來看,結構化數據占比并不多,更多的是一些圖片、視頻和文字等非結構化數據。非結構化數據無論是在格式上還是在內容上,都是雜亂無章的,要想從中分析出有價值的信息,就要結合實際的需求,在大數據分析前對非結構化數據展開大量的清洗工作。
(2) 滿足智慧博物館大數據分析的功能需求。在進行非結構化數據的數據清洗之前,一定要確定的是項目的需求分析,即大數據分析是為了滿足什么樣的需求,最終實現什么樣的目的;不同的需求或者目的之間是否涉及多個數據集的關聯。只有思考清楚這些問題,對于非結構化數據的清洗才變得有意義,才能從眾多雜亂無章的數據中清洗出對智慧博物館建設有意義的數據。
3.3 紅旗渠紀念館大數據技術研究思路
結合上述分析可知,該文的目的主要是通過智慧博物館中的大數據技術對紅旗渠紀念館現有數據進行規劃和分析,以為能建設出受廣大群眾歡迎、具有較強影響力的智慧紅旗渠紀念館提供一些建設性的意見。因此論文的整體需求還是要以紅旗渠紀念館受游客的喜愛度為根本,即通過大數據技術對紅旗渠紀念館現有數據進行大數據分析后,根據分析結果進一步優化紀念館的建設。
從大數據分析全流程的角度來看,大數據技術主要包括數據采集與預處理、數據存儲與管理、數據處理與分析、數據可視化和隱私保護等幾個層面的內容[3],并且這幾個層面是存在一個先后發展和相輔相成的關系,也就是說只有提前完成了數據的采集和預處理工作,才能進行數據的存儲和分析工作,否則就相當于是無本之木,無水之源。也只有提前做好,做完備數據的采集和預處理工作,才能為后續的大數據處理和可視化提供堅強的支撐。同時,數據的采集和預處理工作也要根據數據分析和可視化的反饋結果進行適當調整,以使得整個智慧博物館大數據系統更加完善和符合實際的需求。
本文在前期的工作中已對紅旗渠紀念館的數據來源進行了詳細的分析,從上述整體分析可知紅旗渠紀念館數據來源和特點的復雜性,因此作者認為智慧化紅旗渠紀念館大數據的研究工作應主要集中于紅旗渠紀念館數據的采集和預處理工作。但是數據的采集和預處理工作并不是單獨運行,與其他階段大數據技術獨立存在的工作,數據分析與可視化的要求和結果也是在數據的采集與預處理階段需要參考的方面。
就大數據分析工作而言,常用的大數據計算模式主要有批處理計算、查詢分析計算、圖計算、流計算、迭代計算、內存計算等[4,5]。不同的計算模式所分析的數據種類是不盡相同的,例如批處理計算模式主要分析大規模的數據;流計算模式主要分析實時的數據,并可以實時地得出有價值的結果;圖計算主要分析大規模圖結構數據。因此,盡管說紅旗渠紀念館的數據來源紛繁復雜,但是大數據眾多的計算模式為其智慧化建設提供了最契合的解決方案。智慧化紅旗渠紀念館大數據的研究工作應以大數據計算模式為反饋,以吸引游客為目的,結合紅旗渠紀念館的數據來源,針對不同的數據特點,對數據進行詳細和完善的采集和預處理分析。基于大數據的智慧化紅旗渠紀念館整體調查研究思路框架圖如圖4所示。
4 總結
本文首先通過一系列調查問卷得出目前博物館的游覽情況并不理想,而通過信息技術等平臺了解博物館相關信息的占比越來越高,但是由于博物館具有“百聞不如一見”的不可取代性,因此如能把互聯網信息化技術應用于博物館建設過程中,必將促使博物館更具特色和受歡迎。因為不同博物館屬性不同,側重點不同,繼而智慧化建設過程中面臨的問題也存在較大差異,但是歸根到底智慧化博物館的建設都是要以數據為基礎的,并且要以受游客歡迎為目標展開的,因此還是要回歸到對博物館數據的規劃和處理上。大數據技術具有得天獨厚的數據處理優勢,如果能利用大數據技術對博物館相關數據進行收集、處理和分析,必將對智慧博物館的建設提供堅強的支撐。其次在具體研究方面,本文以紅旗渠紀念館為例,確定了紅旗渠紀念館的數據來源,對數據進行了分類,總結出數據的三大特點,在此基礎上確定了數據處理的兩大原則:符合大數據技術處理原則和符合功能需求原則。最后通過分析大數據技術流程和計算模式,鑒于紅旗渠紀念館大數據研究的復雜性和重要性,主要就紅旗渠紀念館的數據采集和處理工作研究思路進行了闡述。
參考文獻:
[1] 王文析.淺談文物視頻供給側服務——河南博物院《中原藏珍》系列短片攝制推送的實踐與思考[J].河南博物院院刊,2021(2):121-129.
[2] 杜丁華.試論紀念館的性質及特點[A].湖南省博物館學會.博物館學文集1[C].湖南省博物館學會:湖南省博物館學會,1982.
[3] 林子雨,賴永炫,陶繼平.Spark編程基礎(Scala版)[M].北京:人民郵電出版社,2018.
[4] 龍虎,彭志勇.大數據計算模式與平臺架構研究[J].凱里學院學報,2019,37(3):73-76.
[5] 姚舸.大數據平臺安全架構體系研究[J].信息記錄材料,2019,20(10):181-183.
【通聯編輯:代影】