李廣建,化柏林
近年來,隨著公共文化服務的發展以及大數據技術的廣泛應用,人們開始認識到大數據在公共文化服務領域的意義與作用。如何構建公共文化服務大數據資源體系,并利用大數據推動公共文化服務領域的整體發展、協同進步與精準服務,成為研究的重點。劉煒等認為,當前伴隨公共文化服務而產生的各類大數據已經完全能收集、組織和利用起來[1]。嵇婷等對大數據的采集存儲技術與分析方法進行了探討[2]。張春景等認為公共文化服務大數據應用主要有技術驅動與社會化兩種模式[3]。曹磊等對歐美發達國家關于公共文化服務大數據方面的政策進行調研并給出政策建議[4]。陳建認為應將大數據邏輯治理融于公共文化服務實踐,構建公共文化服務供需大數據庫及其開放共享平臺[5]。這些研究在公共文化服務大數據的數據類型與應用服務等方面進行了有益的探討,促進了公共文化服務大數據的研究。除理論研究外,很多公共文化服務機構嘗試把大數據的理念和方法引入工作中,取得了很好的效果。2016年3月26日“文化上海云”上線,平均每月為市民推送1萬場活動信息,近100萬活躍用戶帶來的每月訪問量達1500萬人次。平臺產生的大數據廣泛應用于文化主管部門及機構的行政管理、資源調配等,通過大數據的集成化采集、分發、再分析,協助政府將公共文化服務供給側的“端菜”模式,轉變為更貼近百姓需求側的“點菜”模式。時至今日,在已有研究與實踐基礎上,對公共文化大數據的理論體系進行系統研究與深入探討,時機已經成熟。本文首先梳理構建公共文化服務大數據研究體系的背景,然后探討公共文化服務大數據研究的體系與內容,最后提出公共文化服務大數據研究近期應該關注的重點課題。
公共文化服務是由政府主導、社會力量參與,或由經過授權的公共機構,利用公共資源,向公民提供文化產品、設施、活動等服務,以滿足公民的基本文化需求的制度和系統的總稱。這體現了政府的責任,也順應了民眾文化需求的變化。我國提出到“十三五”末期即2020年,基本建成現代公共文化服務體系。十九大報告指出我國社會的主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾。在公共文化方面,如何解決好這一矛盾,“美好生活需要”在公共文化方面有哪些具體表現,如何準確地把握用戶需求,如何充分利用數據資源的共享與對接解決不平衡不充分的問題,成為新時代公共文化服務需要著力解決的問題關鍵。事實上,十八大以來,黨和政府重視公共文化服務大數據發展的頂層設計,重現提高政府公共文化服務大數據治理能效、打造數據驅動的新型公共文化服務鏈、加快公共文化服務大數據應用示范,以加快實現在“十三五”期間建成我國現代公共文化服務體系的戰略目標。
2015年1月14日,中共中央辦公廳、國務院辦公廳印發的《關于加快構建現代公共文化服務體系的意見》指出,要加快推進公共文化服務數字化建設,“結合‘寬帶中國’‘智慧城市’等國家重大信息工程建設,加快推進公共文化機構數字化建設”,“加強公共文化大數據采集、存儲和分析處理”,“加快推進數字文化資源在智能社區中的應用,實現‘一站式’服務”。
2017年3月1日起施行的《中華人民共和國公共文化服務保障法》(以下簡稱《保障法》),將公共數字文化服務點納入公共文化設施,要求縣級以上地方人民政府將公共文化設施建設納入本級城鄉規劃,根據當地條件,“形成場館服務、流動服務和數字服務相結合的公共文化設施網絡”。《保障法》指出,國家統籌規劃公共數字文化建設,構建標準統一、互聯互通的公共數字文化服務網絡,建設公共文化信息資源庫,實現基層網絡服務共建共享;國家支持開發數字文化產品,推動利用寬帶互聯網、移動互聯網、廣播電視網和衛星網絡提供公共文化服務;地方各級人民政府應當加強基層公共文化設施的數字化和網絡建設,提高數字化和網絡服務能力。這些表明數字信息資源及其服務手段在公共文化服務中的作用已經得以充分重視,與場館服務、流動服務一道構成公共文化服務的三大基礎。如何充分發揮數字信息資源及其服務的效能,是今后公共文化服務工作者的重要任務。
除公共文化服務領域本身十分重視數字公共文化資源及其服務以外,大數據建設領域也十分重視公共文化大數據,公共文化大數據是國家大數據規劃建設的重要組成部分。2015年8月31日,國務院發布《促進大數據發展行動綱要》,系統部署大數據發展工作,要求加強頂層設計和統籌協調,大力推動政府信息系統和公共數據互聯開放共享,加快政府信息平臺整合,消除信息孤島,推進數據資源向社會開放,增強政府公信力,引導社會發展,服務公眾企業;加強數字圖書館、檔案館、博物館、美術館和文化館等公益設施建設,構建文化傳播大數據綜合服務平臺,傳播中國文化,為社會提供文化服務。
上述政策法律文件充分表明,在公共文化服務體系的建設中,國家要求通過公共文化服務大數據的研究與應用來支撐與保障公共文化服務體系的建設與發展。大數據技術應用于公共文化服務,尤其是應用于民眾的需求識別、精準服務等,將給公共文化服務資源匯聚方式、行為模型構建以及智能分析、決策支持等帶來一系列重要變化。在大數據環境下,要保證公共文化服務體系建設的順利開展,就需要把公共文化服務大數據的理論探索與應用研究作為工作的基礎與主線,為公共文化服務的資源匯聚、共建共享,為公共文化服務數據的分析挖掘,為探索公共文化服務的用戶特征與需求提供理論指導。可見,構建公共文化服務大數據研究體系,不僅是學科理論建設的需要,更是國家發展戰略的需要。
公共文化服務體系建設是一項系統工程,涉及的機構、要素很多。
從服務主體看,主要指公益性文化機構,如圖書館、文化館、美術館、博物館、科技館、紀念館等。這些機構因任務、職能不同,擁有的基礎資源有所不同。例如,圖書館主要以圖書、期刊等紙質文獻與文獻數據為主,數據的呈現以文本為主,資源本身是靜態的,資源的更新是持續的,資源的使用具有很強的知識功能;文化館主要以非物質文化遺產為主,涉及傳統文化、曲藝雜技、禮儀民俗等,具有典型的人文特征與明顯的群體性;美術館主要以視覺藝術為中心,資源涉及繪畫、雕塑、攝影作品、插畫、裝置藝術以及工藝美術作品等,通過視覺去感知并欣賞資源是其典型特征,提高藝術修養與陶冶情操是其基本功能;博物館主要典藏人文自然遺產,其資源一般是實物,具有很強的收藏特征、價值一般很高。不同類型公共文化機構之間的資源規模、資源類型以及數字化程度差別很大,這些有著巨大差異的資源合集構成了公共文化大數據的主體。這一點與已實現大數據成功應用的領域(如電子商務、金融)有很大不同。以銀行大數據的應用為例,各個銀行從事的業務內容基本相同,工作流程大同小異,因此所產生的數據在性質上基本相同。不同類型銀行之間的數據屬于“同質異構”(即性質相同,結構不同),這類機構的大數據應用重在解決數據的“量”的問題。而在公共文化服務領域則不同,圖書館、文化館、美術館、博物館等公共文化服務機構提供的服務方式并不一樣,圖書館通過圖書文獻的閱讀來達到服務目的,文化館通過舉辦各類展覽、講座、培訓等開展服務,美術館通過展覽視覺藝術作品來提供服務,博物館通過陳列代表自然和人類文化遺產的實物來進行服務,等等。這些機構的業務系統在體系結構、數據性質、實現的功能等方面完全不同,所產生的數據不僅僅數量大,更為關鍵的是數據的“異質異構”(即性質不同,結構不同)。這種數據規模龐大、異質異構的特性正是大數據的基本特征,非常適合用大數據的理念和技術來進行處理。但是,如何將這些異質異構的數據融合匯聚到一起,實現一個共同的服務目標,以往重在解決“量”的問題的大數據理念和技術并沒有給出現成的解決方案,需要我們結合公共文化服務的實際進行探索。
從服務客體看,用戶在任何一種類型的公共文化服務機構中表現出來的需求都僅僅是其公共文化需求的一部分,而不是全部。正如“公共文化服務體系建設”中“體系”一詞所表明的那樣,只有將用戶對不同類型機構的服務需求集成地、體系化地揭示出來,才能真正理解用戶、理解社會對公共文化服務的需求,從而更好地為民眾服務。顯然,這是一項系統工程,也是“公共文化服務體系建設”的最終目標。公共文化服務用戶需求的這種特征決定了公共文化服務大數據不能簡單地套用大數據理念與技術。以用戶畫像為例,電子商務領域的用戶畫像是最成熟的大數據應用,電商系統與平臺利用用戶注冊信息等基本數據,結合用戶瀏覽、查詢與點擊等行為數據,以及用戶購買的商品、單價、網購量等商務數據,并輔以用戶所在城市、收貨地址等位置數據,對用戶的類型與特征進行全面刻畫,對用戶的需求進行分析挖掘,從而更好地進行推薦與精準營銷,這一系列工作靠電商自身的平臺就可以完成。而公共文化服務則不同,要滿足其用戶需求須分別通過閱讀、觀看、欣賞等感官動作來實現,而且這些感官動作及其施加的對象存在于不同類型的服務機構(圖書館、文化館、博物館等)中。這就需要我們在大數據的理念和方法基礎上,進一步研究不同類型公共文化機構中用戶數據的集成整合,以及對這些數據進行融合分析的方法。從這個意義上說,一般的或其他行業的大數據理論并不適用于公共文化服務領域,需要我們構建公共文化服務大數據研究體系,以指導并解決公共文化服務大數據應用中的具體問題。
在數據驅動的大數據時代,運用大數據推動經濟發展、完善社會治理、提升政府服務和監管能力是新的趨勢。大數據深刻影響著人們思維與決策的方式。“用數據引領創新,用數據驅動發展”是大數據時代的標志,成為推動社會發展創新與現代化治理體系構建的新模式與新要素。大數據在搜索引擎、商業及電子商務、金融保險、公共交通以及城市綜合治理等領域已經取得了成功應用。例如,在現代化商場中,提供WiFi服務已非常普遍,顧客進入商場后便習慣登錄上網,即使不登錄上網,手機WiFi也會處于開啟狀態;商場可以采集到所有上網和開啟WiFi手機的信息,分析商場顧客的人群特征,商場中具體某片區域人流量及聚集情況,顧客在某片區域的停留時間,顧客對某片區域重復訪問次數等。利用這些信息可以分析商場中店鋪的分布是否合理、哪些店鋪是熱點店鋪、顧客的特征、顧客的行走線路習慣等,輔助商場管理者更好地進行管理。公共文化服務機構完全可以借鑒這種大數據應用,提升對公共文化服務場館管理的科學性。
事實上,大數據應用并不簡單地限于上述例子中的統計分析。大數據智能分析方法在近年來也有突飛猛進的發展,不僅在棋類游戲、圖像識別、智能語音、機器翻譯等技術領域表現出強大的能力,在城市管理與社會服務方面也有不俗的表現。如浪潮集團于2017年9月啟動的“基于移動時空大數據深度學習的人群流量預測預警”項目基于TensorFlow框架和深度學習方法,在分析人群時間維度流動規律的基礎上,融合DPI數據、MRO數據、氣象、節假日等多源數據,預測未來一定時間段內人群流量變化,為城市規劃、智能交通以及城市安全決策提供科學依據。使用GIS工具將地圖柵格化,并將歷史DPI和MRO數據清洗轉換為表示人群流量的圖像。在空間維度上采用多層的卷積神經網絡挖掘人群流量的空間距離性和層次性,在時間維度上采用15分鐘粒度、天粒度和周粒度3個采樣周期對歷史人群流量圖抽樣,挖掘人群流量隨時間變化的平滑性、周期性和趨勢性。在此基礎上,實時動態監測區域人群流動變化,綜合考慮不同柵格互相之間的影響,精準分析和模擬每一柵格歷史的人群流入和流出變化,以及對未來一定時間段內的人群變化做出預測預警。基于移動時空大數據和深度學習的人群流量預測預警,能直接服務智慧城市建設,為其出謀劃策、保駕護航[6]。
大數據在這些領域的成功應用已形成較為豐富的理論方法與技術體系,積累了實踐應用的成果與經驗,為公共文化服務大數據研究體系構建提供了理論依據與參考。對具體的公共文化服務機構來說,其數據大致可以分成兩類:一類是業務系統中的數據,包括但不限于數字圖書館服務系統、博物館電子展覽系統、服務機構官方網站、用戶投票系統、參考咨詢服務系統、留言板、論壇等,這些數據記錄了用戶的行為、資源的利用情況等,非常有價值,目前比較關注這些數據的應用。另一類是時空數據,包括但不限于人流數據、閱覽室閱讀數據等,這些數據有重要的應用價值。例如,通過網絡定位技術可以分析人群在圖書館、博物館、文化場所的聚集情況,通過RFID可以收集讀者在閱覽室中閱讀的情況,通過二維碼可以分析用戶對展品的觀看情況,通過傳感器可以采集用戶在活動區域的停留時間。對這些數據的綜合分析,有助于公共文化服務機構進行資源規劃配置、場所有序疏導、服務項目設置、用戶興趣的發現等。由于這些數據并不來自于現有業務系統(即業務系統中并沒有這類數據),目前公共文化領域對其類型、范圍、采集手段以及應用方式認識得還不太清楚,需充分參考借鑒電子商務、城市計算等大數據領域的理念體系、理論方法、技術實踐、服務模式等現有成果與成功經驗,積極引進消化吸收。同時,還要分析公共文化服務領域的現狀與問題,結合公共文化服務領域的行業特點、發展階段與現實需求,形成具有領域特色的公共文化服務大數據研究體系,對公共文化服務大數據應用做前瞻性引導。
公共文化服務大數據是新生事物,其理論體系研究還處于初探階段。為了更好地促進公共文化服務的理論探索與實踐發展,需要深入研究。
在大數據理論體系構建過程中,不同學者由于學科領域與專業背景不同,對大數據研究體系的認識側重點會有所不同。一般來講,計算機信息科學等領域往往是突出技術的發展與應用,以技術為核心要素梳理與構建大數據的研究體系。比如,王元卓等從基礎理論與關鍵技術兩個層面展開具體研究,認為在基礎理論層面,需要對大數據的復雜性進行研究,并提出適合于大數據的新型計算模型;在關鍵技術層面,則需要研究多源異構大數據感知、融合與表示,大數據內容建模與語義理解,以及感知、存儲與計算融合的大數據計算系統架構體系[7]。經濟管理、交通、醫療、智慧城市等領域往往會結合領域特征,以行業應用為核心構建大數據研究體系。所以,采取何種研究體系,是由業務所決定的。在公共文化服務領域,服務是核心。因此,應該以大眾化服務為基點進行理論構建,公共文化服務大數據研究體系需要以用戶為核心要素展開。
傳統的學科體系架構一般有“理論-應用”二維框架、“理論-方法技術-應用”三維框架、“理論-方法-技術-應用”四維框架和“理論-應用-方法技術-管理”四維框架。隨著數據資源的積累以及服務方式的轉變,一些學科或行業的發展由資源為中心轉向以用戶為中心。用戶畫像、個性化定制、精準推薦等以用戶為中心的理念與服務在大數據營銷、用戶行為分析等領域都得到充分的重視并取得了成功。因此,大數據環境下用戶經常作為一個維度出現在體系結構中,這樣就形成了“理論-方法-技術-用戶-應用”的五維框架。公共文化服務作為一種典型的服務領域,有著非常突出的用戶屬性,公共文化服務大數據的研究體系也比較適宜采取以用戶為中心的五維框架來表示,見圖1。

圖1 公共文化服務大數據研究體系架構
這個框架除具備一定的層次性之外,還根據公共文化服務的自身特點,呈現出明顯的網狀結構。其中,理論、方法、技術、應用不再是單純的線性指導或層次性遞進關系,而是以用戶為中心,通過用戶這個紐帶連接起來。這種以用戶為中心的“網狀+層次”體系結構可以有效解決傳統上理論與實踐脫節、需求與服務不對接等問題。
公共文化服務大數據研究作為一個體系,既呈現出以用戶為中心的網狀特征,又保留著一定的層次結構。體系的頂層由公共文化服務大數據理論研究組成,中間層由公共文化服務大數據方法研究、公共文化服務大數據技術研究、公共文化服務大數據用戶研究組成,頂層的理論對中間層的方法、技術、用戶研究起指導作用,后者的研究成果則會進一步豐富理論研究的內容,對理論進行完善。最后一層是應用研究,是根據用戶的需求,在理論指導下,以方法和技術手段解決公共文化服務中的現實問題,同時應用研究可以檢驗理論、方法、技術研究的內容。
如圖1所示,在公共文化服務大數據研究體系中,用戶研究起到核心作用。一方面,以用戶為中心的理念貫穿于公共文化服務大數據研究的每一個組成部分。理論研究要緊扣用戶各需求開展,形成以用戶為中心的公共文化服務大數據理論體系。方法、技術與應用研究也要緊密圍繞用戶研究來展開,在研究過程中始終要考慮用戶的因素,換句話說,用戶研究的需求決定著方法、技術與應用研究的內容。另一方面,用戶研究處于整個體系的中心,公共文化服務大數據研究體系其他4個組成部分又對用戶研究起到支撐作用,理論、方法、技術與應用研究的成果為用戶研究提供理論解釋及研究工具,幫助用戶研究不斷豐富內容,發現新的需求。

圖2 公共文化服務大數據研究體系的內容
圖1所示的公共文化服務大數據研究體系由公共文化服務大數據理論研究等5個部分組成。其中,每一部分又由若干個子領域構成,每個子領域還可以劃分成若干個具體的問題,從而形成一個可擴展的研究體系。在這樣一個體系下,各個板塊分工明確,各負其責,其內容如圖2所示。
(1)公共文化服務大數據理論研究。主要研究公共文化服務大數據的一般原理、一般規律和一般方法,從總體上描述整個公共文化事業發展的概貌和基本脈絡,為公共文化服務大數據提供基本理論和研究方法,對公共文化應用和公共文化服務實踐起著重要的指導作用。作為一個具有自然科學與人文社會科學雙重屬性的研究領域,公共文化服務大數據理論需要研究公共文化服務大數據的概念范疇、特征規律等基本問題,形成公共文化服務大數據的理論框架,研究公共文化服務大數據標準的制定原則與流程,研究公共文化服務大數據教育、人才培養等學科理論。
(2)公共文化服務大數據方法研究。可以從多個維度來研究公共文化服務大數據方法,最為常見的就是公共文化服務大數據方法論研究,其目的是給出應用各種公共文化服務大數據方法的一般性的原則。也可以按照數據處理流程中涉及到的各個方法,如采集方法、清洗方法、分析挖掘方法進行研究,研究各種方法對公共文化服務大數據處理的應用規律。公共文化服務的機構多,涉及到的數據類型復雜,一方面,需要研究公共文化服務大數據處理的共性方法(即適用于圖書館、文化館、博物館、科技館、展覽館的共性方法),另一方面,要針對圖書館、文化館、博物館、科技館、展覽館各自的業務特點與數據特征,按行業開展各自的大數據方法研究。前者構成了公共文化服務大數據一般方法研究,后者構成了公共文化服務大數據行業方法研究。
(3)公共文化服務大數據技術研究。在公共文化服務大數據技術方面,除了要研究分布式存儲、并行計算、高維可視化等大數據共性技術,還要研究對公共文化服務領域有更強適應性以及更有效的領域細分技術,探索公共文化服務領域關鍵技術,形成公共文化服務大數據的資源整合與分析技術體系,研究公共文化服務系統集成,構建公共文化服務共享平臺以及開發行業專用的軟件工具等。
(4)公共文化服務大數據用戶研究。只有理解用戶到底需要什么,才能知道如何更好地為不同類型用戶服務,才能將公共文化資源有效地投放或推送給用戶。對用戶的深入了解是公共文化服務滿足用戶需求的前提,也是落實以用戶為中心的必經之路。公共文化服務大數據用戶研究主要包括用戶建模(根據用戶特征及服務使用習慣建立用戶信息需求模型的理論與方法)、用戶行為分析(采集用戶行為數據并對其統計分析,從而發現用戶使用公共文化服務規律的理論與方法)、用戶畫像(根據用戶行為信息抽象出標簽化用戶模型的理論與方法)、模型重用(保證不同類型公共文化服務機構的模型可以復用,以便提高建模效率的理論與方法)以及公共文化資源的精準推薦(根據用戶模型或畫像,對資源進行分析,將符合用戶需求的資源推送給用戶的理論與方法)。
(5)公共文化服務大數據應用研究。理解了用戶的需求,就可以更好地推進應用。通過公共文化服務大數據的分析與挖掘,全面揭示公共文化服務行業發展態勢,研究公共文化服務的發展戰略,探索公共文化服務新產品與新模式,并對公共文化服務的效果進行客觀評價。
公共文化服務大數據研究內容很多,有些是大數據領域的共性問題,有些是公共文化服務領域的特性問題,有些是大數據理念和方法在公共文化服務領域的應用問題,有些是需要根據公共文化服務的特點所做的“發明創造”。限于篇幅,下文結合我國公共文化服務體系建設的要求及國家政策與行業實踐情況,探討近期我國公共文化服務大數據研究應該重點關注的課題。
公共文化服務大數據的概念與內涵是什么?研究范疇與邊界是什么?可以劃分為哪些類型?功能與作用如何?這些問題是研究公共文化服務大數據的基礎,也是理論研究首先要解決的問題。
大數據的特征包括數據量大、數據類型多樣、處理速度快、價值密度低。公共文化服務大數據既有一般大數據所擁有的共性特點,同時也具有本領域特色,如數據分布不均衡、數據應用效果測評難等(不像電子商務等領域可以直接用點擊率和轉化率等指標進行測評)。因此,從某種意義上說,與公共文化服務相關的各類數據資源都是公共文化服務大數據。但是,也需要指出,當前對大數據概念的使用有一些泛化,針對某一類數據做一些常規統計與對比也稱為大數據,是不夠嚴謹的,如針對幾千人活動的簡單統計顯然不是大數據。另外,如果只是單一類型服務機構的數據甚至某一個具體服務機構的數據,由于數據類型分布與數據累積規模都較為有限,也難以稱得上大數據。值得注意的是,大數據不僅僅指數據量上的大,還體現在新的分析理念與分析方法上,如傾向于全體數據而不是樣本數據,重視相關分析而不是因果分析,追求效率而不是絕對精確。
為避免概念混淆,需厘清公共文化服務大數據的內涵與邊界。公共文化服務大數據是公共文化服務體系中各種活動產生的、體現公共文化要素以及要素與要素之間關系的多源異構大規模數據。公共文化要素包括主體、客體、建筑設備、服務過程、館藏資源等。這些要素在公共文化服務中的地位是不一樣的,因而公共文化服務大數據是有層次的,主要包括四個層次:(1)圖書館、博物館、文化館、科技館等各類公共文化服務機構擁有的資源數據、用戶人口統計學數據以及用戶對各類公共文化機構資源與服務的使用數據,這些數據直接體現了公共文化服務機構的服務能力,是公共文化服務大數據的核心資源,是公共文化服務的核心大數據;(2)業務輔助數據,是指為完成公共文化服務業務工作所需要的數據,包括規范檔、分類表、主題表、解說詞、活動腳本等;(3)管理數據,包括工作人員數據、建筑設備數據、財務數據等;(4)支撐數據,主要包括政策法規、國家或地方的公共文化服務規劃、與公共文化服務相關的互聯網數據等。在上述四個層次數據中,當前的研究重點任務是完善核心數據的采集、處理及應用機制,具體包括各類館藏資源、用戶數據、業務管理數據以及相關支撐數據的采集入庫、規范標引,形成能夠統一揭示、相互關聯與映射的多源異構數據集。在此基礎上,圍繞用戶需求與應用場景,利用聚類分析、關聯分析、可視化分析、信息抽取等數據分析方法與技術對數據進行多維分析與深度挖掘,使之更好地滿足用戶需求,提高資源利用率與數據價值。
大數據方法帶來的新理念包括多源多維數據的融合,強調相關性、效率、全體數據、實時分析以及挖掘新模式,公共文化服務領域需要充分借鑒大數據方法。但公共文化服務也有自身的特點,通常目標任務明確、注重關鍵數據或主導數據。因此,大數據方法的范式不能簡單套用到公共文化服務研究上,而應該結合行業特點,構建具有行業特色的新模式。在方法的研究方面,不能“只移植,不創造”,公共文化服務應該構建適應行業應用的方法體系。對公共文化服務大數據方法的研究,可從多個維度展開:可以按方法層次展開,也可以按處理流程展開。
按方法層次,可以將公共文化服務大數據方法的研究分為方法論研究、一般方法研究以及行業方法研究。方法論是一種以解決公共文化服務領域問題為目標,對一系列具體的問題、任務進行分析研究、系統總結,并最終提出較為一般性的具有指導意義的處理過程與方法。在一般方法研究方面,重點研究各種大數據方法與公共文化服務相互作用機理,探討各種大數據方法在公共文化服務中的適應性,探討如何利用大數據方法推動公共文化服務的改進和創新,總結各種大數據方法在公共文化服務中的應用規律等。如前所述,公共文化服務包括圖書館、文化館、美術館、科技館等多個行業,每個行業有著自身的特點、業務模式、服務對象等等,因此需要針對這些行業的特點,開展各行業的大數據方法研究。
按照處理流程,可以將公共文化服務大數據方法研究分為公共文化服務需求計算,公共文化服務大數據采集方法、清洗方法,圖書文獻、藝術作品、文物展覽等多源異構數據的組織揭示與融合匯聚方法,館藏資源、用戶數據與過程數據的多維關聯分析與深度挖掘,資源、用戶、場景的可視化展示,分析結果的解讀應用與分析評價等。公共文化服務大數據的采集、標引、解析、關聯、映射、分析、挖掘、展現應用的理論方法也是重要的研究內容。雖然大數據的處理已經具有較為成熟的流程與一系列分析挖掘方法,但主要應用在商業領域,而公共文化領域的大數據與商業領域的大數據在某些方面還是有著明顯的不同,因此其處理流程與方法也會略有不同,或者說整體上是相似的,但在某些細節處理或關鍵問題上還需要進行改進。比如,為了更好地提供服務與推送,就需要對公共文化資源進行組織與標引、揭示與解析。這些問題在零售、金融、交通等大數據領域就相對簡單一些,但在公共文化服務領域中就要復雜得多,這就需要探索更加適應公共文化服務的大數據流程與方法。
各級公共文化機構都不可能囊括一個領域所有的數據,更何況公共文化機構涉及到圖書館、博物館、文化館、美術館等多種類型。這些機構所擁有的數據都具有公共文化的特色,體現了公共文化的不同側面。每個機構都有自己的業務系統,每個機構的系統實際上是一個數據孤島。這些系統的數據固然有價值,但由于其存在形式分散而不能得到很好的利用。
大數據時代的數據融合為公共文化數據的利用帶來了新機遇。如果能夠將散落在不同公共文化機構中的數據,基于其特殊的公共文化背景進行集成和融合,就可以對這些數據進行充分的挖掘和利用。在數字館藏資源數據方面,不同文化機構之間的數據資源有重疊的部分,也有自己的特色部分,將這些數字資源數據集成起來,可以彌補各機構數字館藏資源方面的不足。從非館藏資源數據方面來看,不同類型的文化機構屬于不同的領域,位于不同的區域,擁有不同的用戶。它們擁有獨特的服務數據(講座、展覽、活動)、用戶數據(參展、借閱、評論、投票),這些數據的重疊性相對較低。對這些數據的集成是對領域、區域和用戶做全方位洞察的基礎,這是任何單一機構僅通過自身有限的數據很難實現的。通過集成和融合,將這些數據驅動的洞察反饋給數據的源頭,即各級公共文化機構,可以為它們提供更精準、更專業、更客觀的決策支持。公共文化服務大數據集成整合研究近期應主要包括以下內容:梳理公共文化服務機構的系統和數據情況;設計公共文化服務大數據系統的體系架構;探索公共文化大服務系統及其大數據集成的方法與技術;總結公共文化服務大數據系統集成的實現模式,并通過這些研究來改善和提高公共文化服務大數據的應用效果。
用戶是公共文化服務大數據研究的核心要素,如何應用大數據理念、方法與技術提高用戶體驗,滿足用戶不斷增長且變化的服務需求,提供更智慧的公共文化服務,是公共文化服務大數據研究亟待解決的現實問題。通過梳理公共文化服務機構的用戶信息行為數據,抽取公共文化服務網絡用戶人群的行為特征,分析公共文化活動及其用戶行為偏好與群體特征,刻畫用戶畫像,構建公共文化服務用戶行為模型,并在此基礎上構建基于用戶情景的公共文化精準服務推薦系統,為公共文化服務的需求開發、宣傳推廣、內容推薦、產品設計、營銷策劃等環節提供決策支持。針對大數據場景下公共文化用戶精準服務推薦系統構建面臨數據源復雜、數據標準缺失、模型適用性未知等一系列挑戰,探索公共文化服務用戶建模方法,研究用戶模型可重用技術,對推薦系統建設的重要性及可行性進行分析,為公共文化服務機構提升用戶體驗建立理論與方法基礎,都是當前值得關注的問題。具體來說,在公共文化服務用戶畫像建模及精準服務方面,需要研究各類型公共文化服務機構中各類用戶數據的特點及其對用戶建模及用戶精準服務的適用性及可用性,提出公共文化服務用戶建模及精準服務的數據支撐規范;研究公共文化服務用戶特征抽取的準則、方法與技術,公共文化服務用戶畫像模型的構建方法與技術;在識別用戶興趣的基礎上,探索符合公共文化服務特點的推薦及精準服務的模型、技術體系及實現方法;研究不同類型公共文化服務機構之間用戶模型的共享、重用以及互嵌的規律與方法。
在大數據環境下,公共文化服務迎來了新的發展機遇,同時受到外界強有力的挑戰。一方面,國家對構建現代公共文化服務體系高度重視,良好的政策環境為公共文化服務注入了新的推動力;而大數據技術方法在電商、智能交通等領域的成功應用也提供了技術與方法上的新的驅動力。另一方面,一些新興的以內容服務或場景服務為主的網絡平臺或自媒體(如“羅輯思維”“喜瑪拉雅”“得到”)得到了很好的發展,具有很強的知識性與傳播效率,吸引了大量的知識與文化領域的用戶,它們提供的服務內容與傳統公共文化服務機構具有很強的相似性與競爭性。公共文化服務領域如果不重視網絡平臺與大數據的應用,其未來的發展必將會受到很大的挑戰。互聯網與大數據的思維正不斷地滲透到經濟社會發展的各個領域。例如,高德地圖根據用戶使用導航所反映的路況比通過監控器所反映出的路況要準確與實時得多,滴滴出行等平臺迅速改變了原有的電話叫車與路邊招車的出租模式與效率,共享單車的爆發式發展一夜之間擠掉了原有的城市公共租用自行車。互聯網與大數據對產業發展與服務模式的變革能力與顛覆能力必須引起高度重視。雖然公共文化服務領域具有很強的公眾性與公益性,但這種公眾性與公益性也恰恰可能是大數據突破的切入口。大數據在公共交通領域的應用與影響值得公共文化服務領域深入思考與借鑒。
公共文化服務大數據的發展需要從公共文化服務方式轉變、公共文化服務大數據應用場景與價值方面進行探討。公共文化服務在理念思維方面,由資源為中心轉變為以用戶為中心;在服務模式方面,由生產者主導變為消費者主導;在工作模式方面,在業務管理的基礎上越來越重視數據、技術與平臺的融合與運用。公共文化服務體系建設不僅需要有固定設施體系、流動服務體系,還需要有大數據思維。公共文化機構不僅需要有傳統服務方式和手段,更需要有面向個體的個性化服務能力。數字圖書館、數字博物館、數字文化館、移動閱讀和掌上服務等改變的不僅僅是文化的載體形式,更改變著人們利用公共文化服務設施、享受公共文化服務的方式。在公共文化服務體系建設中實現文化和科技的融合,打造數據驅動的新型公共文化服務鏈,是公共文化服務體系建設面臨的時代任務與前景。通過公共文化服務大數據的分析與挖掘,可全面揭示公共文化服務行業發展態勢,探索公共文化服務新產品與新模式,對公共文化服務效果進行客觀評價。
通過對公共文化服務大數據的分析與挖掘,可以為政府或文化事業單位科學決策提供支持或參考研究,主要包括3個方面:一是為地方公共文化建設提供支持與幫助,為地方構建國家公共文化服務體系提供頂層設計、決策參考、指導實踐、總結提升等服務;二是為公共文化服務機構提供應用解決方案,通過大數據分析,實時捕獲公眾文化需求變化、及時開發設計新服務形式新產品、定向進行宣傳推廣、精準測評活動效果等,通過這些舉措能更好地服務公眾,與社會協調發展;三是為公共文化服務宏觀政策制定提供決策支持,通過大數據對我國公共文化服務的新特點、新形勢進行分析研判,為公共文化相關政策的規劃與制定提供數據支撐與決策參考。公共文化服務大數據必將應用到公共文化服務領域的各個方面,提供高效的管理與全面的支撐。這是公共文化服務大數據發展的必然趨勢,也是值得我們深入研究的問題。
公共文化服務大數據具有很強的應用需求與時代特點,公共文化服務大數據的研究也具有很強的理論價值與實踐意義。深入研究公共文化服務大數據既呈現出很強的必要性,又具備了可行性。作為一個典型的交叉領域,公共文化服務大數據的研究才剛剛起步,有很多問題需要逐步細化探討。我們要緊跟社會需求與行業發展,在理論方法、技術平臺以及實踐應用方面進行不斷探索、集成創新,把科技與文化深度融合這篇大文章做好。