基于數字人文視角,通過分析在線社區用戶評論,挖掘非遺用戶的行為特征與需求偏好,旨在為文化遺產的數字化保護與傳承提供理論支撐和實踐指南,推動其在數字社會的高質量發展。以非遺用戶為研究對象,爬取在線社區評論數據,運用TF-IDF詞頻分析、LDA主題模型、共現語義網絡分析等技術,識別用戶關注焦點并構建用戶畫像。通過高頻詞提取、主題聚類和網絡分析,將非遺用戶劃分為三類,解析其核心需求與行為邏輯。結果發現,非遺用戶主要分為民族文化審美型、具身體驗驅動型和知識認知學習型三類,分別側重歷史藝術價值、感官沉浸體驗和系統化知識獲取。據此,分別從國家、企業、社會三方面提出傳承策略。
黨的二十屆三中全會提出建立文化遺產保護傳承工作協調機構和督察制度,強調科技賦能是實現文化遺產現代化發展的關鍵路徑。在線社區作為數字化時代的產物,記錄了用戶對文化遺產的客觀體驗與主觀情感,為研究非遺用戶行為特征提供了重要數據資源。基于數字人文視角,通過高頻詞提取、主題聚類、網絡分析等技術手段解析在線社區中的用戶評論,可深度揭示非遺用戶的體驗偏好與行為模式,進而為文化遺產項目的發展方向與運行效果評估提供決策依據。研究通過構建用戶情感畫像,分類解析用戶對非遺的關注焦點,旨在為文化遺產數字化發展提供理論支撐,推動文化遺產在數字社會實現高質量、可持續傳承。這一研究路徑既響應了國家政策對科技賦能文化遺產保護的要求,也為非遺保護從傳統模式向數據驅動的現代化轉型提供了實踐框架,有助于精準把握公眾需求,促進文化遺產保護與時代發展的深度融合。
研究設計
研究思路
本研究基于數字人文視角,結合數據挖掘理論和用戶畫像理論,構建“數據驅動一理論建構一應用轉化”的研究路徑,旨在通過多維度視角揭示非遺用戶的行為邏輯與需求特征。通過網絡爬蟲工具采集在線社區評論文本,并通過數據清洗形成非遺用戶語料集。基于數據挖掘理論和用戶畫像理論,構建LDA主題模型,實現非遺用戶的主題發現,通過詞云圖與共現語義網絡捕捉用戶特征與關鍵需求并構建用戶情感畫像。基于各類用戶情感需求和行為特征,分別從國家層面、企業層面和社會層面提出非遺傳承策略。具體研究思路如圖1所示。
圖1研究技術路線圖 (作者自制)

數據采集
本文以國家級非物質文化遺產景區的在線社區為研究對象,依托攜程旅行平臺構建實證分析數據庫。該平臺是中國月活躍用戶較多的旅游信息分享平臺之一,其社區具有用戶基數大、用戶生成內容(UGC)活躍度高,以及評論內容結構化程度強等特點,是研究在線社區的優質對象。在樣本選擇方面,遵循《國家級非物質文化遺產代表性項目名錄》與《旅游景區質量等級評定管理辦法》雙重標準,從全國318家5A級景區中通過分層隨機抽樣篩選出20個景區作為研究樣本。使用網絡爬蟲工具獲取攜程旅行平臺上景區的評論數據,包括用戶評分、評論文本、用戶昵稱等,原始數據集共包含37843條評論。鑒于字數少的碎片化評論分析誤差較大,故篩選字數在100字以上的評論,再剔除與文化遺產無關的評論,并通過文本清洗與去噪等數據處理,最終獲得519條用戶評論數據。
研究過程
基于非遺景區的非遺用戶情感畫像
1.主題發現
為更好地理解文本語義,將連續的評論文本拆分為有研究價值的分詞單元,組成非遺用戶評論語料集,并構建LDA模型實現主題挖掘。為確定主題數量,計算不同主題數下的困惑度數值協助決策,如圖2所示。困惑度是指在通過模型對文檔進行主題識別的過程中,模型對特定主題所持有的不確定性程度。從圖2可以得出,隨著主題數逐漸增加,困惑度逐漸降低,表明LDA模型的學習效果較好。但為了避免LDA模型出現過度擬合的現象,降低主題的可解釋性,結合主題聚類結果,選定“主題數 :=3 ”的“肘點”作為最終的主題數量。
圖2主題一困惑度變化情況 (作者自制)

2.用戶情感畫像分析
基于3類主題高頻詞,對各類主題所代表的用戶進行情感畫像,并分別命名為民族文化審美型用戶、具身體驗驅動型用戶和知識認知學習型用戶,用戶情感畫像特征如表1所示。其中,詞云圖由各類用戶的前30個高頻詞組成,高頻詞按照詞頻進行排序。核心路徑與核心節點由高頻詞共現語義網絡的路徑權重和節點度中心性所決定。
表1用戶類型情感畫像描述

結合共現語義網絡與高頻詞聚類結果,對各用戶情感畫像進一步分析。
(1)民族文化審美型用戶
基于文本聚類結果,結合表1和圖3所示,民族文化審美型用戶的節點被劃分為文化認同和審美體驗兩類。“文化”“國家”等作為核心節點,表明該類用戶的關注點高度聚焦民族文化的象征性、藝術價值及獨特性。“藝術一國家一遺產”作為核心路徑,以“藝術”為起點,指向“國家”與“遺產”,反映出用戶將藝術表達視作民族文化傳承表現的核心媒介,同時國家層面對文化遺產的重視態度更能使該類用戶產生文化歸屬感。“魅力一豐富一獨特一文化”作為另一核心路徑,隨著“魅力”“豐富”“獨特”等節點延伸,表明用戶在文化遺產項目的體驗中,通常從項目的文化多元性和特色創新性感知該項目的吸引力,并最終回歸至民族文化的價值認同上。
圖3民族文化審美型用戶語義網絡圖 (作者自制)

(2)具身體驗驅動型用戶
基于文本聚類結果,結合表1和圖4所示,具身體驗驅動型用戶的節點被劃分為場景感知、情感共鳴和互動實踐三類。“感受”“自然”“幽雅”“豐富”“佛像”作為核心節點,表明該類用戶的關注點圍繞環境感知、情感升華與實踐參與三個維度展開。“自然一風景一幽雅一美麗”作為核心路徑,以自然環境為核心起點,通過場景的視覺美感和空間氛圍強化用戶的沉浸式體驗。“感受一震撼一佛像一最大”路徑以用戶的情感共鳴為紐帶,從文化遺產的宏偉性、文化背景的歷史厚重感以及深刻的精神思想內涵激發用戶對文化瑰寶的價值認同,并產生強烈的情感沖擊。
圖4具身體驗驅動型用戶語義網絡圖 (作者自制)

(3)知識認知學習型用戶
基于文本聚類結果,結合表1和圖5所示,知識認知學習型用戶的節點被劃分為歷史背景、知識傳遞、文化保護和工藝感知四類。“歷史一導游一講解一知識”作為核心路徑,表明用戶以“歷史”為起點了解文化遺產的起源和發展,并依賴“導游”接收結構化非遺知識,最終通過“講解”等手段對知識進行系統化學習和內化。“始建一歷史一古城一保存”從文化遺產的起源切入,通過探究“始建”年代背景,理解分析“古城”的歷史意義和文化價值,進而關注物質文化遺產的“保存”狀態和現有的維護措施。
圖5知識認知學習型用戶語義網絡圖(作者自制)傳承策略

基于非遺用戶的行為特征和偏好表現結果,凝練當前非遺保護與傳承工作的提升策略。
首先,構建數字化治理體系與跨文化傳播矩陣。國家層面,政府可建立國家級非遺智慧治理平臺,整合多部門數據資源,運用新興數字技術,從以下三方面構建“用戶需求一政策響應”動態評估機制。一是制定非遺數字化技術標準體系,推動虛擬現實、數字李生等技術在文化遺產活化中的標準化應用;二是建立分層分類保護名錄,將用戶情感畫像中的高頻關注要素納入評估指標,實施差異化保護策略;三是搭建跨文化傳播共情實驗室,通過情感計算技術解析國際受眾的文化共鳴點,開發數字孿生傳播產品。
其次,構建體驗導向的價值轉化生態。企業層面,非遺相關企業可建立“感知一認知一傳播”三位一體的非遺產品開發體系,重點推進三大創新。一是開發沉浸式體驗產品體系,運用眼動追蹤、生理信號采集等技術構建體驗評估模型;二是建立動態需求響應系統,基于用戶情感畫像的高頻特征開發模塊化文創產品組合;三是構建知識傳播賦能平臺,通過主題提取技術獲取高頻知識點并轉化為AR講解系統,形成“歷史脈絡一技藝解析一保護現狀”的三維知識圖譜,努力實現用戶需求與產品創新的精準對接,提升非遺項目的市場轉化效率。
最后,構建參與式傳承賦能體系。社會層面,非遺相關社會組織可構建“貢獻值量化一能力分層一精準匹配”的參與式傳承機制,并重點實施三大計劃。一是開發非遺體驗區塊鏈平臺,運用數字水印技術實現UGC內容的文化貢獻值量化,形成非遺用戶“體驗一創作一傳播”的價值循環;二是針對Z世代文化傳承實施潮流賦能計劃,緊跟時代潮流,依照不同用戶類型設計分層服務方案;三是建立基于用戶情感畫像分析的用戶匹配系統,將用戶情感畫像中的核心特征作為匹配維度,為各組織中的非遺用戶提供適配的項目。
本研究基于數字人文視角,通過高頻詞提取、主題聚類和網絡分析,構建了非遺用戶的三類情感畫像,民族文化審美型用戶側重歷史深度與藝術價值,具身體驗驅動型用戶關注感官沉浸與場景互動,知識認知學習型用戶偏好系統化知識獲取。本研究得出如下結論,一是政府構建“用戶需求一政策響應”動態評估機制,通過智慧治理平臺整合數據,制定數字化標準、分層保護名錄及建立跨文化傳播共情實驗室,推動虛擬現實等技術應用,實現政策與需求雙向互動;二是企業建立“感知一認知一傳播”產品開發體系,開發沉浸式體驗產品、模塊化文創組合及AR知識圖譜,運用眼動追蹤等技術精準對接用戶需求,提升市場轉化效率;三是社會組織搭建區塊鏈賦能的參與式傳承平臺,量化UGC貢獻值,實施Z世代潮流賦能計劃,建立用戶情感畫像匹配系統,激活公眾文化自覺與可持續傳承生態。
(作者單位:湘潭大學公共管理學院)