楊蘇齊 羅建橋 宋瑞雪



摘要:該研究旨在設計和實現一個基于人工智能的中華優秀傳統文化外宣平臺,以“中國書法”為核心示例。該平臺集成了智能解析與分類、個性化內容推薦和交互式智能助手等功能,旨在提供豐富且個性化的文化學習體驗。系統測試結果顯示,各功能模塊在精準率、召回率和準確率方面均表現出色,驗證了平臺在有效傳播和教育中華傳統文化方面的潛力。
關鍵詞:人工智能;傳統文化;外宣平臺設計
中圖分類號:TP311? ? ? ?文獻標識碼:A
文章編號:1009-3044(2024)09-0050-03
開放科學(資源服務)標識碼(OSID)
0 引言
在全球化背景下,傳統文化外宣對于民族文化傳承和國際形象塑造至關重要,促進文化遺產傳播和跨文化理解。而人工智能通過數據分析和模式識別等技術,拓寬了傳統文化傳播的渠道,提供個性化和沉浸式體驗,增強文化的全球吸引力。隨著AI的發展,其在文化保護、傳播和創新中的作用日益顯著。
1 關鍵技術
1.1 機器學習技術
機器學習技術,作為人工智能的重要分支,能夠成為傳統文化外宣的核心動力。在機器學習領域,通過特定的算法和模型,如卷積神經網絡(CNN) 和循環神經網絡(RNN) ,被廣泛應用于圖像識別和自然語言處理,這對于理解和傳播文化內容至關重要[1]。其中CNN可用于識別和分類傳統藝術作品的圖像,通過多個卷積層和池化層提取圖像特征,公式表示為:
[f(x)=max(0,x?w+b)]? ? ? (1)
其中,[x]是輸入圖像的特征,[w]是權重,[b]是偏置項,[f(x)]是激活函數。
另外,RNN特別適用于處理序列數據,如文本或語音,對于分析和生成具有文化意義的文本尤為有效。RNN通過引入時間維度,能夠存儲前一狀態的信息,其公式表示為:
[ht=σWhhht-1+Wxhxt+bh]? ? ?(2)
在這里,[ht]是時間步[t]的隱藏狀態,[xt]是時間步[t]的輸入,[W]和[b]分別是權重矩陣和偏置項,而[σ]是激活函數。
1.2 個性化內容推薦算法
個性化內容推薦算法在傳統文化外宣平臺中能夠根據用戶的興趣和歷史行為定制推薦內容。其中,協同過濾(Collaborative Filtering) 算法應用廣泛。該算法分為用戶基協同過濾(User-based Collaborative Filtering) 和物品基協同過濾(Item-based Collaborative Filtering) 兩種類型。用戶基協同過濾系統會尋找與目標用戶興趣相似的其他用戶,然后推薦用戶偏好內容。其核心算法通過余弦相似度來計算用戶間的相似性,公式如下:
[similarity(u,v)=i∈Irui?rvii∈Irui2?i∈Irvi2]? ? (3)
其中,[u]和[v]代表不同的用戶,[I]是用戶評分的交集,[rui]和[rvi]分別是用戶[u]和[v]對物品[i]的評分。
1.3 自然語言理解技術
自然語言理解(Natural Language Understanding, NLU) 是智能助手技術的實現關鍵,它使助手能夠準確解析用戶的語言輸入。NLU的關鍵在于意圖識別(Intent Recognition) 和實體提取(Entity Extraction) 。這通常通過機器學習模型實現,使用邏輯回歸,公式簡化如下:
[py|x=11+e-(w?x+b)]? ? ? ? ?(4)
在這里,[x]代表輸入特征(如用戶的查詢詞匯),[y]是目標變量(即用戶意圖的分類),[w]代表特征權重,[b]是偏置項,而[py|x]是給定輸入[x]時意圖[y]的概率。智能助手通過理解用戶查詢的具體意圖,并據此提供相應的信息和服務,在傳統文化的傳播中尤為重要,便于提供更加個性化和精準的用戶體驗[2]。
2 系統架構設計
2.1 分層架構設計原則
在基于人工智能的傳統文化外宣平臺的系統架構設計中,遵循一系列精心構思的設計原則是至關重要的,以確保系統的整體效能和未來的可擴展性。這些設計原則包括:
1) 模塊化原則:系統應被劃分為獨立的模塊,每個模塊具有明確的功能和責任邊界。這種模塊化促進了代碼的重用,簡化了維護過程,并允許單獨更新或改進系統的各個部分。
2) 低耦合高內聚:各個模塊之間應保持低耦合,即模塊間的依賴關系最小化,而模塊內部應實現高內聚,即相關的功能和責任應盡可能集中在一個模塊中。這樣的設計有助于提高系統的穩定性和可維護性。
3) 可擴展性和靈活性原則:考慮到技術和業務需求的快速變化,系統架構應設計為易于擴展和適應新的需求[3]。
2.2 數據處理與管理模塊
1) 數據采集與集成。采用高效數據爬蟲技術,基于Python的Scrapy框架,自動化地從多元化數據源采集中華傳統文化相關的數據。涵蓋從歷史文獻、藝術作品到現代文化解讀等多方面內容。同時,運用ETL(Extract, Transform, Load) 工具,確保數據從提取到轉換再到加載的過程的高效和準確,適應中華傳統文化數據的多樣性和復雜性。
2) 數據存儲解決方案。為處理大量中華傳統文化數據,部署分布式數據庫系統,包括Apache Cassandra和MongoDB,以滿足高并發和大規模數據存儲的需求。同時,引入云存儲服務,提供靈活且可擴展的存儲方案,確保數據安全和高效管理。
3) 數據預處理和清洗。利用Pandas庫等數據清洗工具對收集的文化數據進行預處理,包括去除重復值、填補缺失值和糾正錯誤。此外,采用MinMaxScaler統計分析和數據變換技術,保證數據一致性和標準化,為后續的分析和應用提供可靠基礎。
4) 數據分析與處理。結合機器學習算法,如支持向量機(SVM) 和隨機森林,對復雜文化數據進行分類和預測分析。使用自然語言處理(NLP) 工具,對文本數據進行深入的語言分析,以更好地理解和推廣中華傳統文化的獨特價值和內涵。
2.3 核心架構設計
核心架構設計如圖1所示。
3 平臺重點功能
3.1 智能解析與分類功能
智能解析與分類功能是專門針對中國傳統文化的關鍵特性和獨特性量身打造的。該功能集成機器學習技術,旨在對傳統文化的各種作品進行深度識別和細致分類,從而準確展現傳統文化的豐富多樣性和深厚文化內涵。為實現該目標,需要采用卷積神經網絡(CNN) 來處理各類數據。以書法為例,CNN在識別書法中的細微筆觸和風格特征方面表現卓越,能夠區分不同書法家的作品及其所屬的書法流派。這種自動識別和分類功能特別適用于廣泛的中國書法樣本,從古代經典到現代作品,確保每件作品都得到正確歸類和解讀[4]。此外,平臺整合自然語言處理(NLP) 技術,特別是長短期記憶網絡(LSTM) ,用于分析書法作品中的文本元素,如詩詞、題簽等。
3.2 個性化推薦功能
個性化推薦功能是基于人工智能技術設計,提供與用戶興趣和偏好高度相關的中華傳統文化內容。這一功能的核心在于運用推薦算法,使用協同過濾(Collaborative Filtering) 和基于內容的過濾(Content-Based Filtering) ,以定制化方式推薦文化內容,增強用戶體驗。協同過濾算法通過分析用戶歷史行為(瀏覽、喜歡、評論等)和其他用戶的相似性,精準預測用戶可能感興趣的新內容。例如,對于經常瀏覽京劇內容的用戶,系統會推薦相關的京劇表演和藝術家作品,從而提供個性化的體驗。
3.3 交互式智能助手
交互式智能助手功能的設計集中于提供豐富的互動體驗,同時融入高級技術細節以確保精準且高效的用戶交互。該功能主要運用自然語言處理(NLP) 技術,結合先進的算法和知識圖譜,為用戶提供深入的文化探索和個性化體驗。以中國書法為例,當用戶提出關于書法的查詢時,智能助手首先利用NLP中的關鍵詞提取功能,如TF-IDF或BERT算法,分析用戶查詢的文本,精準提取“書法”“王羲之”等關鍵詞。接著,基于用戶的查詢意圖,助手采用如基于LSTM的意圖識別算法,精確判斷用戶的具體需求,無論是探索歷史背景、藝術特征還是尋找學習資源。此外,智能助手廣泛整合中華文化知識圖譜,提供結構化和關聯豐富的回答。例如,在介紹王羲之的行書時,助手能夠同時提供相關的歷史事件、影響力顯著的藝術家和流派信息。在推薦環節,助手使用個性化推薦算法,根據用戶的歷史互動和偏好提供定制化的學習資源和體驗建議[5]。
4 系統實驗與驗證——以傳統文化“中國書法”為例
4.1 評價指標與實驗過程
本研究以“中國書法”進行人工智能外宣平臺的性能評估,主要關注智能助手在書法內容解析和分類的準確性與效率。實驗使用了80%的用戶數據進行智能算法訓練,包括書法圖像識別和風格學習,余下20%用于測試和評估算法表現。采用5折交叉驗證確保結果的可靠性,并通過最小化損失函數優化模型參數。評價指標包括精準率(P) 、召回率(R) 、F值(F) 和準確率(A) ,基于真正例(TP) 、假正例(FP) 、假負例(FN) 和真負例(TN) 來計算,全面反映系統在各方面的性能。按如下方法計算:
[P=TPTP+FP]? ? ? ? ? ? ? ?(5)
[R=TPTP+FN]? ? ? ? (6)
[F=2×P×RP+R]? ? ? ? ? ? (7)
[A=TP+TNTP+FP+FN+TN]? ? ? (8)
4.2 實驗結果
在人工智能驅動的中華傳統文化外宣平臺中,以“中國書法”為例進行全面測試。主要評估了智能解析與分類模型、個性化推薦算法和交互式智能助手模型在處理書法內容的效能,專注于精準率(P) 、召回率(R) 、綜合評估指數(F) 和準確率(A) 四個關鍵指標。實驗結果如表1所示。
實驗結果表明,平臺在關鍵功能上表現卓越:智能解析與分類模型顯示高效識別能力(精準率88%,召回率87%) ,個性化推薦算法良好匹配用戶興趣(精準率85%,召回率83%) ,而交互式智能助手模型在用戶交互方面表現出色(精準率90%,召回率88%,準確率91%) 。這些成果驗證了平臺在推廣中華優秀傳統文化方面的有效性,尤其在提升用戶體驗方面的顯著效果。
4.3 重點功能模塊系統測試
基于人工智能的中華優秀傳統文化外宣平臺中“中國書法”相關功能的測試結果,測試覆蓋了智能解析與分類、個性化推薦和交互式智能助手這三個核心功能模塊,并按照一級測試用例、測試過程、測試結果、預期結果和結論進行呈現:
這些測試結果表明,各功能模塊在處理和推廣中國書法文化方面表現出色,有效滿足了用戶對深入探索和學習中國書法文化的需求。通過這些功能模塊的性能表現,系統在傳播和教育中華優秀傳統文化方面的有效性得到了充分驗證。
5 結束語
本研究成功展示了人工智能技術在推廣和教育中華優秀傳統文化領域的巨大潛力。通過實現智能解析、個性化推薦和交互式助手等功能,不僅提升了文化內容的可訪問性和吸引力,也為全球用戶打開了深入理解和欣賞中華文化的新視角。研究成果不僅體現了技術與文化融合的創新,也為未來類似項目提供了寶貴的經驗和啟示,開辟了利用人工智能促進文化多樣性與全球文化交流的新路徑。
參考文獻:
[1] 張楠.AI促進傳統文化的創造性轉化[J].軟件和集成電路,2023(9):17.
[2] 黃松,譚騰.生成式人工智能時代的中華民族文化共同體建設走向:技術驅動與范式創新[J].學術交流,2023(9):20-42.
[3] 張鵬禹.傳播傳統文化的“新使者”[N].人民日報海外版,2023-09-04(007).
[4] 汪永亮.基于人工智能的中華優秀傳統文化傳播模式創新[J].長春師范大學學報,2023,42(7):177-180.
[5] 李海麗,李海玲.人工智能背景下民族文化負載詞的外宣翻譯[J].海外英語,2022(22):36-38.
【通聯編輯:梁書】