999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BERTopic模型的國內古籍保護研究進展分析

2025-08-19 00:00:00王偉正喬鴻李肖俊王靜靜薛朝輝
新世紀圖書館 2025年6期
關鍵詞:古籍文獻數字

分類號 G251DOI10.16810/j.cnki.1672-514X.2025.06.010

摘要 論文針對業界有關“古籍保護”主題的學術成果,使用基于深度學習的無監督集群學習主題識別方法,旨在梳理國內該領域的研究熱點與分布,為古籍保護研究提供參考。從中國知網(CNKI)數據庫中總共下載2973條記錄,利用BERTopic模型進行主題建模與關鍵信息提取。通過研究主題的主題詞分布揭示古籍保護工作的內在主題結構和重要內容,結合主題演化分析結果,提出國內古籍保護工作發展意見。

Analysis of the Research Progress of Ancient Books Protection in China Based on BERTopic Model

Wang Weizheng, Qiao Hong,Li Xiaojun,Wang Jingjing, Xue Chaohui

AbstractBased on the academic achievements of the industry on the theme of“ancient book protection”,the unsupervised clusterlearning topic recognition method basedon deep learning algorithm is used to sortout the research hotspots and distribution inthis field in China,soas to provide reference fortheresearch of ancientbook protection.A total of 973 records were downloaded from the CNKIdatabase,andthe BERTopic model was used for topic modeling and key information extraction.The internal theme structureand important contentof ancient book protection work are revealed bystudying the subject word distributionof the theme.Itidentifies2Oresearch topics,which can be divided into three clusters: traditionalarchivesresearch,electronicarchives research,and natural disasterimpactonliterature research.Finally,combined with theresultsof theme evolution analysis,this paperputs forward some suggestions on the development of ancient book protection in China.

KeywordsProtection of ancient books.Research topics.BERTopic.Topic mining.Research progress.

隨著我國古籍保護工作的不斷發展,2000年之后“國家重點檔案保護與搶救”和“古籍保護計劃”[2等古籍保護項目的開展,極大促進了我國文獻遺產的保存和保護工作的規范化。相關學者也開始對古籍保護工作研究全景進行了闡釋,通過定量和定性方法探析了我國古籍保護工作的研究現狀。然而,現有研究大多是從古籍保存、檔案保存或紙質文物保存的單一角度出發,使用文獻計量工具對數據進行分析,很少涉及面向文本內容的深度知識發現,對古籍保護研究工作的研究現狀缺乏系統分析,難以準確掌控整體研究主題結構特征。為解決以上問題,本研究以中國知網為數據源,使用BERTopic主題模型挖掘并分析國內古籍保護工作研究的結構特征,深度歸納了古籍保護研究的主題結構和研究熱點,對學界系統把握研究體系、選擇合適的研究方向具有重要的參考價值。

1文獻綜述

我國古籍保護工作現有成果可歸納為四類。一是國內古籍保護工作發展歷程綜述,例如肖媚媚回顧了我國古籍保護政策,分析了現有古籍保護工作存在的問題,從數字人文角度提出了未來古籍保護的工作方向3;趙躍等作者對我國非物質文化遺產保護與傳承工作進行回顧,針對目前我國非遺數字化發展困境提出建議4;劉偉成以湖北省圖書館為例,展示了新時代背景下的古籍保護與實踐的工作機制5。二是國內古籍保護理論和學科建設總結,例如宋鵬梳理了國內紙質文獻修復與實踐的發展歷程,充分認識了當前紙質文獻保護工作的發展狀況,為未來的文獻保護工作提供了有力的支持和指導;張美芳對圖書、文物、檔案保護的學科整合問題進行了探討,構建了一個三維度的專業人才培養體系。三是分析我國古籍保護領域的技術成果,例如,趙淑梅對我國檔案修復技術的主要成果進行分類,并總結了這些技術成果的發展趨勢;彭道友從傳統技藝創新的角度論述了“紙漿修復技術\"的內涵與表現形式;張珂探究了季銨型瓜爾膠在紙質文獻加固工作中的應用,為實現古籍資料“修舊如舊\"提供了新技術。四是對古籍工作不足的總結,有學者提出了古籍數字化過程中的古籍保護問題;史偉等分析了古籍資源轉化存在的諸多問題[2;楊光輝探討了高等院校“古籍活化”存在的問題[13]。

從文獻主題知識發現采用的研究方法來看,傳統方法如關鍵詞網絡,往往只基于詞頻或者數據進行信息挖掘,無法體現整個文獻的語境、捕捉詞語之間的復雜關系。隨著人工智能技術的不斷發展,學者開始使用文本挖掘技術對科技文獻進行深入研究。SHARMA等使用結構主題建模(STM)全面概述1970—2019年信息管理領域的研究進展,揭示了信息管理領域的熱點主題與研究方向[14]。Lin等使用文本挖掘方法潛在語義分析(LSA)對社會商務研究現狀進行了總結,確定了社會商務領域的主要研究主題和課題,為未來的研究提供指導[15]。劉江峰等以圖書情報領域期刊為例,根據文獻句子的語義特征使用BERT模型進行關鍵語句的識別,最終有效地挖掘出圖書情報領域的新興主題[1]。崔旭等使用LDA主題模型對我國檔案館官網和非遺保護中心的新聞報道進行文本挖掘,通過對比分析發現了檔案館在非遺保護中存在的諸多問題[17]。

值得說明的是,文本挖掘是一種新型的知識發現技術,已經廣泛應用在科技文獻分析中,它使研究人員能夠檢查非結構化文本,并從文本數據集合中提取以前未知的、可理解的、潛在的和觀察到的模式或知識,從而更好地理解文獻的內容和主題。BERTopic作為一種深度學習主題模型,可以將單詞表示為多維向量并捕獲上下文信息,從而產生更準確、更豐富的特征。Grootendorst證明了該方法在主題識別方面的有效性[18],因此我們采用BERTopic模型來高效地進行主題識別。

基于此,本研究使用文本挖掘技術中自下而上的無監督主題建模技術BERTopic,基于期刊論文、學位論文、會議論文等多源異構數據集,通過數據清洗、去停用詞、分詞等方法,使用BERTopic模型中的all-MiniLM-L6-v2提取文獻數據集的詞向量,通過BERT嵌入、統一面域逼近和投影(UMAP)、HDB-SCAN聚類算法及c -TF-IDF創建主題類團,最大限度保留了主題中的重要詞匯。相較傳統的主題模型如潛在語義分析(LSA)和結構主題建模(STM),BERTopic主題模型能更好地理解詞語的語義并考慮上下文信息,更準確地捕獲詞語之間的語義關系。

2研究設計及主題識別

本研究選擇中國知網(CNKI數據庫作為古籍保護工作研究相關文獻的數據源,檢索式為:SU%= “文獻保存”OR SU%= “文獻修復”ORSU%= “紙張保存”OR SU%= “紙張修復”ORSU%= “書籍保存”OR SU%= “書籍修復” ORSU%= “圖書保存”OR SU%= “古籍保存” ORSU%= “古籍修復”OR SU%= “檔案保存”ORSU%= “檔案修復”OR SU%= “紙文物保存”ORSU%= “紙文物修復”,時間跨度為1955年1月1日至2023年10月20日。檢索的文獻類型包括“期刊論文”“博士論文”“碩士論文”“國內會議論文”,共獲得4393條結果。

為了精準提煉文獻中的相關主題,本研究使用基于深度學習的BERTopic主題識別算法對古籍保護領域的論文進行主題挖掘。與傳統的主題模型如潛在語義分析(LSA)和結構主題建模(STM)相比,BERTopic主題模型具有更強的語義表達能力,可以更好地捕捉上下文中的語義信息,從而更準確地識別和組織主題。先剔除搜索結果中的“問題”文獻,再使用Jieba分詞等工具包對數據集中的文獻進行摘要預處理,預處理工作包括分詞、去停用詞、詞頻統計、刪除無意義高頻詞等。剔除不相關文獻后,得到3345篇,接下來由兩名古籍專業的研究生共同篩選出符合古籍保護研究的文獻,最終將篩選后的2973篇文獻作為研究數據集。

針對預處理后的文獻數據,首先使用BERT模型對文本進行嵌人,通過Stence—Transformer將文本轉換為嵌人向量;然后通過UMAP算法將高維嵌入向量降維到低維空間,降低嵌入后的維度,以便之后再使用HDB一SCAN算法對降維后的嵌入向量進行密度聚類,得到不同的主題詞;最后,通過c—TF—IDF計算聚類中詞的重要性,然后根據最大邊際相關性提取出與主題相關的候選詞,并生成主題特征詞分布圖、研究主題的潛在層次結構圖、主題相似度圖、文檔一主題分布圖等,進而分析國內古籍保護工作主題分布特征與研究進展。

對于BERTopic主題模型,首先使用了更大的中文語料庫進行預訓練,使其具有更好的性能。預訓練模型使用“RoBERTa-wwm-ext”[19],該模型是在BERT基礎上進一步優化的RoBERTa模型。經過多輪實驗對比與查找文獻,將UMAP維度(n_components設置為5;距離計算方式(metric)設置為cosine,使用余弦相似度計算點與點的距離;點與點之間的最小距離(min_dist)設置為0.01,使文檔嵌入效果更加緊密;將最小聚類規模(min_cluster_size)設置為20;最小樣本(min_samples)設置為10,這樣就避免了小集群數據的噪聲影響;將主題數(nr_topics)設置為“auto”,與不限定主題數目的兩組結果進行對比,對聚類結果進行合并。此外,我們使用(2,3)的n元語法范圍,并選擇頂部特征詞進行輸出,而其余參數則設置為默認值。

根據主題建模設計,在對數據集摘要進行關鍵詞分析的基礎上,共識別出20個主題。以條形圖的形式顯示這20個主題,并展示它們的特征詞,如圖1所示。

3我國古籍保護工作研究主題分布

從圖1可以發現,“檔案保護\"“檔案修復”“古籍修復\"等主題詞在多個主題下有重疊,這些主題詞分布廣泛也從側面說明了我國古籍保護工作研究的熱點。同時,某些重復的主題詞在不同主題中分布,說明這些主題詞在不同的上下文中具有不同的含義。這不僅增加了主題模型的魯棒性,也可以幫助我們更好地理解文本數據中的潛在主題,并揭示出不同主題之間的關聯性,提供更豐富和準確的主題分析結果。根據圖1,可以看出國內古籍保護工作大致包括以下幾個主題:檔案保護與開發、數字檔案長期保存、非物質文化遺產保護、古籍保護技術、科學技術研究、古代科技文獻修復、中國特色檔案學、檔案修復技術、自然災害對檔案影響研究等。

3.1研究主題聚類集群分析

對這些主題進行歸類,可以分為古籍數字化、古籍修復與保護技術、古籍環境控制、數字檔案保存等研究方向。從這些主題聚類來看,其中,電子檔案保護、檔案保護與開發、數字檔案長期保存是出現概率最高的主題。另外,通過交互式主題圖譜可知我國古籍保護工作主要分為三個研究集群。

(1)我國傳統檔案研究:包含Topic1(檔案保護與開發)、Topic4(非物質文化遺產保護)Topic15(國家檔案)、Topic17(城市檔案)Topic18(古代科技文獻修復)、Topic19(中國特色檔案學)等主題,該集群研究主要內容是對中國傳統檔案的收集、整理、保護、修復和利用,以建立完整的中國特色檔案學研究體系,滿足中國歷史研究和文化傳承的需要。

(2)我國電子檔案研究:Topic0(電子檔案保護)Topic2(數字檔案長期保存)Topic3(古籍保護技術)Topic10(信息系統)Topic13(檔案修復技術)等主題,隨著信息技術的發展,越來越多的檔案以電子形式存儲,電子檔案研究成了一個重要的研究課題。

(3)自然災害對文獻影響研究:Topic5(濕溫度對檔案庫房影響研究)、Topic14(自然災害對檔案影響研究),這類集群研究主要是通過對自然環境和歷史上自然災害事件的分析,探討其對文獻的破壞和保護的影響,有利于文獻保護部門制定更加科學合理的文化遺產保護措施。

3.2 主題內容關聯度分析

為識別主題的潛在層次結構,本研究使用層次聚類scipy.cluster.hierarchy庫,將主題之間潛在的關聯和組織模式可視化20,結果如圖2所示。從圖2中可以清晰地觀察到各主題潛在的關聯和組織模式,例如Topic3(古籍保護技術)和Topic16(紙質文物保護)有緊密關聯,有學者探究了化學保護技術在紙質文物保護工作中的應用情況,對脫酸劑和纖維素等脫酸與加固工作中的新材料進行總結歸納2;Topic6(紙質檔案)和Topic13(檔案修復技術)有直接關聯,有研究對我國紙質檔案修復技術文獻進行了統計分析,回顧了傳統修復技術與現代修復技術的發展路徑;Topic10(信息系統)和Topic2(數字檔案長期保存)有間接聯系,有學者為保證數字檔案的安全保存,通過聯盟區塊鏈和公有區塊鏈管理電子檔案信息,構建了一個數字檔案管理信息系統[22]。

3.3研究主題相似度分析

為更好地分析和解釋主題模型的結果,本研究基于余弦相似度計算了每個主題之間的相似度,并通過seaborn庫將相似度矩陣轉化為熱力圖。熱力圖中的顏色深淺反映了主題之間的相似度大小,如圖3所示。通過觀察圖3,我們可以更加直觀地了解主題之間的區別,如哪些主題比較相似,哪些主題差異較大。

圖2研究主題潛在關聯和組織模式可視化圖譜

圖3主題相似度熱力圖

從圖3中可知,Topic1(檔案保護與開發)和Topic19(中國特色檔案學),這兩個主題之間具有較高的相似度,這是是因為中國特色檔案學是對檔案保護與開發的一種研究方法和理論體系,它強調了檔案保護與開發的文化價值和社會功能,提出了許多具有中國特色的檔案保護與開發的方法和理念,如“以人為本”“文化自信\"等[23]。因此,這兩個主題都會涉及檔案保護與開發的相關內容,使得它們之間具有較高的相似度。

TopicO(電子檔案保護)和Topic7(非物質文化遺產檔案),這兩個主題相似度較高是因為電子檔案保護和非物質文化遺產檔案都屬于檔案保護領域中的一個重要分支,都涉及檔案的數字化、存儲、管理和保護等方面。此外,非物質文化遺產也可以通過數字化手段進行保護和傳承[24],因此這兩個主題之間具有較高的相似度。

Topic18(古代科技文獻修復)和Topic19(中國特色檔案學),這兩個主題相似是因為古代科技文獻修復和中國特色檔案學都屬于檔案保護與開發領域中的重要分支,都涉及檔案保護與開發的相關內容。同時,古代科技文獻修復也需要借鑒中國傳統文化中的修復技術和理念25,因此這兩個主題之間具有較高的相似度。

與以上主題相反,Topic3(古籍保護技術)和Topic4(非物質文化遺產保護)與所有主題相似度都非常低。這是因為Topic3(古籍保護技術)更側重于古籍保護的技術方面,如數字化修復、光學掃描、纖維素使用等2。而其他主題可能更加關注古籍保護的文化價值、歷史意義等,這種不同的關注點導致Topic3(古籍保護技術)與其他主題之間的相似度較低;Topic4(非物質文化遺產保護)側重于非物質文化遺產的保護,如傳統技藝、民俗文化等[27]。

3.4文檔一主題分布圖譜分析

為探索文本數據中不同主題下文檔分布的關系與特征,更好地理解文本數據中主題的分布情況,我們使用topic_model.visualize_documents函數將文本數據轉換為二維平面上的散點圖,得到文檔一主題分布圖譜,如圖4所示。

圖4中每個散點代表一個文檔,通過不同的顏色和形狀等參數,將不同主題的文檔區分開來,從中可以看出,國內古籍保護工作集中在TopicO(電子檔案保護)、Topic1(檔案保護與開發)、Topic2(數字檔案長期保存)、Topic13(檔案修復技術)等研究主題,尤其是Topic0(電子檔案保護)和Topic1(檔案保護與開發)是研究數量最多的主題類團。這也從側面說明,隨著數字化技術的不斷發展,越來越多的檔案被數字化保存和傳播,因此電子檔案保護也成了研究者們關注的重要問題2,而傳統檔案也一直是檔案保護與開發領域中的重要研究對象[29]。

4主題挖掘和進展分析結果

本研究基于深度學習算法的無監督集群學習方法Bertopic模型,探究了我國古籍保護工作研究主題和研究進展。通過研究主題識別,發現了傳統檔案研究、電子檔案研究、自然災害對文獻影響研究等三個主要集群;利用主題內容識別,發現了國內古籍保護工作的主要研究方向;使用層次聚類法,識別出主題的潛在層次結構和各主題潛在的關聯和組織模式;運用主題相似度熱力圖,更好地分析和解釋了主題模型的結果。對此,從上述分析結果歸納出如下結論。

4.1技術應用于古籍保護的研究發展迅速

科技的不斷進步,為古籍保護提供了更多的工具和手段,例如TopicO(電子檔案保護)Topic2(數字檔案長期保存)、Topic3(古籍保護技術)和Topic13(檔案修復技術)等主題在古籍保護研究中占有較大比例。這主要體現在兩方面:一方面,應用現代科學(物理、化學、生物和材料學等學科)技術可以通過非侵入性或微創性的手段3%,對古籍的載體和內容進行外部干預,實現原生性保護,并延長其壽命;另一方面,數字化技術可以對古籍進行高效、精確的數字化處理,避免使用者不斷損傷實物,同時也為古籍的傳承和研究提供了更多的便利[3]。

4.2有關古籍保護的管理工作研究不足

傳統的古籍保護工作往往只關注古籍內部的保護,而忽視了管理工作中的外部社會環境影響。例如Topic19(中國特色檔案學)主題熱點非常低,說明我國古籍保護研究體系并不規范,缺乏相關政策、法規和規范的支持。古籍保護工作的不規范和非制度化,社會環境的惡劣和法治環境的欠缺,則會增加古籍被盜、被毀等風險,這些問題都會對古籍保護工作造成不良影響[32]

4.3數字人文和數字記憶研究是古籍保護工作研究的焦點

數字人文和數字記憶技術的應用為古籍保護工作提供了更加高效、準確、全面的解決方案。當前,數字人文工作受到了高度重視,特別是2003年聯合國教科文組織發布的《數字遺產保護憲章》和聯合國教科文組織大會通過的《關于保存和獲取包括數字遺產在內的文獻遺產的建議書》引發了我國對數字遺產保護的關注。例如Topic0(電子檔案保護)、Topic2(數字檔案長期保存)、Topic11(數字化處理)等主題成為古籍保護領域的研究熱點。數字人文以數字技術為基礎,將人文學科的研究對象進行數字化處理,并通過計算機技術進行管理、分析和展示[33]。在古籍保護工作中,數字人文技術可以對古籍進行高效、精確的數字化處理,從多學科角度實現了對古籍內容的全面、系統化的管理和研究[34。數字記憶技術將物質文化遺產、非物質文化遺產等遷移到網絡資源庫中,有助于提高可訪問性,方便研究與學習,促進數據共享與合作[35]。同時,數字記憶技術還可以為古籍保護工作提供新的安全保障和備份手段,避免了傳統古籍保存方式中可能出現的丟失、損毀等問題。

5古籍保護學科發展建議

我國歷來重視古籍保護工作,2007年,國務院辦公廳出臺了《關于進一步加強古籍保護工作的意見》,強調了古籍保護的重要性,提出了加強古籍保護工作的指導意見和措施。2022年,國務院辦公廳印發《關于推進新時代古籍工作的意見》,強調在新時代背景下,古籍保護對傳承中華優秀傳統文化、促進文化繁榮具有重要意義。由此,根據本文分析的結論,對古籍保護學科發展提出如下建議。

5.1加強與自然科學的融合與滲透

由于古籍文獻自身的脆弱性,以及利用不當或環境不適宜造成的各種損害,許多古籍正在老化、破損甚至無法使用,造成了古籍文獻永久價值和壽命有限之間的基本矛盾。因此,筆者認為應擴大古籍保護研究的跨學科交流與融合范圍,加強與物理、化學、生物和材料學等自然學科的協同合作,共同解決古籍保護所面臨的多樣而嚴峻的挑戰。例如,借助生物學技術,可探索古籍中可能存在的生物侵害問題,進一步實施有針對性的防治措施。實際上,為應對老化、破損與文獻使用的矛盾,尋找最合適的方法搶救和保存有價值的人類記錄和文件,保持人類記憶的完整性,1960年開始,我國一批來自生物學、化學、物理學等學科領域的學者就加入了古籍保護工作。當下,更應該不斷打破生物、化學、材料學和計算機科學的學科壁壘,從以人為本的角度,利用古籍保護學科的研究思維,梳理研究問題的內在邏輯。對其他學科關于文物保存的研究問題,運用先進的分析技術,例如質譜、光譜學,對古籍材料的成分進行深入分析,以制定更為有效的保存策略。同時,要勇于探索新的、適用于各種情境的理論和方法體系,將學科內的理論和方法應用于具體的文化遺產保護實踐中,通過數字技術的運用,建立虛擬檔案,實現古籍的數字化保存和傳承。此外,參考其他學科的建設經驗,可以考慮新增特定于古籍保護的二級學科,研究如何將先進的古籍保護知識應用于不同的文化和歷史背景,提高學科的實用性和適應性,推動古籍保護學科的前沿發展。

5.2促進古籍保護領域的制度化建設

古籍保護領域的法制建設工作要以問題為導向,以解決古籍保護領域存在的突出問題為核心[3。在制定專門的古籍保護法規時,要明確各方責任、義務和權利,同時法規應考慮到古籍特有的保存需求。在推進古籍保護領域的法治體系建設過程中強調法治教育與宣傳,以提高相關從業人員和社會公眾的法治素養。同時,要強調法治文化的建設,倡導法治思維方式、法治精神,使古籍保護從業人員更好地融入法治文化,將法治理念貫徹落實在工作實踐中。

5.3擁抱數字人文和數字記憶研究

數字人文研究的最終目的是服務于人文研究,解決人文社科中具有現實需求和研究價值的具體問題。從這個角度來看,數字人文應該與古籍保護領域的具體研究問題緊密結合,同時,促進人文學者與技術人員之間的交流,進而促進古籍保護領域亟待解決的研究問題,與數字人文的深度融合[37。在數字人文研究的初始階段,圖書情報學、計算機科學等資源構建與服務學科成為數字人文研究的中流砥柱,這導致歷史、文學、古籍保護等領域的人文學者缺失。為此,人文領域的學者應積極擁抱數字人文和數字記憶研究,積極主動學習數字人文領域的相關技能,深人理解和應對數字人文的發展趨勢,促進古籍保護工作更好地適應數字時代的需求。

參考文獻:

[1]張美芳,唐躍進.檔案保護概論[M].北京:中國人民大學出版社,2013.

[2]趙文友,林世田.“中華古籍保護計劃”成果:以“中華古籍資源庫”建設為中心的古籍數字化工作[J].新世紀圖書館,2018(3):12-15.

[3]肖媚媚.政策驅動的古籍保護與數字人文學思考[J].圖書與情報,2022(2):122-126.

[4]趙躍,吳曉梅,朵婷,等.擁抱文化數字化戰略:非遺數字化實踐回顧與前瞻[J].圖書館建設,2023(6):80-87.

[5]劉偉成.凝聚新智,開創新局:湖北省圖書館古籍保護與創意利用實踐[J].新世紀圖書館,2024 (6):5-11.

[6]宋鵬.新中國成立以來紙質文獻修復實踐與理論發展研究[D].沈陽:遼寧大學,2023

[7]張美芳.圖書保護、檔案保護、文物保護學科整合研究[J].大學圖書館學報,2016,34(4):69-73,42.

[8]趙淑梅.數字時代我國檔案保護技術發展趨勢:基于1987—2015年國家檔案局優秀科技成果獎的統計分析[J].檔案學通訊,2017(2):72-76.

[9]彭道友.基于古籍修復技藝傳承創新的“紙漿修復技術”研究[J].新世紀圖書館,2021(8):37-40.

[10]張珂.季銨型瓜爾膠在紙質文獻加固中的應用研究[D].廣州:華南理工大學,2022.

[11] 潘星耀.淺談古籍數字化掃描工作需注意的問題[J].新世紀圖書館,2016(12):60-62.

[12]史偉,李天碩,王宇.新時期古籍資源轉化利用工作的若干思考[J].圖書情報工作,2023,67(11):71-76.

[13]楊光輝.關于高等院校“古籍活化”的幾個問題[J].大學圖書館學報,2022,40(3):9-12.

[14] SHARMA A, RANA N P, NUNKOO R. Fifty yearsof information management research: a conceptualstructure analysis using structural topic modeling[J].International Journal of Information Management,2021(58): 102316.

[15]LINX,LIY,WANGX.Social commerce research:definition,research themes and the trends[J].International Journal of Information Management,2016(3): 190-201.

[IU] 小 人 肌不語義特征視角下的期刊新興研究主題發現[J].情報理論與實踐,2024,47(3):177-187.

[17]崔旭,楊煜,李姍姍.基于LDA模型的我國檔案館非物質文化遺產保護主題挖掘與演化分析:與非遺保護中心對比視角[J].圖書情報工作,2022,66(23): 82-92.

[18] GROOTENDORST M. BERTopic: neural topicmodeling with a class-based TF-IDF procedure[J/OL].(2022-03-11)[2024-12-01].http://arxiv.org/abs/2203.05794.

[19]CUIY,CHEW,LIUT,etal.Pre-training withwholeword masking for Chinese BERT[J/OL].(2021-11-25)[2024-12-01]. http://rxiv.org/abs/1906.08101v1.

[20]BLEI D M.Probabilistic topic models[J].Communications of the ACM, 2012:5.

[21]韓瑩.近十年來化學方法在紙質文物脫酸與加固方面的應用[J].中國國家博物館館刊,2022(6):143-160.

[22]左晉佺,張曉娟.基于信息安全的雙區塊鏈電子檔案管理系統設計與應用[J].檔案學研究,2021(2): 60-67.

[23]尹鑫,張斌.論加快構建中國特色檔案學學術體系[J].圖書情報知識,2021,38(5):4-14.

[24]趙云海,劉瑞.數字化時代非物質文化遺產知識產權保護實踐反思[J].文化遺產,2023(2):10-18.

[25]徐擁軍,閆靜.中國特色檔案學的基本范疇與核心命題[J].中國圖書館學報,2024,50(3):30-46.

[26]王國強.古籍修復可逆性原則、技術應用策略及實現途徑[J].大學圖書館學報,2023,41(1):106-112, 128.

[27]吳興幟,周靈穎.非物質文化遺產村落化保護認知研究[J].云南民族大學學報:哲學社會科學版,2023,40(6):72-79.

[28]趙淑梅.數字時代我國檔案保護技術學學科發展走向[J].檔案學通訊,2016(3):72-76.

[29]任漢中.中國傳統檔案文化問題研究[J].檔案學研究,2001(3): 8-11.

[30]陶琴.霉菌對檔案的危害及其防治技術研究進展[J].檔案學通訊,2013(6):90-93.

[31]李世鈺,張向先,沈旺,等.古籍數字化國內外研究現狀分析與路徑構建研究[J].現代情報,2023 43(11)-4-20

[32]李永卉,孫悅帆.建構與邊緣:近代中國古籍保護立法研究[J].圖書館雜志,2023,42(5):116-127.

[33]付雅明,劉煒,祝蕊.東亞文明的數字未來:2023年哈佛大學數字人文國際會議綜述[J]圖書館論壇,2024,44(5):153-160.

[34]劉朔宇,袁曦臨.iField視域下信息資源管理學科的研究領域定位思考:基于數字人文研究的實證分析[J].圖書館建設,2024(3):50-59,116.

[35]姜婷婷,傅詩婷.人本視角下的數字記憶:“人一記憶一技術”三位一體理論框架構建與啟示[]中國圖書館學報,2022,48(5):103-115.

[36]史偉,王宇,胡萬德.我國古籍保護法治現狀及相關政策建議[J].圖書情報工作,2022,66(11):59-65.

[37]于英香.數字人文研究論爭及思考[J].圖書館雜志,2023,42(2):98-105.

王偉正南京理工大學經濟管理學院博士研究生。江蘇南京,210000。

喬鴻山東師范大學商學院副教授、碩士生導師。山東濟南,250358。

李肖俊齊魯工業大學(山東省科學院)情報研究所副研究員。山東濟南,250014。

王靜靜山東大學新聞傳播學院副研究員、碩士生導師。山東濟南,250100。

薛朝輝空軍指揮學院研究生大隊碩士研究生。北京,100097。

(收稿日期:2024-04-08編校:曹曉文,陳安琪)

猜你喜歡
古籍文獻數字
由文獻到文化:公共圖書館古籍閱讀推廣模式及其轉變
圖書館學刊(2025年7期)2025-08-27 00:00:00
用戶視角下高校圖書館外文文獻利用與保障需求研究
數智時代下公共圖書館古籍文獻傳承性保護與活化利用研究
中共黨史黨建學視域下紅色文獻研究的深化
地方文獻“交集”現象探微
圖書館界(2025年3期)2025-08-12 00:00:00
魔法數字
數字化背景下古籍文獻保護與利用策略探討
蘭臺內外(2025年20期)2025-08-05 00:00:00
山西博物院展出近500冊古籍善本
數字卡片等
中國專利文獻數據(2011年12月14日第50期)
主站蜘蛛池模板: 国产a v无码专区亚洲av| 成人免费黄色小视频| 欲色天天综合网| 国产91在线|日本| 国产三级毛片| 亚洲免费福利视频| 91在线中文| 亚洲综合色吧| 精品无码国产一区二区三区AV| 国产乱人视频免费观看| 亚洲精品麻豆| 亚洲色图欧美| 成人亚洲天堂| 2021亚洲精品不卡a| 72种姿势欧美久久久久大黄蕉| 久久久久久午夜精品| 男女精品视频| 亚洲欧美在线综合图区| 5388国产亚洲欧美在线观看| 香蕉蕉亚亚洲aav综合| 成人国产小视频| 91精品人妻互换| 97国产在线视频| 亚洲最大在线观看| 亚洲性日韩精品一区二区| 国产在线麻豆波多野结衣| 国产女人18水真多毛片18精品| 67194亚洲无码| 亚洲一区二区三区麻豆| 久久精品人人做人人综合试看| 国产精品一区二区国产主播| 欧洲欧美人成免费全部视频| 国产永久在线观看| 亚洲精品在线影院| 国产在线观看99| 午夜啪啪网| 亚洲无线国产观看| 国产高潮视频在线观看| 少妇精品网站| 国产欧美视频在线观看| 国产后式a一视频| 日本道综合一本久久久88| 国产尤物在线播放| 在线中文字幕日韩| 91网址在线播放| 欧美日韩午夜视频在线观看| 91 九色视频丝袜| 国产精品嫩草影院视频| 青青热久麻豆精品视频在线观看| 黄色片中文字幕| 国产成人盗摄精品| 亚洲毛片网站| 免费a在线观看播放| 国产福利影院在线观看| 欧美自慰一级看片免费| 亚洲人成色在线观看| 又猛又黄又爽无遮挡的视频网站| 白浆视频在线观看| 国产欧美又粗又猛又爽老| 日韩精品无码不卡无码| 91色在线观看| 国产一区二区丝袜高跟鞋| 亚洲中字无码AV电影在线观看| 秋霞一区二区三区| 国产一级二级在线观看| 欧美精品亚洲精品日韩专| 91精品国产麻豆国产自产在线| 青青国产视频| 无码一区18禁| 免费高清a毛片| 熟妇无码人妻| 久久窝窝国产精品午夜看片| v天堂中文在线| 亚洲色婷婷一区二区| 欧类av怡春院| 高清无码不卡视频| 亚洲综合色吧| …亚洲 欧洲 另类 春色| 亚洲精品第一页不卡| 精品综合久久久久久97| 影音先锋丝袜制服| 欧美精品v|