999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國內(nèi)數(shù)字人文領(lǐng)域文獻主題識別及框架研究

2024-06-03 00:00:00冷雪卓張濤崔文波
圖書館學(xué)刊 2024年3期

[摘 要]數(shù)字人文能夠活化中國文化,向世界更好地展示中國聲音,講好中國故事。從數(shù)字人文領(lǐng)域研究成果中識別文獻主題,能夠客觀地幫助該領(lǐng)域?qū)W者快速了解與掌握國內(nèi)數(shù)字人文研究內(nèi)容和動向,并形成國內(nèi)該領(lǐng)域基于文獻研究的框架,為相關(guān)研究提供理論支撐。以CNKI中數(shù)字人文領(lǐng)域的1886篇文獻為樣本,綜合使用LDA、Word2Vec及共現(xiàn)分析等文本計算方法抽取主題,形成以信息技術(shù)為驅(qū)動,以數(shù)字藝術(shù)、文化遺產(chǎn)、歷史檔案等主要研究領(lǐng)域為學(xué)科建設(shè)突破口,以人才培養(yǎng)為最終目標的國內(nèi)數(shù)字人文領(lǐng)域研究框架。

[關(guān)鍵詞]數(shù)字人文 文本計算 主題識別 研究框架 LDA

[分類號]G250.7

2020年11月,教育部在全國新文科建設(shè)工作會議上發(fā)布了《新文科建設(shè)宣言》,明確指出要積極推動人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù)與文科專業(yè)深入融合[1]。數(shù)字人文作為人文學(xué)科、計算機科學(xué)交叉研究的新型領(lǐng)域,逐漸超越作為工具或提供服務(wù)的功能性角色定位,被賦予新的人文學(xué)科身份,成為新文科建設(shè)的重點內(nèi)容,推動數(shù)字人文領(lǐng)域研究蓬勃發(fā)展,吸引傳統(tǒng)的人文領(lǐng)域、計算機科學(xué)技術(shù)領(lǐng)域以及數(shù)據(jù)分析領(lǐng)域等學(xué)者參與到數(shù)字人文的建設(shè)中來。隨著越來越多的學(xué)科融入其中,如何幫助研究人員從宏觀層面快速了解和把握研究重點和發(fā)展趨勢,探索具有創(chuàng)新性和可持續(xù)發(fā)展的研究課題,提高研究的科學(xué)性和穩(wěn)健性是當下亟待解決的問題。在新文科建設(shè)和文化強國戰(zhàn)略等建設(shè)推動下,通過主題挖掘的方式形成研究框架能夠描述當前學(xué)界研究范圍和研究焦點,從而對我國數(shù)字人文領(lǐng)域研究提供理論支撐。

1 相關(guān)研究

1.1 數(shù)字人文主題研究

數(shù)字人文起源于人文計算,是以人文數(shù)據(jù)為基礎(chǔ),以數(shù)據(jù)挖掘、知識圖譜等計算機技術(shù)和多媒體技術(shù)為支撐,輔助研究者開展人文研究而形成的新型跨學(xué)科研究領(lǐng)域[2],國內(nèi)外學(xué)者從定性和定量視角不斷完善數(shù)字人文理論與方法,針對不同領(lǐng)域開展數(shù)字人文研究,形成了一系列研究成果。劉煒等[3]從技術(shù)體系與理論結(jié)構(gòu)對數(shù)字人文的整體性發(fā)展進行探討。蔡迎春等[4]以“共享場景”理念分析了圖書館創(chuàng)建數(shù)字人文實驗室的時空呈現(xiàn)、基礎(chǔ)設(shè)施、參與人員、交互體驗4個構(gòu)成要素和空間、平臺、培訓(xùn)、管理4個關(guān)鍵環(huán)節(jié)。這些研究成果為開展數(shù)字人文演化路徑與熱點主題識別、人文與信息技術(shù)關(guān)系的探索等量化研究提供了有意義的數(shù)據(jù)支持。柯平等[5]運用文獻計量方法對WOS核心集中數(shù)字人文研究文獻進行統(tǒng)計分析和內(nèi)容挖掘,得出數(shù)字人文研究的前沿和熱點領(lǐng)域。李晚蓮等[6]提出一種基于Word2Vec詞嵌入和LDA主題建模技術(shù)的科學(xué)研究前沿識別方法,對國際數(shù)字人文領(lǐng)域的前沿主題進行探測。魯國軒等[7]提出一種基于機器學(xué)習(xí)的數(shù)字人文文獻主題識別分類模型,實現(xiàn)了不同領(lǐng)域數(shù)字人文文獻的多種分類。Fangli S等[8]使用Pajek和VOSviewer對1900—2020年期間的WOS核心集中數(shù)字人文研究文獻進行分析,識別出館藏內(nèi)容、技術(shù)驅(qū)動、跨學(xué)科合作及數(shù)字人文演進4個研究主題。Soohung J等[9]收集2010—2020年Scopus等多個數(shù)據(jù)庫的數(shù)字人文研究文獻,采用LDA主題建模的方式,分析數(shù)字人文研究領(lǐng)域課題及其發(fā)展趨勢。

1.2 數(shù)字人文研究框架

研究框架能從宏觀層面描述數(shù)字人文領(lǐng)域研究的大致范圍和焦點,目前針對數(shù)字人文領(lǐng)域框架的研究并不多。王麗華等[10]辨析了數(shù)字人文相關(guān)的人文學(xué)科、人文科學(xué)、人文主義等概念,從數(shù)字人文基礎(chǔ)、方法論、具體工作內(nèi)容及研究領(lǐng)域4個方面構(gòu)建了數(shù)字人文理論框架。唐江浩等[11]采用扎根理論等方法從數(shù)字信息獲取能力、數(shù)字技術(shù)運用能力、數(shù)字學(xué)術(shù)交流能力3個方面構(gòu)建了人文學(xué)者數(shù)字學(xué)術(shù)能力理論框架。左娜等[12]基于共生理論從共生單元、共生模式與共生環(huán)境3個方面構(gòu)建了數(shù)字人文多主體共生的分析框架。饒梓欣等[13]運用扎根理論方法對8所國外高校數(shù)字人文中心的項目管理數(shù)據(jù)進行分析,從項目界定、項目規(guī)劃、項目實施、項目結(jié)束4個方面構(gòu)建出數(shù)字人文項目管理框架。

學(xué)者們圍繞數(shù)字人文領(lǐng)域的理論、技術(shù)、資源等方面進行了深入的探討,為形成數(shù)字人文領(lǐng)域研究框架提供了理論基礎(chǔ)。在主題研究方面,現(xiàn)有研究多是使用文獻計量方法,少量文獻采用主題概率模型進行數(shù)字人文領(lǐng)域演化路徑與熱點主題識別研究。在框架研究方面,現(xiàn)有研究主要以定性的研究方法圍繞數(shù)字人文領(lǐng)域研究機制進行初步探索,缺少以定量研究方法從宏觀層面形成國內(nèi)數(shù)字人文領(lǐng)域研究框架的成果。因此,筆者基于LDA主題模型[14-15]、Word2Vec模型[16]及共現(xiàn)分析法提出一種用于數(shù)字人文領(lǐng)域文獻主題識別的方法,為研究人員提供了一種更加符合數(shù)字人文科學(xué)規(guī)律的新視角。通過量化研究方法形成的框架具有可調(diào)性,以可視化的方式呈現(xiàn),可以動態(tài)性地幫助數(shù)字人文領(lǐng)域研究學(xué)者,特別是交叉學(xué)科領(lǐng)域?qū)W者準確把握數(shù)字人文研究的重點和整體發(fā)展趨勢。

2 研究過程

通過文本計算方法識別出主題的組成要素,形成國內(nèi)數(shù)字人文領(lǐng)域研究框架。主要包括數(shù)據(jù)獲取與預(yù)處理、最優(yōu)主題數(shù)目確定、LDA主題聚類、主題圖譜構(gòu)建4個步驟。首先,從CNKI數(shù)據(jù)庫中獲取文獻數(shù)據(jù),構(gòu)造特征詞表和無效詞表,進行數(shù)據(jù)預(yù)處理;其次,使用困惑度評價法確定文獻的最優(yōu)主題數(shù)目,使用LDA聚類出主題-詞分布,進行主題識別;再次,通過引入Word2Vec詞向量模型進行文本向量化表示,計算主題與文本間相似度,并設(shè)置閾值過濾無效主題;最后,利用主題聚類結(jié)果進行共現(xiàn)分析,并通過VOSviewer可視化的方式形成數(shù)字人文領(lǐng)域文獻主題聚類。研究過程如圖1所示。

2.1 LDA主題模型

LDA主題模型可以從語義層面識別數(shù)字人文領(lǐng)域文獻主題,主要體現(xiàn)文檔與主題、主題與主題詞的關(guān)系,其中主題詞服從狄利克雷分布,概率值越大,表示主題與主題詞的關(guān)系越強,越能表示主題。LDA模型的聯(lián)合概率如公式(1)所示[15]。

[p(θ,z,w|α,β)=p(θ|α)n=1Np(zn|θ)p(wn|zn,β)] (1)

2.2 無效主題過濾

相似度平均值能夠從全局視角判斷主題與文本之間是否具有協(xié)同性[17],解決通過困惑度確定最優(yōu)主題數(shù)目可能導(dǎo)致無效主題出現(xiàn)的問題。基于此,使用Word2Vec的Skip-gram模型訓(xùn)練詞向量,計算主題與所有文本的相似度,生成相似度矩陣,然后計算主題與文本間相似度平均值,設(shè)定閾值,過濾相似度平均值低于閾值的主題,如公式(2)所示。

[AvgSim=1n(i=1nsim(tj,di))] (2)

其中,[AvgSim]是指主題與文本間的相似度平均值;[tj]是指第j個主題;[di]是指第i個文本;[sim(tj,di)]是指主題與文本間的相似度。

2.3 核心主題抽取

通過LDA提取的主題詞能夠概括對應(yīng)的主題,但由于LDA聚類出的主題對應(yīng)的詞簇具有泛化性的特點,依靠人工從詞簇中提煉主題存在主觀性。因此,提出使用共現(xiàn)分析的方法識別關(guān)聯(lián)度和影響較大的主題詞,進而發(fā)現(xiàn)最能準確描述和概括數(shù)字人文的研究主題。其中主題詞共現(xiàn)強度如公式(3)所示[18]。

[Eij=S2ijSiSj] (3)

其中,[Eij]是指主題詞共現(xiàn)強度;[Si]與[Sj]是指主題詞在主題語句中出現(xiàn)的頻次;[Sij]是指兩個主題詞共現(xiàn)在主題語句中的數(shù)量。

3 數(shù)字人文領(lǐng)域文獻主題識別

3.1 數(shù)據(jù)獲取與預(yù)處理

首先,以“數(shù)字人文”為檢索詞對CNKI數(shù)據(jù)庫進行檢索,截至2022年12月共檢索出文獻1938篇,剔除無效文獻后共計1886篇,從數(shù)據(jù)庫中導(dǎo)出文獻的篇名、摘要和關(guān)鍵詞;其次,對數(shù)據(jù)進行清洗,提取3154個文獻關(guān)鍵詞作為特征詞表;最后,為進一步提高主題識別的準確度,防止研究、分析、目的等學(xué)術(shù)類無效詞的干擾,構(gòu)建面向數(shù)字人文領(lǐng)域的無效詞表。

3.2 最優(yōu)主題數(shù)目確定

基于分詞結(jié)果,計算主題的困惑度值[19],生成困惑度曲線。為防止過擬合,選取困惑度下降不明顯或處于拐點的值,確定最優(yōu)主題數(shù)目為28,如圖2所示。

3.3 LDA主題聚類

首先,使用LDA主題模型進行主題聚類,生成主題-詞的分布;其次,使用文獻的篇名、摘要及關(guān)鍵詞來訓(xùn)練詞向量模型,基于公式(2)計算主題與每篇文本的相似度平均值,閾值設(shè)定為0.2,并進行人工判讀,過濾無效主題[20],最終確定有效主題數(shù)目為20,LDA主題識別結(jié)果如表1所示。

3.4 核心主題抽取

首先,在主題-詞過濾的基礎(chǔ)上,基于公式(3)使用Python生成主題詞共現(xiàn)矩陣;其次,對“數(shù)字人文”等干擾詞進行過濾及同義詞合并,最終得到大小為157*157的共現(xiàn)矩陣;最后,使用Ucinet軟件將共現(xiàn)矩陣轉(zhuǎn)成Pajek格式,導(dǎo)入VOSviewer分析軟件繪制出數(shù)字人文主題詞共現(xiàn)圖譜(見圖3),圓圈大小表示主題重要度,連線表示主題詞之間的交互關(guān)系。其中較大的圓圈諸如“數(shù)字人文項目”“人才培養(yǎng)”“信息技術(shù)”“學(xué)科”“歷史”“圖書館”“人工智能”等,表示這些主題詞被共現(xiàn)多次,同時這些主題詞也反映出國內(nèi)數(shù)字人文研究關(guān)注的熱點方向。

4 數(shù)字人文領(lǐng)域研究框架

通過對國內(nèi)數(shù)字人文領(lǐng)域文獻核心主題的識別,筆者抽取信息技術(shù)、數(shù)字藝術(shù)、文化遺產(chǎn)、歷史檔案、學(xué)科建設(shè)、人才培養(yǎng)6個主題,各主題之間相互支撐,并存在層次關(guān)系,形成了以信息技術(shù)為驅(qū)動,以數(shù)字藝術(shù)、文化遺產(chǎn)、歷史檔案等主要研究領(lǐng)域為學(xué)科建設(shè)突破口,以人才培養(yǎng)為最終目標的國內(nèi)數(shù)字人文領(lǐng)域研究框架(見圖4),為我國數(shù)字人文領(lǐng)域研究提供了理論支撐。

4.1 信息技術(shù)

數(shù)字人文是人文探索與信息技術(shù)之間動態(tài)對話的結(jié)果,因此信息技術(shù)是數(shù)字人文重要的驅(qū)動[21]。如圖3所示,信息技術(shù)所涉及的核心主題包括圖書館、學(xué)術(shù)、特征、挑戰(zhàn)等,這些內(nèi)容在一定程度上解釋了數(shù)字人文如何從數(shù)字到意義,如何從量化的證據(jù)和對象轉(zhuǎn)變?yōu)殛P(guān)于人文學(xué)科的文化、文學(xué)、藝術(shù)的研究,并解決了當下數(shù)字人文學(xué)科中激增的可視化需求等難題。(1)圖書館。以圖書館等機構(gòu)為代表,將數(shù)字人文作為實踐的新方向,圖書館憑借其獨特的優(yōu)勢融合信息技術(shù),能更好地為數(shù)字人文學(xué)科提供數(shù)字人文服務(wù)[22],如可以在數(shù)字人文專題信息服務(wù)、數(shù)字人文網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)、跨學(xué)科橋梁建設(shè)、數(shù)字人文項目孵化器建設(shè)等方面展開實踐[23]。(2)學(xué)術(shù)研究。數(shù)字人文研究本質(zhì)上是讓信息技術(shù)以一種更好的數(shù)字化方式重塑人文社科數(shù)據(jù)的意義價值。主要包括兩類:一類是基于統(tǒng)計的計量方法搭建數(shù)字人文通用平臺[24];另一類是利用機器學(xué)習(xí)、深度學(xué)習(xí)、知識圖譜等方法針對各領(lǐng)域、各專業(yè)構(gòu)建合適的神經(jīng)網(wǎng)絡(luò)模型、圖解模型等,以挖掘人文資料語義信息、形成專業(yè)領(lǐng)域知識圖譜等,豐富了人文研究的內(nèi)容和工具,如人工智能技術(shù)在古籍整理領(lǐng)域廣泛應(yīng)用于開展自動標注、自動校勘、自動注釋等工作[25]。(3)特征與挑戰(zhàn)。大數(shù)據(jù)、人工智能等信息技術(shù)有利于活化圖書館館藏資源,促進圖書館提供更加智慧化的服務(wù),并輔助人文學(xué)科開展研究。通常數(shù)字人文研究中會出現(xiàn)具有歷史一致性但缺乏語義連貫性的詞組,或者是具有語義連貫性但具有非歷史關(guān)系的語義場的情況。因此,數(shù)字人文研究在注重研究范式的同時,需要警惕不能忽視人文專業(yè)知識,應(yīng)平衡好研究問題與信息技術(shù)之間的關(guān)系。

4.2 數(shù)字藝術(shù)

數(shù)字藝術(shù)是指依托數(shù)據(jù)挖掘和計算方法對原始的藝術(shù)歷史文物等資源展開研究,以期用全新的方式揭示其特征,并促使從事藝術(shù)學(xué)研究的學(xué)者對數(shù)字化藝術(shù)呈現(xiàn)方式的重新定位、思索和發(fā)現(xiàn)。通過圖3可以看出,數(shù)字藝術(shù)所涉及的核心主題包括藝術(shù)、知識、人工智能等,反映出藝術(shù)學(xué)作為八大學(xué)科門類之一,隨著新文科政策的推動及以人工智能技術(shù)為代表的數(shù)字技術(shù)發(fā)展,所衍生的數(shù)字藝術(shù)成為其與計算機科學(xué)類學(xué)科交叉研究的熱點。以圖像藝術(shù)分析和計算機生成藝術(shù)為例,圖像藝術(shù)分析是指將數(shù)據(jù)挖掘和可視化技術(shù)引入傳統(tǒng)的藝術(shù)分析領(lǐng)域,從而借助數(shù)字技術(shù)實現(xiàn)新的藝術(shù)價值,如構(gòu)建特定領(lǐng)域藝術(shù)數(shù)據(jù)庫;計算機生成藝術(shù)是指以藝術(shù)數(shù)據(jù)為驅(qū)動,從事藝術(shù)學(xué)研究的學(xué)者借助人工智能等數(shù)字技術(shù)實現(xiàn)藝術(shù)創(chuàng)作[26]。可見數(shù)字藝術(shù)實現(xiàn)了人工智能技術(shù)與藝術(shù)的深度融合,搭建了藝術(shù)學(xué)家和計算機科學(xué)家之間的橋梁,進而豐富了數(shù)字人文研究內(nèi)容。此外,數(shù)字技術(shù)的使用還需以尊重藝術(shù)為前提,重視藝術(shù)學(xué)研究的理論和范式。如,隨著元宇宙的興起,各類數(shù)字藏品程序為人們傳承文化記憶作品和創(chuàng)作人文藝術(shù)提供方便,但同時僅依托技術(shù)呈現(xiàn)的作品藝術(shù)價值參差不齊,嚴重影響人們的審美取向。因此,數(shù)字藝術(shù)研究應(yīng)以藝術(shù)學(xué)研究為導(dǎo)向,以藝術(shù)學(xué)和計算機科學(xué)資源為依托,在進行知識重構(gòu)和增強藝術(shù)的同時確保藝術(shù)價值。

4.3 文化遺產(chǎn)

《“十四五”規(guī)劃和2035年遠景目標綱要》明確指出要推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展。文化遺產(chǎn)是中華優(yōu)秀傳統(tǒng)文化的重要組成,開展文化遺產(chǎn)數(shù)字人文研究為弘揚優(yōu)秀傳統(tǒng)文化提供了契機。從圖3可以看出,文化遺產(chǎn)所涉及的核心主題包括數(shù)字人文項目、強化、閱讀等,反映出文化遺產(chǎn)數(shù)字人文研究主要以數(shù)字人文項目為成果導(dǎo)向,由文化遺產(chǎn)專家主導(dǎo),以文化遺產(chǎn)為特定研究對象,運用數(shù)字人文技術(shù)、方法與理論的綜合性、跨學(xué)科研究活動[27],以實現(xiàn)從傳統(tǒng)的單人模式向協(xié)作生產(chǎn)項目的數(shù)字化轉(zhuǎn)型[16]。數(shù)字人文項目是開展數(shù)字人文服務(wù)最重要的實現(xiàn)途徑之一,也是數(shù)字人文領(lǐng)域?qū)W者開展研究的重要組成部分[28]。文化遺產(chǎn)作為數(shù)字人文項目的重要組成部分,對文化傳播和文化傳承起到助推作用。如馮惠玲[29]以“北京記憶·雙奧之城”數(shù)字展廳的建設(shè)為例,探討“雙奧”遺產(chǎn)數(shù)字化保存與傳播的應(yīng)用落地,以實現(xiàn)把燦爛悠久的中華文化呈現(xiàn)給世界,也把偉大的奧林匹克精神映照給中國。從整體上看,國內(nèi)文化遺產(chǎn)數(shù)字人文項目發(fā)展迅速,并且具備跨學(xué)科、跨機構(gòu)、跨區(qū)域特征的合作性項目開始顯現(xiàn)[30],但國內(nèi)數(shù)字人文項目的開展主要以高校、圖書館、美術(shù)館、博物館等為中心。為更好地促進文化遺產(chǎn)知識整合與資源建設(shè),未來應(yīng)由文化遺產(chǎn)專業(yè)學(xué)者牽頭,廣泛聯(lián)合企業(yè)及相關(guān)領(lǐng)域團體共同開展文化遺產(chǎn)數(shù)字人文項目,吸引更多的國內(nèi)外資源注入數(shù)字人文建設(shè)中,同時依托人文社科各個專業(yè)領(lǐng)域資源,以響應(yīng)國家文化強國戰(zhàn)略為目標,探索更多可持續(xù)發(fā)展的文化遺產(chǎn)數(shù)字人文項目。

4.4 歷史檔案

歷史檔案資源是我國歷史文化遺產(chǎn)的重要組成部分,也是我國珍貴的歷史憑證,具有重要的史料價值和情報價值,因此成為數(shù)字人文研究重要的對象和資源[31]。如圖3所示,歷史檔案所涉及的核心主題包括歷史、檔案館、回顧、視野、保護、路徑等,反映了在數(shù)字人文背景下檔案館成為開展數(shù)字人文研究的重要平臺,數(shù)字人文的信息技術(shù)賦能傳統(tǒng)檔案館的數(shù)字化建設(shè):歷史檔案資源整理與開發(fā)逐漸多元化[32],拓展了歷史檔案資源對象范圍[33],為歷史檔案資源知識聚合與知識發(fā)現(xiàn)研究提供有力地工具支撐,能夠更加真實地還原歷史、回顧歷史及擴大視野,同時也為歷史檔案資源提供了新的保護路徑。當下數(shù)字人文背景下歷史檔案研究主要圍繞歷史檔案資源庫建設(shè)[34]、歷史檔案資源的數(shù)字化整理[35]、口述歷史檔案資源知識圖譜構(gòu)建[36]等展開,隨著歷史檔案資源的多元、異構(gòu)及其知識化服務(wù)需求不斷提高,元數(shù)據(jù)標記與注釋等數(shù)據(jù)的結(jié)構(gòu)化整理與開發(fā)工作的難度也在不斷增加。因此,未來應(yīng)以服務(wù)需求為導(dǎo)向,優(yōu)化數(shù)字化技術(shù)體系,提高歷史檔案資源整理與開發(fā)的深度;以元宇宙虛擬空間為代表,形成多元化、多場景的歷史檔案資源數(shù)字化成果展示,促進歷史檔案資源的開發(fā)與利用。

4.5 學(xué)科建設(shè)

國內(nèi)高校以信息資源管理學(xué)科為發(fā)展基礎(chǔ),通過設(shè)立數(shù)字人文學(xué)位或開展數(shù)字人文課程確定數(shù)字人文的學(xué)科屬性。中國人民大學(xué)率先在信息資源管理一級學(xué)科下設(shè)置了我國第一個數(shù)字人文二級學(xué)科學(xué)術(shù)型博士點,旨在促進雙一流建設(shè),立足學(xué)科前沿,助力學(xué)科轉(zhuǎn)型,引領(lǐng)國內(nèi)數(shù)字人文新興學(xué)科建設(shè),創(chuàng)新人才培養(yǎng),提升學(xué)生綜合素質(zhì)。國內(nèi)很多開展數(shù)字人文二級學(xué)科建設(shè)的院校以數(shù)字藝術(shù)、文化遺產(chǎn)、歷史檔案等主要研究領(lǐng)域為具體研究方向,而開展數(shù)字人文學(xué)科建設(shè)還需要充分考慮其學(xué)科特征。通過圖3可以看出,數(shù)字人文學(xué)科特征所涉及的核心主題包括學(xué)科、協(xié)同、全球、核心、變化、超越、轉(zhuǎn)型等,反映出數(shù)字人文跨學(xué)科的典型特征。具體體現(xiàn)在:(1)協(xié)同性。一方面指學(xué)科間的協(xié)同性,數(shù)字人文研究的內(nèi)容以尊重各學(xué)科基礎(chǔ)的屬性為前提和核心,將數(shù)字人文學(xué)科發(fā)展的根本問題聚焦于人文學(xué)科本身的學(xué)科身份,對數(shù)字人文學(xué)科從理解逐漸上升到解釋的水平[6],同時注重學(xué)科之間相互協(xié)同、共同參與。有學(xué)者對數(shù)字人文類國家社科重大項目進行分析,結(jié)果呈現(xiàn)出明顯的跨學(xué)科特征,涵蓋人文社會科學(xué)領(lǐng)域和自然科學(xué)領(lǐng)域相關(guān)學(xué)科[37]。另一方面指人文與技術(shù)的協(xié)同性。北京大學(xué)圖書館開設(shè)“數(shù)字人文工作坊”,就人文和技術(shù)的某些專題進行交流和討論,旨在豐富人文社會科學(xué)領(lǐng)域師生的相關(guān)知識、擴展人文社會科學(xué)領(lǐng)域和信息科學(xué)領(lǐng)域師生對彼此研究領(lǐng)域的興趣,并促進二者的互動與跨界融合。(2)跨區(qū)域性。全球化視野是數(shù)字人文學(xué)科的典型特征,一方面,是活化傳統(tǒng)文化資源、講好中國故事、弘揚中華優(yōu)秀傳統(tǒng)文化的需要;另一方面,對接國際數(shù)字人文交流有利于培養(yǎng)具備互聯(lián)網(wǎng)思維、數(shù)據(jù)分析能力、跨學(xué)科知識背景的研究和教學(xué)的復(fù)合型人才[38]。

4.6 人才培養(yǎng)

人才培養(yǎng)是數(shù)字人文發(fā)展與建設(shè)的最終目標,同時數(shù)字人文人才培養(yǎng)符合新文科建設(shè)的人才需求定位,是對新文科人才建設(shè)方針的具體落實[39]。通過圖3可以看出,數(shù)字人文人才培養(yǎng)所涉及的核心主題包括高校、整合、深化等,表明數(shù)字人文人才培養(yǎng)主要以高校學(xué)科資源為依托,強調(diào)在人文學(xué)科專業(yè)性的基礎(chǔ)上培養(yǎng)具有較高人文素養(yǎng)、數(shù)據(jù)分析能力、信息技術(shù)能力及信息資源管理能力的復(fù)合型創(chuàng)新人才。具體體現(xiàn)在:(1)教育創(chuàng)新與實踐。2021年11月,教育部辦公廳發(fā)布《關(guān)于公布首批新文科研究與改革實踐項目的通知》,來自全國高校的1011個項目入選首批新文科研究與實踐項目,包括政產(chǎn)學(xué)研協(xié)同育人機制創(chuàng)新與實踐、文科復(fù)合型人才培養(yǎng)創(chuàng)新與實踐等,旨在培養(yǎng)運用數(shù)字人文研究范式思考并解決人文社科研究問題的跨學(xué)科人才,標志著我國高校新文科建設(shè)和數(shù)字人文建設(shè)進入了實施階段[40]。由南京大學(xué)與中國索引學(xué)會主辦的“時代經(jīng)緯:邁向新文科的數(shù)字人文”學(xué)術(shù)研討會中,除了開展學(xué)術(shù)交流外,開創(chuàng)性地設(shè)置了“數(shù)字人文開放數(shù)據(jù)創(chuàng)新研究大賽”[41]。(2)學(xué)術(shù)平臺搭建。高校依托校內(nèi)圖書館、計算機學(xué)科、人文學(xué)科等資源,并融合業(yè)界資源陸續(xù)成立了數(shù)字人文研究中心,形成培養(yǎng)數(shù)字人文人才的重要趨勢。繼2011年武漢大學(xué)成立國內(nèi)第一個數(shù)字人文研究中心之后,北京大學(xué)、清華大學(xué)、南京大學(xué)、中國人民大學(xué)等高校也陸續(xù)成立數(shù)字人文研究中心,這些研究中心的創(chuàng)建與應(yīng)用是促進我國數(shù)字人文人才培養(yǎng)的組織保障。上述舉措,為培養(yǎng)數(shù)字人文人才起到了引領(lǐng)和示范作用,同時揭示了當下數(shù)字人文發(fā)展面對的挑戰(zhàn)和亟須解決的問題——培養(yǎng)技術(shù)與學(xué)術(shù)能力兼?zhèn)涞膶W(xué)科專業(yè)人才、構(gòu)建多學(xué)科交叉的課程體系、打造學(xué)科交叉的學(xué)術(shù)團體等。

筆者以CNKI數(shù)據(jù)庫為數(shù)據(jù)源,綜合使用LDA主題模型、Word2Vec及共現(xiàn)分析方法對數(shù)字人文研究文獻的篇名、摘要和關(guān)鍵詞進行抽取,得到6個主題,形成以信息技術(shù)為驅(qū)動,以數(shù)字藝術(shù)、文化遺產(chǎn)、歷史檔案等主要研究領(lǐng)域為學(xué)科建設(shè)突破口,以人才培養(yǎng)為最終目標的國內(nèi)數(shù)字人文領(lǐng)域研究框架,旨在為國內(nèi)數(shù)字人文領(lǐng)域研究提供理論支撐。該研究框架是面向數(shù)字人文動態(tài)發(fā)展過程研究的參考框架,具有可調(diào)節(jié)性。隨著數(shù)字人文研究的不斷推進,可逐步完善數(shù)字人文領(lǐng)域研究框架,以服務(wù)國家數(shù)字人文建設(shè)。因此,筆者的貢獻有兩點:一是創(chuàng)建了一種用于數(shù)字人文領(lǐng)域文獻主題識別的方法,通過LDA主題聚類和共現(xiàn)分析能夠有效提取國內(nèi)數(shù)字人文研究的重點主題;二是形成了國內(nèi)數(shù)字人文領(lǐng)域基于文獻研究的框架,為我國數(shù)字人文領(lǐng)域研究提供理論支撐。

參考文獻:

[1] 教育部新文科建設(shè)工作組.《新文科建設(shè)宣言》[EB/OL].[2023-04-20].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzd

t/s5987/202011/t20201103_498067.html.

[2] 蔡迎春.數(shù)字人文評價:學(xué)科性、專業(yè)性、技術(shù)性[J].中國圖書館學(xué)報,2021(4):86-96.

[3] 劉煒,葉鷹.數(shù)字人文的技術(shù)體系與理論結(jié)構(gòu)探討[J].中國圖書館學(xué)報,2017(5):32-41.

[4] 蔡迎春,嚴丹,王健.基于“共享場景”的數(shù)字人文實驗室建設(shè)[J].圖書館雜志,2022(11):94-103,113.

[5] 柯平,宮平.數(shù)字人文研究演化路徑與熱點領(lǐng)域分析[J].中國圖書館學(xué)報,2016(6):13-30.

[6] 李晚蓮,田俊欽.國際數(shù)字人文領(lǐng)域研究前沿探測與發(fā)展趨勢分析:基于詞嵌入和主題建模技術(shù)[J].高校圖書館工作,2021(3):22-28.

[7] 魯國軒,楊冠燦,宋欣.圖情領(lǐng)域數(shù)字人文文獻識別與分類方法研究[J].情報科學(xué),2022(9):154-158,192.

[8] Fangli S,Yin Z. Research output, intellectual structures and contributors of digital humanities research: a longitudinal analysis 2005—2020[J].Journal of Documentation, 2022(3):673-695.

[9] Soohyung J,Jennifer H,Marie K. Exploring the digital humanities research agenda: a text mining approach[J]. Journal of Documentation, 2022(4): 853-870.

[10] 王麗華,劉煒,劉圣嬰.數(shù)字人文的理論化趨勢前瞻[J].中國圖書館學(xué)報,2020(3):17-23.

[11] 唐江浩,盧章平,蘇文成.人文學(xué)者數(shù)字學(xué)術(shù)能力理論框架構(gòu)建研究——基于數(shù)字人文視角[J].圖書館,2020(11):47-55.

[12] 左娜,張衛(wèi)東.數(shù)字人文多主體共生分析框架及其關(guān)鍵問題[J].情報理論與實踐,2021(1):96-101.

[13] 饒梓欣,許鑫.數(shù)字人文項目管理框架構(gòu)建研究[J].圖書館論壇,2022(11):122-131.

[14] Blei, M.D. Probabilistic topic models[J]. Communications of the ACM, 2012(4):77-84.

[15] Blei, M.D, Ng, YA,Jordan I M. Latent Dirichlet allocation[J].Journal of Machine Learning Research,2003(3):993-1022.

[16] Mikolov T, et al. Distributed representations of words and phrases and their compositionality[J].CORR,2013,abs/1310.4546.

[17] 張濤,馬海群.我國大數(shù)據(jù)政策主題分析及發(fā)展動向研判[J].情報理論與實踐,2022(3):72-80.

[18] 張濤,馬海群.基于政策文本計算的開放數(shù)據(jù)與數(shù)據(jù)安全政策協(xié)同研究[J].情報理論與實踐,2020(6):149-155,141.

[19] LTG,Mark S. Finding scientific topics[J].Proceedings of the National Academy of Sciences of the United States of American,2004(6):5228-5235.

[20] Jiang L,Zhang T,Huang T.Empirical Research of Hot Topic Recognition and its Evolution Path Method for Scientific and Technological Literature[J].Journal of Advanced Computational Intelligence and Intelligent Informatics, 2022(3):299-308.

[21] Wang Q. Distribution features and intellectual structures of digital humanities A bibliometric analysis[J]. Journal of Documentation, 2018(1): 223-246.

[22] Wong S H R. Digital Humanities: What Can Libraries Offer?[J].Portal:Libraries and the Academy,2016(4):669-690.

[23] 朱本軍,聶華.數(shù)字人文:圖書館實踐的新方向[J].大學(xué)圖書館學(xué)報,2017(4):23-29.

[24] 王麗華,劉煒.助力與借力:數(shù)字人文與新文科建設(shè)[J].南京社會科學(xué),2021(7):130-138.

[25] 韓業(yè)庭.當古籍修復(fù)遇上人工智能[N].光明日報,2022-04-11(009).

[26] 金家琴,夏翠娟.數(shù)字人文在視覺化藝術(shù)領(lǐng)域的應(yīng)用前沿——圖像藝術(shù)分析與計算機生成藝術(shù)[J].圖書館雜志,2021(6):101-109,132.

[27] 胡娟,柯平.我國文化遺產(chǎn)數(shù)字人文研究的推進策略分析[J].圖書館雜志,2023(4):78-87,140-145.

[28] 歐陽劍,蔡迎春,王健.數(shù)字人文項目可持續(xù)性研究[J].圖書館雜志,2021(11):90-98,116.

[29] 馮惠玲,任瑾,陳怡.北京“雙奧”遺產(chǎn)的數(shù)字化保存與傳播[J].圖書情報知識,2022(3):22-31.

[30] 沈立力,等.漢語語境下數(shù)字人文項目分析與啟示——2020年數(shù)字人文年會(DH2020)項目評選綜述[J].圖書情報工作,20215(24):4-17.

[31] 李子林,王玉鈺,龍家慶.數(shù)字人文與檔案工作的關(guān)系探討[J].浙江檔案,2018(7):13-16.

[32] 楊茜茜.數(shù)字人文視野下的歷史檔案資源整理與開發(fā)路徑探析——兼論檔案管理中的歷史主義與邏輯主義思想[J].檔案學(xué)通訊,2019(2):17-22.

[33] 加小雙,姚靜.數(shù)字人文賦能檔案資源體系建設(shè):機制與路徑[J].山西檔案,2022(3):19-27.

[34] 陳宇.古籍數(shù)字人文平臺對民國檔案開放利用的借鑒意義[J].檔案管理,2021(3):88-89,91.

[35] 梁繼紅.走向文本的歷史檔案數(shù)字整理:歷史追溯與時代轉(zhuǎn)型(上)[J].檔案學(xué)通訊,2021(5):95-103.

[36] 鄧君,王阮.口述歷史檔案資源知識圖譜與多維知識發(fā)現(xiàn)研究[J].圖書情報工作,2022(7):4-16.

[37] 趙宇翔,練靖雯.數(shù)字人文類國家社科基金重大項目的學(xué)科屬性與合作特征[J].圖書館論壇,2022(1):102-116.

[38] 南京大學(xué)高研院數(shù)字人文創(chuàng)研中心.“數(shù)字人文”國際合作聯(lián)盟計劃[EB/OL].[2023-04-20].https://digitalhumanities.nju.edu.cn.

[39] 王濤.從人才培養(yǎng)看數(shù)字人文對新文科的引領(lǐng)[EB/OL].[2023-04-20].https://baijiahao.baidu.com/s?id=167623

3971652957778amp;wfr=spideramp;for=pc.

[40] 中華人民共和國教育部.教育部辦公廳關(guān)于公布首批新文科研究與改革實踐項目的通知[EB/OL]. [2023-04-20].http://www.moe.gov.cn/srcsite/A08/moe_741/202111/t20211110_578852.html.

[41] 彭韻筑,王潤琦.邁向新文科的數(shù)字人文——第三屆中國數(shù)字人文大會綜述[J].數(shù)字人文研究,2022(1):3-12.

冷雪卓 女,1982年生。碩士研究生在讀,副研究館員。研究方向:數(shù)字圖書館與圖書館管理。

張 濤 男,1981年生。博士,教授,碩士生導(dǎo)師。研究方向:政策文本計算與數(shù)據(jù)分析。系本文通訊作者。

崔文波 男,1998年生。碩士研究生在讀。研究方向:文本分析與知識發(fā)現(xiàn)。

(收稿日期:2023-04-23;責(zé)編:劉曉霞。)

主站蜘蛛池模板: 99久久精品国产自免费| 97青青青国产在线播放| 欧美a√在线| 国产黄网站在线观看| 99精品国产自在现线观看| 中文字幕在线观看日本| 国产美女91视频| 亚洲欧美一区二区三区图片| 国产91成人| 国产成人91精品免费网址在线| 亚洲AV成人一区二区三区AV| 亚洲男人的天堂在线观看| 日韩精品毛片| 国产小视频在线高清播放 | 在线亚洲精品自拍| AV在线天堂进入| 伊人久久大香线蕉影院| 51国产偷自视频区视频手机观看| 国产成人av一区二区三区| 日本免费a视频| 久久国产成人精品国产成人亚洲 | 在线观看网站国产| 在线五月婷婷| 国产无码高清视频不卡| 在线观看91精品国产剧情免费| 国内精品视频| 欧美视频免费一区二区三区| 国产迷奸在线看| 亚洲视频三级| 亚洲愉拍一区二区精品| 亚洲日本中文字幕乱码中文| 欧洲日本亚洲中文字幕| 亚洲视屏在线观看| 欧美成人免费一区在线播放| 久久久久国产精品嫩草影院| 99久久精品国产自免费| AV无码无在线观看免费| 2020亚洲精品无码| 亚洲国产成人综合精品2020| AV网站中文| 欧美日韩高清在线| 高清色本在线www| a欧美在线| 日韩欧美色综合| 视频国产精品丝袜第一页| 中国黄色一级视频| 亚洲人成网18禁| 久久青草视频| 五月激情综合网| 国产精品欧美激情| 四虎在线高清无码| 亚洲人精品亚洲人成在线| 国产在线视频欧美亚综合| 亚洲欧美日韩成人在线| 狠狠色婷婷丁香综合久久韩国 | 国产经典免费播放视频| 2019年国产精品自拍不卡| 最新国产精品第1页| 精品伊人久久大香线蕉网站| 在线观看91精品国产剧情免费| 成年看免费观看视频拍拍| 欧美精品xx| 六月婷婷精品视频在线观看 | 亚洲人成网站日本片| 免费毛片全部不收费的| 1024你懂的国产精品| 日本黄色不卡视频| 第九色区aⅴ天堂久久香| 91在线播放国产| 国产成人精品男人的天堂下载 | 亚洲欧美色中文字幕| 亚洲天堂视频在线观看| 欧美、日韩、国产综合一区| 久久永久精品免费视频| 亚洲AV无码乱码在线观看裸奔| 黄色三级毛片网站| 狠狠色丁香婷婷综合| 亚洲无码视频一区二区三区| 成人福利在线免费观看| 九色免费视频| 中文字幕有乳无码| 国产视频欧美|