999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國際數字人文研究的演化路徑與熱點主題分析

2021-06-07 06:41:40
圖書館 2021年5期
關鍵詞:研究

李 娜

(華南理工大學圖書館 廣州 510640)

數字人文(Digital Humanities)是一種將計算機方法與技術融入人文研究,進而提出并回答人文問題的新范式。“數字人文”一詞在英美學術界相關期刊陸續出現,相關研究課題層出不窮,其名稱和定位也經歷了由“人文計算(humanities computing)”到“數字人文”的轉變。究其大略,其演進與計算機技術的發展呈正相關關系,20世紀90年代起個人電腦的廣泛普及促進了其研究的豐富,近年人工智能技術的興起,對其發展起到了推波助瀾的作用。在這種新技術的強大沖擊下,國內外學者積極投身于數字人文理論和實踐的研究中,從不同角度探討數字人文領域存在的問題及其解決方案。本研究采用專業的檢索策略,同時進行主題檢索、標題檢索和期刊檢索,依托科技文本挖掘及信息可視化技術,對2001—2020年國際數字人文研究文獻進行定量和定性分析,既從微觀視域在一定范圍內探討數字人文研究的知識基礎,又同時嘗試以宏觀的視角分析、整理和歸納數字人文領域的研究熱點和演化路徑,以期為未來我國數字人文理論研究和實踐探索提供有價值的參考。

1 數據來源與研究方法

1.1 數據來源

本研究以Web of Science核心合集中的姊妹版數據庫組合SCIE數據庫和SSCI數據庫為數據源。這兩個數據庫收錄的均是經過嚴格遴選的核心學術期刊中的世界一流學術文獻,這樣可以最大限度地保證研究樣本的權威性和代表性。為了避免樣本數據出現漏檢和誤檢的情況,我們將檢索詞進行不同方式的組合與檢索,判讀檢索結果的合理性,設計和調整出更加有效的檢索策略。例如,簡單地采用“digital humanities”或者“humanities computing”進行檢索,檢索結果會出現漏檢情況;采用“digital” and“humanities”或者“humanities” and “computing”進行檢索,這樣的檢索范圍過大,又會出現數據誤檢情況。鑒于此,本研究最終確定在檢索式中應用位置算符(NEAR),同時解決了漏檢和誤檢問題。表面上看,這樣的檢索策略是合理的,其實檢索結果仍存在很大問題,主要是文獻數據過于單一,僅檢索到了涉及相關檢索詞的文獻,更多與研究主題相關的深層次數據未能檢索出來,所以必須考慮相關領域專業期刊的檢索。Literary and Linguistic Computing(《文學與語言計算》)是國際上數字人文領域的主要期刊,該期刊于2008年創刊,2015年更名為Digital Scholarship in the Humanities(《人文領域的數字學術》),作為歐洲數字人文協會的同行評議學術期刊,收錄了計算和信息技術應用于藝術和人文研究各個方面的原創性文獻。Computers and the Humanities(《計算與人文》)創刊于1966年,旨在刊載將計算機方法應用于人文科學領域的重大研究,但是SCI數據庫僅收錄了該刊2001—2004年的文獻。這兩種期刊均有較高的收錄標準,具有較強的專業性和時效性,提供的數據也具有較高的質量。本研究將主題檢索、標題檢索和出版物名稱檢索相結合,以確保檢索結果的合理性和有效性。檢索內容與檢索結果如表1所示。

表1 研究數據獲取方式

1.2 研究方法

本研究利用VOSviewer工具將浩如煙海的文獻數據轉換成可視化知識圖譜。VOSviewer中VOS的含義是visualization of similarities,即相似的可視化。運行VOSviewer生成的可視化圖譜為網絡圖,分析的對象既可以是施引文獻也可以是被引文獻。首先,選擇對被引文獻進行分析,國際數字人文研究領域的知識基礎演進歷程集中展現在共被引(co-citations)分析網絡中,作為知識基礎的引文節點文獻(cited references)根據親緣關系自動形成聚類。這種引文分析有助于捋清國際數字人文知識的發展脈絡,以及在其演變過程中起關鍵作用的文獻。其次,選擇對施引文獻進行分析,通過共現(co-occurrence)網絡分析揭示國際數字人文研究領域的知識單元或知識群之間的網絡、結構、互動、交叉等諸多隱含的復雜關系,在VOSviewer中使用節點來表達所分析的知識單元,節點顏色表達所屬的不同聚類,每個聚類代表了一個研究主題,進而形成了國際數字人文研究領域的熱點主題群。再次,利用CiteSpace軟件考察詞頻的時間分布,選擇時區顯示功能,生成反映近二十年國際數字人文研究的知識演進的時區圖譜,確定國際數字人文研究的前沿領域和發展趨勢。

2 知識基礎

本研究應用VOSviewer工具,選擇科技文獻共被引分析功能,默認以引證次數≥20為條件進行數據篩選,從35 137篇參考文獻中,選出滿足閾值的16篇文獻,得到文獻共被引分析的可視化結果,如圖1所示。在文獻共被引分析網絡中,自動生成2個聚類知識群,表示從兩個角度展示出“數字人文”研究領域的基礎文獻知識分布情況。節點的大小反映文獻被引用總頻次的高低,節點的顏色表示所屬的聚類,聚類I(紅色標識)由9個關鍵節點組成(即9篇文獻),聚類II(綠色標識)由7個關鍵節點組成(即7篇文獻),根據文獻的被引頻次對16篇文獻進行排序,詳見表2。

圖1 文獻共被引分析的可視化結果

高被引文獻通常在其研究領域具有較大的影響力,也是學術同行極為關注的文獻,具有奠基意義。從表2可以發現,在數字人文的發展過程中,有大批優秀的學者可謂數字人文基礎研究的領軍人物,例如Burrows J、Jockers M L、Moretti F等學者,在排名前16的高被引文獻中每人分別有2篇代表性著作或文獻,可見他們不僅僅是數字人文基礎研究的高產學者,而且其研究成果及學術思想對后期的學術研究也產生了不容小覷的影響,成為數字人文研究領域的知識基礎。筆者結合圖1和表2,從學術研究思想的角度對高被引文獻兩個知識集群進行總體分析。

表2 國際數字人文研究領域高被引參考文獻統計(Top16)

2.1 作者身份識別

“作者身份識別”研究歷史由來已久,1994年英國西英格蘭大學學者Holmes D I就開始關注作者身份識別,考慮了文學風格的量化問題,探討了可作為作家文體“指紋”的幾個變量,并將這些變量作為作者風格的識別指標[1],該研究在數字人文研究領域具有開創性意義。澳大利亞紐卡斯爾大學學者Burrows J有兩篇經典文獻被引頻次均排名前列,其中一篇被引頻次雄居首位,可謂數字人文研究領域的奠基之作。該學者從計算語言學的視角出發,提出了基于詞頻受控對比的作者身份識別方法,即Delta,并驗證了該檢測方法的準確性,在一定程度上有助于深入挖掘科學研究背后的學者身份信息,也有助于拓展語言學研究的視野[2-3]。其后,美國紐約大學學者Hoover D L對Burrows J提出的“Delta”方法進行了檢測,明確了該檢測方法的有效性和準確性,并指出其在散文和詩歌上的檢測效果差不多,以及刪除人稱代詞可以提高Delta檢測的準確性[4]。Grieve J對作者身份歸屬研究中常用的39種不同類型的文本測量結果進行比較,以確定哪些是作者身份的最佳指標,提出了一種更準確的定量化作者身份識別的方法,該方法可以對多種不同文本進行度量分析[5]。希臘愛琴海大學學者Stamatatos E從文本表示和文本分類特征來研究作者身份識別,并進一步討論作者身份識別研究的評估方法和標準[6]。美國斯坦福大學學者Jockers M L提出了基于機器學習的作者身份識別方法,主要對有爭議的論文和通常被認為是共同撰寫的論文進行分類。測試過程由兩個單獨的功能集執行:其一是“原始”功能集,包含所有作者共有的所有單詞和單詞二元組;其二是“預處理”功能集,將原始功能集簡化為包含僅滿足最小相對頻率閾值的單詞,測試結果良好[7]。

2.2 遠距離閱讀

美國斯坦福大學學者Moretti F有兩本關于“遠距離閱讀”研究的經典著作均躋身被引頻次排名前列,可謂數字人文研究領域既高產又高質的學者。Moretti F是最早提出“遠距離閱讀”這一術語的學者,他認為文學研究是隨機的、不是系統的,強調文學學者應該停止閱讀書籍,開始計算、繪圖和映射,這一舉動可能會給學科領域帶來新的光彩[8]。他將“遠距離閱讀”定義為“遠遠超出作者預期的解讀”,提出用Z值、主分量分析和聚類系數等備受爭議的文學分析模式,認為這將是非主流文學研究一個正在興起的領域[9]。2003年,美國加州大學伯克利分校學者Blei D M等提出了潛在狄利克雷分布(LDA)模型,這是一種用于收集離散數據(例如文本語料庫)的概率模型,同時還提出了基于變分方法和經驗貝葉斯參數估計的EM算法的有效近似推理技術[10]。此后,美國馬里蘭大學學者Susan Schreibman等研究了計算方法在文學研究中的應用,介紹了人文計算的基本原理、方法和應用以及文本生產、傳播和存檔的內容,這些均屬于人文計算方法的基礎性研究[11];英國倫敦國王學院學者McCarty W結合哲學、歷史、人種學和批判性觀點,闡述了如何通過計算幫助完成人文科學的基本任務,并提出更多具有挑戰性的學術問題[12];美國哈佛大學學者Michel JB構建了一個數字化文本語料庫,定量分析了1800年至2000年英語數字書籍所反映的語言和文化現象,并為詞典編纂、語法演變、集體記憶等領域的研究提供見解[13]。2012年,美國紐約城市大學學者Gold M K撰寫的《數字人文學科辯論》的出版,標志著數字人文已經成為一個學科領域。數字人文不僅具有傳統學科領域的數字檔案、定量分析和工具構建的特征,還涵蓋了更廣泛的方法和實踐內容,即大型圖像集的可視化、歷史文物的3D建模、“天生數字學位論文、移動創客空間等[14]。同年,美國藝術中心設計學院學者Burdick A回答了“什么是數字人文科學?”這一經典問題,進一步探討了與傳統的人文探究模式所不同的方法和技術,其中包括地理空間分析、數據挖掘、語料庫語言學、可視化和模擬[15]。次年,美國斯坦福大學學者Jockers M L基于大規模的文學計算和宏觀分析方法,提出一種文學研究的新方法,幫助讀者更好地理解文學作品并對其進行情境化[16]。

3 演化路徑

本研究利用CiteSpace軟件構建國際數字人文研究的共現網絡關系,再將其轉換成從時間維度來表示知識演進的時區視圖,以便清晰地展示出文獻的更新和相互關系。將高頻關鍵詞定位在一個橫軸為時間的二維坐標系中,一個從左到右、自上而下的知識演進圖就直觀呈現了,可以清晰地描繪出2001—2020年國際數字人文研究的動態演化歷程,詳見圖2。依據關鍵詞分布的親疏程度,將國際數字人文研究大致劃分為3個時期,詳細分析如下。

圖2 國際數字人文研究演化路徑圖譜

3.1 初始期(2001—2007)

從圖2可以看出,2005—2007年這段時間的關鍵詞明顯變少,這是由于期刊Computers and the Humanities被SCIE數據庫收錄的截止時間是2004年,故時區圖譜上顯示出一段空白區域。這一時期相對活躍的研究主題是“digital library(數字圖書館)”“database(數據庫)”“corpus(語料庫)”“corpus linguistics(語料庫語言)”“dialectology(方言學)”“dialectometry(方言學)”“dialect(方言)”“language(語言)”“authorship attribution(作者身份識別)”。2002年國際數字人文組織聯盟(The Alliance of Digital Humanities Organizations,ADHO)成立,2005年國際數字人文中心網絡(Center Net)成立。上述組織的相繼成立向全球知識界傳遞了一個重要信號,明確將著力拓展數字人文研究的深度和廣度。隨著數字圖書館的不斷發展,大規模“語料庫”和“數據庫”的建設成為現實。“語料庫”與“方言學”是相互支撐、相互促進的關系,“語料庫”的發展為“方言學”研究提供了得力的手段和工具,“方言學”的發展反過來促進“語料庫”的完善。“作者身份識別”與“語料庫”之間也存在著內容聯系,傳統“作者身份識別”研究通常是對特定“語料庫”中的文學作品進行作者分析,這些早期研究主要基于一元文體特征,限于長文體的文學作品以及作者人數較少的情況。

3.2 發展期(2008—2013)

與上一時期相比,這一時期的關鍵詞明顯驟增,是因為期刊Literary and Llinguistic Computing于2008年創刊,收錄了大量數字人文領域的研究成果。這一時期“digital humanities(數字人文)”的主導地位已然無法撼動,充分彰顯了其學術影響力。隨著數字化技術的迅猛發展,數字人文研究逐漸由表象走向具體,“semantic web(語義網)”“big data(大數據)”“social network(社交網絡)”“ontology(本體論)”“digital history(數字歷史)”“interdisciplinarity(跨學科)”等熱點詞匯頻繁涌現。語義網、大數據、社交網絡的發展開啟了數字人文研究的新模式,利用語義技術將分散異構的大數據轉換成機器可讀、關聯共享可理解的優質數據,為人文學者提供龐大的、開放的數字資源。與此同時,數字人文各個分支領域的學者試圖顯性地勾勒出學科“本體論”的理論輪廓和框架,明確學科研究的基本面貌,還原學科研究之“本”,構建學科研究之“論”。同時,數字人文方法賦予了歷史科學全新的空間感和立體感,拓展了歷史傳播的深度、廣度與維度,歷史科學與數字人文“跨學科”融合成為已然之實,“數字歷史”這一新學科的誕生也是必然之勢。

3.3 深化期(2014—2020.9)

當科學技術發生顛覆性創新時都會涌現出大量的研究主題,這種客觀規律是符合事物發展方向的,數字人文研究也不例外。“mapping(圖像)”“modeling(建模)”“model(模型)”“visualization(可視化)”“cultural heritage(文化遺產)”“crowdsourcing(眾包)”“literacy(素養)”“twitter(推特)”代表了這一時期的主題特征。由于GIS技術、網絡媒體、人工智能技術等前沿科技的發展,數字人文研究的范式正在發生深刻變革,打破了時間和空間的束縛,實現了由“文本”到“圖像”“地圖”“模型”的動態的“可視化”轉變,散見于世界各地的“文化遺產”實現共建和共享,使研究者和公眾有了一個完整的視野來看待相互連接的文化和歷史。為了解決海量計算、大規模樣本采集、多樣性分析等問題,基于群眾智慧的“眾包”模式將極大地促進數字人文研究的深化和突破。隨著數字人文研究的深入,數據“素養”必然會成為關注熱點,數字人文快速發展為數據“素養”的深化提供了契機與沃土,兩者相互融合與促進。另外,Twitter社交網絡平臺因其對數據下載的開放和友好,逐漸成為數字人文學術圈(至少是西方學術圈)最受歡迎的社交網絡平臺,不僅支持學者間的學術交流,還支持學術活動的實時討論。

另外,縱觀上述三個時期的階段圖可以看出,圖書館是貫穿數字人文研究全過程的熱點話題。“digital library(數字圖書館)”“library(圖書館)”“academic library(學術圖書館)”這三個關鍵詞分布于不同時段,由“數字圖書館”過渡到“學術圖書館”,體現了圖書館與數字人文研究在共同成長。數字人文與圖書館服務轉型有著較強的關聯性,這種關聯不僅涉及文獻保存、信息資源開發、出版發行、學術交流等層面,還引發了學術界人文項目開發等各類議題,包括文本挖掘、圖像處理、地理信息系統、數字化存儲與檢索等項目的展開,數字人文所產生的創新賦能對引導和維護圖書館服務定位起到關鍵性作用。

4 研究熱點

關鍵詞是對文獻主題的高度概括和凝練,通過對某學科領域文獻高頻關鍵詞的提煉分析,可以全面了解和把握文獻的內容結構及相互聯系,同時還可以推斷出大致研究方向和熱點主題。本研究利用VOSviewer可視化軟件工具對樣本數據的關鍵詞進行提取,統計出共現頻率閾值為5的有實際意義的高頻關鍵詞(共83個),構建出關鍵詞共現分析的可視化網絡,根據關鍵詞之間的關聯強度自動生成主題聚類,各個聚類的節點和連線以不同顏色加以區分,如圖3所示。

圖3 國際數字人文高頻關鍵詞共現圖譜

表3 國際數字人文熱點主題歸納

從圖3可以看出,國際數字人文關鍵詞主要分為7個知識群,即7個熱點聚類。本文分別對每個聚類構建密度視圖,根據各個關鍵詞的密度分布情況,歸納出熱點主題,詳見表3。在密度視圖中,主要區域用藍色和黃色來表示密度分布,藍色表示低密度區域,黃色代表高密度區域,某個關鍵詞周圍的其他關鍵詞越多、權重越大、與其他關鍵詞的距離越近,那么該關鍵詞的密度越大。在分析過程中,筆者刻意忽略一些無特殊意義的關鍵詞,重點關注帶有明顯學科特征的關鍵詞,再結合對大量“數字人文”相關文獻的閱讀和理解,對國際數字人文研究的熱點主題進行整理與歸納。

4.1 GIS技術

在大數據時代,人文學和社會科學的發展更加注重定量化和空間化。GIS(地理信息科學)與人文學、社會科學進行了深度融合,以其強大的空間數據管理、空間分析和地圖可視化功能有效地支撐了人文學和社會科學的研究,并成為數字人文研究的重要組成部分[17]。GIS可以有效地處理空間實體,并提供復雜的建模和分析功能來處理空間問題,有學者基于GIS中的點、線和多邊形技術研究語言和文化的表達形式[18]。Zhu Suoling將GIS技術應用于中國古代地方志的開發和利用,以實現有關廣東省地方志中分散的歷史數據的挖掘和可視化[19]。另外,人文地理信息系統(Humanities GIS)位于藝術與科學的交匯處,Charles Travis討論了兩個HumGIS模型的概念化和可操作性,第一個模型用于執行可視化的地理歷史分析,第二個模型將Ulysses整合到社交媒體地圖中,以解釋全球范圍內的數字生態系統空間表現[20]。為了測試GIS是否可以用來繪制主觀空間經驗的表達所提供的定性數據,David Cooper等使用GIS探索兩個英格蘭湖區旅行地圖中文本說明之間的空間關系[21]。

4.2 文化遺產

文化遺產是人類社會在歷史實踐中所創造的具有文化價值的財富遺存,具有不可再生性。數字技術的發展,推動了文化遺產數字化傳播與保護的進程[22]。A. Marco Fiorucci等學者對機器學習在文化遺產中的應用進行了批判性研究,分析了機器學習、監督、半監督和無監督之間的主要分歧,并對各種算法的廣泛應用進行深入思考[23]。Kim Seulah等學者建議使用數字技術促進韓國非物質文化遺產的可持續性發展,提出利用虛擬現實技術創建博物館的展覽內容,以鼓勵公眾參與和了解非物質文化遺產[24]。Emanuela Grifoni研究了3D多源多波段模型在文化遺產中的應用,采用3D多波段/多光譜重建技術,構建和比較使用常規數碼相機(RGB和UV)和多波段相機(IR)獲得的3D多波段模型,并對兩幅世界名畫進行重建繪畫[25]。Francesca Tomasi探討了模型和建模在數字人文科學領域中的作用,并特別關注文化遺產的研究,采用了二維視角將建模視為抽象過程,并使用可由機器處理的語言實現此抽象過程[26]。

4.3 語料庫建設

語料庫是以電子計算機為載體承載語言知識的基礎資源,是需要經過科學取樣和加工的大規模電子文本庫,人文學者可借助計算機分析工具開展相關語言理論及其應用的研究。ArchiMob是一種基于口述歷史訪談而免費提供的通用瑞士德語口語語料庫,Scherrer Yves描述了ArchiMob語料庫文檔如何被轉錄、分割和與聲源對齊,并鼓勵將語料庫用于一般的數字人文科學,特別是方言學[27]。Aynat Rubinstein描述了第一個開放式多類型現代希伯來語歷史語料庫的創建,在語料庫的管理、編碼和分發過程中實施數字人文方法,同時演示了語料庫在歷史語言研究中的用途[28]。另外,還有西方文學經典著作的語料庫(1.0版),Clarence Green描述了該語料庫的發展、組織和原始資料形式,證明其在文化學和語料庫文體學(分別屬于傳統人文學科和數字人文學科)兩個跨學科領域中的潛在用途[29]。Christopher Donaldson等學者采用一種跨學科的方法調查歷史文本語料庫,在這項調查中,利用地理信息系統(GIS)分析了美學理論與描述湖泊地區的空間美學術語之間的對應關系,最后探討了基于地理和語料庫的方法如何加強文學、美學和自然地理之間的聯系[30]。

4.4 數字檔案

檔案是人類社會實踐活動的原始記錄,作為一種具有真實性、原始性、憑證價值與情報價值的固化信息,是數字人文研究的重要對象和信息資源之一。美國廢奴主義者莎莉·霍利(Sallie Holley)(1818—1893)演講語音檔案缺失,Pamela VanHaitsma通過數字替代和元數據重建莎莉·霍利的廢奴主義言論,這些數字方法不僅可以還原她的職業和演講時間,還可以揭示她的演講方式以及公開演講的性別意義[31]。Robledano-Arillo Jesus等學者基于鏈接開放數據技術構建了一個概念模型,用于編碼和傳播與西班牙內戰攝影檔案有關的數據,該模型促進了用于歷史研究的圖像數據的傳播和檢索系統的生成,突破了遺產照片檔案內容與上下文信息表示方法方面的一些限制[32]。紐約大學一個跨學科研究團隊啟動了“藝術家檔案計劃”,采用數字人文方法構建相關信息庫,以展示和保存當代藝術,便于將來處理和重新激活藝術作品[33]。CABDHRP是一個支持中國歷史研究的中國古代書籍數字人文研究平臺,這項研究采用開放源代碼機構存儲系統DSpace,作為對歸檔的圖像、元數據和全文進行掃描的數字檔案系統,以支持數字人文研究[34]。

4.5 數字圖書館

在所有的學術探索中,數字人文最為生動地重現了古代圖書館的精髓,它追求的是形式多樣的信息呈現、知識組織、技術交流與傳播,正是這些追求讓數字圖書館變得生機勃勃[35]。Biligsaikhan Batjargal基于自動元數據映射為日本人文數字圖書館構建聯合搜索系統,其目的是為非日語人文數字圖書館自動執行元數據映射,以及讓用戶僅使用一個查詢輸入即可訪問多個人文數字圖書館[36]。Mnemosyne是一個開放式數字圖書館,允許對特定館藏進行數據建模,該項目借助工具Clavy進行開發,該工具是一個豐富的互聯網應用程序,能夠從數字對象的大數據集合中導入、保存和編輯信息,從而在機構之間建立橋梁和數字存儲庫,并創建豐富的數字內容的集合[37]。George Buchanan研究了人文學科領域的學者如何利用數字圖書館進行信息查詢,以及如何通過更新人文學者的信息搜索技術來提升工作效率,觀察了人文學者在查詢和術語使用中運用的模式,指出了人文學者在信息搜索技術方面存在的問題[38]。

4.6 數字歷史

數字歷史是數字技術與歷史科學融合的結果,已經在人文科學中得到了廣泛應用,主要是對舊內容進行數字分析。Christopher D. Green認為數字歷史方法可以有效闡明心理學過去的某些內容,這種成功并不意味著數字歷史對傳統歷史學構成某種威脅,相反,兩者可以有效互補[39]。Ivan Flis討論了數字歷史與傳統歷史之間的關系,指出數字方法不是取代歷史學家的工作,而是加以補充并將其轉化為新的受眾,同時認為數字歷史的作用是充當量化學科(如心理學)科學家與非量化學科(如歷史)科學家之間的“trading creole”[40]。在加拿大“Trading Consequences”項目中,歷史學家、計算語言學家和計算機科學家合作開發了一種文本挖掘系統,該系統從19世紀大量英文版數字化出版物中提取信息,確定事件、地理位置、日期三者之間的文本關系,基于該研究項目,Jim Clifford解釋了數字人文技術應用于歷史研究的方法、用途和局限性[41]。Jacy L.Young 對早期的兩個姊妹刊《美國心理學雜志》和《教育學院》進行了探索性數字分析,揭示了兩種期刊的許多特征和關鍵屬性,并指出期刊內容之間的界線是流動的,而不是絕對的[42]。

4.7 主題建模

主題建模是一種結合機器學習和自然語言處理等相關方法的統計技術,其基本思想認為文本是由多個主題混合而成的, 而主題是特征詞上的一種概率分布[43]。Zef M.Segal使用主題建模的計算工具研究了19世紀希伯來語報紙HaTzfira中每周和每天時間周期之間的主題差異,分析了周期更改前后的主題情況,顯示出期刊主題的不同變化模式[44]。Quintus Van Galen討論了如何使用主題建模工具來分析歷史報紙檔案,該案例研究了19世紀大英圖書館報紙檔案中對美國的引用,結果表明主題建模通過“遠程讀取”檔案的方式,為傳統問題提供了一種潛在的解決方案[45]。Hu Yuening提出了一種向用戶發出聲音的機制,將用戶對主題模型的反饋編碼作為主題模型中單詞之間的相關性,這個框架是交互式主題建模,它使未經培訓的用戶可以輕松地、反復地將其編碼反饋到主題模型中[46]。Nektaria Potha 系統地研究主題建模在作者驗證中的有效性,研究了涵蓋主要范式的幾種作者驗證方法,包括內在和外在方法以及基于概要和基于實例的方法,并與潛在語義索引(LSI)和潛在狄利克雷分配(LDA)這種著名主題建模方法相結合[47]。

5 結論與展望

本文以SCIE數據庫和SSCI數據庫為數據源,通過對數字人文研究文獻的施引文獻和關鍵詞進行分析,探討了國際數字人文研究的知識基礎、演化路徑和研究熱點,對2001—2020年近二十年國際數字人文研究的來龍去脈有了更加清晰的認識。在知識基礎方面,數字人文知識來源可分為兩大知識集群,一是作者身份識別,二是遠距離閱讀,這兩個知識集群側重于數字人文學科的研究方法與實踐,在數字人文研究領域具有開創性和標志性意義。在演化路徑方面,國際數字人文研究經歷了初始期、發展期和深化期的發展歷程。在初始期,“數字圖書館”“語料庫”“作者身份識別”是最為活躍的主題詞;進入發展期,“數字歷史”、“社交網絡”和“本體論”研究表現得較為積極;到了深化期,“文化遺產”、“可視化”、“圖像”和“建模”等主題詞充分彰顯其優勢地位。由此可見,數字人文研究逐漸由單一走向多元,由淺層思考趨向深入研究。研究熱點主要集中為7個研究主題,分別是 GIS技術、文化遺產、語料庫建設、數字檔案、數字圖書館、數字歷史和主題建模。其中,文化遺產和數字歷史是數字人文研究的核心命題;數字檔案、數字圖書館和語料庫建設是數字人文生態系統良好運行的基礎建設;GIS技術和主題建模是數字人文研究強勁的技術支持。

上述國際數字人文的分析結果為我國數字人文研究領域的發展提供了些許啟示,具體如下:

一是夯實圖書館的學術地位。圖書館可依托現有的信息技術、數字資源和存儲優勢,創建專業性的數據集或大規模結構化數據,擴大人文學者的研究樣本;圖書館需要轉變角色定位,突破輔助支持型服務模式的限制,以研究者身份介入數字人文的科研實踐中,開展相關理論研究。圖書館應與人文學者保持密切聯系,結合具體的人文教學科研情境,嵌入人文學者的教學和科研過程中,擴大“數字人文”實踐的受眾范圍。

二是加強數字檔案資源建設。在理論方面,需要厘清數字人文與檔案工作的邏輯關系和相關理論,尋找數字人文和檔案管理的內涵契合點,探究數字技術的發展前沿和跨界結合的難點。在實踐方面,檔案機構可以依托資源優勢開發基于檔案內容挖掘與知識發現的數字人文項目,促進我國檔案領域數字人文項目的資助和認證體系建設,推動檔案工作者參與“國家數字人文基礎設施建設工程”的規劃,助力“數字中國”的建設。

三是注重跨學科交流與合作。在跨學科研究領域中,數字人文是典型的存在,需要人文學科專家、計算機技術專家、數據處理專家或其他專家共同協作研究。這不僅需要跨學科、跨空間甚至跨機構,還要最大程度最高效率地實現交流與合作。國內數字人文的發展需要在繼續發展已有研究方向、創新研究方法的同時深入挖掘新的研究領域,將文化遺產和數字歷史作為數字人文項目的重點課題,同時加強藝術作品和語料庫的數字化建設。

四是構建數字人文學術環境。數字人文研究深入開展,需要大到國家,中到機構,小到個人的全方位重視和關注,從國家政策、機制等方面著手營造數字人文氛圍。國家建立了支撐數字人文研究的政策和基金扶持、機構平臺搭建、資源提供、技術支持等機制,使得科研人員可以進行跨學科、跨機構、跨地區甚至全球性質的數字人文研究和實踐。這對于提高科研效率、促進我國數字人文研究高速發展具有重要意義。

猜你喜歡
研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側面碰撞假人損傷研究
關于反傾銷會計研究的思考
焊接膜層脫落的攻關研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 久久综合成人| 日本伊人色综合网| 亚洲香蕉伊综合在人在线| 中文字幕一区二区视频| 巨熟乳波霸若妻中文观看免费| 欧美激情成人网| 最新加勒比隔壁人妻| 国产精品视频a| 国产精品观看视频免费完整版| 综合色婷婷| 伊人91在线| 国产自无码视频在线观看| 色综合天天娱乐综合网| 国产主播在线观看| 精品国产Ⅴ无码大片在线观看81| 久久人体视频| 国产不卡网| 天堂网亚洲系列亚洲系列| 国产丝袜91| 国产福利2021最新在线观看| 萌白酱国产一区二区| 亚洲色图欧美在线| 久草性视频| 成人在线第一页| 亚洲第一成网站| 2021国产乱人伦在线播放| 黄色一及毛片| 91网址在线播放| 亚洲av无码成人专区| 一区二区三区成人| 亚洲av无码专区久久蜜芽| a级毛片一区二区免费视频| 一区二区无码在线视频| 狠狠亚洲婷婷综合色香| 国产凹凸视频在线观看| 久久精品丝袜高跟鞋| 中字无码精油按摩中出视频| 国产精品一区在线观看你懂的| 亚洲—日韩aV在线| 亚洲欧美在线综合一区二区三区| 全免费a级毛片免费看不卡| 人妻丰满熟妇αv无码| 九色国产在线| 一本大道无码日韩精品影视| 免费精品一区二区h| 国产成人永久免费视频| 狠狠五月天中文字幕| 亚洲全网成人资源在线观看| 午夜人性色福利无码视频在线观看| 91无码人妻精品一区| www欧美在线观看| 日本少妇又色又爽又高潮| 日本一区高清| 午夜日b视频| 最新国产精品鲁鲁免费视频| 亚洲AV无码乱码在线观看代蜜桃 | 亚洲成人www| 欧美特黄一级大黄录像| 97成人在线视频| 欧美成人a∨视频免费观看 | 国产真实乱人视频| 美女毛片在线| 久久精品免费国产大片| 欧美综合一区二区三区| 日韩av在线直播| 无码'专区第一页| 97se亚洲综合在线| 色综合热无码热国产| 九色视频最新网址| 亚洲AⅤ永久无码精品毛片| 网久久综合| 粉嫩国产白浆在线观看| 国内熟女少妇一线天| 一级全黄毛片| 亚洲天堂自拍| 欧美国产综合视频| 国产精品夜夜嗨视频免费视频| 波多野结衣的av一区二区三区| 制服丝袜在线视频香蕉| 国产精品va| 五月激情婷婷综合| 91精品国产福利|