999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字人文研究熱點與發展趨勢的斷面考察
——以《數字人文季刊》和《人文學科中的數字計算》為中心

2020-01-08 01:01:02劉晗月
圖書館研究與工作 2020年1期
關鍵詞:研究

陳 苗 劉晗月

(中山大學資訊管理學院 廣東廣州 510006)

1 引言

數字人文是近年來中外學界研究的熱點領域之一,有不少學者對這一領域的研究情況給予了高度關注,對數字人文研究狀況進行總結梳理的文章也越來越多。例如,柯平等人研究了數字人文的演化路徑和發展趨勢,提出數字人文領域的研究熱點包括基本理論研究、技術驅動下的人文學術實踐轉向、新合作模式引發的人文學術文化變革、面向數字人文研究的基礎設施建設[1];肖鵬等人總結了學術型圖書館館員開展數字人文研究時應遵循的基本原則和應注意的關鍵問題[2];還有學者指出,數字人文的研究重點在于文化遺產數字化保護、數字歷史項目開發、數字人文基礎設施和相關的圖書館服務[3]。

在我國,由于原創性研究相對滯后,大部分數字人文研究相關論文帶有綜述性質。其中最有價值的是針對國外文獻的分析,但目前相關分析多以Web of Science核心數據集為數據源,采用純粹的文獻計量方法,往往以揭示宏觀趨勢為目標,對于微觀的考察反而有所不足。最典型的是,當前有許多關于數字人文發展方向的討論,但缺乏對具體的數字人文研究的開展、每個方向之下的研究范式的討論。

本文將選用兩本典型的數字人文期刊為研究對象,通過文獻計量和內容分析的方法,結合相關文獻,既從宏觀的視角分析、整理和歸納本領域的研究熱點和發展趨勢,同時也嘗試以微觀視域,在一定范圍內探討數字人文研究的知識基礎,分析具體內容及主要領域的研究范式。

2 方法論

2.1 研究對象的選取

本文選擇《數字人文季刊》(Digital Humanities Quarterly)和《人文學科中的數字計算》(Digital Scholarship in the Humanities)兩本典型的數字人文期刊作為數據源。

所謂典型的數字人文期刊,本文的理解是:以整個數字人文學科領域的學術文章作為主要收錄范圍的期刊。以典型數字人文期刊為數據源,相比在數據庫中進行主題檢索獲取相關數據的方式,可以將研究數據更準確地鎖定在數字人文領域內,從而更準確地揭示數字人文的發展狀況。此外,期刊時效性強、專業性強,加上較高的收錄標準,其提供的數據也具有較高的質量。《數字人文季刊》發布有關數字人文學科各方面的文章、評論、案例研究和觀點,收錄范圍覆蓋“人文學科”和“數字學”領域,并為數字人文的從業者、研究人員和教師提供交流分享的論壇。《人文學科中的數字計算》(原用名《文學與語言計算》)是數字人文領域歷史最悠久的期刊之一,收錄的不僅限于數字人文領域的學術文章,也包括數字人文學科相關領域的其他學術作品,為數字人文和人文領域的發展服務。這兩本期刊從收錄范圍和作用定位上看,都是當前較為典型的數字人文期刊。

當前在世界范圍內,已出現了若干專門以數字人文為主題的期刊,選擇這兩本期刊作為研究對象的主要原因有以下幾點。

(1)兩本期刊都是綜合性的數字人文刊物。由于不同刊物的主要編輯團隊有著不同的學科立場和學術訴求,因此,不少數字人文刊物都存在一定的學術偏好。文章所選擇的兩本刊物接收數字人文各個方面的學術作品,所涉及的數字人文領域較為全面,相對來說偏向性較不明顯。當我們準備通過研究有限的數字人文期刊來推測數字人文整體發展狀況時,選擇內容更全面、偏向性更弱的期刊可以減少期刊學術偏好的影響,使研究結果具有更強的代表性。

(2)兩本期刊數據的時間跨度包含數字人文快速發展時期。根據搜集到的歷年文獻發表量來看,數字人文在最近十年才得到更多的關注,在2008年后文獻增長率顯著提高,因此本文將數字人文的快速發展時期界定為2008年至今。從創刊時間來看,《數字人文季刊》創刊于2007年,《人文學科中的數字計算》創刊于1986年,二者距今已有超過10年的歷史,因此較為完整地記錄了整個數字人文快速發展時期的發展狀況。而其他大部分數字人文期刊的創刊時間是在2012年以后,在反映數字人文快速發展時期時有缺失。

(3)這兩本數字人文期刊在學界的認可度較高。大部分數字人文的文獻集中在這兩本期刊即是一個證明。舉例說明:筆者在Web of Science核心數據集上,以“digital humanities”為主題進行搜索,檢索時間為2018年11月7日,得到檢索結果2 135條。根據期刊收錄的文獻數量對各個期刊進行排序,排序結果如表1所示。《數字人文季刊》排名第一,相關文章數量為79篇;《人文學科中的數字計算》及其前身《文學與語言計算》分別排名第四和第三,相關文章數量為55篇和56篇。盡管《計算機科學系列講義》(Lecture Notes In Computer Science)排名第二,但由于其本身是發文量巨大的會議論文集,所以從比例上講,這本期刊相對其他兩本期刊相關度較低,也不是學者們發表數字人文學術文章的優先選擇。因此,數字人文的研究成果在這兩本期刊的集中程度可見一斑。

2.2 數據來源

本文的數據來自Web of Science核心數據集,檢索出版物名為Digital Humanities Quarterly、Digital Scholarship in the Humanities或Literary and Linguistic Computing的文獻,時間跨度選擇“所有年份”,共得到757條檢索結果。其中,《數字人文季刊》共有151篇,時間跨度為2015—2017年,數據更新至第11卷第4期;《人文學科中的數字計算》及其前身(《文學與語言計算》)共有606篇,時間跨度為2008—2018年,數據更新至第33卷第3期。檢索時間為2018年11月7日。本文使用Citespace 5.3進行數據分析。

表1 相關文章數量最多的期刊(TOP 10)

本文通過選擇期刊作為數據源,規避了手工檢索的局限,選擇近十年的數據進行具體分析,彌補了對數字人文快速發展階段描述分析的空缺,但也存在著不足:①數據不完整。受Web of Science核心數據集中數據資源的限制,本文未能收集到《數字人文季刊》和《人文學科中的數學計算》(含《文學與語言計算》)的所有數據,數據缺失較為嚴重,但是由于未找到將期刊官網上的數據轉化成WOS格式的方法,無法統一爬取數據和數據庫數據的格式,集中分析。②代表性不足。只以兩本期刊作為數據源,在代表數字人文整體上不夠有力。③當前仍然處于數字人文的快速發展階段,在這個階段尚未成為歷史之前就進行分析,難免存在不全面的地方。

3 數字人文的知識圖譜分析

研究數字人文具體如何展開,了解主要方向下的研究范式,可以從數字人文領域的高被引文獻和高頻關鍵詞入手。通過閱讀高被引文獻,可以發現數字人文領域的研究重點和理論來源;高頻關鍵詞代表了這一領域學者主要關注的方向,其變遷一定程度上反映了該領域的發展趨勢。通過研究高被引文獻和高頻關鍵詞,可以從理論來源、研究熱點和發展趨勢三個角度展示數字人文的具體發展狀況。在微觀層面,通過對同一方向的高頻關鍵詞下的文獻進行閱讀,可以歸納出研究領域主要方向的研究范式。

高被引文獻構成了知識基礎,高頻關鍵詞揭示了研究熱點及其發展趨勢。本文將結合知識圖譜,從知識基礎和研究熱點及其發展趨勢兩方面,對兩本典型的數字人文期刊進行分析。

3.1 知識基礎

研究領域的發展狀況,即研究前沿,它的引文就是該研究領域的知識基礎[4]。在從宏觀層面分析組成知識基礎的所有引文的特征時,著重研究高被引文獻,可以實現從微觀的視角考察數字人文的知識基礎。將Citespace時間切片設置為1年,得到參考文獻共現網絡圖譜,如圖1所示。

圖1 參考文獻共現網絡圖譜

圖中共有18 191篇被引參考文獻,但被引頻次大于10次(包括10次)的文獻只有9篇(如表2所示),可見在這一時期高影響力的文獻數量較少。如圖2所示,被引文獻出版的年份主要集中在2009—2013年,被引文獻數量在2012年以前基本呈遞增的態勢,學術活躍度較高,學科發展迅速。在對兩本期刊參考文獻的整體有了部分宏觀認識之后,結合9篇高被引文獻,從微觀的角度考察數字人文研究的內容。

表2 高被引文章(被引頻次>=10)信息表

圖2 出版時間分布圖

被引頻次最高的9篇文獻中,有4本是數字人文專著,其他5篇都是期刊論文,說明這個領域已經得到較為系統、專業的研究。這些文獻根據內容可以分為理論研究和應用研究兩類。理論研究中,包括對整個數字人文領域的綜述性著作[5-6]、文學計算領域的開創性著作[7]和文化組學的開創性著作[8]。應用研究中,最受關注的是作者身份識別方法的研究及其應用,如作者身份自動識別方法的最新進展的綜述[9]、尋找分辨作者特點或風格的最佳分類器[10]、對作者身份識別實際操作中遇到的候選作者不確定和機器學習分類法訓練不足問題的解決方法研究[11]等等。此外,數字人文應用程序[12]等數字人文應用領域的主題也受到重視,體現了數字人文與其他學科的深度交融正在進行,數字人文正盡力發揮本身對其他人文學科的服務價值。

3.2 研究熱點及發展趨勢

關鍵詞在一定程度上體現文獻關注的方向,因此研究高頻關鍵詞可以展現學科研究的熱點。圖3中共有39個關鍵詞,圖中節點大小與對應關鍵詞共現頻次呈正相關。由圖3可知,作者身份識別(authorship attribution)是最大的節點。其次,文本(text)、語言(language)、歸屬(attribution)、信息(information)等節點也相對較大,反映出數字人文的研究熱點。節點外有紫圈突出的是突現性較高的關鍵詞,突現性高意味著共現頻次快速增加。圖3中突現性高的節點有信息(information)、識別(recognition),同時,這兩個節點之間存在較粗的連線,共現頻次高,表明信息識別是數字人文的研究前沿之一。

圖3 關鍵詞共現圖

從圖4可看到,低頻關鍵詞占主要部分,關鍵詞間的頻次差距較小,最高頻次的關鍵詞也只有10次,說明研究主題廣,跨學科特性較明顯。高頻關鍵詞在時間上的分布揭示了研究熱點的變遷,預示著學科的發展趨勢。如圖5所示,從節點的數量上看,隨著時間發展,兩本期刊反映的數字人文的研究范圍擴大,研究的對象、方法更加豐富,廣度與深度進一步得到拓展。數字人文研究早期主要是對文本,包括文字、談話等信息材料本身的研究。之后,利用信息技術對人文學科的研究增多,學者們嘗試從新的角度理解人文學科知識,拓展人文學科的研究領域,創新人文學科的研究方法。

圖4 關鍵詞頻次分布圖

圖5 關鍵詞時區圖

在對關鍵詞進行總體分析之后,結合具體的關鍵詞,總結歸納出主要研究方向,并結合知識圖譜和具體文獻進行分析。

(1)作者身份識別問題的研究

在高頻關鍵詞中,作者身份識別(authorship attribution,10)、歸屬(attribution,7)、識別(recognition,4)揭示了作者身份識別是這兩本數字人文期刊中最熱門的應用研究。這一領域主要有兩大方向,一是探索作者身份識別的技術與方法,其中,文體學是很重要的一個角度;二是作者身份識別方法的應用,主要是在文學領域。

作者身份識別的技術研究方面,機器學習方法和詞頻分析是主要的方法。具體的研究有探究機器學習分類計數訓練集的文本選擇問題[13]、用機器學習方法檢測作者欺騙[14]等等。在詞頻分析上,有學者討論了詞頻方法的一些基本問題和特點,包括如何定義一個詞,使用什么參考語料庫,或采取什么頻率截止[15]等等。

作者身份識別的主要應用領域之一是文學研究。傳統的文學研究具有高度的主觀性,缺乏保證成果有效性的方法,面臨存在危機。采用文學計算等遠距離閱讀的方式,做可重復的研究,是文學研究的新方向[16]。隨著作者身份識別方法的發展,作者身份識別已經擴展到新的應用領域,如作者身份剖析和計算社會語言學[17]。學者們研究作者身份識別的技術和方法,嘗試盡可能降低識別過程中噪音或無關信息的影響,致力于提高自動識別的準確率。作者身份識別也和語言學相結合,研究在不同語言中識別理論與方法的推廣。2016—2018年,以作者身份識別和語言學為主要領域的數字人文應用與實踐成為數字人文學科的研究前沿。

(2)數字人文的研究對象

文本(text,9)、文字(word,6)、信息(information,5)、英語(english,4)揭示了數字人文的研究對象,即各種形式的信息。信息是圖書館學的研究對象,“信息”一詞體現了圖書館學與數字人文學科存在交叉。在實踐上,許多數字人文項目也是由圖書館承擔的。在研究廣度和深度上,“信息”也拓展了數字人文的研究基礎,使數字人文研究擴展到更多領域。在2008—2012年,對信息資源本身的研究是熱點,對這些信息的處理,包括信息管理和整合、信息內容分析等。其中,運用技術對信息進行解讀和表達是重要的研究方向,應用的主要領域是計算語言學和自然語言處理。

隨著信息技術和數字化的發展,研究不僅包括書面的“文本”,也包括非傳統意義上的“文本”,比如演講(speech,2)、口語(discourse,2)。人文資料的數字化是數字人文研究的前提。數字化也是這一時期的研究熱點。谷歌圖書(google book,2)就是這一時期數字化的代表性成果之一。

(3)數字人文的技術研究

信息技術的發展使得網絡(web,5)這一基礎設施更加完善,許多基于網絡的研究方法也得以實現,許多基于網絡的研究工具被發明出來。在2016—2018年間,語料庫(corpus,2)、模型(model,2)、算法(algorithm,2)等關鍵詞顯示信息技術在數字人文的應用更為深入和廣泛。語料庫既是數字化的成果之一,也是語言學研究的基礎資源。模型是對現實的抽象與簡化。它既可以抽象出信息和信息運動的特征,也可以輔助信息分析、提取、生成等操作,如將計算模型應用于敘事語篇的生成系統[18],建立基于距離的手勢相似模型進行手勢研究[19]。算法是對人文學科進行計算機分析的重要基礎。圖像(image,2)、表格(graph,2)等關鍵詞體現了可視化技術的應用。這些技術、工具、理論結合網絡,創造了許多新的研究人文學科的方法。這既是信息技術與人文學科深度融合的實踐,也促進了人文學科的發展。

(4)數字人文應用領域

21世紀初人文學科的主要變革因素之一是從模擬材料向數字材料的轉變,這種轉變將以多種方式影響人文學科[20]。其中數字人文在人文學科的應用是重要方式之一。語言(language,7)所代表的語言學是數字人文主要應用的領域。在語言學上,數字人文學者主要是利用語料庫進行實證研究和定量研究,同時信息技術帶來的語言變化也擴展了語言學的領域。此外,在非高頻關鍵詞中,還有歷史(history,2)、社會科學(social science,2)等人文學科,可見這些人文領域也出現了數字人文應用。結合關鍵詞時區圖可以發現,2013—2015年,社會科學、人文學科(humanity,5)成為高頻關鍵詞,數字人文在人文學科應用更為廣泛、深入。數字人文不僅給傳統的社會科學和人文科學研究帶來了新的研究工具,也催生出新的研究方法和研究范式,成為社會科學和人文學科發展的新的驅動力,文學研究中遠距離閱讀的興起就是一例。

4 結論

本研究選擇綜合程度較高、收錄范圍較廣、時間跨度適當,同時具有一定權威性的典型數字人文期刊作為數據源,對數字人文期刊的內容和形式進行分析,展示近十年數字人文的發展狀況。本研究不僅從宏觀的角度進行分析,也做了微觀的考察,對該領域的重要文獻進行了單篇的閱讀和分析,結合單篇文獻的具體內容,展現近十年數字人文具體是如何發展的。通過本次研究,本文主要總結得到以下結論。

(1)知識基礎分為理論和應用研究兩類,理論研究包括數字人文及其分支領域,如文學計算、文化組學的基礎理論研究;應用研究包括各種具體實踐方法的研究,其中作者身份識別是一個重要的研究方向,主要有兩個研究問題:探索作者身份識別的技術、方法,與作者身份識別方法的應用。

(2)快速發展階段的數字人文相較以往,研究范圍進一步擴大,研究對象更加豐富,研究方法更加多樣,廣度與深度進一步得到拓展,并且這些變化的速度都比以前更快。總體而言,兩本期刊反映的數字人文研究熱點主要可以分為四類:一是作者身份識別;二是數字人文研究對象的分析;三是相關的技術研究;四是數字人文在各個學科的應用實踐。文本內容分析是早期的研究熱點;作者身份識別是一個新的研究熱點,并成為研究前沿;數字人文實踐在各個時期都是研究的熱點,只是其內容在不斷擴展、深化。數字人文技術隨信息技術的發展更加先進、更加多樣化,應用對象更加廣泛,應用方式更加成熟,這些應用既促進了人文學科的發展,也提出了新的研究理論和研究方法。總體來說,數字人文正在致力于實現信息技術與人文學科更深度的結合,研究與實踐相較于以往更具突破性,并出現由技術應用引領的研究范式變革。數字人文從簡單的輔助人文學科研究到開始對人文學科研究發展施加影響。人文計算向數字人文的轉變在這一時期體現得尤為明顯。展望未來,數字人文還將為更多領域的研究服務,比如在非遺數字化研究方面,參考MIDAS Heritage,思考我國國家級非物質文化遺產元數據標準設計的方法[21];在人文學者信息行為和數字行為的研究方面,運用數字人文研究方法,揭示人文研究者在線文獻求助與交流行為的特征[22]。

通過對《數字人文季刊》和《人文學科中的數字計算》兩本數字人文領域較為典型的期刊的研究,本文對數字人文進行了比較近距離的觀察,并且認為對數字人文期刊的研究是非常必要的。但本文僅反映了這兩本期刊的特點,在未來的研究中,還需要對更多的數字人文期刊進行研究,對更廣泛的數據集進行分析,以探索在更大數據范圍里數字人文的具體發展狀況。

猜你喜歡
研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側面碰撞假人損傷研究
關于反傾銷會計研究的思考
焊接膜層脫落的攻關研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 国产人成网线在线播放va| 黄色在线不卡| 毛片视频网址| 欧美一区国产| 在线观看精品国产入口| 欧美综合区自拍亚洲综合天堂| 国产欧美又粗又猛又爽老| 视频二区欧美| 91小视频在线观看| 国产欧美日韩在线在线不卡视频| 亚洲最大在线观看| 精品亚洲欧美中文字幕在线看| 69视频国产| 久久国产高清视频| 国产福利在线免费| 精品一区国产精品| 69视频国产| 精品无码人妻一区二区| 欧美精品亚洲二区| 在线国产欧美| 啪啪永久免费av| 精品99在线观看| 国产chinese男男gay视频网| 亚洲国产精品美女| 亚洲三级网站| 四虎AV麻豆| 亚洲日本在线免费观看| 成人午夜视频免费看欧美| 国产精品极品美女自在线看免费一区二区 | 国产99视频在线| 女人18毛片一级毛片在线 | 国产精品观看视频免费完整版| 国产一二三区在线| 一级爆乳无码av| 波多野结衣二区| 亚洲天堂啪啪| 九色在线观看视频| 久久亚洲AⅤ无码精品午夜麻豆| 久久青草免费91线频观看不卡| 国产一级片网址| 五月婷婷欧美| 在线另类稀缺国产呦| 国产人成在线观看| 中文一级毛片| 久久国产精品国产自线拍| 久久精品中文字幕少妇| 久爱午夜精品免费视频| 欧美激情一区二区三区成人| 日本不卡在线视频| 久久青草免费91观看| 黄色a一级视频| 久久美女精品| 人人91人人澡人人妻人人爽| 亚洲精品欧美重口| 亚洲综合色吧| 亚洲精品欧美日本中文字幕| 国产自在线拍| 大香伊人久久| 制服丝袜无码每日更新| 亚洲日本www| 美女被操黄色视频网站| 亚洲成人一区在线| 久久婷婷人人澡人人爱91| 亚洲国产综合精品一区| 欧美福利在线| 亚洲一区二区三区国产精品| 久久国产V一级毛多内射| 精品久久久无码专区中文字幕| 国产欧美精品专区一区二区| 欧美有码在线| 国产成人一区| 日韩精品欧美国产在线| 五月丁香在线视频| 999国内精品视频免费| 国产尤物jk自慰制服喷水| 成年人国产网站| 色哟哟国产精品一区二区| 亚洲欧美在线综合一区二区三区| 中文成人在线| 无码一区中文字幕| 色爽网免费视频| 在线播放真实国产乱子伦|