孫鳴蕾 房小可 陳 忻
數字人文是針對計算與人文學科之間的交叉領域進行學習、研究、發明以及創新的一門學科,其概念最早是由羅伯特·布薩提出的。將計算機技術與書籍的編輯工作相結合的思想也逐漸向文學、歷史學等領域不斷發展。我國臺灣地區在數字人文(臺灣叫數位人文)領域一直排在世界前列。我國大陸地區的第一個數字人文研究中心是2011 年在武漢大學成立的,主要陣地是圖情檔領域。從內容上講,關于數字人文在不同方面的研究層出不窮,但是很少有系統針對圖情檔學科在數字人文研究方面的綜述性文章。對此,本文對國內圖情檔學科的數字人文相關文獻進行整理及歸納,為后續的研究提供參考。
1.基于國家社會科學基金項目的趨勢分析。通過檢索國社科基金數據庫、國社科基金官網等網址,總結出2010—2019 年度有關數字人文的國社科基金項目總體趨勢和學科分布(圖1、圖2)。據不完全統計,我國最早的數字人文國家社會科學基金項目是從2010 年開始的,總體呈現增長趨勢,高等院校對于數字人文的研究占比達到95%以上,屬于主導力量。學科分布圖顯示,關于數字人文的研究主要集中在圖情檔領域,但語言學、新聞傳播學、統計學、政治學也會有所涉及。其中2017 年和2019 年的項目最多,分別達到6 項和8 項。

圖1 2010—2019 年度關于數字人文國家社會科學立項總體趨勢圖

圖2 2010—2019 年度關于數字人文國家社會科學立項學科分布圖
2.文獻分析。
(1)數據來源。在大陸學者方面,選取了中國知網作為文獻來源,時間截至2019 年,檢索范圍為圖情檔核心期刊(包括C 刊及北大核心)。其中圖情檔領域的檢索條件為:主題=數字人文或者題名=數字人文或者關鍵詞=數字人文,采用模糊匹配。經過手工篩選,最終得到有效文獻187 篇。在中國臺灣地區文獻方面,通過檢索臺灣學術期刊在線數據庫以及臺灣學術文獻數據庫,檢索條件為:主題=數位人文,共得到有效文獻32 篇。
(2)文獻總體趨勢分析。本節主要對中國大陸及臺灣地區的文獻總體趨勢進行分析。經過對知網圖書情報領域的187 篇文獻進行整理,發現我國圖書情報領域最早出現有關數字人文的文獻是在2006 年,2007 至2011 年的發文量并沒有增長,依舊是保持在每年1 篇文章左右,2012 年的發文數量僅增長了1 篇。從2014年到2019 年文章出現了大幅度的增長。
相較于圖情領域,檔案領域在數字人文方面的研究起步較晚,直到2015 年才有相關文章出現,2017 年到2019 年文獻數量較之前有增長,但發文數量依然較少,相較之前增長了11 篇,截至2019 年底有12 篇文獻。
(3)文獻的可視化分析。關鍵詞出現的頻次代表著當前的研究熱度,并與之呈正相關關系,本文將摘要中的關鍵詞抽取出來,構建關鍵詞聚類網絡。從表1 可以看出,數字人文與圖書館結合緊密,衍生出了關于高校圖書館、數字圖書館以及圖書館服務的相關研究。“美國”作為關鍵詞的頻次達到了11 次,說明美國在數字人文方面的研究一直以來為學者們帶來很多啟示。“知識圖譜”“關聯數據”“科研支持”“數字學術中心”這幾個關鍵詞頻率達到了4 次,并且出現于2016—2018年,屬于近幾年數字人文研究的新興領域。“檔案”一詞出現較晚,且頻率僅為2 次,再一次表明數字人文在檔案領域正處于起步階段,相關研究相較于圖情領域數量較少。從中心度來看,高校圖書館達到了0.46,并且與多個關鍵詞聯系緊密,表明學者多以高校圖書館為出發點研究數字人文的發展。
對于中國臺灣地區文獻方面,本文僅對臺灣文獻關鍵詞進行分析(表2),通過分析高頻率關鍵詞,除“數位人文”“數位人文學”等關鍵詞之外,“數位典藏”出現次數最多,頻率達到了8 次,表明臺灣學者一直以來將數位典藏作為研究的重點領域,在后面的綜述中也會針對數位典藏進行闡述。通過對其他關鍵詞進行分析后發現,臺灣學者對于傳統文化方面的研究甚多,佛教藝術、山水畫等均為其研究對象。在與國外數字人文發展對比研究方面,我國臺灣學者多選用東亞國家進行對比,比如日本等國,這與大陸學者多與歐美國家對比不同。關鍵詞中的教學模式、課程評監等詞表明臺灣已將數位人文課程融入到了教育教學中,并且產生了教學研究成果。

表1 按頻次與中心度關鍵詞排名前11

表2 中國臺灣地區文獻關鍵詞匯總
綜上,作者對我國圖情檔領域有關數字人文的文獻進行了定量分析,下面從定性的角度對所搜集的187篇文獻進行歸類。
1.基于數字人文的圖書館特色館藏建設。國內圖書館已開始對特色館藏進行數字化,并開發了相關數據庫,本章主要從特色館藏數字化的對象進行分類,分為典藏文獻數字化、古籍數字化以及上海圖書館的家譜數據庫與名人手稿檔案庫數字化三個方面來進行闡述。
(1)典藏文獻數字化。張毅[1]和程靜[2]在文章中使用了地理信息系統進行研究。兩位以華東師范大學圖書館特藏方志數據庫建設為例,利用文本挖掘、GIS、可視化、關聯數據等技術在時間和空間兩個維度對方志資源進行揭示。而蔡迎春[3]將館藏民國文獻的整理與研究作為突破口,把“原版民國時期文獻”和新中國成立后出版的“新版民國時期文獻”結合起來,同樣利用了GIS 系統及其他工具建設了能充分揭示民國時期文獻及整理的數據庫。除利用GIS 系統外,魯丹[4]還借鑒DPLA 整合的方法,以全國師范大學圖書館聯盟的異構特藏資源為基礎,設計了數字人文系統平臺。
徽州文書被稱作“中國歷史文化第五大發現”,時間最早可以追溯到宋代。湯萌[5]等人以徽州文書為對象,探索利用元數據與主題法結合的組織方法深度揭示資源內容并實現半自動標引。王蕾[6]認為中山大學圖書館有豐富的館藏徽州文書資源, 可以組建歷史文獻數字人文研究平臺,進一步開展徽州文書元數據標準方案研究。
中國臺灣學者對于數位典藏的研究一直以來都排在世界的前列,而且還融入了教育教學之中。林國隆[7]將摘述已經完成開發的“以融入課程教學的屏東地方文史資源數字典藏”的七個地方文史網站內容,并以其中獲獎的屏東崇蘭“蕭氏家廟”為例,對融入課程教學的地方文史資源數字典藏的相關內容進行了說明。
(2)古籍數字化。學者多以構建古籍研究平臺對古籍進行開發。盧彤[8]通過網絡訪問、親身體驗與文獻調研,考察了中文古籍數字化成果輔助人文學術研究的功能,這種將學術傳統與信息技術融合在一起的開發模式,將是未來古籍數字化的發展方向。范佳[9]認為古籍數字化工作是數字圖書館建設的一個重要環節,應該從文本挖掘、GIS 技術、文本可視化和古籍語料庫四個方面進行古籍數字化的深度開發。
(3)家譜數據庫與名人手稿檔案庫數字化。夏翠娟[10]以上海圖書館家譜數據庫中的“上川明經胡氏”和“湖廣填四川”為例,詳細展示了關聯數據在數字人文研究中的作用和用法。作者在另一篇文章中以“名人手稿檔案庫”為例,結合多年來數字人文項目的探索與實踐經驗,從數字人文項目的建設方法、建設流程以及技術框架三方面梳理總結面向知識服務的圖書館數字人文項目的建設過程[11]1。
2.基于數字人文的服務。數字人文的服務主要體現在圖書館知識服務、學術服務以及科研服務三個方面。
(1)國外數字人文服務的借鑒。查閱相關文獻,國外主要以圖書館機構為主體開展服務。田燕飛[12]采用網絡調查法與案例分析法,選取美國十家高校圖書館,從數字人文咨詢服務、數據管理、技術支持及協助申請資金等方面進行研究,認為我國應注重多機構和跨學科合作、加強數字人文資金的引進以及建立專業數字人文研究平臺。同樣,唐樂[13]通過調研美國耶魯大學圖書館數字人文服務,得出結論認為我國高校圖書館應改造空間,積極與校內外機構尋求合作,支持用戶對外學習交流。
(2)圖書館知識服務模式。圖書館的知識服務主要體現在構建相關模式以及實現館員與用戶的精準對接這兩個方面。王新雨[14]分析了數字人文對圖書館服務創新的促進作用,從豐富知識服務產品形態、優化文獻資源整合、發揮數字人文館員作用等方面提出面向數字人文的知識服務策略,構建了面向數字人文的圖書館知識服務模式。孫輝[15]認為在新型科研信息環境中,應有效構建圖書館學科館員與用戶之間的深度對接和精準服務,深挖需求,提供信息資源保障和數據密集型科研能力保障。
(3)基于數字人文的學術服務。基于數字人文的學術服務主要包括學科服務與科研服務。在學科服務方面,李立睿[16]認為高校圖書館可以從重視用戶個性需求內容識別、以協同化模式推動服務進程、加強綜合化服務聯盟構建等方面深化數字學術服務發展。王曉陽[17]重點以哈佛大學開展的培訓項目“數字學術基礎(FDS)”工作坊為案例,梳理和分析了哈佛大學組織開展數字學術培訓項目的構建機制與內容。
對于圖書館科研服務方面,黃鈺新[18]和賴永忠[19]在文章中對此均有研究。前者在解讀數字人文與圖書館關系的基礎上, 揭示圖書館在數字人文中的作用及角色,構建嵌入數字人文過程的圖書館科研數據服務模式并闡述服務內容。后者在解讀數字人文概念的基礎上,分析圖書館支持數字人文的內在邏輯并提出了相應的科研支持服務體系。
3.基于數字人文技術在不同領域的實踐。上文對于數字人文的圖書館館藏建設和服務進行了闡述,本章以數字人文的實踐方法為劃分依據,分別從視覺模型研究、知識圖譜以及眾包平臺三個方面進行概述,提供了數字人文研究的新思路與新方法。
(1)視覺模型研究。關于數字人文視覺的領域,學者們通常采用構造相關模型的方法來進行研究。秦思琪[20]基于深度學習方法和哈希方法構建了面向數字人文的圖像語義特征提取模型。周知[21]提出了一種面向數字人文視覺資源的語義知識層次化聚合服務模型,并且對聚合服務體系提出對應的服務保障方案。曾子明[22]提出了一種基于關聯數據的數字人文視覺資源知識組織模型,并以敦煌文化遺產為具體案例進行進一步的說明與解釋。
(2)知識圖譜。許鑫[23]選取了三個文獻集和兩個引文文本集,通過構建兩個無向的關鍵詞共現網絡和兩個有向的基于文獻引證的關鍵詞網絡,揭示數字人文的研究重點、核心領域與核心技術。周莉娜[24]等人在對領域知識服務需求進行調研的基礎上,設計出了相關本體模型,采用知識抽取、知識融合、知識推理等技術自動構建唐詩知識圖譜,實現了對大規模唐詩數據的語義化處理,為唐詩的研究方向提供新的思路。
此外,除國內特色資源的案例外,崔春[25]通過爵士歷史的數字檔案揭示音樂家之間的關系以及他們在爵士領域的社交網絡,介紹了關聯爵士項目產生的背景、具體內容、開發步驟以及項目中的關鍵問題。我國臺灣的方瑀紳[26]通過Web of Science 資料庫所收納期刊發表的SL(“第二生命”數位學習平臺)文獻為對象,通過共被引知識圖譜呈現的均衡分散現象,得出了SL 研究領域尚未形成自身獨特的核心群集的結論。
(3)眾包平臺。眾包平臺是近些年提出的一個新思路,但是國內學者對此的研究不算是很多。韓文婷[27]以盛宣懷檔案眾包抄錄項目為例,探討了在不同任務復雜度和領域知識水平下,眾包抄錄任務績效的差異,為國內數字人文類眾包平臺的建設提供了在任務設計、參與者招募及任務匹配方面的建議。
4.基于數字人文的教育。
(1)圖書館數字人文教育。本章中學者們多以國外圖書館的數字人文教育與國內圖書館數字人文教育的現狀進行調研及對比,面向對象主要是社會公眾和學生。肖平[28]通過塞勒姆州立大學圖書館的本科生數字實習計劃、密歇根州立大學圖書館的數字人文社區活動以及亞利桑那大學圖書館的ISpace 場所建設這三個實際案例,探討了高校圖書館參與數字人文教育服務實踐的途徑。先衛紅[29]總結了國外圖書館數字人文教育許多成功案例。如加州大學歐文分校揭示了圖書館如何支持數字人文教研的有效方法,澳大利亞國立大學創建數字徽章項目等,她認為要通過創新創業素養教育、建設協同創新服務系統以及構建數字人文創客空間三種教育形式來實現圖書館的數字人文教育。楊曉雯[30]分析了高校圖書館開展數字人文教育的動因,隨后通過調研美國20 個高校圖書館、ARL 相關報告和文獻,認為我國開展高校圖書館教育是使命要求。
(2)高校數字人文教育。數字人文教育不能只局限于圖書館,高校也要加強對學生在數字人文領域培養。吳加琪[31]等人對國外數字人文專業研究生教育的部門設置、學位授予、培養力量、課程體系、職業發展等進行調查分析,提出我國應該以圖書情報學科為主體開展數字人文教育、豐富數字人文專業教育形式、加強數字人文課程整合、發揮數字人文研究中心作用等解決方案。在國內數字人文教育的實踐方面,王濤[32]以“數字工具與世界史研究”課程為例,認為本科層次的數字人文課程體系非常重要,并且需要借助完備的課程和實踐,讓學生為未來的數字人文挑戰做好準備。
(3)數字人文館員培養。美國首先在高校圖書館建立起了數字學術中心來為數字人文的研究提供支持,所以培養數字人文館員也是必不可少的一環。鄭麗央[33]通過調查發現美國十所高校圖書館的數字學術館員崗位職責中都包括了數字人文服務,并得出高校圖書館數字學術館員隊伍的建設具有崗位多樣、職責明確、分工靈活、服務全面等特點。朱慧敏[34]運用文獻調查法和內容分析法,指出數字人文視域下,數字人文館員的能力構建有助于圖書館服務升級轉型。
5.檔案學界數字人文文獻綜述。
(1)數字人文與檔案工作關系探討。李子林[35]13和吳加琪[36]系統地總結了數字人文與檔案工作關系,都提到了加強與數字人文中心的合作。前者還指出數字人文背景下,應發揮檔案專業優勢,立足人文研究需求,引入數字人文技術才能更好地推動檔案開發利用工作的發展。后者通過對檔案工作參與數字人文進行需求分析,提出了檔案工作可以在檔案原始資源提供、推進檔案數字人文項目、培養數字人文檔案館員、建立合理的知識產權保護機制等方面參與數字人文建設。
(2)數字人文在檔案領域的應用。在數字環境下,關于檔案資源的整合也是學者們廣泛關注的主題。張衛東[37]等人認為現代信息技術的不斷演進和發展為檔案資源整合工作提出了更多可供探索的道路,數據驅動環境下的檔案資源整合、檔案智慧數據的整合與應用、館藏史料的數字化編研等領域可能成為未來的研究和工作重點。
還有學者舉出實際案例來探討數字人文在檔案領域的應用。例如,鄒燕琴[38]以地方特色檔案為研究對象,從社會記憶視域下地方特色數字檔案資源開發模式的轉變、社會記憶視域下地方特色數字檔案資源的開發路徑兩大方面為構建完整的社會記憶提供借鑒。對于聲像檔案的利用,張美芳[39]提出面向數字人文的聲像檔案資源組織方法,構建了從數字采集到精準服務利用的模型。
(3)國外數字人文項目對檔案領域的借鑒。數字人文在檔案領域的實踐以“威尼斯時光機”和“暗影之谷”較為著名。董聰穎[40]在文章中提到“威尼斯時光機”的案例,提出了數字人文視野下對檔案信息資源開發利用的影響、檔案資源的開發模式以及探索路徑。趙生輝[41]深入研究了“影谷”項目,在此基礎上認為應該積極參與“國家數字人文基礎設施建設工程”的規劃,建立檔案領域數字人文項目的資助和認證體系,鼓勵歷史和檔案領域研究機構依托優勢開發數字人文項目。
通過對相關文獻進行分析發現,國內圖情檔領域對于數字人文方面的研究還多集中于借鑒國外成果,并沒有形成一個完整的研究體系。另外,相關文獻仍然多以理論研究為主,缺乏相應的實踐。現在的數字人文還處于不斷的探索和發展階段,僅有理論的支撐是不夠的,高校可以聘請相關領域的專家,如計算機專家、歷史學專家開展合作與交流,進行人文學與技術的深入合作。
隨著大數據時代的到來,圖情檔領域學者們的研究內容也發生了相應的轉變,關于數字人文的研究在這個時代脫穎而出。正如在2019 年“圖書情報與檔案管理研究生教育論壇及2019 圖書情報與檔案管理青年學者論壇”中馬費成、馮惠玲等學者提到的:現在的圖情檔學界正在面臨著變革,既要保留自身的特點,又要和其他領域展開協作。數字人文就是這樣一種研究方式,通過計算機技術與傳統人文學科進行深度融合,這就需要培養更多的高素質人才,才能更好地適應未來社會的發展。