平 碩 黃永勤 楊安蓮/國防大學政治學院軍事信息與網絡輿論系
數字人文起源于“人文計算”,是近年來人文社會科學與計算機技術、數字技術相互融合的新型跨學科研究領域。學者們對于數字人文的定義莫衷一是,沒有確切的統一定論,其中2004年John Unsworth等專家編寫的《數字人文指南》成為最早系統研究數字人文的著作[1]。2009年現代語言協會年會(the Modern Language Association)上,“數字人文”作為一個新的研究領域獲得北美人文學界的關注;同年,武漢大學王曉光教授發表《“數字人文”的產生、發展與前沿》[2],最早將數字人文概念引入國內。數字人文被提出之后,國內外學者發現通過信息技術手段重塑和改造人文知識,可以使深奧的人文學術領域被更為廣泛的民眾所理解和利用,進而提升學術領域的影響力[3]。
檔案是傳統人文研究的重要對象和資源,蘊含豐富的國家、社會和民族記憶,數字人文以一種新型學術模式和組織形式為檔案學研究和檔案工作提供了新思路。數字人文連續4年(2018年[4]、2019年[5]、2020年[6]、2021年[7])入選圖情檔學界研究熱點問題,馮惠玲教授[8]等權威專家也將“檔案與數字人文”研究作為“十四五”期間檔案學重點研究領域展望之一。經過數年發展,檔案領域的數字人文研究已經積累了一定數量的成果,但目前尚未發現有相關論文對其進行總結。本文嘗試梳理國內外的相關研究進展,以期為后續研究提供參考。
筆者選擇圖書館和信息科學文摘數據庫(LISA)作為國外文獻來源數據庫,中國知網CNKI(含中國學術期刊〔網絡版〕、中國博士學位論文全文數據庫、中國優秀碩士學位論文全文數據庫、中國重要會議論文全文數據庫和國際會議論文全文數據庫)為國內文獻來源數據庫,檢索范圍從2004年1月至2021年9月,分別構建檢索式“(SU digital humanity OR SU digital humanities OR SU humanities computing) AND (SU archive* OR SU records)”和“SU=(數字人文+人文計算+數字記憶)*(檔案+檔案館+檔案研究+檔案工作+檔案管理)”,經過數據去重和補全,獲得國外文獻239篇、國內文獻222篇(注:檢索并下載數據時間為2021年9月10日—14日)。
對文獻初步統計分析發現:第一,從發表時間看,國內外學者十分關注檔案領域的數字人文研究。整體而言,國外開展研究的時間比國內早,而國內有87%的論文發表在最近3年,研究迅速勢頭迅猛,已成為當下的研究熱點。第二,從文獻來源看,國內研究論文多發表在檔案領域專門期刊上,國外研究論文多發表在圖書館和信息科學領域的期刊上。第三,從發文作者看,國內外學者大多采取合作的方式進行研究,但國內學者多在本研究領域內合作,而國外學者多是跨領域、跨學科合作。第四,從研究機構看,國內外研究學者多集中于高校、圖書館和數字人文研究中心,表明數字人文在檔案領域的研究還需要逐步發展和完善。
筆者利用VOSviewer,分析國內外研究成果的關鍵詞。分析發現,國內外研究熱點可以分為4個方面,且相互之間聯系密切。一是基本理論研究,涉及的關鍵詞包括數字人文、數字檔案、檔案、數字記憶、知識組織、Digital Humanities、Archives And Records、Digital Archives、Digitization、Metadata等。二是學科建設研究,涉及的關鍵詞包括檔案學、檔案工作、檔案館、數字轉型、人才培養、Humanities、Library and Archives、Digital Libraries、Research、Interdisciplinary、Cooperation等。三是應用技術研究,涉及的關鍵詞包括關聯數據、可視化、數據挖掘、Social Networks、Data Mining、Semantic Web、Geographic Information Systems(GIS)、Visualization等。四是實踐拓展研究,涉及的關鍵詞包括社會記憶、城市記憶、數字人文中心、非物質文化遺產、Museums、Semantics、Library And Information Sciences、Digital Preservation等。
綜合上述文獻分析結果可以發現,目前數字人文在國內檔案學領域的研究思路主要是對數字化的檔案資源進行組織,建立檔案資源數據庫,運用信息技術手段進行數據挖掘和知識加工,向用戶提供可視化展示和利用服務。具體研究主題可以歸納為以下4個方面。
一是基礎理論研究。數字人文作為一種理念和方法,在融入檔案學領域的過程中應批判性地加以應用。很多學者對數字人文與檔案工作之間的關系進行探討,認為數字人文有助于檔案學科創新發展。加小雙[9]對檔案領域與數字人文領域的檔案概念進行分析和界定;張衛東[10]認為檔案學科在實施數字人文的過程中,應運用辯證思維,既要積極利用,也不盲目追捧;左娜[11]提出保持對數字人文理念的持續批判,實現由“作為檔案研究重構策略的數字人文”向“作為數字人文重構策略的檔案理念”的轉變。
二是檔案資源建設和開發利用。數字人文背景下,檔案資源建設是開發利用的基礎,檔案資源開發利用是開展項目和服務的重要環節。越來越多的研究借鑒國內外的研究成果,以自建或復用本體、構建知識圖譜和專題數據庫的方式進行檔案資源的開發利用,實現檔案資源知識組織和關聯推理,進而提供查詢和利用服務。同時,還有學者以檔案學科話語體系為標準,提出以“發現”“重構”“故事化”三原語為主線的檔案研究路徑基本模式,形成數字人文視角下檔案研究的方法論體系[12]。
三是數字人文技術。數字人文技術是實現檔案資源服務、保證數字人文項目開展的重要手段。數字人文的技術與理念從檔案組織、著錄、管理、服務等層面給檔案業務活動帶來了巨大變革[13]。數字人文技術的應用取決于檔案資源的特點和類型,整體而言,對檔案內容挖掘與知識發現是數字人文研究的重要組成部分[14]。地理信息系統(GIS)、數字地圖等可視化技術可以直觀展示檔案數據形象;人機交互、虛擬現實(VR/AR)等技術可以提供更好的用戶體驗,實現多媒體檔案的價值;文本分析、內容挖掘等數據分析技術可以在語義層面提供更為廣泛的檔案信息檢索和利用服務。
四是數字人文項目。我國檔案領域的數字人文項目雖起步較晚但成果頗豐。從空間維度看,研究者以美國、日本、歐美等國家具有代表性的數字人文項目為研究對象,為我國數字人文項目提供參考和借鑒。從時間維度看,檔案機構和研究者開展以文化遺產檔案、歷史檔案、紅色檔案、機構檔案等為主體的數字人文項目,以實現檔案資源的價值。此外,研究者對我國具有代表性的歷史建筑、山川河流、文化名人等檔案資源進行整合,形成特色資源知識庫、知識圖譜、知識地圖等產品,為用戶提供檔案查詢和利用服務。
目前數字人文在國外檔案學領域的研究多由研究機構推動,從具體領域項目實踐出發,實現檔案資源的保護與利用。其研究主題可以歸納為以下3個方面。
第一,機構主導特點明顯。國外檔案機構主動服務和接受新思維的理念與意識要強于國內檔案機構,因此國外的數字人文項目實踐大多由檔案機構和數字人文中心合作組織開展。Lavinia Ciuffa[15]闡述了數字人文中心(DHC)對于數字化檔案描述的作用,認為其可以為研究檔案資源提供幫助;Megan E. Macken[16]探討了數字人文學科與GLAM(Galleries、Libraries、Archives、Museums)之間的合作優勢及可行性;Tanya Clement[17]等人采用訪談的方式,討論了數字人文背景下檔案館未來的動態發展特點;Bernhard Fetz[18]闡述了奧地利國家檔案館在開發和利用檔案館藏資源和數字人文發展方面所做出的努力。
第二,數字人文技術和方法。國外學者對于信息技術在人文學科的應用非常重視,自然語言處理、語義關聯、虛擬現實、空間重建、文本分析等信息技術在實證研究方面得到了很好的應用和拓展。以“威尼斯時光機”(Venice Time Machine)項目為例,科研人員運用了掃描、圖形設計、3D建模等數字化技術,文本搜索、語義搜索等數據管理技術,文本分析、內容挖掘等數據分技術,視覺搜索、地理信息系統(GIS)等可視化技術,為檔案資源的保存管理、信息搜索、內容分析和可視化呈現等開辟了新的途徑。此外,A. Miller[19]等人認為交互式數據可視化可以用于深入探索數字館藏并激發用戶驅動;Sheila Bair[20]等人認為以規范化名稱標題和主題的形式添加元數據,可以極大增強關鍵詞搜索體驗、有效滿足用戶需求。
第三,檔案資源保存與保護。國外研究學者對于檔案文化遺產的保存與保護十分重視。相比于傳統的檔案文化遺產保存與保護,開展數字人文項目能夠有效修復、組織、管理和保存數字化的檔案文化遺產,為檔案文化遺產的數字長久保存提供解決方案。如,Marjan Balkestein[21]等人討論了使用ADA(數字學術遺產存檔)方法對舊的數據文件進行追溯歸檔,并發現其在檔案保管中具有現實作用;Cait Coker[22]等人建立關系型數據庫中的樹形結構,用以保存和恢復原始文本和數字化知識。
結合國內外研究現狀,筆者認為國外數字人文與檔案學領域的研究雖然沒有發展成完整的研究體系,但從理論研究和實踐研究看,其相比國內更加成熟。因此,國內檔案領域數字人文研究需要在理論體系建設、技術開發與應用、項目成果與產品服務、跨學科交流合作中進一步發展。
第一,數字人文理念在檔案領域生根發芽。綜合國內外的研究問題和項目實踐來看,一是數字人文與檔案學科領域的融合,革新了檔案領域的研究方法,拓展了檔案學科研究的邊界;二是數字人文理念為檔案資源整合提供了思路和方法、優化了資源配置,有利于檔案資源建設;三是數字人文一定程度上改變了傳統的檔案資源的開發利用模式,有利于實現檔案資源的內在價值;四是數字人文為檔案學研究提供了先進的技術工具,為開展知識服務和組織聚合提供了有力的保障;五是項目實踐為數字人文與檔案學研究融合奠定了基礎,進而在檔案管理、教育、科研等工作中發揮作用。2018年以來國內數字人文研究經歷了追捧熱議和辯證思考,正處于系統深入研究的階段,需要檔案學者們共同努力,為檔案學領域的數字人文研究積累經驗。
第二,數字人文技術不可或缺。技術的支撐作用主要體現在以下方面。在信息組織過程中,自動標引技術、數據管理技術等數字化技術可以將非結構化或半結構化的檔案資源結構化,使結構化的檔案資源有序化,讓資源更加有效地被計算機識別從而進行挖掘和展示。在內容分析過程中,文本分析技術、內容挖掘技術等數據分析技術在發現、提取知識,以及數據描述、數據挖掘等方面有不可或缺的作用。在可視化展示過程中,虛擬現實技術、VR/AR技術等數字人文技術的應用,可以使計算機中的數字資源轉化為直觀的展覽形式,提供可視化的動態展示。但由于漢語具有特殊性,在古漢語識別和自然語言處理方面,我國數字人文技術相對國外還需要進一步發展和完善,這也是國內檔案領域開展數字人文項目需要重點解決的問題。
第三,數字人文項目成果豐碩。國外的數字人文項目主要依托高校和數字人文中心進行,主題大多是歷史記憶和檔案管理,如“影谷(The Valley of The Shadow)”“9·11電子檔案(The September 11 Digital Archive)”“歐洲時光機”“莎士比亞手稿”等項目。國內主要以高校數字人文研究中心和圖書館為主體,相繼開展了“中國家譜知識服務平臺”“北京記憶”“盛宣懷檔案知識庫”等一系列數字人文項目。國內外在這方面也有合作,如,敦煌研究院和美國梅隆基金會合作的“數字敦煌”項目、北京大學和哈佛大學合作的“中國歷代人物傳記資料庫(CBDB)”等,都是典型代表。從形成的產品和服務來看,國內的數字人文項目多以某個主題為主,成果相對分散;國外數字人文成果更加豐滿,更能滿足大多數用戶需求,相比國內其產品服務和應用范圍更廣。
第四,學科和行業間合作交流是必經之路。從國內外研究論文看,數字人文研究涉及計算機學、文學、地理學、考古學、歷史學、經濟學等研究領域,學者們試圖從新的技術角度構建當代知識系統和認知方式,在數字時代重構人文知識的脈絡和內容,這使得數字人文有了普遍的跨學科意義。國外數字人文研究論文的關鍵詞中,涉及的學科領域非常豐富,不僅需要多個學科的學者共同合作完成,研究成果也往往會根據具體的研究內容設置多個學科關鍵詞,這些關鍵詞體現了不同學科之間的交流合作。國內檔案領域數字人文研究多集中在圖情檔學科內部,雖然部分高校開始培養不同學科背景學生的數字人文素養,但還需要以項目為牽引,進行跨領域的開放合作。
第五,數字人文在檔案學領域研究持續深入。截止到2021年5月,通過centerNet網站認證登記的國際數字人文建設實體共計168個。截止到2021年9月,我國有11所高校(清華大學、北京大學、武漢大學、南京大學、中國人民大學、上海大學、上海師范大學、南京師范大學、南京農業大學、曲阜師范大學、臺灣大學)先后成立了數字人文研究中心,這說明數字人文的研究實體逐漸獲得學術界認可。從文獻來源看,國內外有DHCommons、DHQ:Digital Humanities Quarterly、DSH:Digital Scholarship in the Humanities,以及《數字人文》《數字人文研究》《數位典藏與數位人文》等專業期刊,國內于2019、2020、2021年連續召開的3屆數字人文年會,推動了數字人文研究的迅猛發展,為數字人文在檔案領域研究的持續深入提供了學術交流平臺。
下一步,筆者將嘗試在數字人文背景下對軍隊檔案資源的開發和利用進行研究,針對軍隊檔案資源的特點和內容,采取信息組織與整合的方法,構建軍隊檔案領域本體,進而構建軍隊檔案資源專題數據庫和知識圖譜,實現軍隊檔案資源的檢索查詢與關聯利用服務,滿足軍隊備戰打仗和指揮決策的需求。