劉 洪,肖 鵬
著名咨詢公司Gartner每年都會發布《技術成熟度報告》 (Gartner’sannual Hype Cycle Report)。2018年8月底發布的最新報告通過對2000余項具體技術的評估,分析了最具影響力的35項技術的成熟度,總結出“大眾化的人工智能”(DemocratizedAI)等五大新興的技術趨勢[1]。該系列報告的特點之一是將每項備受關注的技術安置在由“期待值”和“時間”構成的坐標軸上,結合“成熟度曲線”,將整個坐標軸切分為“觸發期”“期望膨脹期”“幻滅期”“復蘇期”“成熟期”等階段(見圖1)。這一系列報告很少公布研究細節,因此引發過一些非議,但通過對技術生命周期、技術采納等思想的轉用,“成熟度曲線”為學界和業界提供了指引,實則具有宏觀層面的啟發價值。

圖1 新興科技技術成熟度曲線圖[1]
“觸發期”“期望膨脹期”“幻滅期”“復蘇期”“成熟期”等階段的劃分也適用于科學研究領域。當然,其在科學解釋力上無法與類似的信息計量研究相提并論,但對研究路徑的方向把控而言具有較強的參考意義。根據這一思路,一個頗具前途的研究領域或技術體系剛剛出現時,無疑容易引起狂歡和妄想,由此“觸發期”的期望曲線一路陡升,并逐步進入“期望膨脹期”,學界和業界對其滿懷信心和期待,從各大會議、期刊組稿與線上線下熱烈的討論來看,我國數字人文研究正在走入這一階段。但膨脹的期待經常會遭遇冷酷的現實或無所成就的實踐,繼而走向“幻滅期”,部分研究從此銷聲匿跡,但也有一些研究艱難地穿過虛榮的幻象存活下來,繼而成熟,最終演化為一個范式化、常規化的研究領域,甚至成為具有長久生命力的研究傳統。
本文嘗試討論的主題是:我國數字人文研究是否已經是一項研究傳統,或進一步地,是否已經成為所謂的“研究范式”?如果不是,它又應當如何通向彼岸?本文以《圖書館論壇》數字人文來稿和發表文章為數據源,對《圖書館論壇》“數字人文”專欄設置兩年來進行整體性回顧,并嘗試討論數字人文研究的未來發展與關鍵守則。
2017年1月《圖書館論壇》設置我國第一個“數字人文”專欄,有幸參與到我國轟轟烈烈的數字人文浪潮之中,踩在了這一研究“觸發期”的關鍵節點上,也為圖情檔學科在該領域占據了先機。一般的文獻計量學研究只針對已發表論文,很少涉及對期刊來稿的分析。由于針對來稿的分析可以呈現數字人文研究“冰山之下”的情況,為此下文做一些簡要的分析。
從2016年1月1日到2018年10月24日,“數字人文”欄目來稿量逐漸攀升(見圖2)。在這一期間,通過初步篩選,進入審稿流程的論文計有130篇,其中35篇被錄用,錄用率為26.92%。相較于《圖書館論壇》整體的稿件錄用情況(2014—2017年錄用率分別為 5.70%、5.65%、6.37%和6.27%),這一比例相當高,原因主要有兩個:一是面向專家的約稿較多;二是推動“數字人文”領域的發展。

圖2 “數字人文”來稿量
就來稿作者的機構分布而言,主要來自圖情檔院系和圖書館,占83.33%(見圖3)。這一情況與《圖書館論壇》的學科立場有密切的關系。不過,從來稿情況看,圖書館、博物館、數字人文中心等擁有特藏資源與實踐機會的機構在數字人文研究中確乎具有先天優勢,如上海圖書館的相關團隊對數字人文項目建設方法、流程的實踐總結便頗具示范價值[2]。

圖3 來稿作者機構分布情況
作者的合作和年齡是判斷某領域活躍度的重要指標。在數字人文來稿中,65%為合著。進一步分析發現,跨領域的合作案例相當少,這并不完全符合我們對數字人文研究的期待。在作者年齡分布上,45歲以上的學者僅占4%,表明該領域屬于中青年學者,而博碩士研究生又占了一定比例。
在基金資助方面,在數字人文來稿中,只有26.15%受基金資助,既低于傳統研究領域的基金資助情況,也低于《圖書館論壇》同期來稿52%的基金資助情況。結合已發表數字人文論文的基金資助情況來看,現有數字人文研究多是成熟研究的分支或延伸,專門針對數字人文的資助項目還不多。不過,結合2018年度國家社科基金、教育部基金的立項情況,尤其是重大項目的課題指南清單,可以說各級基金對數字人文領域的關注度正在迅速提高。
(1)主題分布。130篇來稿的主題主要包括數字人文概念和發展歷史、數字人文基礎設施、數字人文教育、圖書館與數字人文的關系、數字人文研究方法和工具、數字人文案例、數字人文書評。本文并未針對各主題給出具體的統計數字,原因在于:許多論文有一定的主題和方向,但基本是粗淺的介紹和分析,或使用較多篇幅討論數字人文定義等在學界已逐步成為常識的內容。
(2)退稿原因。數字人文來稿的審稿采用同行評議制度。退稿原因主要有:①有一定程度的學術倫理問題,尤其是對外文文獻的淺層次整合;②缺乏問題意識,選題比較舊,簡單地重復相關概念和歷史發展情況,尤其是很多文章嘗試以CBDB為案例展開探討,但對CBDB的剖析和理解多屬于介紹;③缺乏學術性,沒有科學的研究方法和研究過程,基本停留在簡單的思辨層面;④缺乏充分的數據和證據支撐,工作量不足。此外,還有一個因素尚未成為主流的退稿原因,卻深深困擾著編輯和審稿團隊:某些研究實際上是傳統的可視化研究、文獻計量研究或信息組織研究,卻以“數字人文”之名進行投稿。若相應的研究本身達不到相應水準自不必說,但假設它們的完成度相當高、方法結論也可稱合格,究竟是否應該在本欄目刊登這些成果呢?目前的處理情況往往是一事一議,但這似不符合長遠的原則。
整體而言,上文分析比較簡單。盡管如此,考慮到當前關于數字人文的計量研究主要以已發表論文作為數據源,而對來稿的分析同時反映了“水面之上”和“水面之下”的情形,這一工作對本專欄潛在的作者群和數字人文領域的研究者、行動者會有一定的參考價值,也可幫助我們窺得數字人文領域的一個側面。
通過對以上數據的考察和日常接觸數字人文領域的個性化經驗,筆者切身感受到潛藏在表面繁榮之下的危機。正如上文所言,如果在技術成熟度曲線的坐標軸上做一個頂點,當前對我國數字人文研究的期待無疑逼近期待曲線的巔峰。但在期待之外,數字人文真正的黃金時代遠未到來,因為屬于數字人文時代所應有的和獨有的工具理念與研究范式尚未構筑完備。基于專欄的數據分析,以及與作者、審稿專家群體的交流,當前我國數字人文研究具有四個特點。
(1)數字人文正在成為學術型圖書館的創新點,但是,大部分圖書館仍然處于數字人文的迷茫期。對大型學術圖書館而言,基于特藏資源的數字化工作本就是日常性的重點工作,數字人文的崛起在這一基礎上提供了兩個層面的新機遇:其一,來自人文社科領域的團隊變得日益主動;其二,國家、地方和學校越來越愿意針對特定項目給予日常預算之外的資助和支持;更重要的是,這兩個機遇往往交纏在一起。但是,對中小型圖書館而言,如何開展數字人文,大多數管理者和圖書館員依然迷茫;隨著大型圖書館迅速發掘其特藏資源與經費資源的優勢,部分中小型圖書館明顯地顯示出焦慮和無奈。這種“鴻溝”在專欄來稿中顯得尤為明顯,即便只是觀察同等學歷和職稱的圖書館館員,大型學術圖書館的館員多能聚焦于特定的學術資源,而中小型圖書館的館員往往難以找到合適的切入點。
(2)當不同領域的學者、圖書館員之間建立合作關系,往往能夠完成更具深度的研究課題,但這種類型的合作十分稀缺。最理想的數字人文合作模式應該是以傳統人文學者為主導,提出研究問題,其他領域的學者與人員提供支持,進而解決問題或發現新的知識;但如今常常變成外來學者突然跳入某一特定的人文領域,勇敢而孤獨地試錯和摸索。這一問題是一個世界性的難題。筆者所在的團隊近日針對五種數字人文領域的期刊——《數字人文季刊》(Digital Humanities Quarterly)、《人文研究中的數字學術》(Digital Scholarship in the Humanities)、《數字研究》(Digital Studies/Le champ numérique)、《文化分析雜志》(Journal of Cultural Analytics)、《交互技術和教育學期刊》(Journal of Interactive Technology)2012-2018年的論文發表情況做了初步的計量分析,通過繪制作者共現圖譜,發現數字人文領域的整體合作情況均不理想,遑論跨領域學者的合作深度問題。
(3)數字人文存在明顯的泛化危機,正在迅速“標簽化”。在某種程度上,這一危機從數字人文誕生之日起就存在,但近期數字人文正在迅速淪為“大數據”般看似光芒四射、實已欠乏解釋力的詞匯。這一點已有論及,不再贅述。

圖4 5種數字人文期刊的作者共現圖
(4)新時期的數據理念和數據認識尚未被充分接受,學界和業界整體的數據公開、共享和聯合情況仍不如人意。非僅《圖書館論壇》的“數字人文”專欄,在絕大部分已發表論文中,提及的數據集往往難以獲取、驗證,這在很大程度上影響了數字人文研究的可信度和說服力。但是,這一問題反而是最容易解決的,因為開放運動是不可逆的潮流,而我們已然身處其中。
針對以上問題,惟其明確并構建起獨有的工具理念與研究范式,方能保持數字人文的長遠發展動力,才有可能哺育和維護相對健康的數字人文領域,實現新興知識體系的共生與長遠發展。筆者斗膽初步提出數字人文研究應當具備的四個基本原則,供學界批判。顯然,在短期內要求所有的相關研究都達到這一標準并不實際,但我們希望將這些原則慢慢融入未來“數字人文”專欄的審稿理念之中。從另一個層面來講,或許這四個原則也能夠幫助學界和業界厘清未來一段時期數字人文研究的發展路向與目標,為數字人文實現“期待值”與“現實情況”的契合、真正走向成熟期做出貢獻。
“人文中心”是數字人文研究的起點與根本,失去“人文”,“數字人文”這一詞匯便失去了所有被闡發和被詮釋的價值。對“人文中心”至少應當有三個層次的認識:尊重人文領域的已有研究,延伸人文課題的問題邊界,增強人文學者的技術賦能。
尊重人文領域的已有研究是對“人文中心”最基礎也是最必要的理解。部分數字人文研究常常忽略人文學者經年累月對相關課題做出的探索。一個經典的例子是很多初涉人文領域的學者熱衷于對某些經典名著進行社會網絡勾勒或字頻詞頻計算,在對應的文獻綜述中也以“無相關研究”一筆帶過,但事實上文學領域的社會網絡研究、語言學領域的語料庫構建,已將相關研究推進至其他領域學者難以縱深和創新的地步,更毋論新知識的發現。
在延伸人文課題的問題邊界方面,在通常的認知中,數字人文屬于跨學科的研究范疇,它在人文學者的傳統學術場域中撕開一道口子,為自然科學與社會科學研究者提供了發聲的空間與行動的機會,但人文課題理應在這一跨領域的研究中占據主導和核心地位。數字人文的關鍵是以“數字”輔助“人文”,而不是以“數字”替代“人文”。
在增強人文學者的技術賦能方面,強調“人文中心”并不是簡單地為人文學者的“權利”搖旗吶喊,更大程度上是對人文學者提出要求,希望人文學者迅速地認識、接受、批判和變革數字人文的研究范式,這些工作的前提是提升人文學者對技術的認識水平和習得能力。
“數字”與“非數字”平衡的追求是開展數字人文研究的第二項基本原則,過度的數字化實際上會消解人文學者解釋的主動權,而程度過低的數字化則無法發揮數據科學、計算機科學等介入人文研究后帶來的跨學科優勢——這兩者之間的拔河正是不同學者對“遠距離閱讀”等新興分析技術爭議紛紛的深層次原因。
2019年斯坦福大學中國史副教授Tom Mullaney將出版《中國人的死亡景觀》(The Chinese Deathscape)一書,該書的研究與其多年以來主導的中國墳墓搬遷研究有著直接關系,“死亡景觀”的呈現便是基于墳墓搬遷資料的可視化工作。2016年Tom Mullaney在談及這一工作時指出,在經典的人文研究與數字化平臺之間需要取得相對的平衡:“如果我們天平的一端走得太遠,那么我們便會失去這一研究的人文內涵;如果朝相反的方向沖過了頭,又將失去數字平臺所提供的宏觀尺度。”[3]這句話切中要害,一項優秀的數字人文研究應當兼顧兩個方面的需求:既發揮數字化與可視化的優勢,又為人文學者留下解釋和分析的話語空間。
問題意識是支撐研究的靈魂,數據意識則豐滿和充實相關研究的血肉,兩者缺一不可,因此,實現問題意識與數據意識的深度融合是未來數字人文研究的第三個基本原則。這一原則具體包括兩個方面:一是充分理解“問題即數據”,研究者能夠自覺、流暢地通過廣泛意義上的數據工作,實現對獨特的人文問題的理解、呈現和探索;二是明確認識“數據即問題”,研究者能夠充分理解特定問題領域的數據收集、構建和形成過程,在使用過程中明確闡述其利弊要害。
數據的開放性、可驗證性與可迭代性是衡量一項數字人文研究的關鍵標準。每個數字人文項目應盡量“張開手臂”,沿著這三個維度伸展開去,以保證該項研究的可信度和可延續性。包括本刊在內的多家圖情期刊在第九屆上海國際圖書館論壇上簽署《共同推進圖書館學情報學期刊開放獲取聯合倡議》,強調“以更開放的姿態,迎接新的信息時代的到來”[4]。再早之前,《圖書館雜志》率先在數據共享方面展開行動,強調對數據出版的支持。可以說,圖情領域已經為“三個維度”的實現奠定了基礎性工作。筆者相信,在未來的某個節點,不符合這三項最低標準的研究不會被視為一項合格的數字人文研究。