文/李點
數字人文的何作何為、何去何從是數字人文學科建設中的“天問”,從其問世之日起從未停息。在人類科學史上,所有新興學科都在懷疑和質詢的聲音中生長成型,數字人文也不例外。在加利福尼亞的硅谷,“炒作周期”(hype cycle)是一個廣為人知的術語。這個具有自嘲意味的術語描繪的是一般高科技公司發展成熟的五個周期,依次是“科技起因”“過度期望的高峰”“失望的低谷”“啟迪的山坡”和“生產效率的高原”。
這個卓卓有名的“炒作周期”理論是否能有效地解釋高科技公司的成敗興亡另當別論,但數字人文目前處于“失望的低谷”已從個別學者的竊竊私語幾乎變成了學界的共識。跟前期的激烈批評不同——那時一些捍衛傳統人文的學者往往對數字人文持徹底否定的立場,而近期的批評則來自數字人文的參與者,是一種反思與自省式的批評,有點恨鐵不成鋼的意味。弗朗科·莫瑞狄(Franco Moretti)可以算是這類批評的最好代表。莫瑞狄既是著名的傳統比較文學學者,也是公認的數字人文的奠基者之一,他提出的“遠讀”(distant reading)的概念已成為數字人文的一個標識。然而在最近一次有關數字人文的對談里,他對數字人文的學科現狀卻表露出相當悲觀的情緒,認為“[數字人文]已取得的成績并不令人滿意……數字人文自己號稱是了不起的新事物,然而至今為止我們拿不出什么證據證明如此”。莫瑞狄想傳達的是對數字人文真切而又執著的關懷,同時也是對數字人文目前處于“失望的低谷”的焦慮。焦慮的根源在數字人文的研究現狀與我們對它的“過度期望”不相般配,這是莫瑞狄的個人意見,但他很顯然綜合了眾多批評者的聲音。
數字人文孵育于20世紀六七十年代,成型于八九十年代,自2004年正式命名之后,進入迅速發展的時期,相當于前文所說的“過度期望的高峰”。迄今為止,數字人文當然不是一無所成;恰恰相反,它可以說是從無到有,碩果累累。除了海量的制作(圖像、數據和編碼)、論文和專著以外,數字人文的成果主要表現在學科本身的制度化建設,包括研究中心、專業協會與行業學術刊物。數字人文的制度化建設的迅猛發展離不開充足的科研經費支持,這方面數字人文相比傳統人文有明顯的優勢,因為其與電腦科技的交叉得以模仿現行自然科學體制的操作模式,從而取得公共資源與私立基金會的資助。
然而,制度化建設的成功并不是一個學科成熟的決定性標志,有效研究成果及其影響才是。迄今為止,數字人文領域內發表的成果雖然非常可觀,可是真正令人滿意的杰作卻是鳳毛麟角。這正是莫瑞狄焦慮的根本原因所在,所以他對數字人文未來的工作提出如下建議:“也許數字人文接下來要做的最重要的事情是了解自己的研究成果的性質,也就是如何評估的問題。同時,我們必須反思為什么生產優異的成果如此之難,盡管我們的精力、人才和工具一樣也不缺。”
數字人文研究成果的評估困難恰恰來自這個學科的新穎之處:即把數據分析帶入文本分析,通過其產生的統計性的數量化結果而導出新的結論,產生新的知識。經過幾十年的努力,數字人文的這種工具理性的價值已經得到了制度化的肯定,可是它的價值理性必須納入現有的科學評估體系,包括傳統人文的價值評估范式。很顯然,數字人文的數量化文本分析方法跟傳統人文的質量化分析方法是有區別的,因此要想建立一個統一的標準是件困難的事。所以早期的數字人文學者處于相對獨立的狀態,在學術領域的邊緣地帶獨自辛勤耕耘。進入21世紀,數字人文的潛在學術價值不再令人懷疑,但是如何在現有的學術體系中評價數字人文研究成果引起了持久的爭議,這首先對于數字人文學者的求職、升遷和獎勵具有實際意義。有鑒于此,美國現代語言協會(Modern Languages Association)于2000年發布了關于評價數字人文與數字媒介學術成果的指導性建議,并于2012年更新。這份建議首先肯定數字媒介對教授職能在讀寫文化、學術研究、教學實踐及公共服務方面帶來的巨大變化,而數字人文代表的方法和理念是延續和張揚人文精神新的知識渠道。由于數字人文學科本身的繁復和多樣,這份建議并沒有給出非常具體的評價標準,只是強調在傳統學術評價規則的框架之下包容更為廣泛的研究成果樣式,如電子出版物、開源期刊及數字與圖像制作。
事實上,數字人文的興起也得益于美國高等教育界自20世紀90年代以來對于高等教育的價值與目的的反思,包括有關學術文化傳統的重新認識。1990年,著名教育學家歐內斯特·博耶(Ernest Boyer)發表了影響深遠的研究報告《重估學術:教授職業的首要責任》,主張在高等院校日益增加的社會責任和迅速發展的信息化科技的前景之下,要突破由來已久的研究即學術的傳統定義。他認為教學與研究決然對立的思維已經過時,提出了擴展學術定義的四點意見,即發現的學術、整合的學術、應用的學術和教學的學術,這四點意見基本上規范了之后關于學術文化的變革方向。
當今的美國高等教育與學術文化在很多方面已經發生了巨大的變化,如大學財政與管理的企業化、學科交叉的制度化、在線與多媒體教育科技的普遍化等。數字人文在這個大環境中迅速發展成型也是順乎自然的事情。至少在博耶所提倡的學術文化新定義的三個方面,即整合的學術、應用的學術和教學的學術,數字人文發揮其先天的優勢。我們注意到博耶把“發現的學術”列在第一位而突出其重要性。發現意味著創造、發明,是產生和傳遞新知識的基礎,也是貫穿一切科學話語之中的核心價值符號。在這方面,數字人文的表現是不能令人滿意的。一如弗朗科·莫瑞狄的悲觀論調,我認為目前數字人文處于“失望的低谷”的說法并不過分。
那么數字人文目前面臨的挑戰是什么呢?筆者認為,一是評估體系的自我指涉,二是闡釋理論的放棄。前者導致數字人文研究的自我封閉,大量的研究成果自娛自樂,而得不到人文學界的認可,更不能滿足“發現的學術”的范式要求。后者傾向于過度相信數據,視之為自在、自明的文本,把文本解讀簡化于數據統計和數字推理。兩者雖然在研究過程和成果呈現中表現不同,實質上都源于方法的理性化,即以工具理性為目的的實驗主義哲學。
數字人文的學科立足點是對源數據的量化分析。對于這種分析的有效性的驗證來自兩個方面,第一是采集源數據的工具是否運行正常,第二是這個運行正常的工具所得出的結論是否可靠。常見的數字人文研究多注重于第一方面而輕視第二方面,或者把兩者混而為一。這里的“工具”是指替代人眼閱讀的機器閱讀,包括研究者依據電腦編碼語言定制的各種處理文本的專用應用程序,或由高科技公司及行業研究機構開發的智能數據庫與通用閱讀器,其中最有名的是由谷歌于2010年推出的“N像閱讀器”(Ngram Viewer)。這個閱讀器可以瞬時“閱讀”谷歌書庫中的海量文本,所以自問世以來成為數字人文研究者津津樂道的工具。因為其聲望和影響,關于數字人文的評估爭議也集中體現在N像閱讀器的功用和效率上面。
N像閱讀器實際上是一個計算機搜索引擎,它通過人為輸入的任意關鍵詞組合而給出詞語頻率和相聯關系的圖標或數據統計。這種閱讀完美體現了莫瑞狄先于N像閱讀器所猜想的“遠讀”的內涵,因為“遠讀”的實質就是借助于數字化手段的泛讀,在海量的文本里通過“分析修辭、主題、借喻、風格和系統性來尋找范式和模型”。顯而言之,完成這樣的閱讀非N像閱讀器莫屬。事實上,弗朗科·莫瑞狄身體力行,通過N像閱讀器,較早地提供了一個關于“遠讀”的研究案例,即考察1740年到1850年之間出版的7000部英國小說中所體現的作家在小說主題和遣詞造句中的性別意識,這是數字人文早期研究一個典范性的成果。
然而,借助N像閱讀器的遠讀功能而產生的結論的學術價值并非毫無爭議,最常見的批評是它們往往只是證實已知的常識,而非創造了新的知識。美國學者艾拉茲·埃登(Erez Aiden)和讓-巴蒂斯特·米歇爾(JeanˉBaptiste Michel)合著的《未知的疆域:大數據作為探究人類文化的棱鏡》是一個體現了數字人文的承諾與局限的例子。這兩位學者置身于信息化時代的宏觀視野,宣稱“大數據革命”不光會改變我們如何認識自我,還會改變人文和社會科學的性質,并重新定位商業化社會與大學這個象牙之塔的關系。基于這個宏觀視野,他們的關注點是大數據的歷史痕跡和社會影響。于此,他們依據N像閱讀器所提供的抽象數據語言來解釋許多歷史和社會現象,其中一個案例是該書第五章《沉默之聲》對納粹德國的藝術審查制度的研究。他們檢索發現,許多著名現代藝術畫家像馬克·夏加爾(Marc Chagall)、保羅·克利(Paul Klee)在德國1933—1945年間出版的書籍中幾乎不見蹤影,這說明納粹德國已成功地根除了作為“頹廢藝術”的現代派藝術。這個結論,正如批評者所言,毫無新意,至多提供了關于納粹德國焚書禁言的一個細節。它代表了很多數字人文學者在構思研究課題時的致命缺陷,即為已知的問題補充顯然的答案。
如此看來,埃登和米歇爾的成就只能說是在整合與應用的學術方面有所貢獻,而在發現的學術方面則無所建樹。更恰當地說,他們證明了數字人文的工具價值,即N像閱讀器遠讀的強大功能。作為N像閱讀器的發明者的團隊成員,他們對這個新穎的高科技“玩具”愛不釋手,不惜以近300頁的篇幅渲染其功能與價值,有一種“工具自戀”的意味。在數字人文界,這種工具自戀的確是一種常見的現象,尤其是在具有科技背景的數字人文學者當中。這種現象反映了數字人文對高科技產業炒作文化的追隨,對其軟件程序產品的商品特性的警醒不足,從而把學術性和市場化混為一談。更為重要的是,工具自戀遮蔽了對工具本身應有的批評維度,對軟件程序可能的偏見與局限視而不見,從而忽略其潛在的結果與效用偏差。在計算機科學的算法研究話語中,“垃圾進,垃圾出”(garbage in,garbage out)是一句很有反省意味的流行語,意指錯誤的數據輸入會產生荒謬的數據輸出。這不僅強調數據采集的人為前在性,也暗含算法程序的局限性。當今許多基于算法程序的數字化商業產品,尤其是使用預測模型(predictive modeling)的數據采集系統,在種族、性別與社會弱勢群體方面都表現出不同程度的偏見與歧視。谷歌的N像閱讀器及其伴侶谷歌書庫也不例外,它們眾多的缺陷如書目選擇的隨意性、科目類別的代表性以及光學掃描的文字誤差都可能引發遠讀的失真。
毫無疑問,數字人文不能放棄對數字化工具的批評,但這不意味著放棄數字化工具本身。數字人文,從根本上來說,就是用數字化工具來回答傳統人文的問題。對于任何一項數字人文研究,工具的重要性不言自明,而問題則更為重要。“正確”的問題應該體現人文精神的精髓,即代表人類對經驗的超越和對未來的構想,指向增進理解和培育共情,其預想的答案一定含有發現的學術內容,并經得起現有學術評估體系的考驗。在研究過程中,這個“正確”的問題與數字化工具碰撞、交融、磨合,有可能變成無意義的問題,也有可能變形為其他的問題,或引發出別樣的衍生問題,這也許是數字人文研究不同于傳統人文研究的地方。這種問題為重、工具為輔的研究構想已經在一些成功的數字人文學者那里體現出來,比如英國學者梅爾芭·卡迪-基恩(Melba CuddyˉKeane)及其合作團隊關于“現代主義的關鍵詞”的研究項目。這項研究在一定程度上揭示了成功的數字人文研究的構想與思路:預設的關鍵詞通過遠讀得到證實或修正,新的關鍵詞形成數據鏈或圖標、曲線,指向潛在的范式、模型,通過再次閱讀而連接傳統人文的課題,從而厘正已知的知識或創造新的知識,最終體現發現的學術文化價值。
如果說數字化的遠讀一向是數字人文研究最重要的方法,那么現在已經到了重新考慮它的涵義的時候。首先,我們必須摒除莫瑞狄最初所設想的遠讀與近讀(close reading,又譯“細讀”)完全對立的立場,重新認可近讀的闡釋功用。遠讀是機器的閱讀,是初級閱讀,它提供了關鍵詞的譜系;近讀是人的閱讀,是再次閱讀,它為關鍵詞添加時空的坐標,然后為人類關注的現實性問題或終極問題給出可能的答案。遠讀與近讀的糅合不應被視為對數字人文學科特性的消解;恰恰相反,它應被看作是電腦科技和傳統人文的交叉性的標志。無論如何,數字人文的研究對象依然是文本,雖然這是數字化的文本,也可以說是文本的文本,文本性是其本質,而發現文本性及其意義依然是闡釋學的范疇。數字化工具為我們提供了逼近文本隱喻(allegory of textuality)的新手段,而研究者用心的近讀和機器強大的遠讀仍然是領悟文本隱喻的必然途徑。
綜而論之,偏重數字工具還是重視學術發現是當今的數字人文面臨的一個抉擇。如果我們只是繼續或重復早期數字人文學者的研究思路,把編碼制圖作為首要任務,止步于采集新的數據來證明已知的結論,那么數字人文將不會得到學界的尊重,永遠處于失望的低谷之中。數字人文的突破之路在于把關注的重心從工具理性的自我把玩轉移到外向性的、可傳達的發現性學術。這要求我們重新思考數據本身的價值及其對于人文研究的意義,相信數據的言說意義,但不迷信數據是社會現實的絕對、唯一的再現。在當今“數據崇拜”風行一時的數字化時代,這當然是一件很難的事情。然而,因為數字人文占有數字工具技術與人文傳統精神的雙重優勢,數字人文學者對于破解這個難局負有義不容辭的責任。正因如此,我對數字人文的未來仍然抱有期待和希望。