"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

推進計算文學研究
——對笪章難《以計算的方法反對計算文學研究》一文的討論①

2019-02-09 22:03:30霍伊特安德魯派博泰德安德伍德馬克阿爾吉休伊特凱瑟琳伯德笪章難姜文濤
山東社會科學 2019年8期
關鍵詞:模型研究

[美]霍伊特·朗 [美]蘇 真 [加]安德魯·派博 [美]泰德·安德伍德 [美]馬克·阿爾吉-休伊特 [澳]凱瑟琳·伯德 [美] 笪章難>撰 汪 蘅>譯 姜文濤>校

(芝加哥大學,美國 芝加哥 60637;麥吉爾大學,加拿大 蒙特利爾 H1K2E3; 伊利諾伊大學厄巴納-香檳分校,美國 伊利諾伊州厄巴納-香檳市 61801;斯坦福大學,美國 加利福尼亞州斯坦福市 94305;澳大利亞國立大學,澳大利亞 堪培拉 ACT 0200;圣母大學,美國 印第安納州南本德市 46556)

一、重申《以計算的方法反對計算文學研究》的基本觀點——笪章難

首先,一個限定條件。由于論壇的時間限制,我只能談及論壇參與者提出的議題中的一部分,而且仍然不夠精確。我計劃發布一份附加回復,處理更為細致的技術問題。

《以計算的方法反對計算文學研究》不是為了改進計算文學研究(CLS)而寫的,不只是呼吁更嚴謹或呼吁全面的重復,不是為了解決哪種統計學研究模式最適用于計算文學分析。這不是一篇方法文章;一些回復我的人也指出了,那樣的文章非常多。

寫這篇文章是要為文學學者和編輯們賦權,讓他們能夠提出關于計算和定量文學批評的合乎邏輯的問題——假如他們懷疑在結果和論證中間存在概念上的不匹配或察覺到文學批評批判方法的收益特別的低。

我希望這篇論文使我們意識到兩種類型的CLS研究。第一,有統計上嚴謹的研究,但無法真正回答它要著手解決的問題,或完全不提有趣的問題;第二,看起來發布了有趣的結果,但要么沒有魯棒性(robustness),要么邏輯混亂。混亂有時來自用戶錯誤等問題,但更經常的是由次優地或不必要地使用統計學和其他機器學習工具引起的。論文嘗試去神秘化這些工具在文學語料庫上的應用,并解釋為何當你的目標是文學解釋或描述時,技術錯誤會被放大。我的文章是長時間調研的終點,調查的是計算方法及其定量分析模式能否在文學研究中有收獲。結論是,驅動定量結果和數據模式的事物往往和學者們宣布的文學批評或文學史論點關系甚少,他們號稱正在找出如此的結果或那般的模式——盡管有時候看起來像是這么回事。如果我們在CLS中發現的結論證實了或駁斥了現有知識,這并不標志它們是對的,而是說它們在最好情況下是同義反復,在最壞情況下只不過流于表面。

本文對文學批評應該為何持不可知立場,不對闡釋習慣做診斷。指控它采取“純粹主義”立場,這純屬推測。文章意在描述學術研究不應為何。即使在文章最后幾頁呼吁讀書,也并不推測“實際在讀”有內在的意義,而僅僅是反駁意在簡單分類的工具應用,人類在這方面的抉擇要精確且所費要便宜得多。

至于探索性數據分析VS驗證數據分析的問題:我不傾向于任何一種。如果涉及數字及其解釋,那么統計學不得不發揮作用;我不知道任何繞開它的方法。如果你僅僅想要描述數據,那么你就得展現一些來自非簡化論測量結果的有趣內容。至于求助探索性工具:如果你的工具由于缺乏力量或對目標來說過于擬合而完全不能探討正在考慮的問題,你的解釋性工具就是不需要的。

定量方法和非定量方法也許可以協力工作,這看起來無可指摘。我的論文只是在說:理論上也許如此,但實際不足。安德魯·派博指出歸納問題,關于如何從局部到整體、從檢驗性到說明性,這正是我的文章質詢的那個缺口,因為這就是合作的理想開始崩壞之處。可以隨便稱呼這個缺口的強行彌合——一種新的解釋學、認識論,或者形態——但到最后,邏輯必須清楚。

批評我的人指出了一種困境,說的沒錯。但這困境是他們的,不是我的。我的觀點也是說,再往前走,不是由我或一小群人來決定這個工作價值為何或應該怎么做。

首先,文學學者一直在向其他領域的學者請教意見和評價。其次,精神分析解讀的收益,哪怕尋求的是文學外的意義和有效性,也不是為了心理學,而是為了文學批評的意義,其成功與否取決于自身。CLS想說:我們的工作本身作為文學批評沒有太多收益也OK的,不管是在散文的水平上還是洞察力的精微上;收益就在于用到這些方法、描述數據、產生預測性模型,或者讓別人未來能夠提出(也許更好的)問題上。收益在于建立實驗室、資助學生、創辦新期刊、為終身教職和博士后資格以及高得驚人的撥款給出理由。如果是這些說法,那么不止一個學科需要被叫來評估這些方法、應用及其結果。由于已發表的對特定文學學術研究的批判通常不會被通過指出依然蓄勢待發的事情而遭反駁,我們對付的是兩種不同的學術模型。這種情況下,我們應該最大限度地跨學科。

二、 信任計算文學研究 ——霍伊特·朗、蘇真

笪章難的《以計算的方法反對計算文學研究》一文在過去反對文學計算方法的論戰中很醒目,因為她自稱要嚴肅對待計算。她承認,嚴肅從事此類研究意味著要發展統計及涉及其他概念的素養。她的論文許諾要讓爭論超越對數字的斷然拒絕,轉向關于研究可否科學重復的對話,這是這種辯論朝前邁出的對于批評有益的一步。

但其效用終結于此。“不要相信數字,” 笪章難警告說,“不要相信他們的數字,相信我的。”“如果你相信他們的數字”,她暗示道,“那么計算方法的整個立場就分崩離析了。”相信她的數字,你會發現這一點。但她的數字無法信任。笪章難對文化分析學領域14篇文章的批判充滿技術和事實錯誤。這不只是關于細節的爭吵。這些錯誤反映出她對基本統計概念理解的缺陷,類似于文學研究的外行把喬治·艾略特稱為“著名男作家”(1)喬治·艾略特(George Eliot),英國19世紀著名女作家瑪麗·安·伊文思(Mary Ann Evans, 1819—1880)的筆名。——譯者注。更讓人擔心的是笪章難沒能將統計方法理解為與語境相關的、歷史的和闡釋的項目,坦率地說,她的論文最大的錯誤是人文主義錯誤。

這里我們關注的是笪章難和預測模型有關的錯誤。這是她在批判我們的兩篇文章中使用的核心方法。在《湍流:世界文學的計算模型》中,我們用13個語言學特征建立了一個意識流(SOC)敘事模型,發現其中10個合起來能可靠地區分我們確定為SOC(和現實主義小說語料庫中的篇章相對比)的篇章。類符/型符比(TTR)是詞匯多樣性的測量,是其中最有區分力的,盡管它本身并不提供信息。我們在論文里仔細解釋過了,這個預測模型的目標在于理解多種特征如何協同辨認風格模式,而不是單獨辨認。笪章難的批判中沒有什么內容表明她意識到了這個基本原則。

其實,笪章難只質詢了我們模型中的一個特征(TTR),并認為修改它就會讓我們的建模失效。具體來說,她檢驗了TTR和SOC之間的強關聯在移除她的“標準停頓詞列表”中的詞語后是否依然成立,而不是移除我們使用的停頓詞列表的詞語。她發現它不成立。這里有兩個問題。首先,TTR和“TTR減去停頓詞”是兩個分開的特征。我們在模型里確實納入了這兩種,而且發現后者有最低的獨特程度。第二,盡管檢驗特征魯棒性的本能是恰當的,但斷言存在一個應該普世使用的“標準”停頓詞列表就是拆臺了。我們的列表是特為用于19世紀和20世紀早期小說而創建的。就算有正當理由采納她的“標準”列表,也必須重新跑模型、檢驗重新測量的“TTR減去停頓詞”特征是否改變了整體的預測精度。笪章難沒有這么做。這就像隨意撥弄鋼琴的一只琴鍵,還沒彈另一個音符就宣布整個樂器走調了。

但是錯誤還不止于此。批判《文學模式識別:文本細讀與機器學習之間的現代主義》時,她試圖讓我們的模型分類英語俳句詩和非俳句詩的魯棒性失效。她的辦法是創造一個新的“中文對聯英譯文”語料庫,在這個語料庫上檢驗我們的模型。為什么這么做?她表示這是因為它們充滿了和英語俳句“類似的意象”,也很“亞洲”。這個誤入歧途的抉擇,有東方主義的氣味,它完全抹去了語境和歷史,提出一個實際不存在的本體論關系。這就是為什么我們花了超過12頁篇幅從批評和歷史的角度敘述英語俳句形式。

這些錯誤代表了一種始終如一的拒絕:拒絕將某人的闡釋實踐置于語境和歷史中考慮(確實去“好好解讀”),不管是統計上還是人文上。我們不相信存在“客觀上”好的文學闡釋或者存在一種“正確的”做統計分析的方法:笪章難的立場是多數科學史家和多數統計學家都會拒絕的。文學和科學的慣例都是持續爭論和重新闡釋的,而非從高處傳下來。和文學研究一樣,統計學這種知識體系形成于亂糟糟的學科史和不同的實踐群體。笪章難的論文堅持一種非常固執的、“客觀的”、黑白分明的知識版本,這種傾向同統計學和文學研究全都完全相反。這種版本的故事不怎么讓人信任。

三、所研究案例的選擇不能代表計算文學研究——安德魯·派博

笪章難的研究文章加入了橫跨幾個學科的新潮流,可以歸在“重復”的主題下。(2)Nan Z. Da, “The Computational Case Against Computational Literary Studies”, Critical Inquiry 45 (Spring 2019),601-639.引自本文的內容,下不一一注釋,只隨正文標注頁碼。——譯者注這方面,她的文章遵循了其他領域的主要做法,例如開放科學合作聯盟(OSC)的“重復性項目”,該項目尋求重復心理學領域過去的研究。(3)Open Science Collaboration, “Estimating the Reproducibility of Psychological Science”, Science 28 Aug 2015:Vol. 349, Issue 6251, aac4716.DOI: 10.1126/science.aac4716.OSC作者寫道,如果做得好,重復的價值在于它能“在發現結果被復制時增加確定性,在不能復制時促進創新”。

但是,盡管她的研究做出了關于整個領域的影響廣泛的結論,卻未能遵循任何由OSC等項目創立的程序和實踐。雖然提到了重復的認知論框架——也就是證明或駁斥單個文章和整個領域的有效性——她的實際做法卻遵照了文學批評領域的古老的選擇性閱讀傳統。笪章難的研究歸根結底有價值,但不是因為她提出的以計算的方法反對計算文學研究(這項工作還待做),而是她突出了傳統文學批評模型被拿來做大規模證據性結論時伴隨而來的諸多問題。好消息是這篇文章讓歸納問題,也就是如何同選擇性閱讀做斗爭的問題,進入了本領域面對的中心議題。

以所選的證據開始說。OSC在做重復項目時,生成的樣本有100個研究,取自1年內出版的3個不同期刊,以接近合理的本領域抽樣。笪章難卻選擇了“少量”文章(我數了下是14篇),來自不同年份、不同期刊,沒有清晰的理由說明為何這些文章能代表整個領域。問題不是所選的數量,而是我們無法知道為什么選擇這些文章而非其他文章,因此無法知道她的發現結果是否可延伸至所選樣本之外的其他研究。唯一的聯系似乎是這些研究按她的標準都“不成立”。試想一下,如果OSC發現百分之百的樣本文章都不能重復,我們會不會認為他們的結果可信?而笪章難則相反,永遠正確,令人驚訝。

笪章難對這些文章的關注表現出更深程度的無代表性。OSC在重復項目中建立了清晰可辨的標準,可以宣布一項研究無法重復,也能承認做出這一結論的困難;相反,笪章難則每篇文章用不同標準,做出有爭議的選擇,并犯下徹底的錯誤,明顯是特意設計的,目的是為了突出差異。

她把文章作者的名字弄錯、引用版本弄錯、論證所引用的書弄錯,還在一些基本數學問題上出錯。(4)她把Mark Algee-Hewitt 寫作Mark Hewitt, 把G. Casella當作 Introduction to Statistical Learning 的作者,實際上作者是Gareth James, 在附錄中把我和Andrew Goldstone當作共同作者,實際上不是。但是每一個論斷加起來總是得到同一個肯定的結論:不能重復。在笪章難的認知里,部分總是整體的完美代表。也許笪章難文章的最大局限在于她對統計推論和計算模型極為狹窄的(也就是無代表性)的定義。在她看來,使用數據唯一恰當的方式是做顯著性檢驗,也就是用統計模型去檢驗給定的假設是否“成立”。(5)像下面這種說法也表明,就算在統計學這個方面,她也遠遠不夠做可信的向導:“畢竟,統計學假定95%的時間里都沒有差異,只有5%的時間里存在差異。尋找低于0.05的P值就是這個意思。”這不是尋找低于0.05的p值的意思。p值是零假設成立時得到觀測數據的估計概率。原假設成立的情況下,p值越小,就越應該拒絕原假設。前面提到的5%門檻對于出現“差異”的頻率(或者說,零假設不成立的頻率)并無影響。相反,它的意義是:“如果我們從數據得出結論認為存在差異,我們估計我們在5%的時間內是錯的。”“統計學”也不會“自動”假設0.05是合適的臨界點,這取決于領域、問題和建模的目標。這些都是很嚴重的過分簡化。解釋性數據分析、理論建構或預測性建模在她對本領域的理解中沒有位置。(6)關于對文學模型的反思,見Andrew Piper, “Think Small: On Literary Modeling”, PMLA132.3 (2017): 651-658; Richard Jean So, “All Models Are Wrong”, PMLA132.3 (2017); Ted Underwood, “Algorithmic Modeling: Or, Modeling Data We Do Not Yet Understand”, The Shape of Data in Digital Humanities: Modeling Texts and Text-based Resources, eds. J. Flanders and F. Jannidis (New York: Routledge, 2018).考慮到笪章難自己就沒有做此類檢驗,這特別諷刺。她要別人按標準來,自己卻不用據此負責。她也沒有引用那些明確做了檢驗的文章,(7)參見Andrew Piper and Eva Portelance, “How Cultural Capital Works: Prizewinning Novels, Bestsellers, and the Time of Reading”, Post-45(2016); Eve Kraicer and Andrew Piper, “Social Characters: The Hierarchy of Gender in Contemporary English-Language Fiction”, Journal of Cultural Analytics, January 30, 2019. DOI: 10.31235/osf.io/4kwrg; and Andrew Piper, “Fictionality”, Journal of Cultural Analytics, Dec. 20, 2016. DOI: 10.31235/osf.io/93mdj.或者引用質疑此類檢驗的價值的研究,(8)討論顯著性檢驗的價值的文獻非常多。見Simmons, Joseph P., Leif D. Nelson, and Uri Simonsohn. “False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant”, Psychological Science 22, no. 11 (November 2011): 1359-66. doi:10.1177/0956797611417632.或引用那些探討詞頻和人類判斷之間關系的研究,她是認為這一關系很成問題的。(9)參見Rens Bod, Jennifer Hay, and Stefanie Jannedy, Probabilistic Linguistics (Cambridge, MA: MIT Press, 2003); Dan Jurafsky and James Martin, “Vector Semantics”, Speech and Language Processing, 3rd Edition (2018): https://web.stanford.edu/~jurafsky/slp3/6.pdf; 關于交流和信息理論的關系,參見M.W. Crocker, Demberg, V. & Teich, E. “Information Density and Linguistic Encoding”, Künstliche Intelligenz 30.1 (2016) 77-81. https://doi.org/10.1007/s13218-015-0391-y; 關于與語言習得和學習的關系,見Erickson LC, Thiessen ED, “Statistical learning of language: theory, validity, and predictions of a statistical learning account of language acquisition”, Dev. Rev. 37 (2015): 66-108.doi:10.1016/j.dr.2015.05.002.笪章難的研究工作的選擇性和更廣闊的研究景觀深深脫節。這些實踐突出了一個更普遍的問題,文學研究領域中太長時間以來都未審查這個問題——對于世上萬物,要如何可靠地從個體觀察轉移到普遍信念?涉及歸納個體研究或整體領域時,笪章難的文章是選擇性閱讀問題的杰作。處理負責的、可信的歸納問題,將是未來本領域面臨的最大挑戰之一。數據和計算建模會和宇宙中其他學科一樣,在此過程中扮演不可或缺的角色。

四、需要更有成效地討論計算文學研究——泰德·安德伍德

人文學科和其他學科一樣,和數字打交道的研究者們時常會重復并檢驗彼此的結論。(10)Andrew Goldstone, “Of Literary Standards and Logistic Regression: A Reproduction”, January 4, 2016, https://andrewgoldstone.com/blog/2016/01/04/standards/. Jonathan Goodwin, “Darko Suvin’s Genres of Victorian SF Revisited”,Oct 17, 2016, https://jgoodwin.net/blog/more-suvin.笪章難對這個成長中的流派的貢獻與先例不同,區別主要在于移動得更快。例如,我和我的共同作者用5800個詞描述、重復并部分地評論一篇關于流行樂的文章。(11)Ted Underwood, “Can We Date Revolutions in the History of Literature and Music?”, The Stone and the Shell, October 3, 2015, https://tedunderwood.com/2015/10/03/can-we-date-revolutions-in-the-history-of-literature-and-music/ Ted Underwood, Hoyt Long, Richard Jean So, and Yuancheng Zhu, “You Say You Found a Revolution”, The Stone and the Shell, February 7, 2016, https://tedunderwood.com/2016/02/07/you-say-you-found-a-revolution.相反,笪章難用38頁就打發了14篇運用不同方法的文章。文章的能量令人印象深刻,其長期影響應是正面的。

但這節奏有代價。如果讀者尚未了解她總結的那些作品,當她匆忙解釋、開始譴責時,其論證也許讓人頭暈,了解這些作品的讀者會意識到笪章難的總結充滿重大的忽略和錯誤。對文學研究領域的計算開展理論爭論的時機已成熟,但很不幸這篇文章非常誤導人——即使在釋義的層次上——無法作為這一爭論的起點。

例如,笪章難提出,我的文章《體裁的生命周期》讓體裁看起來穩定,只是因為它忘了比較蘋果和蘋果:“安德伍德應該在1941年前的偵探小說(A)上訓練他的模型,和1941年前的‘亂燉’(指隨機混雜的作品——譯者注)相比較,再在1941年后的偵探小說(B)上訓練,和1941年后的‘亂燉’相比較,而不是在兩組作品上用同一批‘亂燉’作品”(p.608)。

這讓人迷惑不已的批判要我去做的事,我在文章里明確說過已經做了:根據出版日期比較不同組的作品。(12)Ted Underwood, “The Life Cycles of Genres”, Journal of Cultural Analytics, May 23, 2016, http://culturalanalytics.org/2016/05/the-life-cycles-of-genres.文章里也沒有隨機混雜的作品,笪章難的可笑措辭將隨機對比集和令人不快的“亂燉”混為一談,它在論證中起到了不同的作用。

更重要的是,笪章難的批判壓制了我的文章的比較主題——主題確定偵探小說比其他幾個體裁更穩定——以便豎起一個聲稱所有體裁“從19世紀20年代直到如今都多少保持一致”(p.609)的稻草人。這個稻草人主題缺乏任何可用于測量一致性的比較準繩,因此變得無法證明。在其他情況中,笪章難忽略了一篇文章的顯著性結果,就為了嘲笑一個顯著性有限的結果,而作者已經承認了這一點——但她完全沒有提及作者承認了有限。這就是她對待喬科斯和基里洛夫的方式(p.610)。

簡單說,這篇文章沒有在整體批判上下工夫。笪章難沒有描述組織起一篇文章的各種目標,而經常假設研究者試圖(或未能)做一些她認為他們應該做的事。比如,主題模型能識別語料庫中的模式,而不用假裝發現了獨特而正確的描述。人文學者用這個方法多半是為了解釋性分析,但笪章難一開始就假設主題模型肯定是混亂的嘗試,要證明某種假設。于是,當她發現(并花了一頁內容去證明)這個方法跑了好幾次能出現不同的主題,感到震驚。這是真的。這也是這個方法的基本預設,笪章難提及的所有作者都承認這一點——他們彼此之間用了好幾頁來討論變化的結果如何仍能用來解釋研究。笪章難沒有承認這一討論。

最后,《以計算的方法反對計算文學研究》一文起始就有一些關鍵性誤導,暗示說文化分析學純粹基于語言學證據,主要是詞語。確實,詞語能揭示許多事情,但這種對當代趨勢的說法很誤導人。定量方法正掀起浪潮,部分因為研究者們已經學會從文學中提取社會關系,部分因為他們將語言和外部社會證據配對——例如評論家的判斷。(13)Eve Kraicer and Andrew Piper, “Social Characters: The Hierarchy of Gender in Contemporary English-Language Fiction”, Journal of Cultural Analytics, January 30, 2019, http://culturalanalytics.org/2019/01/social-characters-the-hierarchy-of-gender-in-contemporary-english-language-fiction.有些文章,就像我自己關于敘事速度的文章一樣,使用數字完全是為了描述讀者的闡釋。(14)Ted Underwood, “Why Literary Time is Measured in Minutes”, ELH 25.2 (2018): 341-65.笪章難的論戰戰略再一次要將整體中的細節孤立出來,然后當作整體來批判。

對文化分析學更盤根究底的研究方法也許已經發現,它不是單塊巨石,而是幾個彼此頻繁互相批判的項目之間持續展開的辯論。例如凱瑟琳·伯德就在一個范例性的論證中批評其他研究者的數據(包括我的),論證開頭精確描述了歷史表現的不同研究方法。(15)Katherine Bode, “The Equivalence of ‘Close’ and ‘Distant’ Reading; or, Toward a New Object for Data-Rich Literary History”, MLQ 78.1 (2017): 77-106.笪章難本可以做出類似有成效的干預——比如解釋研究者應該如何在解釋性分析中報告不確定性。她的論文沒能做到這一點,因為要急匆匆譴責盡量多的例子,這阻止了該文花時間描述并真正地理解其批判對象。

五、文化分析學是增強版的人文學科,不是沒有闡釋技巧的虛擬人文學科——馬克·阿爾吉-休伊特

笪章難的文章《以計算的方法反對計算文學研究》中充滿了一系列二元對立:計算或閱讀;數字或詞語;統計或批判性思考。從這些錯誤的對立出發,文章魔術般變出了計算和批評之間的沖突。但文化分析學領域卻是依賴于發現這些二元項目間的可兼容性的:計算要有和文學批評手牽手一起工作的能力,從業者用批評性闡釋去理解自己的統計。

笪章難假設的這些對立導致她把注意力完全集中在對驗證數據分析(CDA)的零假設檢驗上:選擇圖表,提出假設,尋找顯著性中的錯誤。(16)笪章難提到的許多文章都結合了CDA and EDA.但是,在探索性數據分析(EDA)的創始人、數學家約翰·圖基看來,讓數據自己說話,不帶潛在假設地將之視覺化,能讓研究者避開確認偏見的陷阱。(17)Tukey, John. Exploratory Data Analysis, New York, Pearson, 1977.這就是心理學家威廉·麥奎爾(1989)說的“假設檢驗神話”:如果研究人員一開始就相信一個假設(例如文學太復雜,無法用計算分析),那么,她或他就能通過對數據的簡單操縱證明自己是對的(挑揀支持自己論點的例證)。(18)McGuire, William J. “A perspectivist approach to the strategic planning of programmatic scientific research”, In Psychology of Science: Contributions to Metascience ed. B. Gholson et al. Cambridge: Cambridge UP, 1989. 214-245.拘束于本領域正統的從業者往往會在統計學整合到新研究領域時錯過被揭示出來的新模式。

文學研究中,EDA產生的視覺化并不取代閱讀;相反,它將閱讀重新導向新的目的。統計顯著性的每個場所都揭示出新的閱讀中心:定量行為和任何解釋一樣并不特別簡化。統計的嚴謹依然關鍵,但這些數據目標嵌入理論裝備中的方式同樣不可或缺,這一裝備依賴文學闡釋。(19)例如我們關于“批評的模塊化”的論證,見Algee-Hewitt, Mark, Fredner, Erik, and Walser, Hannah. “The Novel As Data”, Cambridge Companion to the Novel ed. Eric Bulson. Cambridge: Cambridge UP, 2018,189-215.然而在笪章難的文章中,她從平均長度10250個詞的13篇文章中摘取簡單的統計數字。她只有忽視這些萬字文章,拒絕解讀圖表語境及論證、調整、異議,才能控制其論斷。

由于笪章難堅持驗證數據分析,她的批判就需要一個假設:如果缺席語境之外沒有假設,她就被迫發明一個。就算粗略讀一遍《維特拓撲學》就能發現,我們對于“《維特》對其他文本的影響”的問題不感興趣:相反,我們感興趣的是當語料庫圍繞《維特》的語言重新組織時對語料庫的影響。(20)Da (2019), 634; Piper and Algee-Hewitt, (“The Werther Effect I”, Distant Readings: Topologies of German Culture in the Long Nineteenth Century, Ed Matt Erlin and Lynn Tatlock. Rochester: Camden House, 2014), 156-157.這種拓撲學創造出新的鄰接性,激發了新的解讀:它并不證明或反駁,它不存在對或錯——如果提出其他理解,那就是范疇錯誤。

文化分析學不是要用數學嚴謹性取代學者們數百年來發展出的闡釋技巧的虛擬人文學科,它是增強的人文學科,在最好的情況下,能展現最仔細的細讀讀者往往也看不見的新類型的證據和仔細考慮過的理論觀點,二者聯手產生新的批評研究。

六、需要對用機械方法研究文學數據、統計學和機器學習進行更多的批判——凱瑟琳·伯德

笪章難對CLS的統計學評論所駁斥的一種研究方法我本人也很關注,但她對這個領域和統計研究的框架有誤解。她對CLS的定義——用統計學,主要是占壓倒性地位的機器學習去研究詞語模式——排除了大多數我會歸到計算文學研究范疇的內容,包括以下研究方式:運用數據建設和數字信息綜合處理作為批評分析的形式;分析文獻學和其他元數據,探討文學趨勢;采用機器學習方法界定文學現象,做非計算解釋;或者為了文學研究的目的,將數據視覺化和機器學習等方法的含義理論化。

除了笪章難對CLS獨具一格的限制性定義外,我最吃驚的是她對統計研究的構想過于拘束且前后不一致。笪章難提到的研究者中,大多數都明確認為機器學習的支點排斥以實證主義觀點對待文學數據和計算,而更傾向于將建模看作主觀實踐。笪章難似乎認為,首先,這個支點出現得還不夠(CLS采取機械方法處理文學解釋);其次,走得太遠了(CLS對數據推論太隨心所欲,例如“隱喻化……編碼和統計學”[p.606 n.9])。一方面,笪章難一再表明,如果CLS選擇一條略微不同的路——也就是用更恰當的樣本訓練,準備文本數據時更嚴謹,避免主題模型等不可復制的方法,以語料庫語言學家的成熟方式運用自然語言處理——就能抵達轉折點:采用的數據、應用的方法、提出的問題就能變得適于統計分析。另一方面,她又將“好好讀文學”確定為“界限點所在”,從而排除了這個可能性,在這個點,計算文本分析就不再有“效用”(p.639)。這種對統計研究的有限看法也在笪章難關于文本挖掘的統計工具的兩個說法中浮現:它們“在倫理上是中性的”;必須“根據其實際功能”使用(p.620),笪章難界定的實際功能是簡化信息以便快速做出判斷,但是任何知識上的探索,任何測量結果——更不用說有此特定目標的測量——都是和這個有倫理維度的世界的互動。

統計論證的統計檢驗至關重要。我同意笪章難的看法:用機器學習去界定文學中的詞語模式往往簡化了復雜的歷史和評論議題。她提出,這種簡單化包括將模型看作“有意的解釋”(p.621),認為詞語模式表示文學因果關系和影響。但是,認出這些問題和堅持認為統計工具有對文學研究有害的“實際功能”,這中間相距甚遠。我們的學科歷來從其他領域(歷史、哲學、心理學、社會學等)吸收不同方法。也許正是假設中的文學研究缺乏功能效用(而笪章難聲稱要為之辯護)才讓這些吸收采納如此富有成效;也許這些采納卓有成效是因為文學的意義不是單一的,而是由社會構成性地鍛造而成的,在這個社會里,特定時刻中特定范式(歷史的、哲學的、心理學的、社會學的,現在是統計學)的突出地位塑造了我們所知的一切和了解這一切的方式。任何情況下,學科的純潔性都無法保護貧乏的方法論;跨學科性能增加方法論意識。

笪章難對統計學“實際功能”的僵化看法阻礙了她就文學研究和統計方法間可能的遭遇提出更有“論證意義”(p.639)的問題。這樣的問題可能包括:如果不是有意的或解釋性的,那么機器學習辨識出的模式在認識論上——以及本體論和倫理上——地位為何?有沒有將詞語計數和其他文學或非文學因素相連的方式,可以促進類似模型的“解釋力”(p.640)和/或批評潛力,如果沒有,為什么?就像哲學、社會學和科學技術研究領域中發生的一樣,文學研究能否應用理論視角(如女性主義經驗主義或新唯物主義)重新想象文學數據和統計研究?沒有這些方法論和認識論上的反思,笪章難用統計方式對統計模型的暴露就落入她歸到這些論點頭上的同一陷阱中:將“機械地發生的事混淆為深刻的見識”(p.639)。我們非常需要機械的——實證的、簡化論的和非歷史的——方法處理文學數據、統計學和機器學習。不幸的是,笪章難的批判卻顯示出她強烈批評的問題。

七、我文章中的一些錯誤——笪章難

1. “畢竟,統計學自動假定”(p.608)這個說法是不對的。更正確的說法應為:在標準假設檢驗中,95%置信度意味著,當零假設成立時,95%的情況下無法拒絕。

2. 將不同的文本挖掘/機器學習應用描述(p.620)為“倫理上是中性的”,措辭不夠小心。我顯然并不認為其中有些應用在倫理上是中性的,例如用算法追蹤恐怖分子。論文中的意思是,這些工具有無數種應用:為了好的、壞的,或其他的目的。總的來說,很難給它們分配一個意識形態的位置。

3. 泰德·安德伍德說我在討論他的文章《體裁的生命周期》時,將“令人不快的‘亂燉’”和他用于預測性模型中的隨機控制集混淆了,他是對的。安德伍德也沒有犯我在文章中提到的他犯下的基本統計錯誤(“安德伍德應該在1941年前的偵探小說[A]上訓練”[p.608])。

有關錯誤陳述的指控:一篇論文“僅有的中心思想……是說我們稱為‘體裁’的東西也許是不同種類的實體,有不同的生命周期和文本連貫度”,要釋義這篇論文是困難的。此處安德伍德的論點涉及偵探小說、哥特小說和科幻小說隨時間過去的相對連貫性,以1930年為截斷點。

我關于這篇文章的其他說法依然成立。該文引用了不同文學學者關于體裁變化的定義,但它隱含的體裁定義是“10000個常用詞隨時間過去的一致性”。它無法“拒絕弗朗哥·莫雷蒂關于體裁有代際循環的推測”(多數人應已發現這個推測太過于簡化論),因為它所用的不是同樣的可檢驗的體裁定義或變化定義。

4. 主題模型:我的觀點不是說主題模型不能重復,而是說,在這個特定應用中,它們不魯棒(robust)。例舉各種證據中的一個:如果我從一百個文檔中移除一個文檔,主題就變了。這就是問題。

5. 關于霍伊特·朗和蘇真的論文《湍流:世界文學的計算模型》,我需要更多一點時間,負責地重新跑一下其他方案。霍伊特·朗和蘇真建立的工具有13個特征,用于預測兩個體裁間的差異——意識流和現實主義。他們說:大多數特征單獨不怎么有預測性,但合起來就非常有預測性,而那種能力被集中在單獨一個特征中。我表明那一個特征不魯棒。修正一下他們令人困惑的隱喻:就好像如果有人聲稱一架鋼琴彈奏起來很優美而大半聲音來自一個鍵。我按了那個鍵——沒用。

6. 蘇真和霍伊特·朗辯稱,因為我證明他們的分類器錯誤地分類了非俳句——如他們指出的,我不僅使用了中文詩歌的英譯,還用了俳句之前久已存在的日文詩歌——我就犯了“誤入歧途的抉擇,有東方主義的氣味,它完全抹去了語境和歷史,提出一個實際不存在的本體論關系”。這一點值得搞清楚。他們的分類器缺乏力量,因為它僅能以非常不同于俳句的詩歌為參照分類俳句;說白了,它會把包含和俳句很接近的重疊關鍵詞的同樣短小的文本分類為俳句。重疊的關鍵詞是他們的預測特征,不是我的。我不確定為什么指出這一點就東方主義了。至于他們的模型,如果不得不說,我會說,它只是輕微東方主義,如果不是決定性的東方主義的話。

7. 霍伊特·朗和蘇真提出,我的“數字無法信任”,我的“批判充滿技術和事實錯誤”,結尾也同樣斷定我的論文“不怎么讓人信任”。我承認在這篇文章中犯了一些錯誤,但不是在我對霍伊特·朗和蘇真論文的分析中(錯誤基本在第3部分)。我希望用印刷出版或在線附錄這種更正式的回復列出所有這些錯誤。總而言之,發現一個錯誤不能就似是而非、含沙射影地說證明了某人模型無效就是東方主義、冥頑不化,諸如此類。

八、我最后的回應:呼吁有效、公平的批評——笪章難

我想表明,這個《批評探索》雜志設立的論壇沒有不平衡或不公正之處。我寫了這篇文章,不同意這篇文章(部分或全部)的人也有權在學術論壇批判它。

我的批評者和中立方想從《以計算的方法反對計算文學研究》中得到的不外是:(1)全面的重復性檢查(如派博建議的,由OSC來做);(2)對CLS工作的仔細分析,其中就算對細枝末節的“抑制”都算作誤導;(3)計算文學研究和相關數字人文領域的研究現狀。在他們看來,此種腦力勞動會讓我的研究變得有效。

泰德·安德伍德提出,我的文章和這個論壇其實是設計好用來吸引關注的噱頭,這個說法損害了我們可以簡單稱為批評研究的學術工作模式。他認為這可能是時代的功能,他是對的。社交媒體等都提出,由于我以非恭賀的方式批判CLS,要求我必須立刻為此負責,這是一種征象,體現出計算研究和數字人文為自己積累的社會和體制權力。

確實,“殺死領域”這個說法不屬于學術界,它是又一個跡象,表明特定類型的學術話語只應發生在特定語境中。說了這些,關于團結和“更多”的無根修辭——我們全都在一起,在其中——是拙劣的辯解方式。如我所言,現在是時候提出一些問題了。

安德伍德譴責社交媒體和其他公眾回應,他遺漏了社交媒體和其他圈子里同樣有害的要讓我的文章無效的嘗試,其方法是私下議論——或不如說,公開質疑——《批評探索》的同行評審程序。安德伍德和這篇文章的其他許多批評者提出,文章沒有領域外人士恰當地進行過同行評審。這不是事實,而且造成了破壞——我的論文由一位定量分析和數學建模專家評審過。它表明,任何敢于核查CLS領軍人物研究工作的人將會被流言折磨。

我的文章是否犯了實證錯誤?是的,有幾個,大多在第3部分。我會及時列出,但它們對該部分的宏觀論點并無影響。除了討論安德伍德論文時的一處誤解,在這個論壇上發表的以實證為基礎的反駁當中,沒有一個有任何根據。派博說我“基本數學不及格”的證據涉及的是一處簡單的修辭,我出于易讀性考慮將數字四舍五入到千位。

任何從事嚴肅定量分析的人都能看出,我肯定不是評估這一工作的理想人選。但我仍然認為,此處爭議的根本利益沖突對所有人都顯而易見。能夠高水平做這個工作的人往往不太在意,不去批判它,或者他們傾向于不去質疑定量方法如何以各種形式和論證模式同文學批評的獨特性相交叉。為了充分表露情況:我的領域外評審人在評估了我的實證觀點的有效性后,最終并不贊成我認為計算方法對文學目標效果不佳的看法。這就是問題的癥結。統計學家或計算科學家能夠核查執行中的實證錯誤和誤差,他們不理解什么構成了文學學術研究中的弱論證或概念混淆的論證。這就是為何我在附錄中列出的指南——有很多人參與了同行評審——應該得到考慮。

九、要鼓勵文化分析學新學術與新生代學者——馬克·阿爾吉-休伊特

2010年,我作為新的博士后研究員向一些資深學者講解一篇論文,主題是詹姆斯·湯姆遜1730年的詩《四季》。我用細讀表明,湯姆遜在這首詩的每部分都為讀者模仿了一種審美體驗,然后教他們如何解釋它。聽眾反應溫和,多數正面。六個月后,我已經獲得略多一些的信心,又講了同一個題目,但有個逆轉:我加入了一張圖表,顯示我的解讀是基于詩歌貫穿始終的一個重復語篇模式。反應迅速且兩極分化:屋里有些人認為定量方法深化了論辯,其他人強烈認為我正在破壞整個領域。對我來說,這次經驗對我的發展是形成性的:在數字人文還遠未獲得任何聲望、資金或制度支持之前,僅僅拿出數字就足以惹怒年長我許多的學者們。

我的經驗表明,這個項目通過了笪章難說的“氣味測試”:評論結果依然有效,甚至不用定量分析的設備支持。同時,盡管笪章難說這證明了項目的定量方面原本并無必要,我表示尊重,但還是對此提出反對。我發現的模式是我的解讀的基礎,假如我講解時表現得好像完全是通過細讀得到的結論,再怎么也是不真誠的。我的論點的定量部分也讓我能夠將這首詩和18世紀更大規模的詩學模式相連。而且我進一步認為,定量分析進入一個領域并改變了這個領域,那么同樣,這個領域也改變了這個方法,讓它適應自己的目的;根據統計學結果和文學史方法得到的結論的一致性而肯定這一結果,這和零假設檢驗一樣有力。換句話說,笪章難的“氣味測試”提示了綜合這些方法的向前的潛在方式。

但我學到的教訓依然強大:不管計算方法如何嵌入研究、不管誰使用,它總能激發許多人文學者即刻的、往往是負面的反應,這值得問一句為什么。審查各種方法的體制、政治和性別史總是值得的,如新歷史、形式主義,甚至細讀,那么就像凱瑟琳·伯德建議的,在數字人文中作為整體仔細考慮這些議題,也是重要的。關鍵是從事這些工作時,我們不要抹除本領域新出現的、往往結構上脆弱的成員的工作。這些方法在新的學生和年輕學者群體中有很強的吸引力。想要斷言方法和目標之間存在完全的不兼容并借此壓制學術,這將損害新生代學者令人驚嘆的探索工作,而這些工作正在重新塑造我們的批判實踐和我們對文學的理解。

附錄1:遠讀與文學知識——評《遠距離視野:數字證據與文學變化》(21)附錄1、2兩篇書評摘自耶魯大學 “Post45”研究團隊網站(post45.research.yale.edu)。2019年5月,該網站發表了由丹·辛金(Dan Sinykin)主持的“Cultural Analytics Now”學術專欄,這兩篇書評為此專欄的一部分。感謝“Post45”及丹·辛金授予中文版權。附錄1所評書為泰德·安德伍德(Ted Underwood)的《遠距離視野:數字證據與文學變化》 (Distant Horizons: Digital Evidence and Literary Change, Chicago, London: The University of Chicago Press, 2019 ),引自本書的內容只隨正文夾注頁碼,不再另注。書評作者丹·辛金是美國圣母大學(University of Notre Dame)數字人文博士后研究人員,從2019年秋天起將擔任埃默里大學(Emory University)的助理英語教授。

一、沖突

泰德·安德伍德野心勃勃。在芝加哥大學出版社2019年2月出版的《遠距離視野:數字證據與文學變化》(以下簡稱《遠距離視野》)一書中,他報告說,統計模型中的最新進展提供了“表現和闡釋世界的新方法”(p.162)。《遠距離視野》用一本書的篇幅論證了應在文學研究中采用這些方法。他用統計模型修訂了語言、體裁、聲望和性別的文學史,并特別提出,將文學研究劃分為不同的歷史時期培養了局部見識,卻妨礙了有關橫跨長時間的文學史知識,而統計模型可令這種知識成為可能。其中涉及的觀點有力且充滿爭議,事關文學語言的獨特性和美國大學英語系在宇宙中的位置,他的直截了當令人佩服。最近圍繞文學計算分析的熱烈討論可在這里找到其根源上的利害關系:英語作為一門學科的未來和知識本身的性質,受到學術界中英語學科的權力份額下降和2008年后世界政治經濟秩序的影響。

《遠距離視野》的寫作充滿大家風范。任何關注文學研究的人都應閱讀本書,盡管安德伍德因其抱負而意在讓本書面向更廣泛的受眾——“那些想要理解人類歷史的人們”(p.162)。這本書清晰易懂、調子精確、令人信服。安德伍德知道,許多計算文學批評——或者用他更喜愛的說法:遠讀——“都可能陷入過分苛求的泥潭”(p. 150),他在附錄中闡述自己的數據和方法,解決了這一障礙。他相信“大規模文學分析的真正挑戰并非認知的或倫理的,而是審美的:根本很難以風卷殘云之勢就數千本書寫作”(p. 156)。關于認知和倫理,他錯了;但就他給自己設立的“風卷殘云”這個挑戰而言,完成得很漂亮。對我來說,這本書令人欲罷不能。

文化分析工具的批評者往往聲稱定量工作并未產生——甚至無法產生——有價值的文學研究知識。《遠距離視野》應能終結這些批評。安德伍德特意為此目的做了安排。前四章的每一章都對當前學術研究做一種介入,揭示出學術研究中歷史分期如何模糊了長期趨勢。例如第一章中他問道,小說在其歷史上是否從講述轉移到表現?我們有時會聽到這個問題。對比亨利·菲爾丁《湯姆·瓊斯》中的全知敘述和一部亨利·詹姆斯小說中受限的第三人稱敘述,就能輕易看出這點。但是,安德伍德寫道,“還完全不清楚之前的19世紀小說是否應理解為在此方向的緩慢進展。全知敘述成就了維多利亞時期小說的獨特力量,在如今的后現代元虛構作品和類型小說中也依然重要”(p. 7)。學者如何才能判斷實際發生了什么?

為了回答這個問題,安德伍德引進了模型,他簡單將模型定義為“變量間關系”(p. 19)。這在有關近代大學的思想史方面的研究上,是令人興奮的進展。安德伍德采用的模型只有一二十年歷史,但已經轉變了社會科學和自然科學的諸多學科,《遠距離視野》是其應用于人文學科的最成熟案例。要理解它,文學評論家需要忘掉之前聽說的有關數字人文的許多說法。安德伍德強調,現在是時候對這一工作進行重大框架重整了。他用不著大數據,沒有擴展正典或分析大量未讀作品。他欣然承認筆記本電腦力量足夠,不到一個下午就能運行一個典型程序。和算法標榜的客觀性相反,他為了人文研究的目的而利用了人類對計算模型的偏見。

閱讀安德伍德第一章的興奮感部分來自觀看他麻利地改變了文化分析學的范式,這是從測量到模型的轉移。作為對小說敘述長時間線理解的最初把握,安德伍德求助于斯坦福文學實驗室早期的一個著名發現。2012年,賴安·霍伊澤爾和朗·勒-柯克發表了一個小冊子,表明在1800—2000年間,物理描述在小說中越來越常見,抽象則越來越少見。乍一看,這種測量似乎讓小說從講述到表現轉變這一說法令人信服。但安德伍德仔細地消除了這種模式發現可能提供的任何權威,他尤其提到“翻遍海量證據、尋找有趣內容時,我們冒著選擇性使用的風險”(p. 17)。

關鍵的轉變在于一開始就不從文學數據中尋求模型,而是“以闡釋性假設起步”并“發明檢驗這個假設的方式”(p. 17)。安德伍德寫道:“我們需要調轉研究中的步驟順序”(p. 17)。而后,他復制了霍伊澤爾和勒-柯克的研究。他添加了傳記,“作為對比研究的試金石”(p. 13),并證明霍伊澤爾和勒-柯克揭示的小說的語言傾向對此并無影響。不同尋常的是,他提出假設說:在文學史的漫長區域內,小說偏離了傳記。為了檢驗這一點,他采用了統計模型。

貫穿全書所用的模型是邏輯回歸——機器學習的一種形式。一種常見的解釋這個模型的方法是以垃圾郵件為例。一個假想的電子郵件提供商訓練模型學習區別垃圾郵件和合法郵件,方法是給它加標注的兩種郵件的范例,要它學習能借以最可靠地分辨二者的那些特征。這些特征可能包括充斥著全大寫或類似“意外之財”或“得到報酬”等短語。提供商測試模型時給它未加標簽的電子郵件并讓它分辨。如果它大部分時候都能做到,那就是個不錯的垃圾郵件過濾器。一旦模型內化了專屬一個范疇的模式,從業人員就能測試其他范疇的文本與其有多接近。如果我訓練了一個垃圾郵件過濾器,就可以用來自我母校和我母親的郵件來測試其中一類郵件和垃圾郵件的相似度,采取的角度來自使垃圾郵件和其他內容不同的任何內容。安德伍德把這叫作視角化模型。他用它做各種用途,包括從任意一個體裁的視角來測試不同體裁的相似之處,比如偵探小說和科幻小說。

在這個例子中,安德伍德在加標注的小說和傳記上訓練模型,讓它預測未加標注的文本的種類。對他最有用的不是模型的二元預測,而是其他功能屬性中的兩個:它展示出任意文本是小說或傳記的可能性,將其顯示為二者間連續體上的一個百分比;它顯示出讓它得以辨別二者的那些特征。這兩種體裁隨著實踐分道揚鑣,行為動詞、身體部位和感官知覺動詞成為小說的特征,傳記的特征則是政治術語、有組織的信仰體系、抽象概念。(p. 25)安德伍德的結論是“小說在傳記(和其他非虛構形式)很少能夠提供的方面穩定地專業化起來:精確描述的時空中的身體描述、肢體動作和即刻的感官知覺”(p. 26)。通過模型,他確認了霍伊澤爾和勒-柯克測量的真實性,將其置于更大的語言趨勢中與傳記相比,發現了小說的獨特之處。盡管這一測量揭示的是孤立的事實,能引發猜測,安德伍德的模型使得關于文學史的一種有說服力的論點成為可能。

他巧妙地結束了本章,回到批評傳統,承認“學者們對小說和傳記間不斷擴大的差距中每個部分都已有了一些解釋”(p. 31)。但他提醒讀者,占有片段不一定就認出了整體。文化分析學的批評者太經常落入事后諸葛亮的偏見中,想象他們一直就知道分析家剛剛展示的內容。安德伍德仔細審視分析的每一步驟,明確表明我們尚未了解之事,又在本章末尾指出并暴露后見之明的偏見,徑直解決了這個問題。其論點的力量是兩面的:從長時間線來看,各特定時期的主張變得彼此一致;特定文本的語言行為通過表達或進入爭論而以新的方式產生意義,不僅和該時期公認的規范爭論,也和數世紀來延伸的趨勢爭論。本章結尾安德伍德暗示了能展示這種力量的一種細讀。我希望他寫了,但他沒有寫,這是他對這種做法意見減弱的表現。

第三章令人滿意地擴展了第一章,提出了可能的機制。安德伍德發現,史上建立在評介基礎上的有威望的判斷越來越鼓勵人們將文學性理解為“時間上的即時性和具體性”(p. 107)。他將此發現和傳統上對文學史的敘述相比,后者強調對比和革命。在亨利·詹姆斯的序言中或在艾茲拉·龐德的宣言中,文學批評家已經發現了斷裂,其中盛行的文學價值觀發生了戲劇性變化。但安德伍德利用機器學習表明這不是文學史起作用的方式;相反,視角化模型顯示,文學史遵循一個積累過程,他稱之為“更是如此”(p. 107)邏輯。“‘更是如此’這個邏輯”,他寫道,“解釋了每一次賺到錢的單次真實重啟(gritty reboot)如何讓我們注定要有一長串越來越真實的重啟。”(gritty reboot指的是更為現實、逼真地重新制作系列電影,以符合成年觀眾口味,此處的“真實”帶有現實得令人不快的含義,如《蝙蝠俠》系列等。——譯者注) “但是,”他又說,“高級文學形式的文學史家忽視了這種勢頭”(p. 107),就像我們得到越來越真實的重啟那樣,文學的聲望經濟中的刺激給了我們小說,由于其與眾不同的語言,小說和傳記的差異越來越大,而我們逐漸將這樣的語言確認為文學性。

被追問時,安德伍德關于歷史分期的論證顯出裂縫。他寫道,“過去六七十年,我們假定只有當文學史關于沖突的故事時,才可能有趣且有啟發”(p. 106)。這個我們是誰?我認為符合這一描述的文學評論家很少,有兩個原因:“才可能有趣”忽略了許多并不依賴沖突敘事的學術工作;另外它低估了反諷的可能性,我們讓自己與歷史分期保持試探性距離,我們拿它當特洛伊木馬用,一旦進入其中我們也許能發現許多有趣、有啟發的內容,超過允許我們進入其中的那些學科規范。他對歷史分期的評價延續了前一本書《為何文學時期很重要》的闡述,他在那本書中表明文學分期的興起最初是一種讓中產階級維護文化權威的方式,后來是文學研究維護文化權威的方式。阿曼達·安德森在另一篇本來熱情洋溢的評論文章里提到安德伍德讓論證的需求導向了他對那些不那么強調中斷的思想流派的忽視,例如馬克思主義,另外在她看來,中斷“并不像他說的那么普遍和具決定性”(p. 136)。在《遠距離視野》中,中斷在安德伍德眼中的用處導致了對它的夸大。

安德伍德反對文學史沖突模型的論證中還有一種未明言的張力。沖突模型——我們以為事情是這樣但它們其實是那樣——也是他的模型,如果從文學史傳遞到文學批評史的話。他經常背離它(沖突模型),用他的發現去綜合現存學術研究,而這些都是本書最佳段落,但他自己對沖突模型的使用是導致他夸大分期對文學史影響的原因之一,他寫道:“沖突確實能講個好故事”(p. 107)。

二、文學性

笪章難在《以計算的方法反對計算文學研究》中提到,在文化分析學的“數據工作”中,“要決定哪些詞語或標點要計數、如何表現這些計數。就這些。”(22)Nan Z. Da,“The Computational Case Against Computational Literary Studies”,Critical Inquiry 45, no. 3(2019): 606.她提到這一點是作為批判。她認為用電腦給詞語計數無法提供必要的細微之處來解釋文學的復雜性。在她的敘述中,嘗試這么做的學者注定失敗,包括安德魯·派博和泰德·安德伍德。

安德伍德為詞語計數的力量辯護。他的視角化模型只需依靠詞語計數便可區分文本類型。“不熟悉這種方法的讀者”,他寫道,“經常為了僅僅通過詞頻來表現文學作品這種做法表面的單純而感到困惑不安”(p. 21)。他有兩條論證對此反駁:在學術研究中,“基于詞頻的模型在預測人類讀者(關于如何分類文本)的判斷時和更為復雜的方法一樣(成功)” (p. 21);另外,“體裁在諸多不同層面上被冗余地表現”(p. 42),包括詞語計數。第一條很可靠;第二條也不可不加考慮,而笪章難希望讀者不用考慮這條——但也無法像安德伍德有時候認為得那么牢靠。安德伍德好幾次暗示詞語計數捕捉了——對應于——定義體裁的其他模式,包括風格(p. 42, p. 52, p. 58, p. 89)。但是他很大程度上將這個問題交由他人決定,包括安德魯·派博和他在《列舉》中的說法。反過來,派博又指向計算語言學和自然語言處理中的規范語言哲學:分布語義學,苔絲在她的評論中對此有討論。(23)此處指的是苔絲·麥克納爾迪對安德魯·派博出版于2018年的著作《計算:數據與文學研究》的書評,見附錄2——譯者注分布語義學和文化分析學的相遇對我來說既充滿可能性又遠遠未充分研究。

但《遠距離視野》基本不取決于詞語計數是否與風格相關。這本書的一個成就在于表明了詞語計數在視角化模型方面的力量,安德伍德以此為基礎做出的結論基本上有說服力。再想想他的第一章,他用詞語計數為隨時間出現的小說與傳記間的差異制作模型。他的模型借以權衡每個詞的基礎在于它對于區分這二者有多少幫助。他用一個詞匯表(“行為動詞”“身體部位”“政治術語”)將詞語分組為語義范疇并計算各自權重,這讓他對這兩種體裁間大規模的一般性話語差異有細微的感知。安德伍德承認這有點簡略,但也展示了他提到的它揭示的內容:在漫長的小說歷史中之前不為人知的趨勢。我在別處也寫到過,他在第四章中以更精彩的方式用了同樣的方法,其中就有和大衛·班蒙、薩賓娜·李的合作研究,揭示了作者如何就性別寫作的歷史。他的模型很容易區別1850年的角色性別,但這種二元屬性越來越不清晰,直至當下,同時傾向于性別的聚合或模糊或增加。安德伍德追蹤了個體詞匯如何對這種性別化做出貢獻。例如,19世紀時“露齒一笑”(grinned)和“微笑”(smiled)意思中性,但到了1950年變得兩極分化——“露齒一笑”意味著男性,“微笑”則是女性——但到了2000年才重回中性。“眼睛”(eyes)和“頭發”(hair)在1800年是中性的,漸漸卻變得女性化;“口袋”(pocket)則變得男性化;而“閱讀”一直都是中性的。

這樣的論辯為文化分析學做了有力辯護,顯示出模型建造能如何挑戰或促進批判的本能。《遠距離視野》解決了文化分析學對文學研究是否有用的問題。但是笪章難的論文以及它所吸引的關注揭示出學科內關于在緊縮時代文學研究應該做什么這個問題上分歧有多嚴重。

安德伍德預料到他的方法和笪章難的觀點容易引發爭吵,他用最后一章為作為學科實踐的“遠讀”辯護。考慮到這場爭論的性質,許多觀察者也許會驚訝地了解到笪章難和安德伍德的意見有許多一致之處。安德伍德不喜歡“技術崇拜”,對“大數據”也保持懷疑。他和笪章難一樣,批評文學評論家天真地運用主題建模和網絡圖表。他和笪章難一樣,堅持認為研究者應該分享代碼、報告效應值并測量可能的不確定之處。他們彼此一致的范圍表明我們已經抵達了爭論的新階段,不再那么涉及計算的能力或文化分析學是否能有所貢獻,更多的是關于建立模型和統計方法的含義和作用。這樣,笪章難因為確認了安德伍德提倡的重構正在順利展開而推進了這個領域。

盡管他們有一致之處,笪章難和安德伍德也確實站在一項重要分歧的兩端。對于文化分析學是否適合文學分析,他們意見不同,而且這一分歧來自根本上互不相容的文學觀念本身。笪章難認為計算方法無法評估文學細微的復雜性,她的專著《不可傳遞的相遇》講述了陌生而遭誤解的跨太平洋文學互動,她在書中關注了“文學獨特的形式或修辭或邏輯”(24)Nan Z. Da, Intransitive Encounters: Sino-U.S. Literatures and the Limits of Exchange (New York: ColumbiaUniversity Press, 2018): 2.。文學獨特的功能屬性立于其視野的核心處。她認為遠讀無法辨識或闡明她所研究的短暫的中美交流。(25)Nan Z. Da, Intransitive Encounters: Sino-U.S. Literatures and the Limits of Exchange (New York: ColumbiaUniversity Press, 2018):26-31.2018年12月,笪章難和加州大學洛杉磯分校的阿納海德·內西西安擴展了這個學科觀點,在芝加哥大學出版社發布了系列叢書——《思考文學》,專注于“改進作為推理模式的文學批評”,將“解釋的藝術當作獨特的研究種類”。(26)“Thinking Literature”, series ed. Nan Z. Da and Anahid Nersessian, University of Chicago Press.在其他地方,內西西安還復活了克林斯·布魯克斯的觀點,提出將文學定義為無法充分釋義的事物,文學是“行動而不示意” 的藝術品。(27)Anahid Nersessian, “Literary Agnotology”,ELH 84, no. 2 (2017):341.她認為,文學提供了有關“修辭格或修辭手段”的“否定的或延期的知識”。(28)Anahid Nersessian, “Literary Agnotology”,ELH 84, no. 2 (2017):342.另外,內西西安和耶魯大學的喬納森·卡拉姆尼克為作為文學研究概念的“形式”的特異性做了辯護,它“無歉意也不妥協地服務于文學的學科性”。(29)Jonathan Kramnick and Anahid Nersessian,“Form and Explanation”, Critical Inquiry 43, no. 3 (2017): 39對卡拉姆尼克而言,尊重文學研究的自治性——“其學科閱讀實踐及相關形式、風格或體裁的詞匯,以及涉及關注、嚴謹、歷史背景等等的相關規范”——來自更基本的多元主義,一種“對世界多樣性的尊重”(30)Jonathan Kramnick,“The Interdisciplinary Delusion”, Chronicle of Higher Education, October 11, 2018.。

這些就是安德伍德在最后一章里討論的觀點,指出這是遠讀的一個對立來源。他確定它們屬于更悠久的文學史,尊崇獨特細節而非概括,大概隨著浪漫主義出現,直至新批評和新歷史主義。他直接反對在方法論之間劃一道“理想化的邊界”(p. 150)。他寫道:“我們發明了關于某種知識形式的理論,只有文學批評家才能接觸——因為唯有我們在照料語言的微妙、思想的本質吊詭,或人類多樣性的倫理后果”(p. 148)。在他看來,“定義(文學研究的)獨特性的坦誠方式是說出我們擁有關注有趣或令人愉快之物的特權”(p. 148)。這一點上他很堅定:“我只愿意通過直截了當強調文學的趣味和樂趣,將文學史同社會科學分開”(p. 150)。安德伍德通常都寬厚面對對話者,此時他跌入少見的嚴苛時刻:“為文學研究自治性辯護的論點是為不關心做辯解”(p. 150)。很奇怪看到他在用這本書展示了文學研究的獨特力量之后,又這么摒棄了它。

文學知識在多元論世界中是獨特的還是同萬物相連?雙方都有夸張。文學既非嚴格自治于其他類型的語言,也非斷然與其同構。安德伍德表明了文學性如何是歷史的偶然、如何依賴于特權的社會學、如何與傳記區分并成為自身;但文學評論發展了特別的方法處理修辭格、修辭手段、形式、風格、體裁——語言的微妙之處。這些方法需要經年的大量實踐方能掌握,就像我記得每次我教授文學研究入門時都發現本來很聰明的學生并不覺得細讀是憑直覺的。

雙方都表達了摒棄,還鼓勵了認為文學分析學同文學研究實踐不相容的錯誤想法。這就是為何我認為安德伍德細讀的缺乏令人失望。他在《遠距離視野》中所做的一切都為新鮮而有潛力、令人驚艷的細讀鋪好了路,能展示計算分析在闡釋文本中看不見的細微差別、復雜性、微妙之處和利害關系方面的能力。例如他順帶提到,他的科幻小說模型錯誤地將托馬斯·品欽的《拍賣第四十九批》分類到自己這邊。學者們傳統上、也很有理由地將品欽的小說看作對偵探小說的惡搞。但根據安德伍德的模型,令科幻小說與眾不同的是一種粗略的崇高感。“這個模型認為的同科幻小說傳統有關的內容可能并不是品欽明面上對熵的關注,”他寫道,“而是他對大眾社會的規模本身偏執著迷”(p. 59)。隨后本來可以是一段讓人頭暈眼花而又愉快的解讀,有機會促進我們對這本小說、這個體裁,以及詞語計數變為紙頁上的風格方式的理解;但安德伍德匆匆走開,錯失了能證明評論家錯了的機會。

三、現實主義

安德伍德很現實,考慮到學習定量方法所包含的挑戰,“如果今后十年哪怕有2%的文學學者愿意投身這項任務”,他“都會很驚訝”(p. 145)。他相信,如果我們承認“如今數字在人文學科中著實邊緣的地位,就這個話題大量辯論會很可笑”(p. 145)。我同意。圍繞這些方法的爭斗是象征性的,是個替代物,為了爭論我們珍視之物以及我們對身為學者所做之事的看法。從爭辯往后退一步,這場爭斗看起來像是浪費精力。莎拉·布洛萊特認為英語系的命運不取決于這場斗爭的結果,更宏大的力量正參與其中。

文化分析學在學科中的位置非常小,其方法不僅和笪章難、卡拉姆尼克和內西西安提倡的完全兼容,和文學批評家支配的所有領域都兼容。它和任何其他方法一樣,也可能被糟糕地使用。安德伍德通過《遠距離視野》已經表明,這個方法能夠被出色地運用,教我們一些與文學語言、體裁、特權及性別有關的事。對于任何對文化分析學如何看待文學感興趣的人,安德伍德搭好了舞臺,讓偉大的工作到來。

附錄2:模型與意義——評《計算:數據與文學研究》(31)附錄2所評書為安德魯·派博(Andrew Piper)的《計算:數據與文學研究》(Enumerations: Data and Literary Studies,Chicago,London:The University of Chicago Press,2018),引自本書的內容只隨正文夾注頁碼,不再另注。書評作者苔絲·麥克納爾迪(Tess McNulty)為哈佛大學學者,研究方向為當代文學和數字文化。

一、模型

2018年8月,芝加哥大學出版社出版了安德魯·派博的《計算:數據與文學研究》(以下簡稱《計算》),開篇便提出簡單而具煽動性的指控:文學評論家不懂如何恰當地歸納。為了證明觀點、表明野心,派博以艾里希·奧爾巴赫的《模仿論》為例——這個選擇特別且單一,出人意料。在派博看來,這本備受尊崇的書為整個“西方文學”提出了主張(p. 6);但他認為這是建立在謬誤的基礎上。《模仿論》的每一章都用一個單篇代表一部完整的“巨著”。這些單個“巨著”又代表了“所有西方文學”。派博稱這種錯誤為“認識論悲劇”:它表明了將部分與整體相聯系這種基礎能力的缺乏(p. 7)。

派博認為問題一直存在。文學評論依然像奧爾巴赫那樣尋求歸納——例如,我們也許會對“那本小說”(p. xi)做出總體性斷言。派博認為,即使那些抵制歸納的人也必須承認其重要性。甚至凱瑟琳·加拉格爾和史蒂芬·格林布拉特等新歷史主義者——那些留意文本獨特個性的人——最終也將其糾纏置于一般語境之中。但派博說,盡管有必要做歸納,我們卻仍不勝任。我們無法以“用于單個文檔的……那種嚴謹”將文本與其語境聯系起來。派博稱,我們要呼吁的是“歸納的科學”(p. xi)。在《計算》中他提出了一種:他認為文學評論家能夠用計算模型更好地歸納。

初初一看這可能很眼熟。過去20年,計算文學評論和弗朗科·莫雷蒂的名字緊緊相連,他2005年的《遠讀》一書提出類似觀點。莫雷蒂和派博一樣強調需要提出歸納性論點——他說,除非文學評論家也看了另外99.5%的作品,否則就無法理解那0.5%的正典化作品。莫雷蒂也和派博一樣推崇計算,他認為壓根就沒辦法讓學者們去“細讀”那些“大量未讀作品”。(32)Franco Moretti, Distant Reading (London: Verso, 2019), 66-7. 他將這個說法歸功于瑪格麗特·科恩(Margaret Cohen),是她造了這個詞。他們必須求助于“遠讀”,這完全必要。

不過,派博在兩個方面修正了莫雷蒂的想法:第一,他并不強調規模——也就是查看更多文本的必要性——而強調代表性。他問道,我們如何能夠做出真正有代表性的歸納,我們是在談論單個篇章抑或全部體裁?第二,他不是寬泛地提議使用計算方法,而是更具體地為建造“模型”辯護。派博所稱的“模型”是電腦設計的文本“體現”或“縮微模型”(p. 9)。如通常所說,它們給“詞語計數”,但也能進行更復雜多樣的操作。派博說,建立這些模型就能更好地議定文學的部分和整體。

我們能怎樣著手這項任務?諷刺的是,很難歸納。派博在他內容廣泛的書里建立了諸多不同類型的模型——僅舉三例:“矢量空間模型”“主題模型”和“預測模型”。他用這些模型回答不同類型的問題。在本書的六章里面,他逐步使用越來越復雜的計算方法來處理基本的文學評論主題:標點、情節、傳統主題、功能性、角色塑造和語料庫(或詩歌生涯)。他的推進結束于自我意識中。派博將他的方法用于自身,開始有點異想天開地建造模型,描述我們剛讀過的這本書。例如,他優雅地承認,書的章節隨著它們的逐步進展越來越自信——也就是隨著他的逐步進展。對我來說,最后這個謙遜的姿態比這本書開頭大膽的火炮齊鳴更加體現力量。《計算》為模型提出了兩個野心勃勃的理論辯護,但最終其論據由于在實踐中被小心限制的程度而令人信服。

二、詞、詞、詞

派博給模型做的第一個辯護源于以下信念:詞語計數不只是詞語計數,它是通往我們所謂文本“意義”的關鍵因素。這一信念在派博從計算語言學中得來的“分布語義學”理論中找到了支持。根據這個理論的“分布假設”,一個詞的意義和它出現在特定語境中的頻率以及它在該語境中和其他詞相比出現的頻率相關。由此可推論,一個文檔的意義也和詞頻及分布相關。這個理論有某種直覺的力量:一條能發現“花生”和“杏仁”這兩個詞意思相近的捷徑也許可以指出它倆都經常在“醬”這個詞的前面出現在名詞詞組中。這也有認知心理學支持:有證據表明這是我們閱讀時大腦處理意義的方式。

文學評論家可能覺得這些概念不太熟悉。可以說,分布語義學以其對詞語間關系的強調把結構主義語言學理論編碼了。派博將它和后結構主義理論相連,后者將意義置于“句子之外”。他引用了巴特在《作者之死》當中的看法,即文本“不是一串發布單一神學含義的詞語”,而是一種“多維空間,其中多種作品混雜碰撞”(p. 16)。他還提到德勒茲的“塊莖論”閱讀和克里斯蒂娃的互文性。這一切意在提出:當我們建造適應于詞頻的模型時,就捕捉住了某些非常接近語言學意義的事物,不僅是計算語言學家所理解的那樣,而且也還是后結構主義理論家理解的那樣。

矢量空間模型尤其適合這個任務。為了解釋其工作原理,派博提出了歌德的三個句子。

1. My dear friend, what a thing is the heart of man!(親愛的朋友,人心是何等的事物!)

2. I treat my poor heart like a sick child.(我待我可憐的心靈如對待病童。)

3. I have possessed that heart, that noble soul.(我擁有了這顆心,這高貴的靈魂。)(p. 14)

派博解釋說,矢量空間模型將每句話轉換為詞頻。在此基礎上,它能測量其語義學關系。此處,它發現前面兩句話彼此更為類似,超過它們和第三句話的相似度,因為這兩句話都有“心靈”(heart)和“一個”(a)。細讀的讀者可能提出異議(后面會更多談到這一點)。但根據分布語義學理論,至少這個模型表現并比較了這些句子的意義。

派博求助于分布語義學,意在先發制人,阻止一種普遍的反對意見:詞頻對于闡釋文本沒有功能上的用處。近來,笪章難重新提起這條反對意見,她在《以計算的方法反對計算文學研究》中再次強調:派博的這種工作僅僅探討了詞頻。“要決定哪些詞語或標點要計數、如何表現這些計數。就這些。”(33)Nan Z. Da,“The Computational Case Against Computational Literary Studies”, Critical Inquiry 45, no. 3(2019): 606.這種計數“不是闡釋”,也并未捕捉到文學特質,例如“同音異義、比喻、多義性,(和)反諷”。(34)Nan Z. Da,“The Computational Case Against Computational Literary Studies”, Critical Inquiry 45, no. 3(2019):606,636.派博則多虧了他在分布語義學中的投入,以相反的效果重復了笪章難的表達。他說,詞語重復講述了文學的“深層故事”,它們是文化表達的“溝槽和渠道”(p. 3)。

派博的反駁很有力。分布語義學的存在就表明詞語計數不能根據表面而被視為無意義。但他也得加以更多說明才能說服持懷疑態度的人站到他這邊。就算拋開有關分布假說是否確實成立,或是否和后結構主義觀念一致的疑慮,還有其他問題浮現。除了矢量空間模型,其他模型能捕捉到分布假說理解的那種意義嗎?即使捕捉到了,這是否說明它們也能捕捉《計算》分析的更為具體的文學性,如體裁、人物或情節?派博訴諸分布假說,開始回答笪章難這樣的反對意見,但沒有解決爭論。

三、超凡魅力

派博對建造模型的第二個辯護帶有民主的腔調:模型不僅有助于我們更嚴謹地爭論,還能更透明。派博說,典型的細讀讀者從高處提出“盛氣凌人的聲明”,依賴純粹的“超凡魅力”去說服別人;相反,建造模型的人則受制于更為嚴格的方法,她能“界定(其)智識過程的每一步”;計算或許“也經常模糊費解”,但完善而公開地操作,就能打敗“評論的超凡魅力的黑盒子”(pp. 10-11)。

論證在多種層次上展開。在智識層面,它暗示了模型更為精確,因為它鼓勵自我意識——模型建造者面對外部機制必須抑制本能。在政治層面,它提出模型也許可以拆解學院等級制度。確實,派博更寬泛地接受了這個目標。在他的后記中,他用模型揭示了體制特權的運轉。他表明,從1970年開始,在最顯赫的文學評論期刊上發表的所有文章中,86%都來自頒發博士學位的學院中的前20%。

但是如果派博在表明模型能夠揭示學院等級制時很輕松,那他在提出模型本身并不依賴有超凡魅力的權威時就不那么有說服力。他有關細讀對超凡魅力的依賴性的提法則小題大做——畢竟細讀的讀者不得不求助于文本本身、抑制其本能并給出有說服力的論點;而他關于模型對超凡魅力的依賴則論述太少。在一個大多數文學評論家仍然不理解高級統計學的世界里,就算最為“開放”的計算分析也不得不被無條件地信任。他們訴諸高等技術,這仍可能構成其權威的基礎。

文學評論家對賣弄技術并不陌生。新批評派產生了嚴格的“細讀”方法,合法化了文學研究。從那以后我們將自己的“理論鏡頭”運用到文本樣本上——詹明信式的解釋學、解構主義的操作以及讀者的“方法”。“遠讀”并不比之前的評論實踐更加擺脫了光暈式技術性,很可能還更迷戀它。例如,派博在第四章分析角色時,很快就引入了“角色特征工具”,這是他和一位同事開發的,“嘗試根據26種不同維度評估角色塑造的實踐”,包括“行為形態”“目標—導向”和“行為、描述及能動位置的多變的組曲”(p. 131)。除了屈服于這壯觀而莫測的工具運作,還能怎樣。

無論如何,來自超凡魅力的論點都是次要的,它能否起到重要的論證作用將首先取決于派博更基本的聲稱是否成立:模型能產生好的文本闡釋。如果不能——笪章難就提出模型在捕捉文學性上表現差勁——那么它們包含透明流程這一事實本身就不足以舉薦這些模型。許多流程可以逐步設計——比如我能輕松解釋我只閱讀一個文學文本每第800個單詞最后一個字母所采取的步驟,但這不意味著它們應該在解釋學實踐中被接受。

四、雙聚焦

派博很幸運,他的論證經得起徹底檢查——至少就它本身而言。確實,它的彈性往往來自其謙遜。模型也許是,也許不是所有文學批評歸納的最終解決辦法。但也不必如此,派博更有保留的評論實踐為其目標效用提供了有力證據。

首先,派博用模型工作,這不是單一方法,而是許多評論方法中的一種。他毫不含糊地提倡細讀和遠讀彼此啟發的實踐方式,并在第一章里對此做了說明。此處,派博討論了20世紀詩歌中的標點。他運用一種叫作grep的方法確定了一組1900年以后的詩歌,其中詞均句號的數量特別高;有意思的是,他發現這些詩歌作者中非裔美國詩人的數量高得不成比例。有了這個發現,派博通過新的鏡頭細致查看了阿米里·巴卡拉和安吉拉·杰克遜的“多句號詩歌”:為何如此多的句號?這和詩歌的種族政治可能有何關系?他的細讀令人信服:它們表明句號編碼了斗爭和潛力,就像刺傷一樣作為一再重復的痛點起作用。派博的解讀在評論上也是有成效的:就我所知,還沒有專門對非洲裔美國詩歌中過量句號的詩學研究。

借用派博所說的“雙聚焦”過程結合細讀和遠讀的一個較大的好處在于,它讓遠讀擺脫了要無所不包的壓力。再想想歌德的句子:

1. My dear friend, what a thing is the heart of man!(親愛的朋友,人心是何等的事物!)

2. I treat my poor heart like a sick child.(我待我可憐的心靈如對待病童。)

3. I have possessed that heart, that noble soul.(我擁有了這顆心,這高貴的靈魂。)(p. 14)

回憶一下,矢量空間模型判斷出句子1和句子2在語義上更為接近,從而顯示了它的力量。然而,這個例子起初可能顯得會適得其反。為什么?因為如果你和我一樣最初直覺認為其實句子2和句子3才最為接近——共享第一人稱代詞,在我看來,這才是最要緊的特征。但這不意味著模型錯誤或我在這件事上錯了;相反,模型促使我去考慮另一種解釋。畢竟這是真的——就像派博給他的結果做的注解中說的——由于句子1和2中“我的”和“一個”的重復存在,它們通常強調“所有”和“一般性”(p. 17)。如果我們以這種方式考慮模型,作為闡釋的伙伴而非單一的仲裁者,就難以否認它們能對實踐有所貢獻。

甚至在派博只使用遠讀時,他的例子對論證的支持也和他更寬泛的理論申訴一樣多——如果不是更多的話。想想他有關功能性的第四章問的那個基本問題:什么是小說?約翰·塞爾告訴我們,虛構語言和非虛構語言之間沒有本質差異。但派博還是提出,難道沒有哪怕一些常見特征能區分二者?為了找出這些常見特征,他采用預測性機器學習模型,類似于區分垃圾郵件的模型(參見笪章難的評論中的解釋)。后來發現,這個模型能根據許多特征可靠地區分虛構和非虛構文本。派博對這些特征的運用落實了一個更普遍的文學史說法,即盡管我們往往認為現代主義引入了對角色和世界間不確定關系的更多重視——“測試”或“假設”的關系——這種強調實際上顯而易見屬于虛構作品。

當笪章難將她關于詞語計數不能有意義地捕捉文學性的論斷具體化時,想到的正是此類模型。的確,她提出這個論點時,有一段話提到了垃圾郵件過濾。她認為,我們使用垃圾郵件過濾器等工具時,“(知道)人類的閱讀能夠捕捉更多細微差異、例外、歧義和限定條件。”但正因為這些過濾器執行了實際任務,我們不在乎——“你就不會愿意自己手動來做了。”但是,當我們做文學批評時,我們執行的不止實際任務,因此我們應該在乎——我們應該更愿意“自己手動來做”。笪章難再次斷言垃圾郵件過濾器的“實際”功能和文學批評的“隱喻”功能之間有分野,以此強調她的論斷:“如果我們所用工具明面上的目標是功能性而非隱喻性的,那我們必須根據其實際功能來運用。”(35)Da, “Against Computational Literary Studies”,620.

但是,僅僅因為一個預測性模型為“實際”功能服務并不能說明它就無法產生“隱喻性”的看法。其實,應該說,預測性模型在實際上起作用,恰是因為它們注意到了與隱喻性或描述性相關的特征。例如,假如垃圾郵件能被部分識別,是因為它們可靠地運用例如“錢”這種詞,那么可能“錢”就和“垃圾特質”有某種重要關聯。如果根據虛構文學對感知和身體的討論就能可靠識別它,那么也許這種“現象學”的關切——派博如此稱呼它們——就和“虛構性”有某些重要關聯。如笪章難所說,細讀——如果能在這種規模上運用——會覺察其他細微之處,這也許是真的。但并不完全清楚它是否會探知到相同的細微之處。熱切的細讀讀者讀一年的小說,也未必能偶然發現關于身體的詞匯如此頻繁出現。而這正是派博的重點:計算機可以對我們正常的闡釋實踐提供信息而不會壓倒它。

五、結論:或許可以兩全其美

當然還是會有反對意見。有些人會說我們作為文學評論家的任務本不是歸納——因為,正如派博提到的,新歷史主義傾向的評論家認為我們存在主要是為了處理特殊性。其他人會說無論我們是否應該歸納,用計算方法這么做不值得付出那些政治代價——對莎拉·布洛萊特這樣的評論家來說,遠讀對于學術界的新自由主義化讓步太多。派博的書可能對這兩種人都無法影響。它并未小心翼翼為歸納辯護,而主要假設——雖然我認為是很公平的假設——我們確實至少某些時候想要歸納(我們真的情愿讓本學科每一本做出一般性聲稱的主要作品都失效?)它也沒有從抵抗新自由主義化的具體指控出發為模型辯護,而是從不同的政治原因為模型背書:作為一種可拆解學術等級制的工具。

《計算》最可能說服我這樣有兩種思路的批評家。我和許多人一樣,就模型能對智識項目做貢獻這個想法持開放態度;但我也和許多人一樣,一想到英語系整個兒投入文本挖掘就不寒而栗。對那些和我有同感的人來說,派博也許在這些方面引起興趣:它所假設的批評世界中,細讀和遠讀、美學分析和數據分析、文化批評和文化分析學可以共存。如果《計算》是某種象征,那么遠讀就不會、也不應壓垮我們這個變化中的學科。我們可以有電腦分析的小說;我們也可以讀它。

猜你喜歡
模型研究
一半模型
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产午夜在线观看视频| 国产精品尤物在线| 国产成人精品18| 蜜芽国产尤物av尤物在线看| 久久中文无码精品| 久久国产精品无码hdav| 国产精欧美一区二区三区| 在线精品自拍| av一区二区三区高清久久| 精品免费在线视频| 国产成人综合网在线观看| 国产97色在线| 欧美亚洲一二三区| 国产欧美日韩免费| 一级一级一片免费| 天天婬欲婬香婬色婬视频播放| 四虎永久免费网站| 欧美区一区| 国产欧美在线视频免费| 欧美区一区二区三| a毛片在线| 国产噜噜噜视频在线观看| 人妻夜夜爽天天爽| 真实国产乱子伦高清| 国产成人综合日韩精品无码不卡| 尤物午夜福利视频| 亚洲精品欧美重口| 欧美亚洲香蕉| 丁香婷婷久久| 永久在线播放| 老司国产精品视频91| 欧美三级不卡在线观看视频| 深爱婷婷激情网| 噜噜噜综合亚洲| 国产一区二区三区夜色| 日韩一区精品视频一区二区| 激情六月丁香婷婷四房播| 亚洲成人黄色网址| 蜜芽一区二区国产精品| 亚洲成AV人手机在线观看网站| 在线观看国产网址你懂的| 欧美综合区自拍亚洲综合天堂| 中文字幕日韩视频欧美一区| 久久精品aⅴ无码中文字幕| 在线精品欧美日韩| 国产理论一区| 国产成人做受免费视频| 人妻出轨无码中文一区二区| 自拍偷拍欧美日韩| 极品私人尤物在线精品首页| 一边摸一边做爽的视频17国产| 一区二区日韩国产精久久| 全部免费毛片免费播放| a色毛片免费视频| 少妇极品熟妇人妻专区视频| 久久亚洲中文字幕精品一区| 久久综合九九亚洲一区| 99r在线精品视频在线播放 | 国产精品无码一二三视频| 国产主播在线一区| 欧美日韩在线第一页| 国产欧美日本在线观看| 午夜小视频在线| 日本人妻丰满熟妇区| 国产美女91视频| 久久人人妻人人爽人人卡片av| 亚洲永久视频| 国产自在自线午夜精品视频| 黄色网站不卡无码| 毛片久久久| 国产女人在线| 欧美中出一区二区| 国产剧情无码视频在线观看| 中文字幕久久亚洲一区| 国产麻豆aⅴ精品无码| 91成人在线免费视频| 激情综合网激情综合| www.99在线观看| 40岁成熟女人牲交片免费| 亚洲国产精品国自产拍A| 成人免费午间影院在线观看| 久久夜夜视频|