張慧玲
體認翻譯學作為一種新興學科理論,批判繼承了傳統的語言學與翻譯理論,將翻譯視作體認的產物,而不僅僅是語言符號與意義的轉換[1]。從體認翻譯學的視角來看,翻譯活動中的“同”與“異”可分別從“體”和“認”的角度進行分析?!绑w”是馬克思主義哲學唯物論的表現,強調翻譯過程中譯者的互動體驗;而“認”表示人類對于語言的認知加工,凸顯認知的重要性。體認翻譯學著力對于翻譯過程中“現實—認知—語言”的動態建構,而非單一的靜態考察。人工智能軟件 ChatGPT 風靡全球,它是人工智能技術驅動的自然語言處理工具,能夠學習人類語言來進行對話以及翻譯。作為機器,它并不能從現實生活中獲取生活經驗及互動體驗,不能完成“體”。作為人工智能,ChatGPT的工作機制是人類使用者輸入提示后,其再輸出答案。不過,ChatGPT集成了Grammarly、Phrase Bank、Collocaid等軟件的校對、替換、改述功能[2],并且ChatGPT可對譯文進行校對和潤色。那么,ChatGPT 能否從“體”和“認”來處理翻譯文本,它的內在的認知機制以及它是否能夠完成翻譯的動態構建,這是本文將要探究的重要議題。
體認翻譯學是王寅結合了認知語言學與翻譯學研究,分別從“體”和“認”兩大要素對翻譯進行研究的新興翻譯學理論。這一理論重點突出語言是由“體”與“認”兩個過程產生的,即先有“體”后有 “認”。王寅認為傳統翻譯理論過于重視“語言層面”上的轉換,而忽視其背后的體認機制[3]。而體認翻譯學旨在彌補這一缺陷。翻譯是一個從現實到認知,再到語言的動態構建過程。體認語言學認為,認知和語言來源于人類對客觀現實的“互動體驗”和“認知加工”。在體認翻譯學的框架之下,翻譯的過程并非將現實、認知、語言三個層面分隔開來,而是憑借體認機制,強調各層面的互動性,三個層面的動態轉換。語言的轉換是現實世界和認知世界共同作用的結果,“體”是由于人們對現實世界的體驗存在共通之處,“認”是由于各民族的文化背景和思維模式不同,所以,受其影響而形成的認知世界也不同。針對體驗的普遍性和認知的差異性,譯者作為體認主體,以現實世界為基石,分析認知世界的異同,巧妙地將源語映射為目的語。體認翻譯學是整合體驗哲學、認知語言學、體認語言學及翻譯學的創造性成果。體認翻譯學作為一種新興的翻譯理論,是中國本土化特色的翻譯理論[4]。
目前,體認翻譯學的研究現狀主要分為以下三方面:理論建構、動態建構以及與傳統理論的銜接。第一,理論建構?!绑w認翻譯學”是由王寅在2021年首次提出的,形成了系統的理論體系,但其思想萌芽于20 世紀末接觸認知語言學,他意識到可將認知語言學與翻譯研究相結合。2010 年,馬丁(Martin)在書中正式提出了“Cognitive Translatology(認知翻譯學)”,因此,國內學者融合了認知語言學與翻譯學,于 2012 年在《中國翻譯》上首次使用認知翻譯學這一術語。緊接著,中國學者嘗試將哲學(傳統哲學、馬列主義、語言哲學、后現代哲學、中國后語哲等)與語言學研究結合,就將“認知翻譯學”修改為“體認翻譯學”。第二,動態建構。體認翻譯學主要從“現實、認知、語言”三個層面進行研究?!罢Z言”是對現實世界進行“互動體驗”和“認知加工”的結果[5]。就目前對于體認翻譯學的應用,主要是從三個層面的其一或其二來進行分析的,對于翻譯過程中 “現實—認知—語言”的相互作用的研究并不多見,體認翻譯學的研究方向應著力于動態建構,而非單一的靜態考察[6]。第三,與傳統理論的銜接。體認翻譯學理論基礎包括馬列主義唯物論、語言哲學、體驗哲學、認知語言學、體認語言學、后現代哲學及認知科學。如今,西方翻譯理論被廣為使用,我們要努力建構我國自己的譯論學派。我國傳統的譯論“文質之爭”和“信達雅”是中國學者接受和學習的譯論,而新興的中國特色譯論卻略顯爭議。在西方譯論的統攝下,中國傳統譯論逐漸淡出公眾視野。我們的翻譯研究只能跟著西方理論走,從“文化轉向、多元理論”到“異化—歸化”等等都是如此。我們創立了我國的特色翻譯理論,不應僅限于和西方譯論的銜接,應該加強與中國傳統譯論的融合。
ChatGPT 是2022年美國人工智能研究實驗室 OpenAI 開發的一種新型人工智能聊天機器人。該機器人在對大量數據進行整合與訓練應用的基礎上,通過“監督學習”與“強化學習”的方式,具有了較強的自然語言理解和生成能力,并能與人類進行高質量對話。在此基礎上,可以完成相對復雜的工作,包括連續問答、摘要生成、文檔翻譯、信息分類、代碼編寫、論文撰寫等多種任務。ChatGPT與以往的人工智能聊天機器人有本質區別。ChatGPT的出現標志著人工智能從低級智能階段逐步邁入高級智能階段。ChatGPT在超大規模預訓練語料的基礎上,通過深度學習機制,獲得了強大的語義分析能力,已具備進入人類語境和理解人類語言的功能。在運行邏輯上,ChatGPT應用了“基于人類反饋的強化學習”訓練機制,可在與人交互的過程中習得人的語言特征和思維方式,從而獲得能力的進化。
ChatGPT仿擬人類神經網絡運作機制進行知識生產,但尚不具備人的思維、邏輯能力和認知水平,其邏輯基底是由人設計和構建的。ChatGPT不是原創性的知識生產者,而是按照先置算法對人類知識進行加工和重組的知識搬運工。翻譯是一個復雜的知識生產轉換過程,對翻譯目的的理解、對原文語言風格的體悟、對原文文化信息的領會、對原文知識的創造性轉換和翻譯方法與策略的使用等與譯者的知識儲備、文化底蘊與專業素養密切相關。
ChatGPT,即生成式預訓練轉換模型。ChatGPT 類語言模型的特點之一是對詞語序列的概率相關性建模,即根據輸入的語句預測接下來不同語句出現的概率分布。簡而言之,ChatGPT 可以根據上文預測下一個詞出現的可能性,所以也可以看作統計語言模型。筆者通過對ChatGPT 的主體架構和主要組件的分析,發現語料體系、預訓練算法與模型、微調算法與模型構成了ChatGPT 的技術核心,其使ChatGPT可承擔模仿人的思維模式、自由創作、文檔翻譯等邏輯性更強的工作。
ChatGPT 的運行必須要有龐大的語言語料庫,要有大量功能強大的運算模型作為邏輯推理的支撐,才能夠實現其功能[7]。語料庫是生成內容的原始素材來源,語料庫的大小直接決定了所生成內容的豐富性及全面性,其覆蓋面越廣、內容越詳盡,內容生成可選擇的空間就越大;而其中模型和參數是基于實際需要不斷變化和更新的,用戶規模越大,他們需求的差異化就越會表現出來。大型語言模型不僅是涵蓋了多種語言的模型,還是能夠對各類語言進行推理運算并實現內容篩選所呈現的模型,它也是 ChatGPT 的核心模型。
ChatGPT 的預訓練分為無監督預訓練和有監督微調。ChatGPT通過有監督的調優、模擬人類偏好、近端策略優化來進行強化學習。無監督預訓練是通過學習數據間的內在結構和模式來提取信息,ChatGPT是通過閱讀大量的對話數據,學習語言的語法、語義和上下文的聯系。微調是在無監督訓練之后,在一個特定任務上對預訓練模型進行重新訓練。對ChatGPT的微調階段,研究者使用了監督學習和強化學習相結合的方法。學習與用戶的實時情景交互是ChatGPT內容生成能力的重要體現,它能夠根據不同情景給出相對應的答案,并且能就某一內容的系列問題展開持續對話。由于用戶規模巨大、個體差異明顯,ChatGPT 所面臨的交互情景也就更為復雜多樣,要想解決這個難題,可以采用不斷更新優化模型和補充、更新與完善語料庫的方式。基于現實情景的調整進行相應模型的優化,通過精準的參數設置來實現與用戶對話的匹配性。語料庫的改進是基于用戶的需求,加入新的內容,對老舊內容進行補充,對有誤的內容語義進行改正,從而保證語料的數量和質量。
ChatGPT的微調一般是通過兩種方式。一種是指導模型生成更符合用戶期望的語言表達,我們可以通過提供一些優秀的對話樣本,告訴模型哪些回答是正確的,模型會根據示例樣本生成更加準確的回復。另一種是通過強化學習來微調,我們可以通過獎勵模型生成高質量回復來提升性能,將ChatGPT的回答與人類生成的參考回答進行比較,并根據相似度來獎懲模型,通過更新迭代來改善模型。ChatGPT的語言表達的好壞,主要是用戶對 ChatGPT 的感知,即相較于與真實的人會話所感覺到的差異,這種差異越小表明 ChatGPT 的表達越接近于人,其語言表達越真實。這也會受到外界的影響,如果對話內容來源于較權威的專家學者,并且已是成熟的學術概念,那么生成的語言表達就更接近人;而面對復雜情景下的個人情感或新出現的學術研究概念,ChatGPT 的回答便跟人有了差距。所以,ChatGPT 語言表達的人化程度是其功能發揮的重要考量,其不僅要具備專業知識,在知識儲備上甚至要能夠超過領域內的專家,而且還要具備人的邏輯推理及表達能力,從而形成用戶所需要的內容。ChatGPT 在內容生成以及信息傳遞過程中,提供給用戶的是真實的內容,生成的內容是客觀的,能夠根據會話完成具有邏輯性的內容生成與傳遞。
ChatGPT 的興起,源于人工智能技術的普及,在不同場景下,其可根據用戶的需要完成情景交互和互動體驗,能夠滿足用戶的即時需求,并以可見的內容呈現出來,實現了由淺向深、由虛向實的轉變。隨著相關領域的進一步拓展,其會被應用于更多的行業。綜上所述,語料體系、預訓練算法與模型、微調算法與模型構成了ChatGPT 的核心技術,情景交互和語言表達是ChatGPT的一種能力,我們要利用好、發揮好ChatGPT強大的功能,實現人與機器的和諧發展。
ChatGPT 利用深度神經網絡對大規模文本數據進行訓練,對信息進行歸納、整合和完善,其本質上屬于詞和句序列的自動輸出。這種模型以模仿人類自然表達為目的,能夠生成符合語言邏輯的文本,其算法邏輯并不關注信息的真實性。相反,它能夠修正雜亂的語法或錯誤的翻譯,并變換為更適合的表達方式,使虛假的信息顯得更具說服力和可信度。OpenAI首席技術官米拉·穆拉蒂認為,ChatGPT可能會“編造事實”,并表示這是當下基礎的大語言模型共同面臨的挑戰。
ChatGPT作為大型語言模型具有強大的通用語言理解和生成能力,能夠遵循人類指令完成不同類型的自然語言處理任務。ChatGPT在尊重除了美國的其他國家的文化背景和使用習慣上仍有欠缺,看似客觀中立的技術背后隱藏了平臺資本的操控。翻譯具有價值觀構建功能,世界雖然是相似的,但是各個地區的自然環境不完全相同,人們認識世界、理解世界、表達思想的方式也不盡相同,那么翻譯時自然會融合譯者的人生觀、價值觀、世界觀,由于譯者的地區不同、經歷不同、感受不同,那么其所翻譯出來的譯文自然各不相同,這是處于體認翻譯學下對翻譯的探究,我們在翻譯過程中必須透過語言的現象看到體認的本質,才能將翻譯做好。對ChatGPT來說,它的翻譯是和語料庫進行比對,再結合用戶的需求而生成的一個語言產物,并不會考慮到體認翻譯學的三大核心內容“現實、認知、語言”,從而不能實現三者的動態構建。
ChatGPT 類生成式人工智能不具備理解能力。ChatGPT 本質上是基于語料庫的數據積累和概率計算進行的輸出,盡管在形式上已非常接近于人的表達,但其本質仍然是一種計算機語言的計算和轉譯[8]。本文從體認翻譯學和ChatGPT 翻譯內容生成的角度,探討了ChatGPT能否實現體認翻譯學的動態構建,從發展現狀、運行機制、案例分析幾個方面進行研究,提出了ChatGPT產出譯文的方式,以期對翻譯理論的發展提出一種新模式。當然,ChatGPT的應用要充分發揮其知識創造能力,著重其創新模式的培養。在翻譯知識創造過程中,人依然是主宰,人工智能只是被應用的工具和手段[9]。