從口語與書面語角度看GPT的自然語言處理弊端

2024-06-28 05:45:23王寧張世傳

今古文創 2024年22期

王寧張世傳

【摘要】人工智能語言存在表達生硬、分析固化及話輪轉換滯后等問題，原因在于其自然語言處理機制對自然語言理解不足，過度依賴書面語料進行分析。在不改變語料類型的前提下，關鍵在于理解并優化書面語與口語之間的轉換。本文結合語言學與人工智能理論，探討了文字和語言的關系，分析了人工智能語言與人類語言的差異，并給出相應建議，即人工智能應重視語境分析與應用，基于數據庫解析的“最優解”未必適應靈活的話語空間，同時，對話中上下文聯系也應得到關注。

【關鍵詞】語言；文字；人工智能；ChatGPT

【中圖分類號】H021? ? ? ? ? ? 【文獻標識碼】A? ? ? ? ? ?【文章編號】2096-8264（2024）22-0134-03

【DOI】10.20024/j.cnki.CN42-1911/I.2024.22.041

一、引言

人工智能的語言生成能力受限多種因素，如語料規模和類型。書面語因其易總結應用，被AI廣泛采用，而口語則因難以模仿，較少被采用。文字作為書面語的載體，在口語表達中有局限。當前，對如何利用文字表達語言的理解已深化。本文探討將“文字生動表示語言”的理論應用于“AI語言生成問題”的可行性。

語言障礙已成為21世紀全球化發展的制約因素。因此，讓計算機理解自然語言，實現自動化處理和個性化服務，是國際前沿研究，也是全球共同目標。[1]在ChatGPT廣泛應用下，袁毓林（2023）提出語言學研究應轉向以數據/計算密集型為主要構造對象的第四、第五范式，為語言學發展指明方向。

有學者認為，人工智能與人類有本質區別，前者學習，后者創造。然而，這與創造AI的初衷不符。盡管ChatGPT改善了以往AI語言的產力、話語死板、用詞單一、句法簡單等問題，但如何使其更接近人類語言仍待解決。原因在于語言和文字的本質。

二、書面語系統與口語系統的區別

（一）書面語系統

書面語是文字書寫的產物，用于記錄語言。文字的出現就是為了記錄語言，于省吾提到，文字起源于原始社會，初衷是簡單記錄事物，防止遺忘。隨著階級形成和國家出現，生產力提升，人事繁雜，文字逐漸用于記錄語言。[2]文字從語言獨立成符號后，相較于語言，延長了思維時間，并經歷了簡化過程，導致書面語與口語差異。

人工智能語言代碼的輸入與輸出的機制構想是摹仿人腦對語言的輸入與輸出進行架構的，人所使用的是人腦，人工智能所使用的是自然語言處理機制，這是言語產出是否能符合語言的根源。文字是表達于書面的通過大腦加工后的語言代碼，包括表音文字、表意文字和符號等類型，這些存在于視覺、聽覺等感知下的文字與語言之間的變換是人工智能需要關注的重要一環。我們要清楚地認識到，人工智能的代碼輸入和輸出機制與人類的語言解析和產出并不完全一致（雖然我們是這樣預想的），而是與文字的表述模式有一定的相關性。因此，當回答“人工智能所發出的語言如何才能更像人的語言”這個問題時，關鍵之處在于如何使得文字的表述更接近以至于成為“真實的”語言。

（二）口語系統

口語是語言的表達形式，人類依賴語言進行思考和交流。言語是心理現象，是人類運用語言的行為。起初，言語無固定規則，但隨著社會共同語言的出現，受到制約，但仍保持自由生成性，為語言更新提供動力。大腦是言語接收與發出的中樞[3]，語言信息處理依賴詞匯和語法。

在普通語言學中，存在兩個基本的觀點：第一，語音是語言的本質，文字是語言表達的輔助工具。第二，語言的存在先于語法，語法是對語言規律的滯后總結與歸納[4]。對于第一種觀點，文字是大腦組織語言思維后的視覺映射，傳遞視覺圖像和字義；語言則是思維組織輸出為聽覺的聲響，傳遞語音序列和語義。這種差異導致語言受語境、心理等因素影響，文字受書寫、表達方式等影響。

第二種觀點中，“滯后”包括歷時和共時的雙向滯后。語法對新生語言的控制力逐漸減弱，如古代漢語語法不適用于現代漢語。嚴格遵循語法規律創造語言，忽略語境、用詞和語氣，會導致聽眾難以接受，如人工智能回答問題時過于死板。

（三）人工智能語言分析

人工智能語言追求準確性，因此其表達更為正式，易于識別與人類語言的差異。人類語言反映思維，聽話者可判斷說話者狀況；而人工智能語言依賴于程序等，僅反映不完美的語法系統，難以實現人機語言融合。如某人言：“我該得的那個，你付都多了，我該得的應該得，這里拿多掉了。”雖語法錯誤，但人類能理解。這是因為非規范語言具有真實感，聽話者可根據說話者身份、心理等進行判斷。而人工智能缺乏這種能力。此外，這種語言難以文字表達，因文字需更多大腦加工。楊立昆（2022）認為，語言僅承載人類知識一小部分，大部分知識和動物知識非語言（非象征符號的）。[5]但人工智能語言具有強制正確性，輸入輸出固定，表達受限。能否將人類語言轉移至人工智能？可從漢語獨特性入手。

三、如何用書面語語料表現口語

當模仿物缺少必要現象，即失去了“靈魂”。常說漢語缺少形態變化，語序和虛詞至關重要。人工智能的自然語言處理不僅需要理解語序、虛詞帶來的差異，更要理解在某些情況下語序與虛詞的改變在意義表達不會產生任何影響這一人類語言理解特征。

（一）語序

語序是一種語法手段，但卻不一定會改變意義的表達。例如下面的兩個句子：

（1）你淋著雨沒有/雨淋著你沒有

（2）肉末夾燒餅/燒餅夾肉末

例（1）同義，例（2）異義。例（1）前句，在實際語言環境中的使用更傾向于詢問“你”的感受，身上是否被雨打濕；后句則更傾向于對“雨”效果的詢問，雨有沒有被你躲開。例（2）前句給人以肉包裹著燒餅，肉多的心理體驗；后句則是燒餅為主，夾縫中有肉末，讓人覺得肉少。

問ChatGPT兩者區別，AI回答：兩種表達方式主語和語序不同，但含義相同，并以系統中所保存的“著”表示“現在”的依據作出這兩句話是在詢問“正在”發生的事情。實際中，“著”在此句中僅起結構助詞作用，對語義無影響。

在進一步對ChatGPT進行詢問的回答中更為明顯：

問：這兩種表達方式都只能表示“正在”嗎？

答：對的，這兩種表達方式通常用來詢問對方當前的狀態或情況。它們都含有“正在”的意思，即詢問是否在某個特定的時間點或時間段內正在被雨淋著。請注意，這些表達方式強調的是持續性的動作或狀態，而不是雨是否曾經淋過你或你曾經淋過雨。

人工智能僅僅以‘“著”表示現在，不表示過去或未來這一程序代碼為依據，對于語境與事實置若罔聞，在實際語言環境中，若是下雨后問對方是否淋雨了，也會以這種方式進行詢問。詢問發出的時間是現在，對象也是現在，而問詢的事物是過去。

ChatGPT對于例（2）的回答更是讓人啼笑皆非：

問：“肉末夾燒餅”和“燒餅夾肉末”有什么區別？

答：二者實質相同，僅表述順序不同。通常可互換，無明顯區別。前者指切開燒餅，夾入肉末，再合上；后者是將肉末置于燒餅上，對折或卷起，使肉末被包裹。簡言之，二者皆描述同一種食物組合，順序差異而已。

首先這段話的邏輯就出現了語義矛盾。首句末句皆言明是同樣的食物，同樣的組合，只是順序不同，但描述時卻用不同的制作工藝技巧進行敘述，說前句是“夾有肉末的燒餅”，是半包裹狀態，后句是“肉末被燒餅包裹”，是全包狀態，因此得到的食物并不同。事實上，在實際語言環境中這兩種表達描述的是同一種食物，只是給人的感覺不同。前一種表述給人以肉多的心理體會，即肉包裹著燒餅；后句給人以肉少的感覺，即燒餅包裹著肉。食材的前后順序給人以食物數量多少的心理體會，就如配料表是以含量多少進行排序，排名靠前則含量更多，靠后則較少。

總之，對于語序帶來的影響應當被準確對待，細致劃分，了解到這種表述的社會性是一個很重要的方面。

（二）虛詞

虛詞在現代漢語中很重要，但有時刪減不影響句意。如：

（3）買不起別買/要是買不起就別買

（4）洗干干凈凈收著/洗得干干凈凈收著

例（3）和例（4）前后句意思相同，虛詞的省略并無語義上的改變，尤其在口語中更常見。兩句在自然口語對話中并沒有顯著的區別，GPT卻過于敏感：

問：“買不起別買”和“要是買不起就別買”有區別嗎？

答：兩者微小差別。“買不起別買”簡潔，強調行為建議，若買不起，別買。未提條件。“要是買不起就別買”較復雜，先給條件（買不起），再建議不買。語氣較靈活，可尋求替代品或改變消費習慣。核心意思相同，皆建議經濟不允許時不購買。第二句提供條件，給人更多思考空間。

人工智能難以理解“意合法”，雖前句省略了“要是……就”，但當我們對其進行解讀時會自動加上這種關聯，口語中轉換無礙。但問人工智能，由于后句增加了關聯結構，其解讀就必然會有所增加以解讀關聯詞的出現，這種解讀是毫無必要的，更是不符合人之解讀的。

例（4）后句的“得”是句子中表示結構關系的虛詞，但在口語中也可以不說出來，人工智能卻把注意力放在了“得”上：

問：“洗干干凈凈收著”和“洗得干干凈凈收著”有區別嗎？

答：“洗干干凈凈收著”和“洗得干干凈凈收著”的區別在于前者強調結果，后者強調過程和結果。兩者均表示洗凈后收起，但“洗干干凈凈收著”更簡潔，注重結果，而“洗得干干凈凈收著”更詳細，強調過程和結果。根據場景和喜好選擇即可。

回答單純從虛詞“得”入手進行分析，而漢語語法意合性顯著，非典型規則不易把握。“得”的語法功能在本句中已經虛化，而回答反復從語法、語用角度解釋“洗”在句子中的語法作用和語用表現，是語言規則的刻板表述，是被輸入的語法代碼的表述。這種解讀并不適用于現實生活，在口語中人們經常使用省略“的、地、得”這種結構助詞的表述方式，對于語義和表達并無影響。

總之，GPT的自然語言處理并沒有意合的“程序”。在自然口語對話中，也經常有不理解對方意義的情況出現，但這種情況是少數，即使出現了，也能夠通過多次的對話去解決這個“誤會”。GPT不僅難以持續性對話，更是以高頻詞“誤解”顯現，這是不合適的。若將詞序和虛詞作為一種自然語言的特殊現象對人工智能進行培養，或許會出現對同一問題的不同形式而意義相同的回答，相對于同樣的死板回答來說則更顯得“人性化”。

（三）語境表現

從根本上說，當前系統只能構建語言骨架，無法充分展示語言豐富性。嬰兒表現的不流暢、錯誤的發音卻可以被識別，這是因為其獨特的音調、音高、音色及氣力不足導致的斷句、重音。言語障礙者雖然無法通過語言被他人理解，但卻可以通過情緒感知、不斷詢問猜測到想要表現的意思，這是因為失語癥患者仍然具有“人”的語言能力，通過聲帶震動和肢體語言表達。這些體現了語言魅力和“人”的語言特點，即使不使用規范的語言，也能表達意義，這與認知和文化共鳴有關，是共情和意義相通的關鍵。

總之，這些都無法通過大數據或基本方程獲得。真正“語言”的真實構建不僅需要結構主義語言學對操作程序的講究、轉換生成語法對結構模式及其背后心智過程的探索，以及功能語言學基于認知科學的研究，還需要經驗觀察，立足于“言語”事實，不能只關注局部，而忽視整體，只有兩者相結合，才能實現人工智能自然語言的正確發展。

深度神經網絡受生物學啟發，瞳孔攝入像素，大腦皮層細胞發現邊緣和方向，判斷物體形狀和類別。這種程序導致人工智能難以真正理解運用語言，生理判斷雖似人類思維，實為簡單思維模式，這不僅包括“看山不是山，看水不是水”這樣的高度抽象思維邏輯，還包括無需思考的“習慣” ①邏輯。

語言學有一個經典歧義問題，即：

（5）咬死了獵人的狗

說話人身處于“獵人”的尸體旁，眼睛觀測到了一幅“狗”咬死“獵人”的場景，經過大腦的思維后，從口中對他人以語言的形式指出“這條狗是咬死了獵人的那條”這件事實，接收信息者以聽覺形式接收的信息在大腦中思索不會感覺有歧義或不解；但如果說話人以文字的形式進行書寫，接收信息者以視覺形式接收的信息經過大腦分析后卻會得到兩種不同的理解：狗被咬死了/獵人被咬死了，以致產生不知所云與不明其意的困惑感。而人工智能是以文字為基數，通過視覺或聽覺方式發出信息的一種傳輸系統，其使用文字符號來表情達意，即使是以音響形式發出，也是以文字的思維邏輯原封不動地表述，這也就是為什么人工智能有時被戲稱為“人工智障”，總是與人類的語言有著顯而易見的差別感。

當今人工智能以深度學習為主要學習方法，這種學習確實會使機器獲取大量語言范式并生成語言藍本，但這種學習是由無數的人類語言組合而成的類似“共同語”的系統，其選擇的解答也通常為“最優解”。但在不同語言環境中，這種所謂的“最優解”并非適合人類的思維感情。因此，對于語境的認識勢必要成為人工智能在對話中語言選擇的主要影響因素。

四、結語

書面語系統與口語系統存在現實差異，我們可以通過對語序、虛詞等漢語自身特點在書面語、口語上的表現來解決這些差異問題。這就需要我們更加深入地對自然口語對話進行研究以及對自然語言處理的研發，找到更多的具有漢語特征的口語語料，與書面語語料進行對比分析，以實現一種數據密集型的研究范式，為語言學及人工智能語言提供進一步發展的空間。

注釋：

①例如：中國人見面后常問“吃了嗎”屬于文化邏輯，熟練使用鍵盤的人可以不看鍵盤快速打字屬于空間邏輯，人在看見美好事物的時候眼球會隨物而動屬于生理邏輯等。

參考文獻：

[1]中國科學技術協會主編，中國人工智能學會編著.人工智能學科路線圖[M].北京：中國科學技術出版社，2022：57-58.

[2]于省吾.關于古文字研究的若干問題[J].文物，1973，

（02）：32-35.

[3]程琪龍.認知語言學概論——語言的神經認知基礎[M].北京：外語教學與研究出版社，1999：37-38.

[4]索緒爾.普通語言學教程[M].裴文譯.上海：教育出版社，2002.

[5]楊立昆.語言的有限性決定了AI永遠無法比肩人類智能[DB/OL].https：//mp.weixin.qq.com/s？_biz，2022-8-26.

作者簡介：

王寧，女，河南焦作人，碩士研究生，研究方向：漢語國際教育。

張世傳，男，河南鄭州人，碩士研究生，研究方向：漢語言文字學。