999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文心一言對漢語歧義的翻譯研究

2024-05-07 10:56:41唐紅芳李婧怡
名家名作 2024年6期
關鍵詞:人工智能結構研究

唐紅芳 李婧怡

[摘要] 語言歧義一直都是自然語言處理系統面臨的最大挑戰之一,最近百度推出的人工智能模型文心一言引起了大眾的關注。通過實證研究,分析文心一言在漢語歧義句方面的翻譯現狀,探討其在漢語歧義句翻譯方面的特點和不足,得出文心一言可以通過人為反饋對結果進行優化,而且關注語言的使用習慣,讓表達更地道,但是翻譯比較單一,且沒有一致性。這讓人們更好地了解自然語言處理機制,優化人工智能的性能,讓其更好地為人類所用,達到“人機合作”的理想局面。

[關? 鍵? 詞] 漢語歧義;人機互動;文心一言;翻譯

一、引言

我國著名語言學家朱德熙先生認為:“一種語言語法系統里的錯綜復雜和精細微妙之處往往在歧義現象里得到反映?!彪S著時代的發展,人工智能逐漸出現在生活中,比如機器翻譯、人機對話、智慧教學等,而語言是人機交流最基礎的媒介,自然語言的處理就變得十分關鍵。機器無法像人類一樣可以通過生活常識和對漢語的精準掌握來排除歧義,它只有掌握人類制定出來的一套消除歧義的規則才能破解這個難題。而機器翻譯就是一個不斷去除句子分析歧義的過程。因此,研究自然語言的歧義現象,并制定系統的消解歧義的規則,讓機器去掌握,是新時代語言學發展的一個關鍵方向。

二、文獻綜述

對于漢語的歧義研究最早可追溯到趙元任先生用英語發表的《漢語歧義問題》。此后,漢語研究者從多個方面對歧義進行了探討,主要有歧義定義、歧義類型、歧義格式、歧義比較和歧義消解方法等。劉悅怡等(2020)對歧義的分類文獻進行了詳細的梳理,將現代漢語的歧義類型劃分為語音歧義、詞匯歧義、句法歧義、語義歧義和語用歧義五大類,本文將按照此分類標準進行實驗。目前的歧義研究以書面語歧義為主,語用歧義的相關研究還不夠深入,且多注重口頭交際,書面交際中的語用歧義研究比較匱乏(尤天來,2022)。因此,這里主要探討兩個基本歧義層次,即詞匯歧義和句法歧義,這也是自然語言處理模型要面對的最基本的挑戰。

目前對于人工智能在歧義句翻譯方面的研究還不多。劉海軍等(1997)基于全句翻譯的智能英漢機器翻譯系統,構造了一個語言環境以消除語境方面的歧義,如組合歧義、省略等語言現象。陳海東(2009)針對計算機翻譯系統中漢語詞匯切分的問題,提出在漢語標點中利用切分詞標點的解決方法。要想機器識別出漢語歧義句并準確翻譯成另外一種語言,需要大量的實證研究和推理,從而得到歧義消解的辦法。實際上,機器翻譯就是一個不斷去除句子分析歧義的過程(劉海軍等,1997)。

根據上述文獻,研究人工智能對于漢語歧義句的翻譯現狀是有必要的。本文基于一篇研究ChatGPT語義模糊分析的實驗步驟,從漢語歧義角度出發,讓文心一言翻譯一些典型的漢語歧義句,并對翻譯結果進行分析,探討其在漢語歧義句翻譯方面的特點和不足,進一步討論人工智能與語言學理論是否可以相適應。

三、結果與討論

(一)詞匯歧義翻譯

劉悅怡等(2020)認為,詞匯歧義是指由詞(字)形相同、意義不同的詞(字)所引起的歧義,且與詞匯結構、句法結構的差異無關。詞匯歧義又可進一步分為多音詞歧義和一詞多義歧義。比如說,“這是一本好書”,這句話中的“好”既可以是說書的“內容”好,也可以是說書的本身完好、無損壞,兩者都是形容詞,所以這是一個詞類相同的一詞多義歧義。多音詞歧義只出現在書面語中,一旦讀出來就沒有歧義了,但是文心一言支持用戶語音輸入,因此這里不討論多音詞歧義的翻譯情況,只研究一詞多義造成的歧義現象。每個句子的實驗流程基本如下:(1)翻譯。(2)問是不是歧義句。(3)問句子中多義詞的含義。(4)再次翻譯這句話。

首先,對它進行簡單句的測試,包括“桌子上放著蘋果”“菜不熱了”和“ 他走了一個小時了”,并判斷文心一言能否識別出其中的歧義現象,答案是不能。 像“桌子上放著蘋果”這句話中的“蘋果”既可以指水果,又可以指蘋果牌電腦,因此在沒有語境的情況下,這是一個歧義句。但是文心一言并沒有看出這里的歧義,堅持認為“蘋果”是指水果。這樣的情況在測試的三個例句中都有發生,文心一言都只能確認這個詞語最常見、用得最多的意思,對其進行英語翻譯也只提供了這一種翻譯方式,包括 “There is an apple on the table”,“The food is not hot anymore”,“He has been gone for an hour”。

其次,通過多輪有意提問的方式,比如“有沒有可能‘菜不熱了中的‘熱字是作動詞表示加熱”等這種指向性的提問方式,獲得的反饋是積極的,通過人為提示,知道這個詞語可能還存在的幾個意思,不過也暗示用戶要提供更多的語境信息和明確表達自己的需求,才能避免句子歧義。但是也發現一個現象,即使它知道這是一個歧義句,其展現出來的歧義解釋有些不符合人們正常的思維規律,比如說對于“菜不熱了”中“熱”這個字的解釋是“菜已經冷掉了”和“這不是一道熱菜”,后面一個解釋似乎不符合語言使用習慣,且已有文獻并未提供這個解釋(劉悅怡等,2020)。

最后,在幾輪提問和獲得正向性反饋的基礎上,讓其再次翻譯一下這句話,并且提問方式換成了“這句話可以有哪些翻譯”,或許是受到提問中“哪些”這個詞的影響,一般會得到多種答案,大都包含了這個詞語不同意思的翻譯,并且對于用法沒那么常見的解釋,也會提供更加準確、地道的英語句子,比如說“他走了一個小時了”理解為“他已經去世一個小時了”的話,比較直接的翻譯是“He has been dead for an hour”。但是這種翻譯并不符合英語的語用習慣,因此它建議翻譯成“He passed away an hour ago”。

總的來說,文心一言很難識別出一詞多義歧義句,有時甚至還會提供錯誤的意思,但是通過人為有意的引導和提醒,它可以識別出這個多義詞的多重含義,說明文心一言具有根據用戶反饋從而提高回答準確度的能力,因此,我們可以通過有意識的訓練提問方式,來獲得想要的答案,從而減少機器運行負擔。比如說,可以問“這句話有哪些翻譯”而不是“請翻譯一下這句話”,這樣得到的答案或許更符合我們的預期,也能擴寬知識量。

(二)句法歧義翻譯

句法歧義是指句子因結構層次不同或句法成分之間的關系不同而產生的歧義,又可以細分為結構層次歧義和結構關系歧義(劉悅怡等,2020)。比如說,“小王和小張的同學”是典型的結構層次歧義,句子由于層次切分的不同,可以產生兩種解釋,即“小王/和小張的同學”和“小王和小張的/同學”。像“學習文件”這句話,兩種解釋的結構層次都相同,都是“學習/文件”,但是成分間的關系不同,“學習”和“文件”的關系既可以是偏正結構,也可以是動賓結構,因此稱為結構關系歧義。這一部分我將分析五個句子,每個句子的分析步驟大致如下:(1)翻譯。(2)問是不是歧義句。(3)確定有歧義的部分。(4)再次翻譯這句話。

首先分析一個結構層次歧義句,在漢語中,“張三和李四的同學”屬于結構層次歧義句,由于連詞“和”管轄領域的不同,其層次可以理解為(N1+和+N2)+的+N3,也可以理解為N1+和+(N2+的+N3),從而產生歧義,既可以表示“張三自己和李四的同學”,也可以表示“張三和李四兩個人的同學”,其中同學可能是一個,也可能是兩個或者很多個。當問文心一言這句話是不是歧義句時,它辨別了這是一個歧義句,然而它給出的歧義解釋并不全面,只包含 “張三和李四共同的同學”和“張三和李四各自的同學”這兩個意思。當繼續問能不能有“張三自己和李四的同學”這個意思時,它同意存在這個解釋。從最初的翻譯“Classmate of Zhang San and Li Si”增加了“Zhang Sans classmate and Li Si's classmate”另一種英文表述。因此,對于漢語中的結構層次歧義句翻譯,我們可以在詢問時組織好措辭,盡可能簡明地表明問題,包括詞語的單復數形式、句子切分后的語序等,把潛在的歧義都顯化出來,以獲得更加準確的結果。

同樣的結構層次歧義句“咬死獵人的狗”卻有不同的實驗結果,一開始它不認為這是歧義句,翻譯出來的句子也是 “The dog that bit the hunter to death”。后面經過多次提問,它認為這句話中的歧義問題可以通過上下文或者語境來消解,因此在實際使用中一般不會造成誤解。而且最后給出的翻譯都包含了這兩種釋義,即“The dog that bit the hunter to death”“The hunters dog that was killed by an attacking animal”“The hunters dog that was bitten and killed by another dog”這再一次印證了有效的提問方式和人為的反饋可以提高文心一言文本內容生成的準確性。

對于結構關系歧義,我選取了兩種關系不同的短語,即“學生家長”這種并列或偏正結構,以及“學習文件”這種偏正或動賓結構。第一種關系歧義句,它只識別出了偏正結構,即“學生的家長”,翻譯結果為“Students parents” or “students parents”。經過提醒后,也指出并列結構的解釋需要依靠語境,而且這是一個復數概念,或許是上一輪回答有提到“復數”概念,最后讓它再次翻譯的時候,“學生”都是復數形式,不同于第一次給出的有單數形式。第二種卻恰恰相反,最先給出的翻譯 “learned document”到最后直接沒有了,只剩下動賓結構的形式,這要歸于中間多輪刻意的詢問。它可以準確識別出這句話存在兩種解釋方式,即“學習這份文件的內容”和“將文件作為學習資源”,但是在翻譯環節出現了錯誤,只翻譯出了動賓結構這種形式。

盡管文心一言前后回答存在出入,但經過多次的詢問之后,其最后給出的翻譯結果也不十分完美,但是這對研究這個模型是如何自我學習有重要的作用,而且還有助于用戶學習如何與其互動,以達到更好的效果。文心一言可以通過人為干預來提升其回答的準確性,因此可以讓用戶自主學習有效的交流方式和提問方式,這或許不失為一個好辦法。

四、歧義句生成測試

想了解文心一言對于歧義句的概念界定,最直接的辦法就是讓其自己生成一個歧義句,結果它生成的句子是“他背著我去了一趟書店”,顯然這是一個歧義句,而且是多音詞歧義,但它給出的兩種解釋都屬于一個意思,即“他偷偷地去了書店,不想讓我知道”和“他去書店的時候,我是知道的,但是我是在店外等他,而他沒有告訴我他去書店干了什么”。因此,它對于漢語歧義句的定義完全沒概念,只知道有幾種不同的解釋方式就算作歧義句,不管解釋得對與否。這或許也是導致它前后回答矛盾、得出的翻譯結果不夠全面的原因之一,此次實驗的全部數據總結如下表:

表格包含了文心一言對于漢語歧義句的翻譯測試結果,其中正確識別(解釋)行列是指通過提示后的結果,正確翻譯是指最后測試的翻譯結果。實驗結果表明文心一言可以借助用戶的提問方式和反饋來優化其生成結果。不過它也多次提出,消除歧義的關鍵是充足的語境。但是,它正確且全面地把歧義句翻譯出來的比率只有識別的一半,即42. 8%,主要表現在句法歧義方面。英文的句法習慣不同于中文,可能受提問方式的影響,從而影響對中文歧義句的判斷。

五、結論

本文從漢語歧義角度出發,讓文心一言翻譯一些典型的漢語歧義句,并對翻譯結果進行分析,探討人工智能在漢語歧義句翻譯方面的特點和不足,結果表明文心一言在歧義句翻譯方面有利有弊,它可以通過人為反饋對結果進行優化,而且關注語言的使用習慣,讓表達更加地道,但是翻譯比較單一,且沒有一致性,答案多變不固定,有時還會出現有歧義的英語句子。然而,實驗也會存在一些局限性,文心一言作為一款人工智能模型,一直在優化迭代,導致這個實驗中的一些數據和結果可能會與未來的模型存在出入。這需要做更多研究和實驗,以更好地了解和發展自然語言處理機制,優化人工智能的性能,讓其更好地為人類所用,達到“人機合作”的理想局面。

參考文獻:

[1]陳海東.計算機翻譯存在的困難及解決方法新探[J].廣東科技,2009,18(16):87-88.

[2]賈光茂.英漢語量詞轄域歧義的認知語法研究[J].現代外語,2020,43(4):451-462.

[3]劉海軍.智能機器翻譯中的語境信息處理[D].北京:中國科學院研究生院(計算技術研究所),1997.

[4]劉悅怡,宮齊.現代漢語歧義類型的再討論[J].暨南學報(哲學社會科學版),2020,42(5):24-32.

[5]尤天來.言語行為理論視角下的語用歧義策略研究[D].長春:吉林大學,2022.

[6]于秒,周思敏,龍佳欣.內隱韻律與語境對漢語均衡型歧義結構歧義消解的作用[J].心理與行為研究,2022,20(6):739-746.

[7]趙帥,鹿士義,陳婧,等.母語為韓語的漢語學習者加工“V+N1+的+N2”歧義結構的眼動研究[J].心理與行為研究,2019,17(1):15-23.

作者簡介:

唐紅芳(1968—),女,漢族,湖南瀏陽人,教授,研究方向:語用學、應用語言學、外語教學。

李婧怡(2000—),女,漢族,湖南岳陽人,碩士研究生在讀,研究方向:外國語言學及應用語言學。

作者單位:湖南工業大學

猜你喜歡
人工智能結構研究
FMS與YBT相關性的實證研究
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
EMA伺服控制系統研究
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
論《日出》的結構
主站蜘蛛池模板: 亚洲无码久久久久| 熟妇无码人妻| 国产国模一区二区三区四区| 亚洲h视频在线| 久草视频一区| 97久久人人超碰国产精品| 亚洲成人免费看| 国产在线98福利播放视频免费| 日韩无码一二三区| 国产成人成人一区二区| 欧美综合区自拍亚洲综合绿色 | 国产精品美女自慰喷水| 在线欧美日韩国产| 国产一级小视频| 99久久99视频| 一级毛片基地| 72种姿势欧美久久久大黄蕉| 在线观看亚洲精品福利片 | 日韩欧美色综合| 国产在线第二页| 国产欧美另类| 国产一级精品毛片基地| 一边摸一边做爽的视频17国产| 四虎永久免费网站| 国产欧美在线观看精品一区污| 香蕉久人久人青草青草| 国产欧美在线观看视频| 2021国产精品自产拍在线| 香蕉在线视频网站| 国产伦精品一区二区三区视频优播| 中文字幕首页系列人妻| 久久精品中文无码资源站| 亚洲欧洲自拍拍偷午夜色| 免费AV在线播放观看18禁强制| 91精品啪在线观看国产60岁 | 中文字幕亚洲精品2页| 激情在线网| 呦系列视频一区二区三区| 玖玖精品在线| 中文字幕自拍偷拍| 国产流白浆视频| 国产亚洲视频在线观看| 久夜色精品国产噜噜| 亚洲国产综合第一精品小说| 88av在线播放| 88av在线| 鲁鲁鲁爽爽爽在线视频观看| 国产乱肥老妇精品视频| 亚洲综合九九| 日韩欧美国产精品| 毛片免费在线视频| 亚洲无码免费黄色网址| 青青青视频蜜桃一区二区| 亚洲高清在线播放| 91原创视频在线| 国产一区二区福利| 国产美女久久久久不卡| 91在线日韩在线播放| 中文字幕免费视频| 国产毛片一区| 国产91丝袜在线播放动漫 | 亚洲AⅤ无码日韩AV无码网站| 亚洲精品无码久久久久苍井空| 亚洲欧洲日本在线| 久久伊伊香蕉综合精品| 日韩色图在线观看| 18禁不卡免费网站| 国产成年无码AⅤ片在线| 国产美女免费网站| 欧美日韩在线成人| 日韩一级毛一欧美一国产| 色婷婷成人网| 欧美亚洲一区二区三区在线| 成人免费午夜视频| 国产一级无码不卡视频| 国产91在线|日本| 在线观看无码a∨| 国产精品一区二区在线播放| 精品国产一二三区| 青青操视频在线| 高清码无在线看| 国产人人乐人人爱|