999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器翻譯視角下規范彝文文本分詞歧義類型探究*

2020-05-18 04:21:18
民族翻譯 2020年1期
關鍵詞:規則語言

⊙ 蔡 夏

(西南民族大學,四川 成都 610041)

一、研究背景及現狀

彝語是屬于漢藏語系藏緬語族彝語支的一種語言,同屬彝語支的語言還有納西、拉祜、傈僳、哈尼、基諾、怒蘇、白、土家等。學術界一般將彝語分為六大方言區,即北部方言、東部方言、南部方言、東南部方言、西部方言、中部方言,其中又包括了五個次方言和二十五個土語。[1]本文所關注的是最大的彝語方言區——北部方言區在日常交際中出現的歧義現象,文中以書面語的使用為例。彝語是表意的音節文字,規范后的彝文雖然只有819個字(加上次高調上的彝文,共計1165個),但是幾乎每個字都有其本義與引申義,而且大多核心詞匯的詞性也會隨著使用性的增強而發生變化,從而逐漸擴展其本身的詞性和詞義。因此,彝語中的同音異義、同形異義現象在長期的使用中是相當普遍的,這使得彝漢機器翻譯在文法上分詞時遭遇諸多歧義現象和易混淆詞句,增加了在算法上的實現難度系數。[2]

目前,學術界對彝語言的研究多集中在語法、語音等層面,聚焦語料庫或計算機語言的角度來研究彝語及其翻譯的成果則很少。[3]本文嘗試運用機器翻譯的分析和加工方法,對文中選取的彝語例句進行切分和結構剖析,簡單探討機器翻譯模式下“彝譯漢”所面臨的切分歧義現象,同時為彝漢翻譯語料庫的建立提供具體案例。

二、研究視角——機器翻譯

機器翻譯(machine translation,MT)是計算機把一種語言(源語言,source languaage)翻譯成另一種語言(目標語言,target language)的一門學科。它既是一門學科也是一門技術,作為語言學的一個分支,涉及計算機、認知科學、語言學、信息論等學科,是人工智能的終極目標之一。機器翻譯是自然語言處理在計算機科學、語言學、心理學、認知科學和數學等多學科交叉中衍生出的,一般通過建立形式化的模型來分析、理解和處理自然語言。[4]

機器翻譯中與語言智能有關的有三個方面,即語音識別/合成、自然語言處理和計算機編程。這三個領域涉及的問題各不相同。以自然語言處理領域為例,機器翻譯側重于解決該領域中的詞性標注、句法標注、語義標注、詞義消歧、指代消解、信息抽取等問題,以達到提升信息處理效率和效度的目標。[5]

一般而言,機器翻譯主要運用以下三種運算方法,即基于規則的方法、基于統計的方法和基于實例的方法,這三種方法各有優缺點。基于規則的方法在翻譯中完全依賴規則,而當規則出現摩擦時,則需要更多的人力物力資源配合;基于統計和實例的翻譯則依賴于語料庫和實例的規模,也存在一定的局限。[6]

機器翻譯通過對句子成分進行切分與標注的方式以達到分析和輸出語句的目的。[7]切分歧義是影響分詞系統切分正確率的重要因素,包括交集型歧義、組合型歧義以及混合型歧義3種類型:1.交集型歧義:如字符串abc既可以切分為ab/c,又可以切分為a/bc。其中,a、ab、c和bc都是具有獨立意思的詞或詞語;2.組合型歧義:若ab為詞,而a和b在句子中又可以分別單獨成詞;3.混合型歧義:由交集型歧義和組合型歧義自身嵌套或者兩者交叉組合而產生的歧義。采集歧義字符串的兩種具體方法:正向最大匹配和逆向最大匹配兩種方法掃描發現交集型歧義;正向最大匹配和逆向最小匹配,并且最小匹配從單字詞開始的方法發現組合型歧義。[8]

三、理論基礎及相關概念簡述

(一)轉換生成語法

按照轉換生成語法“管約論”的觀點,人類大腦的語言器官中有一個詞庫和一個推導程序或稱演算系統。推導程序從詞庫中選擇詞項,推導出句子的結構描寫式,然后交由大腦中的其他應用系統進行語音和語義解釋[9],如圖所示:

轉換生成語法“管約論”[10]

“X-階標理論規則”是“管約論”模型句法最基本的句法結構規則。它可以描述任何語言中的任何句子類型。

“X-階標理論”[11]

轉換生成語法理論也制定了一套符號[12],其常用符號列舉如下表:

實義詞/短語功能詞漢語名稱代號漢語名稱代號名詞N限定詞(冠詞、指示代詞、物主代詞、不定代詞等)D/DET動詞V代詞Pron形容詞A/ADJ助動詞Aux副詞Adv/ADV標句詞C介詞P連詞Conj名詞短語NP疑問式Wh--動詞短語VP

最常見的句法結構有以下幾種[13]:

(1)S=NP+VP;(2)VP=V+S;(3)NP=NP+S;(4)VP=NP+S;

(5)VP=V+NP;

(二)文法中的歧義現象

任何一種自然語言中都存在著歧義現象。所謂歧義是指人們在言語交際的過程中,聽話人對一個句子的語言意義有著兩種或兩種以上理解的言語現象。也就是說,當一種語言形式能夠傳遞出兩種或兩種以上的意義,進而傳達出兩種或兩種以上的解釋時就會產生歧義。[14]一般來講,詞匯歧義包括了同形異義詞和同音異義詞。結構歧義是指由于句子結構切分不同或結構關系不同或潛在關系不同而形成的語句歧義。[15]彝語歧義現象是指詞與詞、詞與短語、短語與短語組合后,呈現出不同的語義結構關系、不同的語法結構關系、不同的層次結構關系,可作幾種形式的切分,從而形成句法上的歧義。[16]本文主要探討和關注的是彝語言實際運用中的詞匯歧義和結構歧義現象。

四、彝語切分歧義的舉例與分析

(一)組合型歧義舉例

(二)交集型歧義

(三)混合型歧義句

五、結論

機器翻譯通過將彝語自然語言結構在使用中產生的各種歧義即語用歧義進行系統歸納和比較研究,找出彝語文本中容易產生歧義的共性特征。其涉及話語、言語行為和指示意義等,進而積極地利用歧義產生的多重語用效果,去驗證與豐富語言規則,最終推動有關彝語言文本的深入研究。從以上探討機器翻譯對彝語句法結構的切分、標注和解釋、分析中,我們可以看到,目前機器翻譯尚且面臨諸多挑戰,但同時我們也有理由相信,通過大量實例的分析與累積,對彝語句法和詞匯等進行切分、標注與轉換、輸出等處理,使得基于規則和基于統計的機器翻譯語料庫不斷充實,機器翻譯的效果也一定會逐步優化,使我們在語言交流中的障礙和壓力得到有效緩解。

*本文系“四川省高校重點實驗室——民族語言文字信息處理實驗室建設項目”研究成果之一。

猜你喜歡
規則語言
撐竿跳規則的制定
數獨的規則和演變
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
讓語言描寫搖曳多姿
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
多向度交往對語言磨蝕的補正之道
TPP反腐敗規則對我國的啟示
累積動態分析下的同聲傳譯語言壓縮
搜索新規則
主站蜘蛛池模板: 日韩精品亚洲精品第一页| 久久精品无码一区二区国产区| 人妻一区二区三区无码精品一区 | 呦女亚洲一区精品| 极品私人尤物在线精品首页 | 亚洲全网成人资源在线观看| 国产成人无码AV在线播放动漫| 日韩一级毛一欧美一国产| 区国产精品搜索视频| 国产簧片免费在线播放| 亚洲国产看片基地久久1024 | 噜噜噜综合亚洲| 精品无码一区二区三区在线视频| 久久久精品久久久久三级| 欧美福利在线观看| 久久九九热视频| 无遮挡国产高潮视频免费观看| 亚洲一区二区三区国产精品| 免费亚洲成人| 真人免费一级毛片一区二区| 天堂va亚洲va欧美va国产| 99国产精品一区二区| 欧美国产精品拍自| 亚洲人成在线精品| 67194亚洲无码| 日韩精品免费在线视频| 欧美精品啪啪| 欧美一级一级做性视频| 在线播放精品一区二区啪视频| 久久久精品无码一区二区三区| 日韩大乳视频中文字幕| 在线色综合| 国产综合在线观看视频| 欧美翘臀一区二区三区| 波多野结衣一二三| 国产香蕉国产精品偷在线观看| 91无码人妻精品一区| 久久国产精品波多野结衣| 亚洲av日韩av制服丝袜| 她的性爱视频| 欧美自拍另类欧美综合图区| 巨熟乳波霸若妻中文观看免费| 日韩欧美91| 亚洲九九视频| 欧美一区中文字幕| 亚洲91精品视频| 国产成人久视频免费| 成人毛片免费在线观看| 日韩AV无码一区| 欧美日韩91| 国产美女久久久久不卡| 小蝌蚪亚洲精品国产| 久久精品这里只有国产中文精品| 一本一道波多野结衣av黑人在线| 国产精品视频白浆免费视频| 欧美精品在线免费| 99在线视频网站| 亚洲第一av网站| 亚洲aaa视频| 狠狠亚洲五月天| 日韩精品无码免费专网站| 亚洲VA中文字幕| 91久久国产热精品免费| 国产亚洲一区二区三区在线| 日韩av高清无码一区二区三区| 亚洲男女天堂| 她的性爱视频| 黄色一及毛片| 99久久精品久久久久久婷婷| 99ri精品视频在线观看播放| 午夜性刺激在线观看免费| 中文字幕va| 精品无码视频在线观看| 免费激情网站| 国产在线观看高清不卡| 国产一在线| 在线永久免费观看的毛片| 99视频免费观看| 中文字幕亚洲乱码熟女1区2区| 色综合天天视频在线观看| 色偷偷av男人的天堂不卡| 久久精品人人做人人爽97|