999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析機器翻譯瓶頸及研發趨勢

2019-09-10 17:43:56安寧
新教育論壇 2019年35期
關鍵詞:規則計算機語言

機器翻譯(Machine Translation)是翻譯人員利用多種計算機翻譯軟件,將源語言(Source Language)文件,轉換成另外一種目標語(Target Language)或者多種目標語言,翻譯人員借助計算機器翻譯一直是人工智慧領域中的重要研發方向。機器翻譯進行翻譯時涉及到自然語言(Natural Language,如中文、英文等)的加工合成,幾乎已經覆蓋自然語言處理的所有技術,并且有較為明確具體檢測手段,可以當做自然語言處理技術的研發項目。不可避免的一個重要問題就是機器翻譯若要占領翻譯市場,就必須要面對來自人工翻譯者的挑戰。按照機器翻譯的流程,翻譯成品要譯者人工潤色和審核,這部分的人力成本將會占實際運作成本的大部分。也就意味著能夠節省的時間必須多到一定程度,機器翻譯才能達到實用化的階段。在理想情況下,人工潤色盡量無須參照原文,直接進行修飾即可。

機器翻譯總體上可以分為直接式(Direct)、轉換式(Transfer)及中介語(Interlingua)三大類,實操一般都是采用轉換式。轉換式機器翻譯流程大致可分為三個階段:分析、轉換和生成。自然語言處理最大的難處,在于自然語言本身復雜更新較快,而且例外繁多。因此機器翻譯所面對的主要問題,可以歸納為兩大項:(1)文句中歧義(Ambiguity);(2)語法不合設定(Ill-formedness)現象。自然語言的語法和語意中需通過上下文線索加以判斷。以下是兩類問題:

問題一,歧義。就是一個句子有多種解釋。我們日常生活中不知不覺地充滿了歧義句。雖然人們可以根據常識正確判斷句意,但是對于依照文字規則來理解句子的計算機翻譯軟件來說,這就是一個歧義句。在做句子分析時,幾乎在每一個環節(如斷詞、句法分析、語意分析等)都可能出現歧義。單個字或者詞的解釋往往會因前后的內容產生不同的意思。除此之外,判斷句義依靠的線索在不同范圍。因此在機器翻譯過程中,若采用線性流水式的處理程序(Pipelined Architecture),則前面的模塊則無法做出確定性的(Deterministic)判斷,而須盡量多地保留候選者,而讓后面的模塊進行處理。所以,最終判斷的時機應盡量延后,在累積足夠信息后,再選擇要使用的方法。這樣才不會在開始就把正確的譯法排除到考慮范圍之外。

問題二,所謂的語法,是語言學家,依靠目前擁有的大量語料,歸納總結出的一些規則。這些規則是不完整的,往往有許多的例外。而且語言是一直在變遷的,無法要求語言的使用者,每字每句都合乎這些人為加工訂定的文法,自然地也難以避免這樣的情況出現在翻譯稿件中。這些與設定語法的例子不符的地方包括不明的字匯,如新生的專有名詞,和舊字新法的。這些現在部分來自單純的疏失,例如錯字、漏字、贅字、轉檔或傳輸時產生的亂碼,或是不慎混入的標簽(tag),也有些是已被大眾所接受的字匯和語法。理想化的機器翻譯,必須能夠處理這些與設定語法不符的問題。

如何解決上述的歧義或語法問題,則需要大量知識。這些大量知識的管理,分類,儲存和應用,是建立機器翻譯時最大重點和難點。我們首先要將這些包含在語言學之內(intra-linguistic)、跨語言學的(inter-linguistic),以及超乎語言學之外(extra-linguistic)的知識抽取、表達出來,解釋上述的語法和歧義問題,而且還要維護這個龐大的知識庫。所以,我們要建立的知識庫必須包羅萬象,吸收涵蓋各領域、各層面的知識。它本身就是一項艱難復雜的工作。也就是說知識庫的建設維護是機器翻譯系統開發最大的瓶頸。

一般來說知識的取得,和我們表現知識的方式有著緊密的聯系。知識表現方式可以有很多不同的存在形式。其一就是加入知識庫的規則,規則系統是由事先以人力建立好的大量規則所構成。在進行機器翻譯時,翻譯軟件根據這些規則,進行二擇判斷,進行分析、轉換和生成步驟,最后給出明確答案。這種方法被機器翻譯廣泛采用。它的優點在于貼近人的直覺,容易理解,遵循已有的語言學知識和規則,充分利用已有的經驗和研究結果。逐漸使其參數化,不同的語言現象用幾率掃描進行描述,積累量足夠大時,語言模型就自然建立起來。其最大的優點在于通過參數,讓計算機翻譯軟件在不同的條件下根據不同的偏好進行解釋和加工,依靠參數估算任務給計算機翻譯軟件進行。

機器翻譯的未來,研發高品質的翻譯系統,需要的知識庫是巨大并且瑣碎的。對于知識的獲取和管理,是機器翻譯系統研發的瓶頸。近些年來,機器翻譯系統的研發,已經漸漸地由規則庫的方式轉變成為參數化方式,并且其優越性已經得到了證明,也逐漸成為了主流。隨著計算機行業的發展,計算機硬件性能的大幅提升,機器翻譯軟件已經突破了計算能力和記憶容量的限制。與此同時,人們生活和語言的發展使得語料庫的規模也在爆炸似的增長,由譯者來制定和模擬模型,利用計算機的處理優勢進行語料庫的加工,可以大大提高計算機學習效率,降低知識獲取和管理的難度。這也是對機器翻譯研發瓶頸的突破。放眼未來,如果能構建精準的模型,提高語言融合的鍥合度,利用合適的規則抽取語料庫中相關的知識,可以在專業特種行業領域發揮巨大的作用,提供高品質的翻譯。如此一來,機器翻譯最終可以擁有廣泛的實用化領域和空間,也必將占有相當大的翻譯市場份額。

作者簡介:安寧(1980.01-),男,漢族,吉林長春人,吉林建筑大學國際合作與交流碩士,講師,從事外國語言文學,機器翻譯研究。

猜你喜歡
規則計算機語言
撐竿跳規則的制定
計算機操作系統
數獨的規則和演變
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
讓語言描寫搖曳多姿
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
TPP反腐敗規則對我國的啟示
累積動態分析下的同聲傳譯語言壓縮
主站蜘蛛池模板: 国产剧情国内精品原创| 国产成人8x视频一区二区| 婷婷色婷婷| 亚洲精品男人天堂| а∨天堂一区中文字幕| 欧美专区日韩专区| 国产在线拍偷自揄拍精品| 亚洲精品在线影院| 国产小视频网站| 亚洲精品在线影院| 美女黄网十八禁免费看| 亚洲成人免费在线| 国产成人高精品免费视频| 99热在线只有精品| 国产女同自拍视频| 欧美国产日产一区二区| 欧美亚洲激情| 在线观看无码av五月花| 国产区在线观看视频| 9999在线视频| 久久国语对白| 国产精品视频久| 久久免费成人| 真人高潮娇喘嗯啊在线观看| 国产免费一级精品视频| 天天综合天天综合| www.精品国产| 国外欧美一区另类中文字幕| 刘亦菲一区二区在线观看| 欧美日韩国产在线人| 福利国产在线| 亚洲中字无码AV电影在线观看| 国产啪在线91| 99热最新网址| 午夜a级毛片| 福利视频99| 亚洲不卡影院| 亚洲av无码久久无遮挡| 国产不卡国语在线| 手机永久AV在线播放| 国产手机在线小视频免费观看| 午夜精品福利影院| 国产乱码精品一区二区三区中文 | 国模沟沟一区二区三区| 22sihu国产精品视频影视资讯| 伊人久久福利中文字幕| 青青草原国产免费av观看| 日韩精品专区免费无码aⅴ| 综合五月天网| 伊人大杳蕉中文无码| 五月婷婷亚洲综合| 色妞永久免费视频| 国产亚洲男人的天堂在线观看| 99久久免费精品特色大片| 一区二区无码在线视频| 欧美a级完整在线观看| 国产99视频在线| 亚洲视频无码| 中文字幕在线日本| 白浆视频在线观看| 一级成人a做片免费| 国产99在线| 毛片在线播放a| 99久久精品免费视频| 六月婷婷激情综合| 国产精品成| 国产在线观看人成激情视频| 国产精品污视频| 日韩在线播放中文字幕| 国产成年女人特黄特色毛片免| 欧美成人怡春院在线激情| 三级国产在线观看| 制服丝袜亚洲| 日韩无码视频网站| 色偷偷一区| 国产在线观看精品| 日韩 欧美 小说 综合网 另类| 久久国产亚洲偷自| 亚洲an第二区国产精品| 国产 在线视频无码| 亚洲人成影视在线观看| 久久午夜夜伦鲁鲁片无码免费|