藍(lán)巖真 朱虹雨
摘 要:韓語復(fù)句通常由多類型“節(jié)”構(gòu)成,各類句式結(jié)構(gòu)相對(duì)復(fù)雜,各節(jié)之間存在不同層次與包含聯(lián)系,因此連接復(fù)句在進(jìn)行自動(dòng)處理識(shí)別時(shí)通常需要依次分解為單句方能實(shí)現(xiàn)句子結(jié)構(gòu)的全面解析。文章主要探討了以語言知識(shí)為基礎(chǔ)的韓語復(fù)句自動(dòng)識(shí)別對(duì)策,旨在有效解決復(fù)句處理識(shí)別問題。
關(guān)鍵詞:語言知識(shí);韓語復(fù)句;自動(dòng)識(shí)別;對(duì)策
中圖分類號(hào):H55文獻(xiàn)標(biāo)識(shí)碼:A收稿日期:2017-12-06文章編號(hào):2095-624X(2018)01-0063-01
從韓語語法角度出發(fā),含有單一主謂賓關(guān)系的句子被定義為單句,含有超過兩組以上單句的句子被稱作復(fù)句,但是在自動(dòng)處理技術(shù)實(shí)際實(shí)施過程中,計(jì)算機(jī)通常難以準(zhǔn)確識(shí)別出句子當(dāng)中的主謂賓關(guān)聯(lián)和數(shù)量,導(dǎo)致韓語復(fù)句自動(dòng)處理充滿挑戰(zhàn)。從語言知識(shí)角度出發(fā),韓語主要依靠豐富的詞尾、助詞等體系達(dá)成語法表達(dá)效果,致使韓語復(fù)句自動(dòng)識(shí)別需要面臨“同型異質(zhì)”等語句歧義現(xiàn)象,影響自動(dòng)識(shí)別結(jié)果的準(zhǔn)確性。
1.韓語復(fù)句語言特點(diǎn)
充分掌握韓語復(fù)句的語言特點(diǎn)是準(zhǔn)確解構(gòu)韓語復(fù)句的重要前提,為此必須從復(fù)句關(guān)系判別標(biāo)準(zhǔn)、潛在復(fù)句關(guān)系標(biāo)記入手,深入解析復(fù)句的構(gòu)成表現(xiàn)、連接詞尾等內(nèi)容,并結(jié)合各類復(fù)句的特征整理自動(dòng)識(shí)別程序構(gòu)建思路。例如:“??? ?? ???./恩熙不是傻瓜。”該條韓語從語法成分角度出發(fā),均隸屬補(bǔ)語從句類型,因此難以通過單純的復(fù)句關(guān)系對(duì)其進(jìn)行準(zhǔn)確標(biāo)記。而有些連語會(huì)存在明顯的邏輯先后聯(lián)系,在自動(dòng)處理時(shí)必須注意連語銜接部分的準(zhǔn)確應(yīng)用。比如:“?? ? ?? ?? ??./樸永哲一回來,會(huì)議就開始了。”這句話隸屬邏輯語義關(guān)系范疇,具有時(shí)間連貫語義特性,其功能與復(fù)句關(guān)系標(biāo)記等同。
2.語料來源與解構(gòu)分析
本文所采用的各類語料多源于韓國(guó)新聞?wù)Z篇等主流媒體的相關(guān)報(bào)道,如《東亞日?qǐng)?bào)》等,解析語句約為50萬,主要采用U-Tagger詞法分析器進(jìn)行詞義標(biāo)注。在對(duì)復(fù)句進(jìn)行判定時(shí),主要根據(jù)句子的構(gòu)成表現(xiàn)、句末存在終止性停頓、由若干小句構(gòu)成等特點(diǎn)進(jìn)行復(fù)句識(shí)別和處理。經(jīng)相關(guān)數(shù)據(jù)資料分析統(tǒng)計(jì)發(fā)現(xiàn),從結(jié)構(gòu)角度出發(fā),韓語復(fù)句可通過分析句式層級(jí)、分句包含數(shù)量等方式,降低復(fù)句自動(dòng)處理復(fù)雜度,采用“化繁為簡(jiǎn)、對(duì)癥處理”的模式將復(fù)雜復(fù)句解構(gòu)為簡(jiǎn)單的相對(duì)應(yīng)分句,予以分層級(jí)和針對(duì)性處理,提高復(fù)句自動(dòng)識(shí)別的有效性和準(zhǔn)確性。
3.個(gè)案解析
例如,“?? ?? ??? ?? ??.”分別采用有道、必應(yīng)、谷歌、人工等語言自動(dòng)識(shí)別軟件對(duì)例句進(jìn)行處理,處理結(jié)果如下。有道:“下雨帶雨衣。”必應(yīng):“去下雨,帶上雨衣。”谷歌:“下雨了,所以我有雨衣。”人工:“下雨了,把雨衣帶上吧。”根據(jù)上述實(shí)踐結(jié)果可知,雖然必應(yīng)和谷歌均識(shí)別出了復(fù)句結(jié)構(gòu),但是在語義處理方面存在明顯缺陷,而有道雖然語義識(shí)別效果良好,但未能準(zhǔn)確判斷出復(fù)句結(jié)構(gòu)。這是因?yàn)樵陧n語復(fù)句軟件自動(dòng)處理過程中,通常需要將句子拆解為若干個(gè)短語片段,再通過類比思路將各片段譯為目標(biāo)短語,最后將各個(gè)短語連接成句,通過語序調(diào)整得到譯文。經(jīng)過語料和案例分析后發(fā)現(xiàn),復(fù)句語義和結(jié)構(gòu)識(shí)別失誤與連接詞尾的缺省翻譯關(guān)聯(lián)密切。
4.程序設(shè)計(jì)思路與實(shí)施效果
經(jīng)上述復(fù)句解構(gòu)和語義解析后可知,在進(jìn)行韓語復(fù)句程序編寫時(shí),必須重點(diǎn)關(guān)注句子語義、結(jié)構(gòu)和邏輯思路,從而進(jìn)行正確的解構(gòu)翻譯。基本設(shè)計(jì)流程如下:首先,必須實(shí)施句子預(yù)判處理工作。譬如,對(duì)于單句,可在語言自動(dòng)識(shí)別軟件直接輸入后進(jìn)行翻譯;對(duì)于復(fù)句,則需進(jìn)一步判斷句子的層級(jí)結(jié)構(gòu)和語義邏輯。其次,在連接詞尾處理方面,必須將句式中的各個(gè)連接詞尾重新設(shè)置為相應(yīng)的終結(jié)詞尾,并以連接詞尾的形式出現(xiàn)在譯句中。最后,根據(jù)中文單句翻譯結(jié)果和相應(yīng)的邏輯順序整合成全新的復(fù)句。實(shí)踐表明,采用此種方法能夠有效提高韓語復(fù)句自動(dòng)識(shí)別技術(shù)的翻譯質(zhì)量,在有道和必應(yīng)在線軟件應(yīng)用中改進(jìn)效果更加明顯。
綜上所述,本文以韓語復(fù)句特點(diǎn)為切入點(diǎn),對(duì)相關(guān)語言知識(shí)的理論基礎(chǔ)進(jìn)行了初步分析,并重點(diǎn)探討了基于語言知識(shí)的韓語復(fù)句自動(dòng)識(shí)別對(duì)策,通過句子解構(gòu)、語義解析、邏輯判斷等方式,提高韓語復(fù)句自動(dòng)識(shí)別的準(zhǔn)確性。
參考文獻(xiàn):
[1]黃丙剛.韓語因果復(fù)句在漢語中的對(duì)應(yīng)研究[J].東北亞外語研究,2016(3):49-54.
[2]劉 洋,畢玉德,李 健.基于句法知識(shí)的復(fù)句解構(gòu)對(duì)韓漢復(fù)句機(jī)器翻譯改進(jìn)芻議[J].洛陽師范學(xué)院學(xué)報(bào),2017(2):49-54.