999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

俄語地名翻譯的音節切分研究

2015-02-08 10:35:23趙云鵬胡斯玥劉新貴宋華標趙政坤
地理空間信息 2015年6期

趙云鵬,胡斯玥,劉新貴,宋華標,趙政坤

(1.信息工程大學 地理空間信息學院,河南 鄭州 450052;2.湖北省基礎地理信息中心,湖北 武漢 430074;3.61206部隊,北京 100042)

俄語地名翻譯的音節切分研究

趙云鵬1,胡斯玥2,劉新貴1,宋華標1,趙政坤3

(1.信息工程大學 地理空間信息學院,河南 鄭州 450052;2.湖北省基礎地理信息中心,湖北 武漢 430074;3.61206部隊,北京 100042)

在境外地名數據庫建設過程中,地名翻譯是境外地名數據整合的前期基礎性工作,但目前缺乏有效的地名翻譯解決辦法。音譯是地名翻譯的主要方式,也是地名翻譯研究的重點內容。以俄語地名為例,在分析俄語發音特點和音節構成的基礎上,制定了較為合理的音節切分方案,并實現俄語地名音節切分,將翻譯對象由地名長字母串化簡為音節,能夠有效降低地名翻譯的復雜度,為地名規范化翻譯工作提供參考。

地名翻譯;音譯;音節切分;俄語地名

為了構建全球地名數據庫,豐富我國地名信息資源,進一步滿足境外地圖制圖和對外交流的需求,地名翻譯工作必不可少[1]。自從20世紀90年代初IBM的研究人員Peter Brown等提出IBM模型以來,機器翻譯技術不斷快速發展和應用,使人們重新樹立起了對機器翻譯的信心[2],但是對于地名翻譯技術的專題研究還很少。由于地名翻譯規則較為特殊,現有主流翻譯軟件難以滿足需求,地名翻譯多以人工翻譯為主[3]。本文以俄語地名為例展開地名翻譯的相關技術研究。

1 俄漢對照音譯結構

音譯即譯音,是把一種語言的詞語用另一種語言中跟它發音相同或近似的語音表示出來的翻譯方法。在進行俄語地名音譯時必須要嚴格遵守俄語和漢語的標準發音規則。為了避免“同音異字”等情況的發生,規范地名翻譯結果,國家民政部和國家測繪地理信息局制定了俄語漢字音譯表,用于指導俄語地名的漢字轉寫工作[4]。表中俄漢對照關系可以用T=(E,H)結構表示。其中,T代表對照關系;E代表俄語部分,可以是簡單音節,也可以是元音或輔音音素;H代表俄語對應的漢字。例如:T1=(бaй,拜)、T2=(бa,巴)、T3=(a,阿)、T4=(б,布)等。

俄漢音譯表為俄語地名音譯提供了基礎,但是直接利用俄漢對應關系翻譯整個地名字母串時,音素間界限不夠明顯,翻譯復雜度較高,準確率難以得到保證。對俄語字母串進行音節切分,將翻譯對象化簡為音節,將原有的二層翻譯結構變為三層翻譯結構,可達到降低翻譯復雜性、提高翻譯準確率的目的。音節切分后翻譯效果如圖1所示。

圖1 音節切分后翻譯效果示意

2 音節切分

2.1 俄語語音結構分析

俄語是俄羅斯國家的官方用語,屬印歐語系斯拉夫語族的東斯拉夫語支。俄語語音系統中有33個字母(10個元音字母、21個輔音字母、2個無音字母),表示42個音(6個元音、36個輔音)[5]。從發音的角度,俄語詞可劃分成為音節片段。一個音節可以由一個元音音素構成,也可以由一個元音和一個或幾個輔音構成[6,7]。俄語詞的語音結構樹枝圖E=(W,J,S),如圖2所示。其中,W代表俄語詞;J代表音節;S代表音素或無音字母。

圖2 俄語語音結構樹枝圖

為了便于音節切分,將俄語音素劃分為元音、響輔音、噪輔音、無音字母4種類型,如表1所示。其中,ё 、ю 、я、 е在讀音上與元音о、 у 、a 、э存在著對應關系[8],根據發音特點,將ё、 ю 、я 、е定為元音。對于輔音音素,不再進行軟硬音區分,只分為響輔音、噪輔音2類。同時,考慮到無音字母對音節切分的影響,設置了無音字母類型,在進行音節切分時需先對無音字母進行處理,并且參照“響度說”,將元音、響輔音、噪輔音的響度等級分別設定為3、2、1[9]。

表1 音素分類表

2.2 音節切分基本原則

在俄語語音學研究史上,曾先后出現過多種音節理論,其中影響較大的有“元音中心說”、“呼氣說”、“響度說”、“肌肉緊張說”和“合張運動說”,它們分別從不同視角闡述和說明了俄語音節的本質和切分原則[9]。通過分析這些經典理論,本文采用“元音中心說”和“響度說”對俄語音節切分的基本原則進行歸納與總結。

1)一個元音對應一個音節。“元音中心說”指出,元音是成節音,能作為中心組成音節,而輔音都是非成節音,不能單獨組成音節。因此,俄語詞中有多少個元音,就能有多少個音節,且一個音節包含一個元音。如雙音節詞“один”含有2個元音“о”、“и”,分別對應2個音節“о”、“дин”。

2)詞首輔音屬于后行元音,詞尾輔音屬于前行元音。根據元音中心說,輔音不能自成音節,輔音或輔音群需要與鄰近元音構成音節。因此,詞首的輔音或輔音群需要與其后的第一個元音結合形成音節,詞尾的輔音或輔音群需要與其前的第一個元音結合形成音節。如俄語地名詞語“Покровск(波克羅夫斯克)”中的詞首輔音“п-”屬于第一個元音“о”,詞尾輔音群“-вск”屬于第二個元音“о”。

3)元音間的輔音劃分有兩種情形:①元音間只有一個輔音。“響度說”認為,在非詞首音節中,響度總是漸次遞增,而音節界限位于響度遞增時的最低點之前。所以當2個元音之間只有1個輔音時,這個輔音屬于后面的元音。如俄語地名詞語“Ленa(勒拿河)”中,元音“е”和“a”之間的輔音“н”屬于后元音“a”。②元音間存在輔音群。根據“響度說”,音節界限位于響度遞增時的最低點之前,而輔音音素可以有噪輔音、響輔音兩個級別。所以需要對輔音群的輔音逐個進行判斷,直到找到響度谷值作為音節的切分點。

4)詞中存在無音字母ь和ъ時,需在無音字母處斷開。硬音符號ъ和軟音符號ь都是不發音的,在音節劃分時,硬音符號ъ和軟音符號ь處均需斷開。

2.3 音節切分基本思想

俄語詞具有“音素-音節-詞”的3層語音結構,俄語詞是頂層,音節是中間層,音素作為底層。對詞的音節切分實際上是對詞中的音素進行分割與組合。音節的核心是元音,一個音節只含有一個元音,音節界限存在于2個鄰近元音之間的響度谷值處,例如俄語詞“выщинский(維辛斯基)”的響度分布為“1 3 1 3 2 1 1 3 2”,可見響度谷值在щ、с處,則可劃分為3個音節вы、щин、ский,如圖3所示。因此,確定2個鄰近元音的位置,分析二者間的輔音數量與類型,找到響度最低點,是實現音節切分的關鍵。

圖3 音節界限示意圖

2.4 音節切分基本步驟

2.4.1 地名詞語預處理

俄語地名中經常會含有“_”、“-”、空格等特殊符號,如“Бaян-Бурд(巴彥-布爾德)”、“Сaxaрный Зaвод(薩哈爾內扎沃德)”。在進行音節切分之前,應首先對這些詞語進行去特殊符號處理,在“_”、“-”、空格等處將詞語分割成單詞。另外,俄語存在著一些特定的發音規則,如音組тц、дц要讀成較長的ц音;音組сш、зш要讀成較長的ш音;音組сч、зч、жч要讀成較長的щ音;音組тск、дск中的тс、дс讀成ц音等。所以要先將單詞中的這些音組進行替換,如“Иркутск(伊爾庫茨克)”變化為“Иркуцк”,然后再進行音節切分。

2.4.2 音節切分

在完成地名詞語預處理之后,按照音節切分基本規則開始音節切分工作。首先對單詞中的無音字母進行處理,在無音字母處斷開,舍去硬音字母ъ,保留軟音字母ь到前面的字符串中,接著獲取元音在字符串中的位置。以元音為核心確定字符串音節切分點的位置,假設俄語詞中的元音為Y(n)=y1y2…yi…yn(n>0),且它們在字符串中的位置為T[i](i>0),然后對鄰近元音間的輔音進行判斷,獲取音節界限,設置切分點,具體過程如圖4所示。

1)T[i+1]-T[i]=2時,鄰近元音yi、yi+1之間沒有輔音,切分點位于T[i+1]處。

2)T[i+1]-T[i]>2時,鄰近元音yi、yi+1之間有輔音,設鄰近元音yi、yi+1間的輔音為F(m)=f1f2…fj…fm(m>0),且每個輔音在字符串對應的位置為L[j],則切分點的位置LQ為:

圖4 音節切分點位置的獲取過程

若2個鄰近元音之間只有1個輔音(即m=1時)F (1)=f1,就在輔音f1對應位置L[1]處設置切分點。

若2個鄰近元音之間存在輔音群(即m>1時),F (m)=f1f2…fj…fm,則需要對輔音群的輔音逐個進行判斷,若輔音f1為噪輔音,則輔音群屬于后面元音構成的音節,切分點在L[1]處;若輔音f1為響輔音,則需要對輔音f2進行判斷,若輔音f2為噪輔音,則輔音f1屬于前面元音構成的音節,輔音f2及其后面的輔音群屬于后面元音構成的音節,切分點位于L[2]處;否則,需要對輔音f3進行響、噪輔音判斷,直到找到輔音群中的第一個噪輔音f (j),將其位置L[j]作為切分點為止。

根據得到的音節切分點對音節進行切分,表示為“J1-J2-…-Jn”形式。

2.4.3 后處理與結果輸出

對字符串的切分結果進行后續處理,將無音字母、空格、“-”、“_”引起的斷開進行拼接,生成最終結果,以表格形式輸出。

3 實 驗

本文在VC++6.0平臺上實現了俄語地名的音節切分系統,并從《新編俄羅斯地名譯名手冊》中隨機選取了300個俄語地名作為實驗材料進行音節切分,共切分出音節1 076條,明確了地名內部的基本語音界限,切分效果如圖5所示。其中無需字母再劃分,可直接進行翻譯的簡單音節有758條,約占音節總數70%,有效降低了地名翻譯的復雜度。

圖5 音節切分結果

4 結 語

地名是地圖的重要組成部分之一,其翻譯的正確、統一與否,直接影響到我國政治、經濟、軍事和外交工作的開展[10]。音譯是境外地名翻譯的主要方式,音節是聽覺能感受到的最自然的語音單位,本文以俄語為例,展開音節切分研究,明確地名字母串的發音界限,減弱了譯者主觀意識對翻譯過程的影響,有效降低了地名音譯的復雜度,為境外地名規范化翻譯提供參考。但是在俄語地名的音譯過程中存在著部分意譯現象,俄漢音譯表中存在著一些不符合音節結構的對照關系,因此,在下一步工作中需要研究音節切分過程中這些特殊字母組合問題,以及音譯與意譯相結合的問題,來提高切分后俄語地名翻譯的準確率。

[1] 杜祥明.中國大百科全書:地理學[M].北京:中國大百科全書出版社,2004

[2] 杜金華,張萌,宗成慶,等.中國機器翻譯研究的機遇與挑戰——第八屆全國機器翻譯研討會總結與展望[J].中文信息學報,2013,27(4):1-8

[3] 劉新貴,孫群,馬小青,等.境外地名翻譯軟件的研制[J].測繪通報,2011(4):74-76

[4] 民政部,國家測繪地理信息局.外語地名漢字譯寫導則(俄語)[M].北京:中國標準出版社,2008

[5] 陳君華.俄語語音學教程[M].北京:北京大學出版社,1997

[6] 陶瑩.俄漢語音節差異淺談[J].外語與外語教學,1994(增刊):19-22

[7] 王玲玲.漢俄語音對比分析及對俄漢語語音教學策略[D].長春:吉林大學,2014

[8] 哈爾濱工業大學外語第二教研室.俄語(第二外語用)[M].北京:人民教育出版社,1980

[9] 徐來娣.俄語音節理論研究與俄語音節切分優化方案[J].中國俄語教學,2009,28(4):69-72

[10] 朱萌.引進版地圖中地名表示方法研究[J].測繪通報, 2014(12):56-59

P281

B

1672-4623(2015)06-0161-03

10.3969/j.issn.1672-4623.2015.06.054

趙云鵬,碩士,主要研究方向為地名數據一致性處理與地名翻譯。

2015-09-09。

項目來源:鄭州市科技計劃資助項目(141PPTGG369);信息工程大學地理空間信息學院碩士學位論文創新與創優基金資助項目(ZS201503)。

主站蜘蛛池模板: 国产成人啪视频一区二区三区| 91丝袜乱伦| 97se亚洲综合在线天天| 五月婷婷伊人网| 呦女亚洲一区精品| 国产又粗又爽视频| 91po国产在线精品免费观看| 久久99蜜桃精品久久久久小说| 国模私拍一区二区三区| 日韩毛片在线播放| 国产清纯在线一区二区WWW| 激情無極限的亚洲一区免费| 亚洲国产天堂在线观看| 国产网站一区二区三区| Aⅴ无码专区在线观看| a亚洲视频| 国产精品一区二区无码免费看片| 日韩欧美国产成人| 亚洲国产精品美女| 99久久国产综合精品2020| 亚洲不卡av中文在线| 欧美成人免费| 久久免费观看视频| 天天色天天操综合网| 亚洲一区毛片| 香蕉eeww99国产在线观看| 第一页亚洲| 99ri精品视频在线观看播放| 99久久99视频| 动漫精品啪啪一区二区三区| 久久96热在精品国产高清| 亚洲日本精品一区二区| 美美女高清毛片视频免费观看| 国产精品一区在线麻豆| 亚洲大学生视频在线播放| 国产精品片在线观看手机版 | 亚洲欧美日韩动漫| 国产人人射| 在线观看欧美精品二区| 不卡的在线视频免费观看| 扒开粉嫩的小缝隙喷白浆视频| 91精品日韩人妻无码久久| 亚洲精品久综合蜜| 一本色道久久88综合日韩精品| 无码专区第一页| 国产精品美女免费视频大全 | 99热这里只有精品免费| 波多野结衣的av一区二区三区| 四虎精品黑人视频| 亚洲国产成人麻豆精品| 欧美一级高清片久久99| 亚洲成在线观看| 国产国拍精品视频免费看| 日韩免费毛片视频| 国产成人精品高清不卡在线| 亚洲日韩欧美在线观看| 国产日韩丝袜一二三区| 国产成人精品一区二区免费看京| 国产91久久久久久| 国产网站一区二区三区| 日韩最新中文字幕| 五月丁香伊人啪啪手机免费观看| 国产剧情伊人| 国产欧美在线观看一区| 538精品在线观看| 日本人妻一区二区三区不卡影院 | 亚洲一区黄色| 欧美日韩资源| 国产欧美精品专区一区二区| 欧美97欧美综合色伦图| 高清亚洲欧美在线看| 国产最爽的乱婬视频国语对白| 真实国产乱子伦视频| 欧美国产成人在线| 亚洲精品国产综合99| 久久综合九色综合97婷婷| 国产乱论视频| 久久永久精品免费视频| 国产亚洲欧美在线人成aaaa| 91丝袜美腿高跟国产极品老师| 国产精品对白刺激| 欧美三级自拍|