999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

石家莊公示語漢英平行語料庫的設計與建設

2014-03-13 01:12:59宋建威

宋建威 吳 慧

(石家莊鐵路職業技術學院 河北石家莊 050041)

石家莊公示語漢英平行語料庫的設計與建設

宋建威 吳 慧

(石家莊鐵路職業技術學院 河北石家莊 050041)

基于語料庫語言學的基本觀點,結合石家莊市公示語的文化特色及特點,對石家莊公示語漢英平行語料庫的主題欄目進行規劃,重點介紹建設石家莊公示語漢英平行語料庫的具體過程和做法,最后指出該語料庫的應用及不足之處,對改進石家莊公示語翻譯質量,提升石家莊國際形象具有重要意義。

公示語 平行語料庫 設計 建設

1 引言

語料庫(Corpus)通常是包含數以萬計字的機器可讀的語言材料集,它不同于檔案,通常是被挑選出來并經過處理的文本,可用來代表特定的語言變體或流派,因此可作為一個標準的參考。平行語料庫作為語料庫的一種,是指“由原文文本及其平行對應的譯語文本構成的雙語語料庫”(王克非2004: 4-6),其用途非常廣泛,“不僅可以比較兩種語言的異同,而且可以利用它開展廣泛的翻譯教學與研究,以及雙語詞典的研編”(王克非2004: 28)。平行語料庫最早創建于上世紀90 年代中后期,迄今為止國內外業已建立多種類型的雙語平行語料庫。國際上比較知名的平行語料庫有挪威的“英語-挪威語平行語料庫”、英國的“德語——英語文學文本平行語料庫”。國內則有北京外國語大學中國外語教育研究中心創建的“新型雙語對應語料庫”,李德俊教授以漢英詞典研編為主要目的創建的英漢平行語料庫;衛乃興教授以研究探討英漢對等表達為目的主持建設的英漢平行語料庫等等。上述雙語平行語料庫主要是通用型以及文學翻譯類型的平行語料庫,以某一專門用途為導向的平行語料庫仍較為鮮見。在專門用途為導向的公示語(Public Signs)領域方面,國內目前僅有北京第二外國語大學建設的全國公示語翻譯語料庫,還沒有建成涉及地方特色的公示語語料庫。同時由于公示語語言短小精悍,對應性強,不涉及過多的語法與措詞,這些特點都使得語料庫能夠更好的應用于公示語翻譯中,有關公示語翻譯的語料庫建設還存在很大的發展空間。鑒于這一研究現狀,我們以課題研究為契機,建設石家莊公示語漢英平行語料庫,在此基礎上,力圖摸索其在漢英公示語文本語言特征、漢英翻譯等教學研究中的應用。

2 石家莊公示語漢英平行語料庫創建思路

根據不同使用目的,語料庫可以分為很多種,其建設方法也不盡相同。而石家莊公示語漢英平行語料庫屬于雙語平行語料庫,諸如此類的語料庫建設基本可以分為三個部分:首先,根據設計理念設計語料庫的基本框架。本語料庫創建過程中主要考慮了設計目的、規模、語料范圍、代表性、均衡性、雙語比例、共時或歷時性、語言類型、語言質量、取樣策略以及標注加工等。然后規劃語料庫的主題欄目。課題組針對石家莊公示語的特點,初步規劃了語料庫的主題欄目,分成道路交通、文化教育、醫療衛生、體育運動、商場購物、餐飲娛樂、景區景點、公共場所等8個大類31個子類,如表1 所示,基本涵蓋了石家莊各類公示語的范圍。接著是語料的釆集、加工和整理。為了提高語料庫的實際應用價值,搜集平行翻譯語料的同時,也搜集、整理和加工國外各類公示語的英語原文文本,形成可比公示語語料庫。最后,按照標準將整理后的語料入庫,建設成完整的語料庫。

序號 一級分類 二級分類 序號 一級分類 二級分類警告提示信息警示提示信息1 道路交通基礎設施信息 功能設施道路與車輛信息 企業名稱及業態類2 文化教育警示提示信息 經營服務信息功能設施信息 商品名稱文化教育名稱 部門服務名稱6 商場購物警示提示信息3 醫療衛生警示提示信息功能設施信息 功能設施信息醫院系統信息 服務類信息7 餐飲娛樂4 體育運動警示提示信息 餐飲名稱功能設施信息警示提示信息運動項目名稱 功能設施信息場館名稱 服務類信息警告性、提示性標志8 景區景點5 公共場所說明性標志禁止性標志功能設施景區景點介紹

3 石家莊公示語漢英平行語料庫建設步驟

石家莊公示語漢英平行語料庫是一個開放式的語料庫,其庫容將會隨研究需要不斷得到擴充。同時石家莊公示語漢英平行語料庫是第一次系統地對石家莊市范圍內公示語翻譯的整理和收錄,所以在建庫之前,我們學習借鑒了己有語料庫的建設過程,熟悉了語料庫建設的相關知識,根據前人經驗制定了本次建設的流程。

3.1 語料搜集選取與整理

搜集語料方法主要有三種:正式出版物(圖書、論文、音像制品等),非出版物(網頁、各類旅游宣傳材料如酒店介紹、旅行社介紹、景點旅游宣傳冊等),實地考察,其中以實地考察為主,以圖書和網絡等途徑作為輔。為了使采集的語料更加全面系統,按照表1語料庫欄目的設計類別,均考察三個以上的代表性場所進行實地釆集。如道路交通類別下的語料采集以石家莊市二環路以內道路、公交、新火車站、正定國際機場、正在修建的地鐵1號線以及周邊的石黃高速、京石高速、京昆高速等為考察基地,采集內容主要涉及道路名稱,站點翻譯以及各大公共交通場所的警告類、基礎設施類以及服務性公示語等。醫療衛生類別下的語料采集以河北醫科大學第二醫院、第四醫院,河北省人民醫院,河北省中醫院等為考察基地,盡量全面的覆蓋到西醫和中醫的相關公示語。其余子類別的語料也以同樣的方式方法進行收集。為了保證語料庫的完整性、代表性和系統性,課題組還從正式出版物、非出版物等其它途徑進行收集對語料進行補充。通過多種途徑搜集到語料后,課題組成員對原始資料進行了初步整理:實地考察的照片資料逐一轉寫為word文檔;印刷品逐一掃描然后轉為word 文檔;網站資料去除圖片、鏈接、格式轉為統一格式的word文檔等。

3.2 語料文本糾錯與翻譯

經過初步整理文本資料,發現很多語料存有各種類型的翻譯失誤。于是課題組成員對所有資料進行二次篩選,保留翻譯質量相對優秀,可供使用的其他資料。但即使這一部分資料,細加審查之下也有各種各樣的翻譯失誤。課題組成員又對保留下來的資料進行了糾錯工作,著重處理了語言性錯誤以及文化性錯誤,同時兼顧糾正語用錯誤和文本特有錯誤。

針對上步排除的部分翻譯質量低劣,不可修改的原始資料以及沒有英譯卻存在一定數量的高質量的漢語公示語,進行了重新翻譯。為了保證翻譯的英語公示語的質量,課題組在組織專業人員進行國內外相似中英文公示語語料的搜集完成初步翻譯,再輔以三次校對,第一、二次由中國老師完成,第三次由外籍教師完成,以保證英語譯文公示語盡可能準確、地道,兼具代表性。

3.3 語料標注與對齊

語料收集、加工、整理完成后,下一步的工作就是按照標準將整理后的語料入庫,建設成完整的語料庫。

3.3.1 中英文公示語語料對齊

語料對齊(alignment)指將源語語料與譯語語料分別保存,并使兩個文本中的語料按段與段或句與句的關系一一對齊。這一工作至關重要,否則語料庫檢索軟件ParaConc無法對建成的“石家莊公示語平行語料”中的語料進行處理。目前,現有的句與句對齊軟件處理準確率不是很高(約60%)。所以本研究首先由人工通過Word工具完成段與段對齊的工作,再進一步通過軟件處理與人工排查,最終達到句子層級的對齊。最后,通過Paraconc進行檢驗,以確定全部文本已經達到句與句對齊的效果。在語料實現對齊后,文本轉換為XML格式,這樣就能讓語料庫以多種語言格式編碼,以便傳播與檢索。

3.3.2 中英文公示語語料詞性賦碼

詞性賦碼(POS Tagging)指把語料中的有用信息用一組符號系統標注出來,是為語料庫付以“增值”的效果,目的是從中提取遠遠超過從生語料庫中可以提取的信息,使語料發揮更大的作用,從而適應更多的研究需要。本課題中文公示語的標注采用中國科學院計算技術研究所開發的ICTCLAS漢語分詞軟件,據中科院計算技術研究所網頁介紹,該分詞系統的分詞精度可以達到98.45 %;英語公示語的標注采用CLAWS4,CLAWS是蘭克斯特大學研制的一種基于概率的詞性附碼工具,據稱該軟件賦碼的準確率可以達到97 %。為了提高中、英文公示語語料標注的準確性,經過軟件標注后的還需要經過人工校對與修正。

4 石家莊公示語漢英平行語料庫的應用及其價值

石家莊公示語漢英平行語料庫將大量實際應用中的較高質量的公示語漢英翻譯語料收集、整理、糾錯修改后整合起來提供給所需的用戶進行檢索使用,這對于譯者、對于外語翻譯研究、對于石家莊市相關管理部門以及其他省市都具有較強的實用意義和參考價值。對于譯者而言,該語料庫可提供參考,助其查詢具體字詞在實際使用中的譯法,有助于加快其翻譯速度,提高其翻譯質量。同時語料庫主要通過探討如何從一種語言轉換成另一種語言,比較原文及譯文中的語言特征及其出現頻率來研究翻譯過程。如探討公示語的中國文化、修辭等現象的翻譯方式。通過該“石家莊公示語平行語料庫”將上述句式的翻譯情況進行總結與歸納,可以從中尋找并發現一些中英轉換的規律和特點,為建立一定的翻譯規范提供依據。對于石家莊市以及其他省市相關管理部門可直接使用其中資料,為相關部門準確、地道使用公示語英文提供翻譯支持。

5 結語

雖然在石家莊公示語漢英平行語料庫建設過程中,課題組付出了很大的努力,但仍存在一些不足。首先,課題組成員在公示語語料庫建設方面的研究比較少,且缺少地方公示語語料庫資源的借鑒,在語料庫設計上會花費較長時間。其次,相比于收詞量千萬的大型語料庫,石家莊公示語漢英平行語料庫的語料總量仍嫌單薄,以后尚需進一步充實。最后,一些研究者缺乏相關語料入庫的計算機知識,而后期語料庫的構建技術上需計算機專業人士進行架構,但其又缺乏相應的語言知識,導致語料標注、入庫過程容易出現差錯。

[1]董李鵬,高東懷等.陜西省旅游景區公示語翻譯語料庫系統的設計與實現[J].中國教育信息化.2012(23):54~59

[2]王克非.雙語對應語料庫研制與應用[M].北京:外語教學與研究出版社,2004

[3]王克非.新型雙語對應語料庫的設計與構建[J].中國翻譯,2004(6):73~75

[4]王克非.雙語平行語料庫在翻譯教學中的用途[J].外語電化教學,2004(6):27~32

[5]呂和發,蔣璐.公示語翻譯[M].北京:外文出版社,2011

[6]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學[J].外語電化教學,2011,(1):20~26

[7]李德超,王克非.新型雙語旅游語料庫的研制與應用[J].現代外語,2010(1):46~54

[8]常寶寶,俞士汶.語料庫技術及其應用[J].外語研究,2009(5):43~51

Design and Construction of a Chinese and English Parallel Corpus of the Public Signs in Shijiazhuang

SONG Jian-wei WU Hui
(Shijiazhuang Institute of Railway Technology Shijiazhuang Hebei 050061 China)

Based on the concept of Corpus Linguistics, this paper falls into eight categories of Shijiazhuang public signs according to its features. Then, the authors introduces the specific process and methods on establishing the Chinese-English parallel corpus about Shijiazhuang public signs. At last, they analyses possible applications and defects of the corpus. This is of considerable significance for the improvement of the translation in this field and the enhancement of the international image of Shijiazhuang City.

public signs parallel corpus design establishment

A

1673-1816(2014)04-0092-04

2014-10-16

宋建威(1980-),男,漢,河北深州人,碩士,副教授,研究方向英語教學與翻譯。

本文系2013年河北省高等學校人文社會科學研究青年基金項目:《基于平行語料庫的石家莊公示語翻譯個案調查與研究》部分研究成果(課題編號:SQ136008)

主站蜘蛛池模板: 波多野结衣AV无码久久一区| 欧美成人手机在线视频| 久久久久国产精品熟女影院| 免费毛片网站在线观看| 中文字幕中文字字幕码一二区| 精品无码日韩国产不卡av| 国产成人AV男人的天堂| 亚洲国产天堂久久综合| 2022国产91精品久久久久久| 国产精品无码制服丝袜| 欧美中出一区二区| 在线观看免费人成视频色快速| 国产美女久久久久不卡| 亚洲AV成人一区二区三区AV| 亚洲中文无码av永久伊人| 中文字幕丝袜一区二区| 98超碰在线观看| 欧美精品伊人久久| 在线免费不卡视频| 国产真实乱子伦视频播放| 久久9966精品国产免费| 国产欧美在线视频免费| 久久99国产综合精品1| 久久窝窝国产精品午夜看片| 亚洲精品欧美重口| 热99精品视频| 国产AV毛片| 亚洲天堂日韩在线| 亚洲国产精品成人久久综合影院| 毛片在线看网站| 国产精品无码一区二区桃花视频| 夜夜高潮夜夜爽国产伦精品| 欧美中文字幕第一页线路一| 在线国产资源| 欧美福利在线观看| 亚洲第一区在线| 欧美一道本| 亚洲精品桃花岛av在线| 高清欧美性猛交XXXX黑人猛交| 91口爆吞精国产对白第三集| 亚洲欧美成aⅴ人在线观看| 欧美黄色网站在线看| 国产精品第三页在线看| 国产99免费视频| 99视频精品在线观看| 国产亚洲欧美在线人成aaaa| 久久这里只有精品国产99| 成人免费一区二区三区| 中文无码毛片又爽又刺激| 2020国产在线视精品在| 欧美精品亚洲精品日韩专| 国产福利一区二区在线观看| 综合社区亚洲熟妇p| 国产精品久久久久无码网站| 香蕉在线视频网站| 99无码熟妇丰满人妻啪啪| 久久综合亚洲色一区二区三区| 日韩黄色在线| 成人国产精品网站在线看| 综合网久久| a毛片基地免费大全| 国产va在线观看免费| 少妇露出福利视频| 日本a∨在线观看| 中国一级毛片免费观看| 国产精品林美惠子在线观看| 色有码无码视频| 无码aaa视频| 国产91线观看| 亚洲成人黄色在线| 免费全部高H视频无码无遮掩| 精品乱码久久久久久久| 国模视频一区二区| 国外欧美一区另类中文字幕| 波多野结衣一区二区三视频| 红杏AV在线无码| 在线一级毛片| 中美日韩在线网免费毛片视频| 亚洲成在线观看| 日本久久免费| 欧美在线一级片| 久久久国产精品免费视频|