吳松林 吳冠喬
(1.東北大學 河北秦皇島 066004;2.德拉薩大學 菲律賓馬尼拉 0900)
《二十四史》生難字研究以計算機造字開發技術為手段,以生難漢字為目標,以能夠進行語義對等的英文釋義為媒介,以辭書編撰原理為指導,通過跨學科研究,取得應用性的技術成果。
研究對象是日常較少使用到的生難漢字,字庫的建設是重要而且費時、費力的工程,也是決定后續工作能否正常進行的關鍵要素。建庫的文字除了少量可以從百度、搜狗、QQ等時尚拼音輸入法提取出來以外,絕大多數漢字必須訴諸計算機編碼設計,通過硬性規定設計字形、外部關系設計和內部特征設計等方法,完成紙質錄入和編校前期的計算機處理技術。這是整個課題的工作難點。
英文釋義要求結合具體漢字的語用關系,細致、精確、客觀地反映出文字的語義內涵。雙語釋義工作是極具精細化的技術過程,這是整個課題的工作重點。
漢英雙解《二十四史》生難字字典(以下簡稱《生難字字典》)編纂的主要目的之一是為了“《二十四史》整體英譯工程”做的前期工具性準備。《二十四史》英譯過程中遇到最大難題之一就是:閱讀過程中會遇到很多難僻字,普通學者、甚至有些專家都不能正確識讀,對其表意更是一頭霧水,翻譯成英文就更無從談起了。《生難字字典》對《二十四史》中生難字進行篩選并編纂成漢英雙解字典,包括自用電子字典,滿足《二十四史》英譯工程的需要。
對于該字典中、英文釋義沒有書證,基于以下幾點考慮:
(一)《生難字字典》的編纂不是為了中國讀者或專家閱讀《二十四史》專門進行的中文注釋,而是為了把《二十四史》翻譯成英文而做的前期工具性鋪墊,編纂目的不同。所以,中、英文釋義沒有出現書證。
(二)《生難字字典》一旦投入市場,使用的人群絕不僅僅限于“《二十四史》英譯工程”團隊,典籍翻譯領域的專家或學者會以此為參考,而中華典籍絕不僅僅指《二十四史》,還包含其他各類古代文獻。如果這部字典里面只提供《二十四史》中的書證,難免過于學院氣,進一步增強項目組了勞動的強度,大大縮小了字典的使用效度。
(三)對于英文釋義也是基于使用人群考慮的。《生難字字典》從國際角度而言,一定程度上充當著維護民族文化身份的角色。我們將中華的精髓譯為英語,融入到世界多元文化中去,認同多元文化的共生,使之相互影響,共同發展。為了方便外國普通讀者或漢學研究機構更好了解生難字或《二十四史》中的生難字,把《生難字字典》定位成一種輔助性工具,提供簡單、直白的英文釋義,而且,考慮到英文翻譯的統一性和規范性,沒有在英文釋義中體現書證。
通過自查,隨機遴選出“廄、厝、佤、傈等二級字,收了‘傈’,卻沒收‘僳’”,解釋如下:
《生難字字典》在最初收字的時候也參照了國家《現代漢語字典》收字標準,一級字多少、二級字多少,也是按這樣的劃分標準去做的。進一步論證的時候,考慮到《生難字字典》自身的特色就是收錄生難字,但何為“生難字”?這里定義為:生難字是指一般學者不易識讀的簡化字、繁體字、異體字及其他漢字。按照這一定義,對收錄的字頭進行審閱,劃掉了熟識的字頭,劃掉部分字頭,結果導致體系最終不完善。但是,考慮到《生難字字典》本身就不同于普通的各類辭典,應該有自己的收錄標準,因此沒有完全按照國家現代漢語漢字收錄標準收錄生難字字頭。
(一)《生難字字典》中確實存在大量的異體字、通假字等,釋義只說同某、通某,但被同、被通的字缺沒有存在于該字典中,主要是因為大部分“被同、被通的字”屬于簡單字,比如:
其中,被同、被通的字的為“至、乖、老、所、夜、成、事……”,對于這批字是否收錄到《生難字字典》中,討論結果是:這批被同、被通的字屬于簡單字,不符合《生難字字典》字頭收錄標準,不建議收錄。對于該被同、被通的字“釋義沒有著落”的問題,項目組也進行了討論,因為這些字為簡單字,其釋義為所有國內一般學者耳熟能詳,對于“《二十四史》英譯工程”不造成障礙,對于國內普通學者使用該字典也不產生影響,對于國外讀者或研究者由于項目組都提供了英文釋義,也未造成任何障礙。基于以上考慮,研究最終決定不收錄被同、被通的字。
(二)在《生難字字典》中“被同或通的字”還有這樣的情況:被“同”的字屬于生難字范圍,一般學者也不認讀,比如:
對于這種情況項目組是這樣處理的:在《生難字字典中》收錄了該字頭,并提供了中英文釋義。如上文提到的被同字在字典中可找到:
②棗子jujube;Chinese date③姓a surname
(一)對于注音無調號問題,查閱了《生難字字典》中無音調的字,發現存在以下兩種情形:
1.確定字頭后,對于該字的讀音主要參考了《漢語大字典》(共9冊,四川出版集團·四川辭書出版社;湖北長江出版集團·崇文書局)和《難僻字字典》(浙江大學出版社)。對于注音無調號的字頭,在這兩本詞典中就無音調,查閱了其他書籍,也沒有查到這些字頭的音調,項目組理解為該字頭本身就是輕音,沒有音調。由于沒有找到其他相關依據,未敢對這類字頭讀音進行處理,尊重了《漢語大字典》和《難僻字字典》。
2.電腦上編輯之后,然后整合完成,由于項目組成員各自電腦系統不同,在整合過程中,電腦程序原因不明地將部分音調去掉了,項目組成員沒有意識到這一問題,之后,校對無音調字頭的時候才發現了這一問題,并逐一進行了校正。
(二)對于“有的字缺中文釋義、有的字缺英文釋義”和“釋義不對或不準確,中英文都有這種情況,較為普遍”這兩個問題,主要從對外傳播角度給予考慮。字典主要服務于“英譯工程”,為有需要向國外展現中國文化的人提供工具性幫助,最終向外國人展現中國傳統文化的魅力與精髓,確立我國文化的民族性。為了方便國外人理解生難字,我們在中文和英文釋義方面只選取了使用度最高、最為廣義的釋義,尤其實在英文釋義方面只列出了三個較為直接的解釋,力求準確、簡練、明白,省略了那些偏、難的解釋,并沒有窮其盡。
這里出現了雙重標準,在《凡例》中明確提到“收字……生難字參照2013年《通用規范漢字表》(8105字)三級劃分標準及有關辭書……字頭釋義以《簡化字總表》所列字目為準”。從這一點觀察,應該按照2013年《通用規范漢字表》(8105字)的統一標準進行修正。
《二十四史》生難字漢英雙語研究旨在解決跨文化交際過程中的文字障礙,運用辭書編輯學原理、比較語言學原理、語義學原理和計算機技術等多學科,設計完成涵蓋38759個未譯漢字的英文釋義工作。漢英生難字雙語編寫首先利用數字化處理技術,界定字典編撰的原則,描述字典編撰的方法和手段,確定編寫的具體流程,明確編撰過程中所需要解決的主要問題,通過規模化英譯處理,完成這部針對性較強的辭書編輯字庫和英譯工作。