摘 要:本文提出的漢字拼音,含兩級矢量編碼,含兩級高頻簡化,是一種讀、學、寫性能兼優的漢字形式。
關鍵詞:漢字拼音 形聲化 拼音化 高頻簡化
中圖分類號:H125.2 文獻標識碼:A 文章編號:1003-9082(2018)11-0-01
本篇提出的漢字拼音,可為那些既想了解中國,卻又不愿承受學習漢字之苦的外國人,包括華裔后代等,提供一種學習時間成本十分低廉的漢字形式。
以國外的華裔兒童為例,如果學習漢字拼音,應該做到,要不了一年,就能把會說的漢語寫出來。
外國人學會了漢字拼音,除了與我們口語交談之外,還可在網上與我們交流文字信息。此時,對各方計算機的要求是,己方屏幕上看到的,是己方輸入的漢字信息,傳與對方的,是計算機平行給出的,字數對等,音義對等,唯漢字形式不同的另版信息。
筆者相信,只要數據準確,措施得當,漢字拼音的優良性能是可以“訂制”的。以下是筆者的幾個主要設想。
一、形聲化,拼音化
形聲化是單字內的第一級矢量編碼。(單字,即漢字拼音中的一個字,是臨時稱謂)
效益:形聲化的效益表現在兩個方面。一方面,形聲化可為音節補足信息量,把含義不清的音節升級,變為字義清晰,形音義具備的單字。另一方面,在已知單音節漢語名稱的基礎上,形聲化能夠把數千個單字的學習,減少為400多個聲旁,和少量形旁的學習。
拼音化是單字內的第二級矢量編碼。
效益:在學會了漢語音節及拼音技能的基礎上,拼音化能夠把400多個聲旁,和少量形旁的學習,進一步減少為30多個聲韻母的學習。
聲旁的拼音化是容易實現的,漢語拼音和注音字母中的音節,都是漢字音節成分的拼音化,而且形(書面音節)音之間均是一一對應的。
形旁的拼音化也是容易實現的,因為大類事物往往有多個名稱。如“niɑo(鳥)、qin(禽)”,“shu(樹)、mu(木)”等。
根據需要,取其一二,用拼寫聲旁的聲韻母拼寫這些名稱,就可一并完成聲旁和形旁兩種部件的拼音化改造工作。
漢字拼音依靠單字內的兩級矢量編碼,既可再現現有漢字形音義具備的優良性能,又可徹底擺脫現有漢字學習難的缺點。
【一個比較】
與英文相比,漢字拼音是更加容易學習的拼音文字。
理由是,由于歷史等原因,英文中形音之間有大量的多一對應,即同一字母組合(形),因單詞的不同會有多種讀音。反之,同一讀音,又因單詞的不同會有多種字母組合。這種多一對應會大量增加單詞的補充記憶。
二、兩級高頻簡化
高頻簡化參考的是信息論中介紹的幾種編碼法[1] (日 藤田広一,1982年 ,頁55—59),這些編碼法的高頻碼簡短些,低頻碼冗長些,可在實際使用過程中,有效減少編碼的平均碼長。
第一級高頻簡化,在頻率最高的1000個單字范圍內,每個音節選出頻率最高的一個單字作為簡化單字,規定該單字只留聲旁,簡去形旁。依據《漢字信息字典》中的頻率數據[2](上海交通大學漢字編碼組等,1988年,頁729—989),選出的簡化單字317個,合計頻率達53.3%。
效益:書寫或打字時,可省去過半的形旁。代價:317個簡化單字是需要專門記憶的。好在數量少,只有317個,容易記住。
另外,某個音節中,哪個單字最常用,人們多少有些模糊印象。這對于記憶該音節中,哪個單字是簡化單字,多少有些幫助。
第二級高頻簡化,高頻聲韻母簡單些,低頻聲韻母復雜些,可提高書寫速度。
——在漢字拼音中,每個聲母、介母、韻母,均是一個字母。
三、左形右聲,上聲下韻
左形右聲,指的是單字的組合,即左形旁,右聲旁,且形旁窄一些,仿照的是現有漢字的一種構字傾向。
依筆者觀察,現有漢字中的同一部件,有“在左小,在右大”的傾向,如“朋、林、部、陪、加、叻”等。而在左右排列的形聲字中,確有更多的是把數量多、信息量大的聲旁放在了右側。
上聲下韻,指的是聲旁的組合,即上聲母,下韻母。上下排列是巨大的位置差異,這對閱讀有利。即便與單個注音字母或拉丁字母相比,上下排列仍允許聲韻母有大幅簡化,這對書寫有利。關于聲韻母,詳略。
四、形旁之下,調號填空
作為矢量碼的兩個分量,聲旁的取值范圍為400多個音節,形旁如果不用韻母,其取值范圍為20多個聲母。此時聲旁、形旁的信息量之和,估計與現有漢字的信息量大體相當(這一數據是可以統計和計算驗證的)。
如上所說,右側的聲旁是上聲母,下韻母。左側的形旁如果只有上聲母,而下空缺,則左右失衡。若以調號填補這一空缺,既可左右平衡,又可輔助聲調的學習?!曊{是外國人學漢語的另一難點。
印刷品、屏幕上的調號,不是輸進去的,而是輸入了聲旁和形旁之后,有了充足的信息量,由電腦自動加上去的。手寫時,加不加調號任便。
現代的“寫”,多是機寫,也就是計算機輸入。在鍵盤上,輸入聲旁在先,以聲韻并擊為宜,輸入形旁在后,單擊聲母即可。由于信息量充足,無需選字,不看鍵盤,不看屏幕,將有很快的輸入速度。
【頻率范圍的界定】
具備上述書面形體的形聲單字,加上簡化單字,二者合計三千多,與知識界人均會寫的現有漢字的頻率范圍大體相當。
至于其余的冷僻字,根據高頻簡化、低頻繁化的原理,允許增加一些復雜程度。由于這部分單字的頻率極低,對打字速度,書寫速度的負面影響甚微。
結語
漢字拼音能夠繼承漢字合成詞的高比例,加之單字的形聲化,拼音化,漢字拼音作為一個文字系統,便有了三級高質量的矢量編碼。
與英文過多的多音節單純詞相比(見筆者之前的文章),與英文形音之間過多的多一對應相比,漢字拼音是更加容易學習的拼音文字。
漢字拼音的讀、學、寫性能兼優,漢語走向世界便會一路順風。
參考文獻
[1] (日)藤田広一 .基礎信息論[M].魏鴻駿等譯.北京:國防工業出版社,1982.
[2]上海交通大學漢字編碼組,上海漢語拼音文字研究組編著.漢字信息字典[Z],北京:科學出版社,1988.
作者簡介:高其海,男,山東青島人,1946年生。所學專業:工業企業電氣化自動化專業。