陳耀西 陳紅根

摘 要:本文以系統論思想論述了漢字的“二維結構”規律,揭示了傳統漢字理論被掩蓋的“音、形、義”關系,從而實現了漢字的表音化。
關鍵詞:系統論 二維結構 表意漢字 表音漢字
文字是信息的信源,讓計算機識別漢字,事關中國人獨立自主走信息化道路的根本問題。要讓計算機識別漢字,漢字必須走表音化的道路。而漢字的“音、形、義”系統論思想,則是打開漢字表音化之門的鑰匙。但是,傳統的漢字理論掩蓋了漢字的字與字之間的“二維結構”規律,致使漢字近兩千年來未能走上表音化的道路。
一、被掩蓋的漢字“二維結構”規律
近年來,由于遵循了漢字的“音、形、義”系統論思想,在國家推行的注音字的基礎上,用加綴法,以一個表意漢字復制一個表音漢字,從而順利地實現了漢字表音化。
例如,在北京舉辦奧運會的印章標志上,以漢語注音“Bei jing”代表“北京”。但是,讀“bei”的有41個漢字,讀“jing”的有78個漢字。分別列舉如下:
1.(bei)北 邶 苝 軰 鉳
2.(bei)備 憊 鞴 俻 偹 備 僃 憊 犕 糒
3.(bei)背 褙 偝 揹 禙 鄁
4.(bei)卑 碑 俾 埤 椑 痺 萆 諀 錍 鵯
5.(bei)貝 狽 鋇 唄 垻 梖 狽 珼 蛽 鋇
以及:
1.(jing)京 倞 驚 婛 猄 鯨 鶁 麖 鯨
2.(jing)敬 警 儆 憼 擏 曔 檠 璥 蟼 驚
3.(jing)景 憬 幜 暻 燝 璟
4.(jing)晶 橸
5.(jing)井 肼 阱 坓 宑 汫 汬 穽 妌
6.(jing)竟 鏡 境 獍 傹 璄 鏡
7.(jing)巠 經 徑 頸 莖 勁 痙 弳 剄 脛 逕 涇 俓 剄 勁 弳 徑 桱 涇 烴 烴 痙
経 經 脛 莖 葝 踁 逕 鋞 陘 陘 頚 頸 鵛
所以說“Bei jing”只是一個注音符號,根本不能代表“北京”。可是,在分析上述“北京”的注音符號“Bei”和“jing”的同音字系列之后,人們不難發現:漢字信息可用二維數組A(m,n)來表示:
A1.1,A1.2,A1.3,A1.4,……A1.n,
A2.1,A2.2,A2.3,A2.4,……A2.n,
A3.1,A3.2,A3.3,A3.4,……A3.n,
A4.1,A4.2,A4.3,A4.4,……A4.n,
…………………………………………
Am.1,Am.2,Am.3,Am.4,……Am.n,
(一)同音基本字的列變是基本字的部首(前綴)變化
每一行的黑體字都是基本字,讀“bei”的基本字為“北、備、背、卑、貝”;讀“jing”的基本字為“京、敬、景、晶、井、竟、巠”。在基本字后面的都是該基本字的不同部首的同音字。例如“(bei)北 邶 苝 軰 鉳”和“(jing)京 倞 驚 婛 猄 鯨 鶁 麖 鯨”。也就是說,同音基本字的列變是通過部首變化來實現的,部首不參與讀音,是示意的加綴作用,由于它在字中的位置居前,所以稱為部首或前綴。由此可以看出:漢字的形聲字是加綴字。其實作為部首的“金、木、水、火、土”等也是基本字,只是作為部首時,有的字已經符號化了,例如:“水”符號化為“氵”,“金”符號化為“钅”等。
(二)同音基本字的行變是基本字的變化
上述“bei”和“jing”就是兩個音素,讀“bei”的基本字“北、備、背、卑、貝”有5個;讀“jing”的基本字“京、敬、景、晶、井、竟、巠”有7個。有的同音基本字較多,但是,一般不超過25個基本字。
在甲骨文字里,形聲字只占20%,到東漢許慎的《說文解字》里,形聲字所占比例達到82%,到清代康熙年間編纂的《康熙字典》,形聲字已占90%。而非形聲字,主要為圖像文字的象形、指事、會意字,它們大都為基本字。例如“北、京”兩個基本字,“北”是會意字,“京”是象形字。如果將基本字包括在形聲字系統中。那么,整個漢字就形成一個以基本字為核心的形聲字矩陣,每個漢字都有自己的坐標位置。在漢字的416個讀音中,幾乎每一個讀音都有同音字,這是一個普遍現象。所以說:整個漢字體系是二維結構體系。
因此,對漢字體系的二維結構規律,可用公式表示如下:
H=A(m,n)
公式中的“H”代表漢字體系,A(m,n)為二維數組。
二、漢字“二維結構”規律是如何被掩蓋的
“高等教育面向21世紀課程教材”《現代漢語文字學》中指出:“語言里的詞是‘聲音+意義的結合體,選擇一個同音或近音的字作聲旁,再配上一個合適的形旁,就可以造出一個新字來,方法很簡單。”這段文字中,“選擇一個同音或近音的字作聲旁”的“字”就是基本字,“再配上一個合適的形旁”指的是“部首”。傳統的漢字理論都將基本字叫“聲旁”,都將部首叫“形旁”。這樣定義,混淆了漢字的“音、形、義”關系,割裂了漢字“音、形、義”的內在聯系。
(一)“部首”參與形聲字構字的功能是部分功能
“部首”只具有符號意義,是表意的符號;它本來也是字,但不表示音,是字的加綴部分;很多“部首”已經符號化了,如“水”符號化為“氵”,“金” 符號化為“钅”,“形”在退化;因此,“部首”不再具備“字”的“音、形、義”的完備功能。
而更重要的是:當我們將同音字并列時。例如:
1.(gao)高 篙 鎬 禞 蒿 搞 縞 槁 稿 暠 膏
2.(gao)告 筶 鋯 祰 郜 誥 勂 峼 浩
3.(gao)羔 糕 餻
4.(gao)皋(臯)槔(橰)滜 獋 韟 鷎(鷱)
5.(gao)睪 睪
6.(gao)杲 菒
大家知道,系統的要素特征是:必須具有變化的特性?!傲x變”是“部首”在變化,是漢字的橫向變化,或稱“列變”。而基本字就是同一個基本字,它是不變的,故“形”不變,“音”也不變。所以,“部首”的變化不能稱“形變”,因而不能將“義旁”叫“形旁”。從《說文》以降,幾千年以來,一直將“義旁”叫“形旁”,即部首既是“義變”又是“形變”,身兼兩職,其實是重復的,說的是一回事。是通過“部首”符號變化而實現意義變化。當稱為“義旁”之后,不能再稱為“形旁”。
(二)基本字參與形聲字構字的功能是完備功能
基本字參與形聲字構字的功能是完備功能,即具有“音、形、義”三要素的全部功能。
1.系列字“(hev)合、(yphev)郃、(slhev)饸、(mbhev)盒、(ywhev)頜”。其中,基本字“(hev)合”,后綴為“v”說明為動詞。參與形聲字構字時:
(1)從“音”來說,是由“(hev)合”而得“音”;
(2)從“義”來說,它們所記錄的詞都有“合”的含意。例如,“(yphev)郃”,地名:郃陽,因地處郃水以北而得名;“(slhev)饸”,一種條狀食品;“(mbhev)盒”,底、蓋相合的盛物的器具;“(ywhev)頜”,口腔的上、下兩部為頜,上部為上頜,下部為下頜。“合”之表意非常明顯,形聲字的含義,都由基本字賦予?;蛘哒f:形聲字將基本字的信息帶到“部首”所分類的各個門類,去表達哪個門類的事物,從而擴大文字表達事物的能力,所以形聲字是發展了基本字。基本字與形聲字的關系是共性與個性的關系,是由“一般”深入、滲透到其他門類(“個別”)去表達事物。
(3)從形體來說,在構字時,布局所占面積的比例大,這是漢字書法的基本規律。
所以,基本字“合”在形聲字構字時,應占主導地位。不應將次要部分的“部首”稱“形旁”“形符”。
2.系列字“(jianz)戔(小,少)、(shjianz)淺、(zhjianz)箋、(bkjianz)賎、(dqjianz)殘、(jjianz)銭”。其中,基本字:“(jianz)戔”,后綴為“z”說明為形容詞。參與形聲字構字時:
(1)從“音”來說,是由“(jianz)戔”而得“音”;
(2)從“義”來說,它們所記錄的詞都有“小,少”的含義。例如,“淺(淺)”:水少;“箋”:短信件;“賎”:貝小也;“殘”:餐之剩也;“銭”:金之小者?!皯狻敝硪夥浅C黠@,形聲字的含義,都由基本字賦予?!安渴住敝黄鸱诸惖淖饔?。
(3)從形體來說,在構字時,布局所占面積的比例大。
把參與形聲字構字的基本字叫“聲旁”,顯然丟掉了“形、義”要素?;咀謪⑴c形聲字構字是一個整體,既然是整體,就包含“音、形、義”三要素。它不是一個“旁”,而是一個“字”。它坐在“正位”,不是“偏旁”;也不是一個“符”,它沒有定義為“符”號,不是部首意義的“符”號,不能稱“符”。
前文已經說過:從《說文》以降,幾千年以來,將基本字在形聲字中只稱“聲旁”。但是,音有同異之別,在上述讀“gao”音的基本字系列中:“高、告、羔、皋、睪、杲”諸字是同音字,沒有“音變”,只有“形變”;漢字的這種縱向變化,或稱“行變”?!靶凶儭睍r,“意”也沒有變?!案?、筶”“鎬、鋯”“禞、祰”“浩、滜”等“部首”相同,作為“部首”表意的核心——“類別”并未變。故說“部首”未變,所以也就沒有“義變”。故漢字的縱向變化才是“形變”?!靶巫儭睍r,“義”不變,“音”也不變。不能隨便稱“聲旁”,因為這組字都是同音字,讀音并沒有變化。
因此,漢字的“義變”是橫向變化;漢字的“形變”是縱向變化。漢字的“義變”和“形變”組成同音字平面,稱為音素面。例如,本例中,在漢字讀“gao”音的平面稱“gao”音素面;讀“bei”音的平面稱“bei”音素面。漢字共有416個音素面。音素面的變化才能稱為“音變”,“音變”體現在音素面的垂直線上。所以漢字的“音、形、義”系統是一個立體結構。
漢字的“義變”和“形變”是一個發展階段,《說文》以降,近兩千年以來,漢字研究者誤將“義旁”當作“形旁”,不加區別的叫“聲旁”,掩蓋了漢字的“二維結構”規律,以致在漢字發展的第二階段——拼音階段,裹足不前。這個影響何其大耶?又何其悲耶?
三、漢字的“二維結構”與漢字注音相結合
當發現漢字的二維模式后,在漢字注音基礎上,將“二維結構”與漢字注音相結合,就可以實現漢字表音化。
(一)對漢字的縱向變化,用加后綴的方法將同音基本字表音化
漢字是單音節字,由23個聲母、24個韻母相拼,只有416個音素字。以數學的觀點來說,單音節字相當于兩個數字的排列組合,即A和B的全排列:AA、AB、BA、BB四種情況?,F以A代表韻母,以B代表聲母,那么,BA情況為聲母、韻母拼音,這類情況符合拼音規律;AA情況為韻母與韻母在一起,可以發音(如:“見jian”中的“i”和“an”);BB情況為聲母與聲母在一起,不能拼音;AB情況為聲母在韻母后,也不能拼音。但是,BB、AB這兩類情況可以利用,作為同音字的前綴和后綴,以解決同音字的信息差異問題。
將讀“bei”的基本字加一個信息差異,即為“(bei)北、(beiv)備、(beir)背、(beix)卑、(beib)貝”,就將其區分開來。同樣,將讀“jing”的基本字也加一個信息差異,即為“(jing)京、(jingv)敬、(jingr)景、(jingx)晶、(jingb)井、(jingd)竟、(jingp)巠”。因為加信息差異就將同音基本字區分開來,所以處于第一行第一列的“(bei)北”和“(jing)京”都不需加后綴,這就將北京舉辦奧運會的印章標志表音化了。
對于龐大的漢字體系來說,漢字讀音只有416個,其余的字,則是這416個讀音的重復循環。每循環一次,讀音沒有變化,通過字形變化來表達不同的含義,所以漢字多同音字。如果我們將漢字字形的變化看作是符號的變化,我們將打開一條新思路:每循環一次,改變一個信息,如果這個信息是有規律的,那么拼音漢字就是有規律的。這就可以將表意漢字轉換成表音漢字。
1.將常用基本字放在音素字系列為第一循環,不加后綴,使拼音字使用簡單方便。例如“中華人民共和國:Zhong hua ren min gong he guo”“北京:bei jing”等。
2.為了使表音漢字具有語法特性,將詞性引入拼音系統中。為此,將動詞基本字放在第二循環,加后綴v;將有生命的名詞基本字放在第三循環,加后綴r;將形容詞基本字放在第四循環,加后綴x。如此進行下去,直將23個聲母字用完。由于“v”在漢字注音中被保留,我們將其作為隔音符使用。將“v”加在動詞基本字后面,作為第二循環與其它循環相區別的信息。這樣一來,我們將獲得25個循環。在歸并同音基本字以后,我們發現同音基本字超過25個的極少。
3.每四個循環為一組,可達六組。到第七組時系列基本字就很少了,則可配雙聲母字做后綴,配到第七組后,就可以停止。
4.后綴表如下:
將詞性引入表音漢字,這將為漢語語法帶來重大影響,因為從漢字字形上看不出詞性。
(二)對漢字的橫向變化,用加前綴代替部首將其表音化
漢字的形聲字由兩部分組成,即由基本字與部首組成。其實,作為部首的“金、木、水、火、土”等也是基本字,只是作為部首時,有的字已經符號化了,例如:“水”符號化為“氵”,“金” 符號化為“钅”等。在將漢字表音化時,對基本字“水”的注音字“shui”,作部首時以“sh”代表;對基本字“金”的注音字“jin”, 作部首時以“j”代表。其中:“zh、ch、sh”因為雙聲母字,所以單聲母字作部首的將是下列20個部首:(b)疒、(p)丿(撇)、(m)木、(f)阝(阜),(d)刀、(t)土、(n)女、(l)力、(g)戈、(k)口、(h)火、(j)金、(q)犬、(x)心、(r)人、(z)足、(c)草,(s)糹、(y)言、(w)王。對于“(zh)竹、(ch)蟲、(sh)水”及部首為兩個聲母字的“(nr)牜、(gr)瓜、(cv)辶、(rb)日”等。其中,因“?!钡幕咀衷谧帜富瘯r為(nuir),將其縮寫為(nr),以其代表“?!钡牟渴住R赃@種縮寫法,可將其余作部首的基本字全部轉化為表音化的部首。故下面的部首表音化為:
1.(bei)北(ypbei)邶(cbei)苝(cbbei)軰(jbei)鉳
2.(beiv)備 憊 鞴 俻 偹 備 僃 憊 犕 糒
3.(beir)背 褙 偝 揹 禙 鄁
4.(beix)卑 碑 俾 埤 椑 痺 萆 諀 錍 鵯
5.(beib)貝 狽 鋇 唄 垻 梖 狽 珼 蛽 鋇
以及:
1.(jing)京(rjing)倞 (xjing)驚 (njing)婛 (qjing)猄 (ykjing)鯨 (nkjing)鶁 (lrjing)麖(ykjing)鯨
2.(jingv)敬 警 儆 憼 擏 曔 檠 璥 蟼 驚
3.(jingr)景 (xjingr)憬 (jmjingr)幜(rbjingr)暻 (hjingr)燝 (wjingr)璟
4.(jingx)晶 橸
5.(jingb)井 肼 阱 坓 宑 汫 汬 穽 妌
6.(jingd)竟 鏡 境 獍 傹 璄 鏡
7.(jingp)巠 經 徑 頸 莖 勁 痙 弳 剄
脛 逕 涇 俓 剄 勁 弳 徑 桱 涇 烴 烴 痙 経 經 脛 莖 葝 踁 逕 鋞 陘 陘 頚 頸 鵛
從上例可以看出:
1.常用字(第一循環)不加綴;基本字加后綴,基本字大多是象形字、指事字、會意字;常用字的形聲字加前綴,沒有后綴;形聲字既有前綴,也有后綴。所以說拼音漢字簡單。前綴和后綴不參與拼音,這在外語中是常見的現象。
2.對于以“a、e、o”單獨注音的注音字,在實現“音、義、形”集成的漢語拼音文字時,在加部首前,先加隔音符“v”,再加部首。例如“(an)安、(mvan)桉、(jvan)銨、(rvan)侒、(kvan)咹、(tvan)垵、(?van)洝、(cvan)荌”等。
3.根據《新華字典》,常用的漢字有203個部首,《說文解字》中有500個部首,按排列組合計算:23個聲母應當為:23*25=575。因此,將部首符號化,完全能滿足漢字部首的數量要求。
4.在歸并同音基本字過程中,可以看出:簡化漢字和繁體字在漢語拼音字中沒有區別。這給漢字省去了很多麻煩。
5.為了使表音化工作具有堅實的基礎,我們選用國家標準GB18030-2000漢字庫作為平臺。因為GB18030漢字庫收錄了27484個漢字,它是為漢字研究、古籍整理等領域提供的統一的信息平臺,所以,能滿足一般的應用所需。
(三)辨別多音字,以兩個聲母字作后綴將多音字表音化
漢字不僅同音字多,而且有大量的多音字。例如第三循環的“(pir)皮”:
1.(pir)皮、(fpir)陂、(bpir)疲、(jpir)鈹、(xpir)怶、(pir)蚾、(jpir)鈹、(tpir)坡、(zpir)跛、(mrpir)駊;
2.(fbipr)陂、(rbipr)佊、(xbipr)怶、(mbipr)柀、(?bipr)波、(sbipr)紴、(ybipr)詖、(ybipr)诐、(zbipr)跛;
3.(tpopr)坡、(fpopr)陂、(zpopr)跛、(mrpopr)駊;
4.(wbopr)玻、(zbopr)跛、(sbopr)紴、(?bopr)蚾。
為此,在“皮”字的系列字中,必須增加信息,以示基本字“皮”讀音的變化。其中,有基本字“皮”的第一列稱為正列;其他的二、三、四列稱為奇列。如果以選配部首的方法來選配奇列的后綴。這樣,既可保證不重碼,又可保證以基本字為核心的規律。
“皮”字的表音字是(pir),去掉韻母(i),保留聲母(pr)做為奇列字的后綴。這樣做的好處是,一來可將奇正兩列區分開,二是(pr)為(pir)的簡化,有利于聯想到(pir),這種用正列基本字(pir)的簡化(pr)作為奇列字后綴的方法,就是奇列基本字的后綴。
四、結語
在當今信息時代,計算機可以說是無孔不入,中國正在走向全民使用計算機的時代,這是漢字應用史上的一次重大轉折。
中國語文現代化學會第5次學術會議于2002年10月12到15日在河南省開封市召開,會議發表的《漢語現代化中國語文現代化學會第5次學術會議綜述》中說:“事實上,用拼音給漢字注音,用拼音漢語用于漢字不方便使用的領域,已經在逐漸走拼音化道路。世界文字發展的許多事實證明,確實存在表音化方向。今后如果社會迫切需要,誰也阻攔不住拼音文字?!?/p>
在當今信息社會里,計算機硬件的核心是芯片;計算機軟件的核心就是計算機語言。我國為計算機硬件投入了巨大的人力、物力和財力,終于在國際上占有一席之地。但在軟件領域,別人出版一個新操作系統,你就得跟著換裝,總是跟在別人的后面轉,處于非常被動的地位。這對于一個擁有13億人口的大國來說,是不能容忍的。在軟件領域,我們應該像硬件領域一樣,兩手都要硬。
但是,在軟件領域我們硬不起來的原因,就是中文不是拼音文字?,F在,有了表音漢字,可以用表音字設計計算機語言,設計中文計算機軟件,設計中文編譯器。這樣漢字就能進入計算機的核心——中央處理機,全面掌控計算機,這是何等的重要!
語言學是領先的科學,只有語言學的進展才能帶動其他學科的進展。語言是人們交際時的公共平臺。
參考文獻:
[1]中國語文現代化學會第5次學術會議,漢語現代化中國語文現代
化學會第5次學術會議綜述[Z].開封,2002.
[2]殷寄明,汪如東.現代漢語文字學[M].上海:復旦大學出版社,
2007.
(陳耀西 河南鄭州 解放軍信息工程大學測繪學院 450052;陳紅根 鄭州 河南職業技術學院 450046)