吳 勰
(畢節學院 彝學研究院,貴州 畢節 551700)
彝文是中國彝族固有的文字,明清以來的漢文史料稱為“爨文”、“爨字”、“韙書”、“倮文”、“羅羅文”、“夷字”等[1].從古至今,彝文記錄了卷帙浩繁的民族文獻,是民族傳統文化的精髓.如今,隨著社會信息化進程的推進及網絡的普及,彝文應用的社會環境發生了巨大變化,要求彝文在面對現代化的機遇和挑戰中必須尋求新的出路和發展,以適應彝文社會信息交換和日常交際的需要.在信息時代大背景下實現彝文數字化應用,是傳承和弘揚民族文化不可或缺的有效途徑.目前在彝文字形特征、字形結構、書寫筆順等構字要素基礎之上,結合計算機編碼輸入文字的綜合性要求,制定出一個成熟的彝文字編碼輸入方案是實現彝文計算機編碼輸入的關鍵所在.
本文以前期研究成果《信息技術 貴州彝文編碼字符集·基本集》里的5980個彝文字為研究基礎,以《貴州彝文部件系統》為研究對象,以彝文部件為碼元,設計彝文計算機“形碼”輸入方法,解決彝文計算機輸入的難題.彝文拼音輸入方法不在本文探討范圍.
古老的彝文,是一種以表意為主的、形音義結合的方塊形的單音節文字[2].彝文造字方法的基本特點是以“部首”為主導[3],彝文的字形往往可以分析出一個主體結構和若干附加符號[4].彝文字形由部首和基本筆畫組成,字型結構簡單易于拆分,構字筆畫間層次清晰明了,易于提起構字部件.因此,彝文字形輸入方法設計采用部件碼,也稱為形碼.彝文部件碼的設計是把彝文字字形拆分為若干個構字部件,然后把彝文部件轉換為輸入代碼,再按照計算機鍵位設計原則,結合彝文部件特征把彝文部件代碼安排在輸入鍵位上.因此,彝文基礎構字部件是設計彝文部件輸入碼的基礎.
貴州彝文字數量龐大,彝文整理是一個復雜的系統過程,彝文字形整理工作只能分階段循序漸進地推進.目前,在《信息技術 貴州彝文編碼字符集·基本集》研究成果基礎之上,根據彝文構字規律全面、系統地整理出彝文部件,建立彝文規范部件系統,實現彝文構字部件的規范化和標準化應用,是開展彝文部件編碼設計工作的首要任務.
彝文部件是由彝文筆畫組成的具有組配彝文字形功能的構造單位,也叫字根、字元和字素[5].本文采用《貴州彝文部件系統》里的181個構字部件為代碼,部件筆畫數目從1畫至5畫間不等,分為“方位倒置類、形變類、形近類和單個”4類部件,這些部件都是由彝文筆畫組成的穩定結構塊,這些構字部件的結構具有穩固性,不宜發生變動,具有強大的組配彝文字形的功能,符合計算機輸入碼的基本要件,是科學、合理的輸入碼.
當前,雖然計算機的輸入設備有多種,但是大眾用戶日常使用最多的還是鍵盤.因此,彝文鍵位設計尤為重要,建立彝文計算機輸入平臺.根據人體工學原理,對字母鍵盤的合理化要求是:
1) 中排字鍵應安排最常用的字母,上排負擔其次,下排負擔應最少;
2) 同一手指越排連擊的次數盡量少;
3) 食指、中指、無名指、小指所負擔的工作量應當依次降低;
4) 右手總負擔應略大于左手總負擔.
5) 打字時應盡量左右手交替[6].
在現行英文鍵盤上,根據人體工學原理要求,結合彝文部件在主鍵盤區對彝文部件碼進行合理、有效與實用的排列和分布,以期達到最佳編碼速率.經筆者反復試驗得出彝文鍵位設計應遵循以下規則:



4) 筆畫數相同的部件歸為同類,放置在同一鍵位上.在彝文部件系統中除與英文字母鍵外形相近的部件外,由“點、橫、豎”3種基本筆畫組合而成的部件很難歸類,不利于鍵位碼設計.為了解決這些部件的歸類和鍵位設計問題,把常用筆畫構成的部件按照筆畫數目進行歸類.這類部件可分為“2畫部件組、3畫部件組和4畫部件組”3類,本文把30個部件分別歸為3組,再把各組分別放置在相同鍵位上(見表1),這樣就不僅便于對部件進行有序性歸類,更便于部件碼規律性放置.

表1 相同筆畫數目部件歸類表
至此,彝文部件碼鍵位圖設計工作已完成(見圖1),彝文部件碼在主鍵盤區的鍵位分布得出如下結論:



綜上所述,彝文鍵盤部件碼的分布完全符合彝文構字規律和人體工學原理,是科學而實用的彝文編碼輸入平臺.

彝文編碼是對“彝文字符集”中單個彝文字編制計算機輸入碼.彝文編碼方法在上述彝文部件碼和鍵位圖基礎上,根據“編碼規則”把彝文部件按照其在不同字形中書寫筆順依次編制輸入代碼,本文采用傳統碼和簡易碼2種編碼方法.
彝文編碼規則是指單個彝文字的編碼規則,編碼數為5位,即彝文書寫的前3筆和末筆,最后加上彝文字結構末筆識別碼.即彝文輸入碼 =首筆碼 + 次筆碼 + 第3筆碼 + 末筆碼 + 末筆結構識別碼,其中首筆、次筆、第3筆、末筆是指按彝文書寫筆順編制彝文部件碼,末筆結構識別碼按其結構圖和取碼規則來編碼.
彝文傳統碼完全按照彝文字的傳統書寫筆順來編碼,力爭做到彝文計算機輸入碼與手寫筆形相一致,不僅利于熟悉彝文用戶便捷地應用彝文,對初學彝文的廣大用戶也有很大幫助,它是彝文傳統書寫方式與民族文字數字編碼輸入的有效結合.
按照彝文“自上而下、自左至右、先橫后豎、從外到內、先中間后兩邊、先中間后上下、先下后上”等7種傳統書寫筆順[7],對彝文構字部件進行編碼,如:




按照“從上到下、從左到右、先橫后豎、先主筆后附筆”的順序對彝文部件進行編碼,最大編碼數5位,即簡易碼=首筆碼 + 次筆碼 + 第3筆碼 + 末筆碼+末筆結構識別碼,這種編碼方法簡單,易于掌握.如:


彝文造字方式以獨體字、基本筆形加符號,獨體字加符號和獨體字加獨體字為主,是基本筆形、獨體字、輔助符號互相搭配溶合造字[8].據此,大多數彝文字末筆符號依附在獨體字、基本筆形符號的上、下、左、右、中、兩旁、上下等位置.結合彝文字基本結構,確定彝文末筆符號可能出現在各種字型結構中的不同位置,從上、中、下、左、中、右方位制定彝文末筆結構識別碼方案,末筆結構識別碼共計9位(見圖3),分為上左碼、上中碼、上右碼、中左碼、中碼、中右碼、下左碼、下中碼、下右碼,末筆結構識別碼涵蓋了末筆符號可能出現在字形空間不同位置上.

以彝文字型結構為基準,對應彝文字末筆識別碼結構圖,確定末筆符號準確位置,再提取末筆識別碼.彝文基本字型結構與末筆結構識別碼對照基本如下:
1) 上下型結構與上中碼T、下中碼B相對應.
2) 上一下二型結構與上中碼T、下左碼V、下右碼N相對應.
3) 上二下一型結構與上左碼R、上右碼Y、下中碼B相對應.
4) 上中下結構與上中碼T、中碼G、下中碼B相對應.
5) 左右結構與中左碼F、中右碼H相對應.
6) 左二右一型結構與上左碼R、下左碼V、中右碼H相對應.
7) 左一右二型結構與中左碼F、上右碼Y、下右碼N相對應.
8) 左中右結構與中左碼F、中碼G、中右碼H相對應.
9) 包圍字型除主筆外,其余附筆對照末筆結構圖,根據末筆符號在結構圖中的位置來取碼,均適用于1)~9)取碼規則.
10) 末筆的長度或寬度與字形的長或寬相等或略相等的識別碼取中排碼.
11) 成字部件取中碼,如獨體字О識別碼取中碼G.
總體而言,彝文計算機字形編碼輸入方案綜合分析彝文字型的主要特點,設計出科學有效的字形輸入碼,有利于擴大適用范圍,無論使用者懂不懂彝文,都可以根據文字的形碼規則進行拆分輸入,相比音碼輸入法而言,適用人群更為廣泛[9].
彝文屬于超方言的表意文字,根據彝文構字規律,采用彝文部件碼,設計了彝文計算機字母鍵位,同時結合彝文字型結構和書寫筆順,設計彝文“傳統碼和簡易碼”2種計算機輸入碼,通過這2套編碼,實現彝文計算機數字化錄入,用戶能快捷有效地輸入彝文,實現與漢字、英文等其他文字同平臺數字化應用,達到彝文計算機輸入法軟件開發目標,滿足了用戶使用需求,因此彝文編碼是合理、高效且非常實用的計算機輸入碼.
參考文獻:
[1] 王繼超.解碼歷史——彝文價值及整理[J].當代貴州, 2013 (16): 28-29.
[2] 那建坤.彝文部首淺析[J].貴州民族研究,1989(2):158.
[3] 丁椿壽.論彝文的類型及其超方言問題[J].貴州民族研究,1981(1):77.
[4] 武自立,紀嘉發,肖家成.云貴彝文淺論[J].民族語文,1980(4):37.
[5] 蘇培成.現代漢子學綱要[M].北京:北京大學出版社,2001:74.
[6] 張澤全.漢光碼漢字輸入法的鍵盤分布研究[J].河南師范大學學報:自然科學版,2001,29(3):83-84.
[7] 王正賢,張和平.貴州彝族語言文字[M].貴陽:貴州民族出版社,1999:236.
[8] 李生福.古彝文及其造字規律新探[J].貴州民族研究,2001,21(2):135—138.
[9] 寧威林,王嘉梅,王輝,等.彝文輸入法形碼編碼的研究與實現[J].云南民族大學學報:自然科學版,2011,20(4):310.