微軟、蘋果和Linux等世界主流操作系統(tǒng),相繼實現(xiàn)基于國際標(biāo)準(zhǔn)的藏文支持功能,實際上是為最大層面的藏文使用者打開了真正的應(yīng)用之門。
——扎西次仁(中國藏學(xué)研究中心資深信息技術(shù)專家,微軟Vista藏文版研發(fā)組技術(shù)顧問)
1995年起即從事藏文編碼國際標(biāo)準(zhǔn)研發(fā)的尼瑪扎西,如今是西藏大學(xué)網(wǎng)絡(luò)信息中心主任,也是藏大藏文信息化相關(guān)研究領(lǐng)域的學(xué)科帶頭人。1997年7月,他所屬的研發(fā)團(tuán)隊編制的藏文編碼體系國家標(biāo)準(zhǔn)和藏文編碼字符集等,就已通過了國際標(biāo)準(zhǔn)化組織認(rèn)證而成為國際標(biāo)準(zhǔn),并于1998年1月1日在全國實施。“從那一天起,藏文就成為我國少數(shù)民族文字中,第一個正式進(jìn)入國際標(biāo)準(zhǔn)編碼體系結(jié)構(gòu)的文字。”尼瑪扎西強調(diào)說:這是藏文獲取接軌信息化高速大道通行證的標(biāo)志。

然而,尼瑪扎西話鋒一轉(zhuǎn)又說道:這一習(xí)慣上被稱為小字符集的國家及國際標(biāo)準(zhǔn),在其后的幾年里卻并未得到廣泛應(yīng)用,之前以各種標(biāo)準(zhǔn)進(jìn)行研發(fā)的態(tài)勢仍在繼續(xù)。所以,2006年10月,國家又頒布了新的標(biāo)準(zhǔn)《信息技術(shù)-藏文編碼字符集-擴充集A》,也就是通常所說的“大字符集”。
導(dǎo)致從小字符集轉(zhuǎn)向大字符集的原因通常是這樣解釋的:由于藏文本身書寫特點和我國技術(shù)水平的現(xiàn)狀,該標(biāo)準(zhǔn)(指1997年的小字符集)難以在我國的藏文信息處理系統(tǒng)上實現(xiàn),這嚴(yán)重遲滯了我國的藏文信息化建設(shè)。為此要制定藏文編碼字符集的擴充集標(biāo)準(zhǔn)。
作為過程親歷人,尼瑪扎西承認(rèn)技術(shù)水平確實是根本的促變原因,為此他舉了一簡單的例子:作為拼音文字的藏文并不像英文那樣,可以以“字母、間隔符號等元素”作簡單橫向組合,藏文中還存在大量的字母與各種符號間的縱向組合方式。比如,從已知藏文尤其是古藏文中的梵音轉(zhuǎn)寫字等的統(tǒng)計可知,有多達(dá)7重疊加組合成的藏字,而當(dāng)時的輸入法對那種超出4重疊加的藏字(其實不只是藏字,凡是在結(jié)構(gòu)上顯現(xiàn)疊加特征的文字都存在這種問題)就無法錄入,更說不上顯示、打印和數(shù)據(jù)交換了。在這種情況下, “因挪用了部分公共編碼空間段”而字符存量較大的大字符集,確實好運用一些。
但孰優(yōu)孰劣并不能總局限在當(dāng)時的技術(shù)背景下來權(quán)衡。隨著技術(shù)的不斷提升,堅持以小字符集編碼標(biāo)準(zhǔn)的研究之路已愈顯寬廣。同樣供職西藏大學(xué)的學(xué)者高定國,就一直堅持以小字符集編碼標(biāo)準(zhǔn)進(jìn)行藏文信息化基礎(chǔ)開發(fā)。
他告訴記者,隨著新一代能實現(xiàn)多達(dá)50重疊加文字造字的程序出現(xiàn),小字符集在屬于自己的編碼空間段里,已經(jīng)騰挪出比大字符集大得多的空間。這主要體現(xiàn)在三個方面,一是基于小字符集而來的藏字都是編碼之間的自由組合,像一個孫悟空卻擁有72神變,可隨組隨用。而大字符集是機械地收錄生僻字,然后把它們做成固定的編碼,并給一一安排位置以供調(diào)用。這就好比把孫悟空生掰成72個,不能收放自如了。二是編碼空間段是劃定還是挪用的問題。大字符集被挪用的空間總是要還的。三是信息化的標(biāo)準(zhǔn)無疑是越國際越通行。將之前國家和國際標(biāo)準(zhǔn)合二為一的局面分拆開來,只能是暫時的。
作為技術(shù)顧問深度參與過Vista實現(xiàn)藏文支持研究的中國藏學(xué)研究中心信息專家扎西次仁,如今仍和微軟保持密切聯(lián)系,通過電子郵件處理來自微軟有關(guān)藏文操作系統(tǒng)BUG檢測和調(diào)試等請求,是他的日常工作之一。他告訴記者說:“隨著第一款全面支持藏文的主流操作系統(tǒng)“Windows Vista”于2007年1月30日的全球發(fā)布,一直存在于我國藏文信息化領(lǐng)域的“大小(字符集)之爭”就實質(zhì)性結(jié)束了。”其實在他心中,這個結(jié)束的日子其實還應(yīng)該提前,當(dāng)2000年微軟和Adobe公司共同研發(fā)出OpenType字體格式及其造字技術(shù)后,有關(guān)小字符集標(biāo)準(zhǔn)無法運用的技術(shù)瓶頸(即利用國際編碼實現(xiàn)藏文動態(tài)疊加造字技術(shù))就已經(jīng)告破。所以,現(xiàn)在再探討“大小之別”的原因毫無意義。扎西次仁認(rèn)為:藏文信息化的真實歷程是,以前有標(biāo)準(zhǔn)而無主流操作系統(tǒng)支持,現(xiàn)在有操作系統(tǒng)支持而缺應(yīng)用軟件開發(fā)。對于搞藏文信息化的我們來說,該著手什么再清楚不過了。為此扎西次仁向記者介紹了他目前正在進(jìn)行的工作。
標(biāo)準(zhǔn)不一至少為國內(nèi)外帶來了幾十種藏文編碼,這種“萬碼奔騰”互不兼容的局面,讓大量已經(jīng)電子化的藏文文檔資料難以互通。但如今,一款名為“通用藏文字體轉(zhuǎn)換軟件”的超級工具,卻能在16種主要藏文編碼文字間實現(xiàn)自由轉(zhuǎn)換。目前,這款由扎西次仁獨立研發(fā)的軟件,正在實現(xiàn)網(wǎng)頁運行功能,不久即會在網(wǎng)絡(luò)上免費發(fā)布使用。
萬碼歸一之后又面臨字體不夠的困境。扎西次仁介紹說:藏文有多達(dá)20多種的字體,但目前基于國際編碼標(biāo)準(zhǔn)的藏文字體只有微軟的藏文正楷一種,蘋果公司最新操作系統(tǒng)最近也實現(xiàn)了藏文支持,字體和微軟一樣,也是藏文正楷,但做得要平滑漂亮一些。扎西次仁課題組目前正在研發(fā)的字體有四種,都是精選歷史上比較受歡迎的藏文名家字體。包括朱擦體、白楚體和丘乙體,還有烏金體,即通常所說的楷體。只有基于國際編碼標(biāo)準(zhǔn)字符集,用OpenType字體技術(shù)才能設(shè)計出前三種字體。這就是為什么到今天在計算機中還見不到其他藏文字體的原因。這項字體研發(fā)工作計劃將于今年8月完工后免費推出。當(dāng)然,他們也希望這些字體最終能被微軟等大操作系統(tǒng)采用,從而被更多的藏文電腦使用者使用。