尕松永藏+當曾扎西
摘 要: 人名的音節特征研究是藏文信息技術處理中最重要的工作之一,
等文獻中出現大量的人名詞匯,對其進行分類和相關的語音切分方法研究,可為當前通過藏語信息技術構建格薩爾史詩人名知識庫,提供基礎性的分類思路和方法。
關鍵詞:格薩爾 人名 詞匯 音節 切分
中圖分類號:G64 文獻標識碼:A 文章編號:1003-9082(2017)05-0132-02
《格薩爾王傳》是一部具有很高的文學、美學和欣賞價值的史詩,作為世界上最長的詩篇,它既是藏族民間文化的代表,更是藏族歷史中各類神話、傳說、諺語和詩歌的總和。由于《格薩爾王傳》在藏文化的特殊地位,向來被認為是研究藏文化的橋梁,進入二十一世紀以來,關于《格薩爾王傳》相關的歷史、文學、語言等各領域的研究日漸深入,但限于詩傳的篇幅和各類名詞含義解讀的多元化,仍有諸多問題難以深入到應有的程度。我們將自身專業特點與研究人員的需求結合,嘗試通過藏語信息處理技術構建格薩爾史詩知識庫。由于人名音節相對其他名詞更為復雜和多元,對其正確解讀與否,有時甚至會影響研究人員對關鍵事實的判斷,因此,我們將人名知識庫的構建作為這項工作的首要階段。鑒于計算機和人類思維方式之間差異性的存在,為了方便計算機識別翻譯和人工檢索使用,我們在錄入海量人名的同時,需要對人名詞匯進行基礎的分類,并對其進行相關的語音切分方法研究,并將之轉換為相應的符號語言,最大限度的增加計算機獲取和輸出信息的準確性與科學性。
目前我們暫以《格薩爾王傳》中著名詩篇
等文獻為基本資料,對其中人名詞匯相關的分類方法和語音切分方案進行初步的探討。由于這一工作的長期性和復雜性,我們的專業水平也存在一定的局限,在這一工作的初步展開階段,誠摯的希望得到相關領域不同專業學者的指導與批評。
一、人名詞匯的音節分類方案
《格薩爾王傳》中的人名音節多樣,從單個音節到十個音節的人名詞匯都有不同程度的出現,對其進行合理的分類是建立計算機與人互動的必要前提。根據當前藏語信息處理技術的特點,我們將相關人名詞匯按音節數量的不同,初步劃分為九個子分類,并對其進行簡要說明。
1.單音節人名
《格薩爾王傳》中極少出現單音節人名,但其中若干姓氏用一個音節表示的情況較多,諸如:
根據我們目前的統計,尚未在格薩爾史詩中發現單音節人名。
2.雙音節人名
格薩爾史詩中出現的雙音節人名基本都是以單純人名為主,并未發現任何附加在名字前后顯示身份等內容的信息。
例如:
3.三音節人名
三個音節的人名多是在名字前后附加了姓和身份。例如
4.四音節人名
四音節人名在格薩爾史詩中出現較多,成為音節分類中出現數量較多的人名類型,多數是在名字的前后附加了身份等方面的信息。例如:
5.五音節人名
五音節的人名在格薩爾史詩中屬于相對出現較少的類型,僅有部分人名的乳名、美名和地名信息等內容組成。例如:
6.六音節人名
六音節人名一般是在人名前后附加地名、身份、部落名等信息組合形成的稱謂。諸如:
7.七音節人名
七音節的人名多數是由姓名、地名和性格等附加信息組成的稱謂。例如:
8.八音節人名
八音節的人名出現較少,同于前述六、七音節的人名,這類人名也是多數由姓名、地名、尊號等信息共同構成。諸如:
9.九、十音節人名
就我們收集到的材料而言,目前尚未發現九個音節的人名,但十個音節的人名數量仍有個別出現。例如:
二、人名語音的切分方法
格薩爾史詩中的人名音節長短不一,開展人名知識庫的構建工作,必須首先人工對這些人名進行正確的切音和標注。切音和標注工作的準確性將會直接影響知識庫的質量,不同的語音切分,可能導致對人名和相關信息理解上的歧義。在計算機人名知識庫的構建過程中,由于電腦信息處理和人腦思維方式差異性的存在,為了便于計算機高效識別與正確理解,在較長音節的人名語音切分中,我們暫以藏文“ ”和“ ”分別表示人名詞匯語音切分中的單、雙音節停頓,用“◎”和“○”符號分別作為用于計算機藏文信息識別的單雙音節的切分停頓符號。按照這一思路,對這些人名音節的切分方法暫列如下:
1.格薩爾史詩中幾乎未出現單音節人名, 若有出現也可為單音節來切音,不會混淆于其它人名。
2.雙音節的人名在格薩爾史詩中屬于數量最多的類型,基本都是以雙音節作為語音切分點。
3.三音節的人名多數以雙、單語音切分點的形式表現,但也有個別人名以單和雙的語音切分點的形式表現,大體歸納為如下:
4.四音節人名基本都以雙音節為語音切分點劃分,幾乎沒有單音節的語音切分現象。
5.五個音節的人名在格薩爾史詩出現較少,在語音切分上主流以雙雙單形式劃分音節,也有個別人名是單雙雙形式的進行音節切分。
6.六音節的人名都是以雙雙雙形式的音節語音切分。
7.七音節的人名在語音切分上沒有一致的音節語音切分,相對其他分類而言規律性較弱。
8.八音節的人名都是以雙音節為單位進行語音切分,目前尚未發現單音節切分點的人名出現。
9.九個或九個以上音節的人名在格薩爾史詩中只個別出現,基本除格薩爾王的別稱外沒有其他的人物名稱。
三、結語
《格薩爾王傳》中出現海量的人物形象,人物名稱的音節變化多樣,尤其部分人名具有多個別稱,諸如格薩爾王即有十數個稱謂,多是終其一生不同的友人和敵人出于各自立場對其進行褒貶,因而形成的形成各種稱名,此類人名的出現,給研究者造成極大困擾。將這些人物名稱進行準確的分類和研究,對于構建格薩爾知識庫的工程而言有著難以估量的意義,這些工作的共同開展,又將會極大的有助于理清格薩爾史詩中諸多人物之間的相互關系,從根本上推動和提升當前關于《格薩爾王傳》的研究能力和認識水平。
參考文獻
[1]《仙界占卜九藏》,蘭州:甘肅民族出版社,1982年。
[2]《花嶺誕生六部》,成都:四川民族出版社,1980年。
[3]《瑪玉封地》,成都:四川民族出版社,1980年。
[4]《賽馬稱王》,西寧:青海民族出版社,1981年。
[5]《瑪燮扎》,西寧:青海民族出版社,1982年。