蘇日彥·艾爾西丁 ?艾孜爾古麗·玉素甫
摘要:句法分析是自然語言處理中一個很重要的研究內容。對一個語言的分析包括詞法分析、句法分析、語義和語用分析等幾個層面,因此句法分析直接影響信息檢索、自然語言處理研究的進程。本文選擇用爬蟲方式從天山網“新疆新聞、理論、訪惠聚、援疆”等分類里提取了4339文本(作為語料庫)中的形動詞短語作為研究對象,從計算語言學角度研究形動詞短語語法結構及使用規則過程。
關鍵詞: 維吾爾語;形動詞短語;規則
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)16-0205-02
開放科學(資源服務)標識碼(OSID):
1 形動詞短語概念描述與構成形式
1.1形動詞短語概念
通常,形動詞成分綴加于一個動詞或一個動詞短語末尾上構成形動詞短語被稱為形動詞短語(ADJLP)。一般形動詞??????-(??????-/ ??????-/?????? -/?????? -)和-??(-?/-??/-??)等成分綴加在單一動詞詞干及整個動詞短語的動詞末尾構成自己的形動詞短語。形動詞短語的結構和內涵是形容詞化成分上綴加于一動詞或一個動詞短語、語態短語、體短語、否定短語合并而構成。
1.2形動詞短語的構成形式
(1)??????-(??????-/ ??????-/?????? -/?????? -)和-??(-?/-??/-??)與單一動詞或一個動詞短語合并而構成的形容詞化短語。如:
(2)形容詞化成分與語態短語、體短語、否定短語合并構成形容詞化短語。短語的結構圖中可以表示如下:
(3)形容詞化成分的兩種形式即在句子中??????-(??????-/ ??????-/?????? -/?????? -)和-??(-?/-??/-??)在句子中都表示體意義,其中??????-(??????-/ ??????-/?????? -/?????? -)是傳統語言上所說的完成體意義,它綴加在未完成體成分?? -/????-結尾的動詞短語末尾后形成形動詞短語,修飾后面出現的短語或句子。如:
(4)形容詞化成分??????-(??????-/ ??????-/?????? -/??????-)在句子中是完成體意義,它綴加在進行體成分???????-/ ???????-/ ???????-/ ????? -結尾的動詞短語上是表示持續進行體。如:
2 基于形動詞短語識別規則
維吾爾語的基本語法單位是語素、詞、短語和句子。它的特點是這些語法單位之間有很明顯的界限,每一層單位由特定的附加成分來連接在一起同樣形動詞短語也是動詞或一個動詞短語末尾上
擁有形動詞短語規則庫,首先從12908條簡單句子中人工方式分出1587條形動詞短語。第二、對已挑出的形動詞短語用自動詞性標注識別系統而進行詞性標注。第三階段用統計法對已標注好的形動詞短語規則進行篩選和統計。最后共得到的形動詞短語為52種。圖片為選代表性的動名詞短語為供大家參考。
3 研究方法及設計模塊圖
本文利用系統分析法和統計法,首先“詞性標注系統”“維吾爾語形動詞規則識別系統”等軟件人機互助形式進行統計而獲得數據。獲取的數據用統計法來歸納和闡述。下面為形動詞短語設計模塊圖:
各模塊功能如下:
預處理模塊:此模塊判斷已選擇的句型包含每條句子進行詞性標注;
短語分析器:此模塊主要處理構成的形動詞短語按規則自動識別;
人工處理模塊:處理過程中識別出不符合規則形動詞短語也是無法避免的,因此只能以人工方式來處理。
根據顯示識別與分類結果,對顯示的形動詞短語進行統計,并人工判斷是否標準的形動詞短語。
最后保存到數據庫,從統計結果中得到簡單的結論。
4 形動詞短語實驗結果與分析
打開語料庫,讓識別系統自動分出來簡單句子和復合句子并保存到Access數據庫中,在規則基礎上自動提取形動詞短語進行統計和分析。因系統按照我們給予的規律自動識別出形動詞動詞短語、因此無法避免一些歧義短語,為考慮到歧義現象我們設置了手動刪除歧義短語的功能。
分析和總結出共8045條句子中自動分出2783條形動詞短語總占比例為35%。
5 結語
現代維吾爾語作為一種自然語言,在自然語言處理中一個很重要的研究方向。本文采用了基于形動詞語法特征結構及動詞搭配詞綴的基本搭配規則法對數據庫里的形動詞進行自動識別。本文介紹了傳統語言學和自然語言處理中的相關理論和技術。利用計算機來判斷形動詞邊界。因此句法、詞法分析性能的提高對信息檢索、也為后序自然語言處理、機器翻譯進程奠定基礎。
參考文獻:
[1] 早克熱·卡德爾,吐爾根·依布拉音. 維吾爾語形容詞構形詞綴有限狀態自動機. 電腦知識與技術, 2009(04):939-941.
[2] 楊承興.維吾爾語形動詞形態標記的簡化與整合[J].語言與翻譯,2003(2):22-25.
[3] 許伊娜.維吾爾語形動詞-非漢字符號AN與時位格、從格組合的結構體功能淺析[J].民族教育研究,1999,10(S1):135-139.
[4] 熱依汗·吾守爾.維吾爾語形動詞和日語形容動詞的對比分析[J].新疆大學學報(哲學社會科學版),1999,27(2): 1999(02):105-108.
[5] 吉力力·卡曼爾. 維吾爾語小學語文教材中非人稱動詞調查研究[D]. 烏魯木齊: 新疆師范大學, 2014.
[6] 史倡銘,李勝勝.淺析維吾爾語中形動詞的語法形式及使用方法[J].語文學刊,2015(23):78-79.
【通聯編輯:光文玲】