999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Early算法的藏文句法分析研究與實現

2018-10-25 11:06:56德格加安見才讓
計算機時代 2018年9期

德格加 安見才讓

摘 要: 句法分析是自然語言處理中的關鍵一環,它連接更基礎的詞法分析和更高級的語義分析。文章通過厄爾利(Early)算法分析藏語句子的語法結構,并利用計算機程序實現藏文句子自動分析,生成句法分析樹,對藏語句法分析的研究提供了較好的思路,具有探索價值。

關鍵詞: 上下文無關文法; (Early)算法; 藏語句法分析; 句法分析樹

中圖分類號:TP391.1 文獻標志碼:A 文章編號:1006-8228(2018)09-08-03

Abstract: Syntactic analysis is a key part of natural language processing. It connects more basic lexical analysis and more advanced semantic analysis. This article analyzes the grammatical structure of Tibetan sentences through the Early algorithm, and uses computer programs to automatically analyze Tibetan sentences and generate syntactic analysis trees. It provides a good research idea for Tibetan syntax analysis and has exploration value.

Key words: Context-free grammar; (Early) algorithm; Tibetan syntax analysis; syntactic analysis tree

0 引言

句法分析作為自然語言處理中的基礎性工作和關鍵技術,藏語句法分析的研究直接對進一步研究語義分析、信息檢索語抽取、機器翻譯和自動問答系統等藏語自然語言處理領域具有重要意義[1]。由于藏語自然處理起步晚,發展緩慢,至今在藏語句法分析領域仍未取得突破性進展。因此,藏語句法分析的研究和實現對藏語自然語言處理的發展頗具推進作用和現實意義[2]。

句法分析一般都依賴于某種語法體系,本文句法分析以喬姆斯基(N.Chomskyv)上下文無關文法為基本語法規則[3]。上下文無關文法是程序設計語言所使用的語法。它的特點是同樣的字符串在不同的語境下,意思不變,即本文所研究的藏語句子皆為非歧義性句子。

1 藏語句法分析概述

句法分析也被稱為句法剖析,就是利用語法規則和其他知識,將輸入句子中的詞與詞之間的線性次序轉化為一棵結構化的語法樹。

句法分析可以簡單地分為基于統計方法和基于規則的方法兩大類,其中基于規則方法是利用所研究語言的語法知識和語法規則,用形式化的模型來描寫語言內在的句法規律。對于任意一個字符串,根據規則可以推導出這個字符串的句法結構,根據句法結構又可以判斷該字符串是否合法。而基于統計的方法是用概率統計的方法表示語言單位的語法規律,通過概率矩陣計算出某句子在特定的語言環境中出現的概率,根據概率判斷該句子是否合法的可能性[4]。

自然語言是以句子為基本語義單位的,并都有自身的語法規律和特征,而句法分析的任務是按照給定的語法規則,通過計算機程序自動推導句子的結構規律,根據結構規律識別句子中的句法單位和彼此之間的關系,這種關系用一個層次分明,關系類型明確和主次明了的句法樹來表示。

2 藏語句法分析算法策略

句法分析的過程就是將小的語法成分不斷組合成大的語法成分的過程。雖然藏語句子的語法形式各異,但是在句法分析的過程中所采用的方法基本上是類似的,計算機根據形式化的語法規則判斷和分析句子,確定句子的結構。

藏語句法分析系統可以用如下的三元組來表示:

其中S表示所要分析的藏語句子的非空集合;R表示產生藏語句子的規則的非空集合,即規則庫;A表示該系統所采用的分析算法,本文中A為厄爾利(Earley)分析算法。

在自然語言處理中,常見的基于規則的分析算法有:自頂向下分析算法、遞歸轉移網絡(RNT算法)、CYK算法、厄爾利(Earley)算法、LR算法和富田勝算法等[5]。

2.1 厄爾利(Earley)算法及實現

厄爾利(Earley)算法是處理上下文無關文法算法,是一種自底向上的分析算法,厄爾利算法用項目來表示已經建成的完整或部分成分結構。

項目指在規則右部插入圓點的規則,圓點插入的部位,把規則的右部分為兩半,直觀上理解,左半部是輸入字符串已經被該規則匹配好的,右半部是尚待匹配的[6]。為了更直觀反映出與待分析字符串的哪些字符串匹配,厄爾利算法用字符間隔來記錄匹配字符串的起始點和結束點。厄爾利算法的字符間隔從0開始。

軟件運行截圖如圖4所示。

3 總結

本文對藏語句子的結構和語法規律進行深入研究的基礎上,利用厄爾利(Earley)分析算法,對藏語句子進行結構分析,并通過計算機程序實現藏語句子自動分析推導和生成句法分析樹。為藏語句法分析的研究和藏語句法分析系統的開發提供了宏觀方法和具體做法。自然語言處理中藏語句法分析是其中的一個關鍵問題也是我們面臨的瓶頸,仍需我們繼續探索研究和不斷突破。

參考文獻(References):

[1] 馮志偉.計算語言學基礎[M].商務印書館,2008.

[2] 扎西加.上下文無關文法與藏語句法分析[J].西藏大學學報(自然科學版),2013.2(28):37-41

[3] 劉穎.計算語言學[M].清華大學出版社,2014.

[4] 馮志偉.語言與數學[M].世界圖書出版公司北京公司,2011.

[5] 安見才讓.基于規則的藏語句法分析研究[J].青海民族大學,2014.

[6] 高定國.藏文信息處理的原理與應用[M].西南交通大學出版社,2014.

主站蜘蛛池模板: 成人午夜天| 91精品小视频| 成人午夜视频网站| 国产福利免费视频| 精品久久人人爽人人玩人人妻| 99这里只有精品在线| 日韩视频精品在线| 亚洲国产精品不卡在线| 欧美日韩专区| 色偷偷综合网| 欧美成人h精品网站| www.狠狠| 久久99这里精品8国产| 91年精品国产福利线观看久久| 综合久久久久久久综合网| 国产欧美在线观看一区| 九九热免费在线视频| 国产视频一二三区| 国模沟沟一区二区三区| 免费看av在线网站网址| 亚洲人成网站日本片| 国产精品自在在线午夜区app| 人妻一区二区三区无码精品一区| 成人噜噜噜视频在线观看| 国产激情国语对白普通话| 国产一区二区三区在线精品专区 | 呦女亚洲一区精品| 午夜日本永久乱码免费播放片| 无码精品国产VA在线观看DVD| 成人福利在线观看| 亚洲精品大秀视频| 97人人模人人爽人人喊小说| 青青操视频免费观看| 91麻豆精品国产高清在线| 伊人久久久大香线蕉综合直播| 国产区在线看| 91亚瑟视频| 欧美成人一级| 中文成人在线视频| 在线va视频| jizz在线免费播放| 欧美一级在线看| 日本高清免费一本在线观看| 亚洲人精品亚洲人成在线| 欧洲熟妇精品视频| 国产青榴视频| 最新国产在线| 精品伊人久久久久7777人| 久久人人97超碰人人澡爱香蕉| 国产精品男人的天堂| 欧美国产精品不卡在线观看| 五月天在线网站| 美女免费黄网站| 人人妻人人澡人人爽欧美一区| 亚洲AV无码乱码在线观看代蜜桃 | 热伊人99re久久精品最新地| 欧美日一级片| 亚洲精品你懂的| 亚洲熟女偷拍| 免费国产无遮挡又黄又爽| 97国产在线视频| 色婷婷久久| 久久精品无码一区二区国产区| 伊人天堂网| 日韩无码白| 久久久久中文字幕精品视频| 国产H片无码不卡在线视频| 欧美亚洲一二三区| AV不卡国产在线观看| 麻豆国产精品一二三在线观看| 国产女人综合久久精品视| 国产91无毒不卡在线观看| a毛片在线播放| 精品综合久久久久久97超人该| 亚洲精品视频在线观看视频| 国产菊爆视频在线观看| 久久久亚洲色| 色播五月婷婷| 色综合手机在线| 国产精品视频白浆免费视频| 国产玖玖玖精品视频| 欧美午夜小视频|