999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

軍用文書電子詞典的構建與實現*

2013-08-10 07:54:42郭忠偉周慶伍郭銀忠張曉松
艦船電子工程 2013年9期
關鍵詞:語義分類

郭忠偉 周慶伍 丁 丁 郭銀忠 李 巍 張曉松

(1.陸軍軍官學院二系 合肥 230031)(2.中國人民解放軍66282部隊 北京 102300)

1 引言

軍用文書電子詞典為軍用文書的自然語言理解、信息提取、文語轉換等智能處理系統提供了基本知識源。由于軍用文書電子詞典應用目的的特殊性,它與一般的詞典是不同的,一般的詞典只是存儲詞語的詞性、釋意或與另一種語言對應的詞匯等,而軍用電子詞典除了存儲詞語之外,還包括語法信息、語義信息、語言處理方法規則等等[1]。本文從軍用文書智能處理的角度,著重研究了軍用文書領域電子詞典的構建與實現問題。

2 軍用文書詞語的分類

2.1 軍用文書詞語詞性分類

在中文信息處理中,為了進行語法研究與信息處理,需要把語法功能相同的或者語義相近的詞歸成一類,這是建立信息處理規則和處理方法的重要前提。文獻[1]提出了一個面向語言信息處理的現代漢語詞語分類體系,將數十萬的漢語詞語進行了歸類,分為十八個基本詞類和七類非詞的語言成分。軍用文書作為漢語自然語言中的一個特定的受限領域,又具有自己鮮明的特點:格式記述方法固定、句子簡練、用詞精確、內容規范、組織有序、縮短語使用較多、連接詞較少等[3]。因此,軍用文書的分類可在文獻[1]基礎之上進行簡化,省略其中基本詞類的語氣詞、擬聲詞和嘆詞,對于非詞的語言成分只采用成語、簡稱略語和習用語,其他不進行處理。這樣得到的簡化的軍用文書詞性分類為:名詞(n),時間詞(t),處所(s),方位詞(f),數詞(m),量詞(q),區別詞(b),代詞(r),動詞(v),形容詞(a),狀態詞(z),副詞(d),介詞(p),連詞(c),助詞(u),成語(i),習用語(l),簡稱略語(j)。

2.2 軍用文書詞語語義分類

軍用文書詞語的語義分類主要是為軍用文書智能處理服務的。因此,軍用文書詞語不能完全照搬通用的語義分類系統,需要參考相關軍用術語詞典,在對大量軍用文書樣本中的詞語提取、歸類的基礎上,再進行語義分類[2,4]。這里構建的軍用文書詞語語義分類體系為:

1)事物

主要包括:綜合用語、國防、戰爭戰略、戰役戰役法、戰斗戰術、警戒行軍宿營、組織指揮、體制編制、軍事訓練、裝備管理、政治工作、后方勤務、偵察情報、電子對抗、軍事地理測繪、軍事氣象水文、時間、空間、軍種、兵種等。

2)運動

主要包括:關聯、心理活動、行為(自變、促變、自為、自移、搬移、對待、給予、獲取、創造、遭受)等。

3)性狀

主要包括:外形、表象、顏色、味道、性質、品格、境況等。這種分類與通用的語義分類不同之處主要在于軍用文書電子詞典中名詞的語義分類。由于軍用文書領域的術語名詞都處于具體事物和抽象事物一級,如果繼續分下去對軍用文書的智能處理沒有太大意義,若只分兩類則提供的信息又不夠詳盡,這里的語義分類是按照簡單有效性原則,忽略了暫時不需要的信息。

3 軍用文書詞語的屬性描述

3.1 軍用文書詞語詞法信息

詞法信息是詞的變化信息,軍用文書電子詞典需要收集兩類詞法信息:詞的重疊信息和詞的附加成分信息。漢語不像英語語系,它沒有時態變化,但可通過重疊、附加前接成分或后接成分等方式構成新的詞。設單字詞為A,兩字詞為AB。漢語詞的重疊可能有AA、A一A、A了A、A了一A、AAB、ABB、AABB、ABAB等多種形態。在軍用文書智能處理中,為了實現文書詞語的正確切分,需要給出詞的重疊信息。在名詞庫中設有“重疊”字段,凡單字名詞有重疊形式者,該字段填NN。在動詞庫中,為了給出以VO形式表示的述賓結構的離合動詞是否有VVO的重疊,動詞庫需要設立“VVO”字段。在形容詞庫中,一些單字形容詞A的重疊形式AA再加上狀態詞后綴“的”構成的“AA的”,一定是狀態詞。如果只考察AA,則有的是詞(副詞,d),有的不是詞。因此,在形容詞庫中,除了設立“重疊”字段外,還要設立“重疊詞性”字段。

3.2 軍用文書詞語句法信息

1)擔任句法成分情況

名詞一般是能擔任主語、賓語的,但也有些名詞不能單獨擔任主語或賓語的。因此,需要在名詞庫中設立“主”、“賓”兩個字段,對于“地步”,“主”字段填“否”,表示“地步”不能單獨做主語,即使它受定語修飾構成定中短語也不能做主語,對于“方面”,“賓”字段填“否”表示“方面”不能單獨作賓語,不過受定語修飾構成的定中短語就可以作賓語,如“兼顧各個方面”。一般認為多數動詞是可以作謂語的,因此在動詞庫中設立了“單作謂語”字段。

2)受程度副詞修飾的形容詞、動詞

絕大多數形容詞可以受“很”一類的程度副詞修飾,構成狀中結構,其中形容詞是中心語,副詞是狀語。但是,在現行的詞語分類體系中,不是所有形容詞都能受“很”一類程度副詞修飾。為了準確描述形容詞庫中的每一個詞能否受“很”一類的程度副詞修飾,設立了“很”字段,并規定對于不能受“很”修飾的那些詞該字段填“否”能夠受“很”修飾的則不填。動詞庫中也有一部分能夠受程度副詞修飾的詞,因此在動詞庫中也需設立“很”字段,對那些能受“很”修飾的動詞,該字段填“很”否則不填。

3.3 語義信息

軍用文書電子詞典建立的語法與語義相結合的收詞原則,要求對每個登錄項的語義要有明確的界定,名詞、動詞、形容詞這三個詞都要按語義分類填寫語義編碼。此外,各類詞都包含的“語義項”字段和“備注”字段要填寫簡明的釋義或示例。兩個登錄項如果同字同音同類,則主要靠“語義項”字段來區分其不同的含義。限于自然語言處理技術的水平,“語義項”和“備注”這兩個字段是供人閱讀使用的,為了便于計算機處理,另外需要設立“同形”字段。

3.4 照應信息

在軍用文書中常有這樣的情況,兩個詞有前后照應關系,但這兩個詞并不直接構成某種句法結構。例如,對于介詞“在”,后面常有方位詞“上”、“下”、“中”、“里”等與其照應,構成一個框架。中間可納入其他成分,如“在先期作戰基礎上”、“在火力支援下”、“在作戰準備中”等。具有這樣的前后照應信息對軍用文書句子的分析也是很有用的。因此,在介詞庫中設立了“后照應詞”、“后照應類”這兩個字段。在方位詞中,需要有一個“前介”字段,要求填寫與該方位詞前照應的介詞。在副詞中,需要有“前照應”與“后照應”兩個字段。

4 軍用文書電子詞典詞語表示

在軍用文書電子詞典中,可以將詞語模型表示為一個七元組[8]。

其中 :V為單 詞集;V1為實 詞集;V2為 短 語 集為有限語法特征集,包括詞性、詞法特征、語法特征及句法樹名等[6];Y為有限語義特征集,包括抽象語義、語義前后搭配等;有限集,稱為句法詞典,元素之值a為詞條word的x特征值,且,;有限集為語義詞典,元素(word1,y)之值b為實詞word1的Y特征值,且word1∈V1,y∈Y。由文書生成系統生成的文本,V*為V的閉包[9]。例如“攻占”一詞的表示為[7]

5 軍用文書電子詞典的實現

軍用文書電子詞典的實現主要包括四個步驟:首先從軍用文書語料中篩選、統計出候選詞語[2,10],并進行分類、屬性描述和表示,在特征集表示中應使詞語的特征屬性盡量完全;然后,按照分層建表的思想把軍用文書電子詞典設計為若干個相關的表,主要包括總表、名詞表、動詞表、副詞表、介詞表、形容詞表、習用語表等;再者,在分層后的每個層次上,依據分塊存儲的觀念,按某些標準分成若干塊,分而治之。如對語法層而言,按語法進行分類,按詞性分塊存儲,在語義層則按語義分類,同時按語義分塊存儲。這樣可以對每一個塊采取相同的或者不同的結構存儲,大大提高了運行管理效率;最后采用合適的數據庫管理系統,輸入軍用文書詞語信息,構造出各個數據庫表。本文采用SQL Server數據庫管理系統描述每個詞語及其屬性的二維關系,構建了包含3000余詞匯的軍用文書電子詞典(詞表如圖1所示)。

在軍用文書智能處理過程中,為了詞語調用的方便性以及加快對電子詞典的訪問速度,還應給詞典建立索引機制。

圖1 軍用文書詞表

6 軍用文書電子詞典的應用舉例

軍用文書電子詞典對文書的智能處理有著重要的支撐作用。以對句子“指揮所開設位置”進行自動分詞為例,對構建的軍用文書電子詞典進行試用。采用最大匹配算法,算法如下:

Step1 待切分的軍用文書詞語串為s1,已經切分的軍用文書詞語串為s2(s2初始為空);

Step2 如果s1為空,轉Step6;

Step3 從s1的左邊復制一個子串w作為候選詞語,w盡可能長,但長度不能超過MaxLength;

Step4 從軍用文書電子詞典中進行查找,如果詞典中能找到w,或者w的長度為2,那么將w和一個詞界標記一起加到s2的右邊,并在軍用文書電子詞典中查找出詞語w的詞性,把詞性字符加到s2的右邊,并且從s1的左邊去掉w,轉Step2;

Step5 去掉w中最后一個漢字,轉Step4;

Step6 結束。

圖2 分詞結果

句子“指揮所開設位置”進行自動分詞后的結果如圖2所示。

6 結語

電子詞典是軍用文書智能處理的基礎。本文依據現代漢語詞語分類體系,并結合軍用文書特點,對軍用文書詞匯進行了分類,并從詞法、句法、語義、照應等方面進行了屬性描述,建立了詞語表示模型,并構建實現了軍用文書電子詞典,通過使用,表明該方法能很好地滿足軍用文書智能處理的要求。

[1]俞士汶,朱學峰,王惠.現代漢語語法信息詞典詳解[M].第二版.北京:清華大學出版社,2003.12-60.

[2]鄭家恒,張虎,譚紅葉,等.智能信息處理:漢語語料庫加工技術及應用[M].北京:科學出版社,2010.40-45.

[3]姜放然.軍用文書新編[M].北京:軍事科學出版社,1997.3-14.

[4]Ehud Reiter,Roberty Dale.自然語言生成系統的建造[M].北京:北京大學出版社,2010.21-36.

[5]徐琳宏,林鴻飛,趙晶.情感語料庫的構建和分析[J].中文信息學報,2008,22(1):116-122.

[6]史燕,程顯毅.知網、HNC和框架網的語義知識表示異同[J].廣西師范大學學報,2009,27(1):174-176.

[7]郭忠偉,周獻中,徐延勇.C3I系統仿真中基于NLG技術的文電自動生成[J].系統仿真學報,2003,15(12):1712-1728.

[8]Daniel Jurafsky,James H Martin.Speech and Language Processing[M].Prentice Hall,2005.4-10.

[9]Harris MD.Building a Large-Scale Commercial NLG System for an EMR[C]//Proceedings of the Fifth International Natural Language Generation Conference.pages 157-160,2008.

[10]Daniel Jurafsky,James H Martin.Speech and Language Processing[M].Prentice Hall,2005.7-12.

[11]AnjaBelz,EricKow.Unsupervised Alignment of Comparable Data and Text Resources[C]//In Proceedings of the 4th Workshop on Buildingand Using Comparable Corpora,pages102-109,2011.

猜你喜歡
語義分類
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
語言與語義
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
給塑料分分類吧
認知范疇模糊與語義模糊
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 成人欧美日韩| 亚洲一级无毛片无码在线免费视频| 国产av剧情无码精品色午夜| 在线观看的黄网| 草草影院国产第一页| 国产爽歪歪免费视频在线观看 | 黄色片中文字幕| 精品一区二区三区自慰喷水| 亚洲高清资源| 72种姿势欧美久久久大黄蕉| 在线观看国产精品日本不卡网| 色网在线视频| 国产99精品久久| 欧美日韩精品一区二区视频| 国产女人综合久久精品视| 亚洲综合片| 伊人查蕉在线观看国产精品| 欧美成人二区| 久久久精品无码一区二区三区| 欧美乱妇高清无乱码免费| 免费国产一级 片内射老| 国产尤物视频网址导航| 成人午夜精品一级毛片| av色爱 天堂网| 精品视频一区二区观看| 亚洲无码视频喷水| 久久精品国产免费观看频道| 亚瑟天堂久久一区二区影院| 欧美一区二区三区欧美日韩亚洲 | 无码电影在线观看| 综合色天天| 女人毛片a级大学毛片免费| 亚洲成人高清无码| 亚洲九九视频| 动漫精品啪啪一区二区三区| 日韩人妻少妇一区二区| 国产黑丝一区| 专干老肥熟女视频网站| 91po国产在线精品免费观看| 91在线视频福利| 91蜜芽尤物福利在线观看| 97综合久久| 精品亚洲欧美中文字幕在线看| 成人久久精品一区二区三区| 国产精品精品视频| 欧美第二区| 精品伊人久久久香线蕉| 欧美一区二区丝袜高跟鞋| 免费一级毛片在线播放傲雪网| 黄色网页在线观看| 国产精品久久自在自线观看| 97无码免费人妻超级碰碰碰| 亚洲精品爱草草视频在线| 亚洲swag精品自拍一区| 自拍中文字幕| 亚洲午夜国产片在线观看| 国产国产人免费视频成18| 激情五月婷婷综合网| 中文字幕在线欧美| 国产亚洲欧美日韩在线一区二区三区| 免费又黄又爽又猛大片午夜| a级免费视频| 午夜福利网址| 91在线播放免费不卡无毒| 日本国产精品| 国产精品无码久久久久久| 91精品啪在线观看国产| 日韩欧美综合在线制服| 免费无码AV片在线观看国产| 亚洲无码不卡网| 美女一区二区在线观看| 国产对白刺激真实精品91| 久久久久久尹人网香蕉| 国产区人妖精品人妖精品视频| 亚洲国产午夜精华无码福利| 中文字幕久久亚洲一区| 国产精品网拍在线| 亚洲AV无码乱码在线观看裸奔 | 亚洲视频四区| 国产凹凸一区在线观看视频| 这里只有精品在线| 99re精彩视频|