999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談中文篇章級句間語義關系及標注

2019-03-07 11:21:04李雨欣
考試周刊 2019年16期

摘 要:中國文化博大精深,漢字的發展在中國更是有著幾千年的輝煌歷史。在歷史的發展進程中,以漢字形成的中文篇章往往以句間語義關系的復雜性,更加具有豐富的內涵。篇章句間關系作為中文篇章語義分析的重要內容,具有自身的特點,通過對中文篇章句間關系層次化語義關系進行合理分析,能夠有效對句間關系進行理解描述。本文從中文篇章級句間語義關系及語料標注角度出發,提出幾點自身的見解。

關鍵詞:中文篇章級語義分析;句間關系;語料標注

近年來,隨著中文在世界的影響力逐漸加強,語言文化的研究熱潮逐漸興起,而中文篇章級句間語義的強大,給現代自動化系統中的自動分析及問答、文本質量及內容評價帶來諸多的不便。對于篇章級句間語義關系及標注是語義分析的重要內容,本文通過中文篇章級句間關系的語義分析方法,簡單分析并介紹中文的語義關系的含義,通過對于中文篇章語義關系及標注中存在的問題,提出了自己的建議。

一、 篇章級句間語義關系的含義

在中文篇章級句間語義關系及標注上,首先應明確篇章級句間語義關系的含義。首先,篇章的組成并不是簡單的詞組及句子間的簡單羅列,它更強調一種邏輯思維性。在我們日常接觸到的篇章中,都是通過將一定的信息進行整合后按照結構進行密切組織。通常,將一定的信息按照不同的組織結構進行組織,往往會產生不同的語義。例如,對于句子:“那個小女孩跑了起來,結果那只狗跟上叫了起來。”“那只狗跟上叫了起來,結果那個小女孩跑了。”在這段話中,前者強調小女孩的跑動引起了狗跟上并叫了起來,而后者強調是狗跟上并叫了起來,所以小女孩才會跑掉。從語義關系來看,兩者所體現的主體含義并不相同,由此可見句子間的組織結構影響著邏輯上的語義關系。

二、 面向中文的篇章級句間語義關系

(一) 語義單元的切分

通常在理解整個篇章時,需要把握每個組成篇章的句子的含義。而要充分理解一句話、一個句子的含義,就需要將句子分解為更小的語義單元,在充分理解每個詞組、詞語的含義上,理解一段話,最終通過了解各個句子的含義結合篇章的整體結構,理解篇章的整體思想及所要表達的主旨含義。因此,對于基礎的把握即對于基本語義單元的理解就格外重要。中文基本的語義單元從組成上來看可分為以下幾種:中文單詞;由詞組組成的短語;由短語連成的從句;進而組成的完整的句子;最終通過文本塊組成全部的篇章。

(二) 語義樹的構建

國內對于基本語義單元的分析通常通過語義樹來實現。從語義樹來看,動詞短語組成了最基本的語義單元,當簡單從句中僅包含一個基本的語義單元時,這個簡單從句同樣可以作為一個語義單元。當基本的語義單元組合在一起時,同樣可以生成一個語義單元。而從每個句子至少包含一個語義單元來看,篇章級的句間關系往往就存在于語義單元間,當然,整個關系是在相同層次的語義單元作用下形成的。

三、 基于篇章級語義標注的分析及解決對策

(一) 語義標注中存在的問題

1. 信息及內容的缺失

目前,中文本身所表達的語義是非常豐富的,從語義的組成來看,其組織方式靈活多樣,同英文不同,相似關系的詞組間可表達出豐富多彩的含義。因而在對于計算機標注過程中,會出現諸多困難。首先便是句法成分問題導致的信息缺失。在日常的語義中,中文篇章中往往存在較多的短句,這些短句雖不完整,但所隱藏的含義卻是可以通過人工標注進行理解及感悟,而基于計算機的角色標注卻無法完成。這些短句雖不完整,但卻有著完整的語義,在現代的計算機高速發展下,是否將這些元素參與到篇章構成中值得去思考。

2. 歧義關系的存在

中文語義關系是復雜的,這也導致組成中文篇章的復雜性,語義表達方式上的豐富多樣性,注定了其具有歧義性的特點。中文篇章中存在較多的歧義語義,舉例來說,“××唱片公司自成立以來,僅占整個唱片公司市場份額的0.05%,目前僅有一少部分群體購買該公司的唱片”。前面的一句更多的是闡述的事實。而“目前僅有一少部分群體購買該公司的唱片”更多的是介于“解釋說明”及更進一步的“遞進關系”之上,帶有一定的歧義關系。而如何解決這一問題更值得研究學者的思考。

3. 句法與語義關系是否屬于篇章級句間關系并不明確

在中文篇章中,通常會包含多個分句,這些分局作為多個語義的組成,往往具有并列的屬性,對行文的開展具有良好的推動及促進作用。在計算機的語義標注中,往往會出現對于句法的模糊概念,即無法通過篇章句間關系進行有效處理。

(二) 篇章級語義標注的解決對策

1. 加強中文篇章句間語料關系標注及語料庫的構建

語料關系及語料庫構建更像是一個大的數據庫,而通過這一數據庫的建設,可以豐富中文篇章語料標注中的數據分析,當出現類似的語料關系或語料關系相近時,通過語料關系庫中的標注組合,實現語料關系的自動識別及構建。

2. 加大學術研究力度,實現語義分析器的設計與實現

例如,句子:“【快樂是人的本性】,【但是】,【【我們要想一直快樂】,【一定要保持樂觀的心態】】”。這段句子中,由3個基本的語義單元組成,通過這三個語義單元的相互邏輯關系,加上【但是】這一轉折關系,組成了整體的句子,而“【【我們要想一直快樂】,【一定要保持樂觀的心態】】”這一語義單元又由兩個基本語義單元組成。通過語義單元的遞推關系,往往能夠更好地理解句間語義關系,進而用遞推的方式理解整個篇章。通過加大學術上的科研力度,創建語義分析器,可實現語義的自動標注。

3. 構建中文篇章句間關系類型及句間關系元素的自動識別法

構建中文篇章句間關系類型及句間關系元素的自動識別法是一個漫長的過程。例如,針對句法及語義關系可以通過添加相應的句法關系類別。又如,對于中文短句,允許其作為整體元素進行出現,近而判斷語義的完整性,還可以通過建立多級語義關系嵌套方式實現句間關系元素的自動識別。

四、 結語

中文篇章級句間語義關系及標注具有一定的復雜性,其研究與發展存在一定的艱難性,不過在充分把握篇章級句間語義關系的基礎上,合理看待篇章語義標注上的難題,定能引導中文篇章級句間語義關系及標注走向成功。

參考文獻:

[1]姬建輝.中文篇章級句間關系分析[D].哈爾濱:哈爾濱工業大學,2014.

[2]張牧宇,秦兵,劉挺.中文篇章級句間語義關系體系及標注[J].中文信息學報,2014,28(2):28-36.

作者簡介:

李雨欣,遼寧省朝陽市,遼寧省朝陽市第二高級中學。

主站蜘蛛池模板: 99ri国产在线| 天天婬欲婬香婬色婬视频播放| 亚洲成人精品在线| 亚洲精品国产首次亮相| 好吊色妇女免费视频免费| 香蕉在线视频网站| 欧美成人午夜在线全部免费| 精品国产aⅴ一区二区三区| 日韩毛片免费观看| 国产色婷婷视频在线观看| 国产欧美日韩另类精彩视频| 呦系列视频一区二区三区| 5555国产在线观看| 久久综合成人| 亚洲国产综合精品中文第一| 亚洲视频三级| 欧美激情第一欧美在线| 美女高潮全身流白浆福利区| 在线一级毛片| 91在线视频福利| 国产麻豆精品久久一二三| 色噜噜在线观看| 国产欧美日韩专区发布| 日本国产精品| 伊人久久青草青青综合| 国产女人在线视频| 国产对白刺激真实精品91| 国产精品一区在线麻豆| 青青草原国产av福利网站| 欧美一区二区啪啪| 亚洲视频免| 国内精品久久久久鸭| 亚洲第一黄色网| 一本一道波多野结衣av黑人在线| www.亚洲一区| 国产精品亚洲一区二区三区z| 囯产av无码片毛片一级| 久久久久亚洲AV成人人电影软件| 亚洲色中色| 久久精品国产亚洲AV忘忧草18| 久久国产免费观看| 精品国产自在现线看久久| 国产99视频精品免费观看9e| 精品国产污污免费网站| 日韩成人午夜| 亚洲an第二区国产精品| 九九九精品成人免费视频7| 久久综合伊人 六十路| 国产99久久亚洲综合精品西瓜tv| 亚洲第一黄色网址| 欧美日韩导航| 国产91视频免费| 91成人免费观看在线观看| 国产情精品嫩草影院88av| 亚洲va精品中文字幕| 日日碰狠狠添天天爽| 亚洲无码一区在线观看| 国产精品视频第一专区| 国产真实二区一区在线亚洲| 久久这里只有精品23| 亚洲熟女偷拍| 亚洲va在线∨a天堂va欧美va| 免费啪啪网址| 专干老肥熟女视频网站| 91免费国产高清观看| 亚洲精品无码AⅤ片青青在线观看| 亚洲日本精品一区二区| 人妻丰满熟妇啪啪| 国产乱论视频| 91成人免费观看| 亚洲中久无码永久在线观看软件| 热九九精品| 国产91av在线| 成人免费一区二区三区| 麻豆AV网站免费进入| 在线看片国产| 在线免费a视频| 日本国产在线| 免费可以看的无遮挡av无码| 九九视频在线免费观看| 欧美中文字幕在线视频| 欧美精品影院|