999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

智能信息處理技術(shù)的應用與研究

2014-12-23 00:06:39張成琦湖南涉外經(jīng)濟學院長沙410205
山東工業(yè)技術(shù) 2014年13期

張成琦(湖南涉外經(jīng)濟學院,長沙 410205)

智能信息處理技術(shù)的應用與研究

張成琦(湖南涉外經(jīng)濟學院,長沙410205)

摘要:智能信息處理主要涉及智能搜索和信息處理等方面的功能,應用的主要技術(shù)是自然語言處理和理解。本文發(fā)現(xiàn)、總結(jié)了智能搜索和信息獲取在自然語言理解應用中相關的問題,闡述了問題存在的根源以及解決辦法。

關鍵詞:智能搜索;信息獲取;自然語言處理;自然語言理解

隨著信息化技術(shù)的不斷發(fā)展與深入,特別是網(wǎng)絡技術(shù)的逐漸普及,人們對信息的需求也是越來越多,質(zhì)量要求越來越高,這些所涉及到的都是當前計算機智能信息處理技術(shù)方面急需解決的難題,鑒于智能搜索和信息獲取理論成熟性、深度,也鑒于它們在自然語言理解實驗中取得了較好的效果,重點討論下智能搜索、信息獲取。

1 兩種思想策略

自然語言理解技術(shù)就是研究讓計算機理解人們?nèi)粘K玫恼Z言,通過研究希望建立一種人和計算機之間友好的交互關系,關系建立主要有2種思路,一是實驗模型思路,一種是直接應用模型思路。實驗模型思路,是面向人工智能所期望解決的一般語言理解問題,主要是研究讓計算機理解人的一般語言能力,能在計算機上建立一套計算機能夠識別的語言庫。按照這個思路,最終可能建成言語分析或生成所需的自然語言理解知識庫。而直接應用模型策略是直接以應用為目標,無論哪種情況,都是專門針對某一具體領域采用解決自然語言理解的基本策略。

2 智能搜索

搜索其實采用的就是過濾器模型,通過標注和匹配兩項工作,從原始數(shù)據(jù)中篩選出滿足要求的數(shù)據(jù)。搜索有很多的類型,智能搜索是搜索中最高級的搜索類型,是基于語義搜索,搜索對象小到一句話,大到一段文字。不過它的主要對象是自然語言文本,智能搜索是自然語言處理的重要環(huán)節(jié),它在使用過程的相關問題也就成為大家討論的焦點。

(1)標注。搜索對象是標注的結(jié)果,而標注就是產(chǎn)生對文本的描述,標注的關鍵要素就是標注用詞,而通常包含主題詞與自由詞兩種類型。使用主題詞存在的問題比較多,具體表現(xiàn)在詞表不夠用,內(nèi)容陳舊,而且涉及內(nèi)容過于復雜。鑒于此原因,使用自由詞標注彌補了使用主題詞的缺陷,同時不需要理解全文,效率較高;(2)理解搜索要求。用戶提出的查詢數(shù)據(jù)的要求通常用都是很零散的,用戶提出的數(shù)據(jù)查詢要求,輸入系統(tǒng)、經(jīng)由自然語言理解前端句法語義分析器進行分析生成句法樹,然后,系統(tǒng)通常以名詞短語作為搜索的關鍵詞在經(jīng)過標注的文獻庫中搜索目標對象;(3)實現(xiàn)智能搜索。智能搜索的大致過程是這樣的,對兩個或多個不同的文檔進行標注,如果標注的結(jié)果完全一致,那么說明被標注結(jié)果相應的內(nèi)容也是一致,那所標注的內(nèi)容也就是用戶所查找的目標對象,最終實現(xiàn)了智能搜索的目的。

3 信息獲取技術(shù)

信息獲取相對于信息搜索來說,技術(shù)更先進,更成熟,它是一門綜合性極強的技術(shù),同時以深入的語言處理基本理論和技術(shù)作為支撐,研究多種基本的自然語言處理技術(shù)的綜合應用,具有很好的研究價值。下面就信息獲取的基本內(nèi)涵、語言處理技術(shù)以及信息獲取的基本過程等方面內(nèi)容進行一些基本的討論。

(1)信息獲取的內(nèi)涵。信息獲取是指從一段文本中抽取指定的一類信息,并將其形成結(jié)構(gòu)化的數(shù)據(jù),然后填入一個數(shù)據(jù)庫中供用戶查詢使用的過程。獲取的過程包含三個方面的內(nèi)容:一是模板元素,主要涉及文章中的專有名詞、時間詞、數(shù)量詞和詞組等;二是模板關系,主要涉及命名實體之間的各種關系;三是腳本模板,主要涉及事件之中的各個實體、屬性或關系;(2)語言處理技術(shù)。中文信息的處理包含三個種自然語言處理的技術(shù):一是詞切分和詞性標注。主要技術(shù)是建立信息獲取的詞切分方法,開發(fā)合適的漢語詞切分和詞類標注軟件。二是短語句法及語義分析,主要涉及句法成分的識別與標注,關鍵詞提取,搜索特征集的提取、索引等。三是句群分析,主要涉及句間成分的傳遞、指代、引用信息表的建立和使用,以及概念關系的推理等;(3)信息獲取的過程。信息獲取過程有4個環(huán)節(jié),一是描述信息,就是指利用信息模式描述大家感興趣的信息,比如<公司名><產(chǎn)品名>。這樣在系統(tǒng)中預定義類似的信息模式,存放在模式庫中,供用戶選用。二是詞法、句法及語義分析,并做各種文本標注。借助合適的詞典、構(gòu)詞規(guī)則等知識庫的支持,比如名詞短語有人的名字、機構(gòu)的名稱以及產(chǎn)品名稱等,再比如動詞短語有事件描述與事實陳述等。三是確定信息的最終形式,主要通過上下文文關聯(lián)、指代、引用等分析和推理方式實現(xiàn)。四是結(jié)果輸出,比如生成一個關系數(shù)據(jù)庫或給出自然語句陳述等。

參考文獻:

[1]傅承德.自然語言理解的方法與策略[M].河南人民出版社,2001:185.

[2]陳力為.計算機語言學研究與應用[M].北京語言學院出版社,1993:134.

主站蜘蛛池模板: 强奷白丝美女在线观看 | 国产原创自拍不卡第一页| 国产sm重味一区二区三区| 国产成人免费手机在线观看视频| 久久五月天综合| 亚洲一区波多野结衣二区三区| 欧美成人精品一级在线观看| 日韩精品免费一线在线观看| 欧美成人免费午夜全| 久久毛片网| 2018日日摸夜夜添狠狠躁| 国产视频入口| 国产精品美女自慰喷水| 国产成人综合在线观看| 久热这里只有精品6| 在线观看无码av免费不卡网站| 婷婷开心中文字幕| 男女精品视频| 午夜国产精品视频| 欧美日韩在线亚洲国产人| 伊人久久青草青青综合| 99一级毛片| 欧美成人综合在线| 波多野结衣亚洲一区| 国产自产视频一区二区三区| 亚洲最猛黑人xxxx黑人猛交| 一边摸一边做爽的视频17国产 | 亚洲床戏一区| 亚洲国产精品一区二区高清无码久久 | 伦伦影院精品一区| 国产精品自拍合集| 亚洲国产高清精品线久久| 国产精品毛片一区| 中文字幕自拍偷拍| 在线欧美日韩| 欧美精品导航| 三区在线视频| 日韩不卡高清视频| 亚洲91精品视频| 国产免费羞羞视频| 日韩第九页| 麻豆AV网站免费进入| 国产日韩欧美精品区性色| 国产办公室秘书无码精品| 欧美日韩一区二区在线播放| 毛片手机在线看| 欧洲极品无码一区二区三区| 国产日韩AV高潮在线| 亚洲欧美不卡| 99久久成人国产精品免费| 亚洲精品久综合蜜| 久久精品国产电影| 久久中文字幕av不卡一区二区| 免费人成视网站在线不卡| 97视频精品全国在线观看| 欧美日韩精品在线播放| 99re在线免费视频| 毛片视频网址| 青青草原国产免费av观看| 大香伊人久久| 一区二区三区四区日韩| 91无码人妻精品一区二区蜜桃| 国产亚洲精品资源在线26u| 亚洲无码不卡网| 久久久久亚洲AV成人网站软件| 国产精欧美一区二区三区| 久久青草热| 久久亚洲AⅤ无码精品午夜麻豆| 亚洲视频色图| 99尹人香蕉国产免费天天拍| 在线国产91| 亚洲黄色视频在线观看一区| 欧美日韩一区二区在线播放| 在线视频亚洲色图| 久青草网站| 国产欧美精品一区二区| 欧美区一区| 国产不卡网| 无码国内精品人妻少妇蜜桃视频| 国产本道久久一区二区三区| 精品国产污污免费网站| 国产精品自在在线午夜|