999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

實體一屬性抽取簡介

2019-01-08 03:16:09劉媛媛
電腦知識與技術 2019年33期
關鍵詞:機器學習

劉媛媛

摘要:本文介紹了實體一屬性抽取的相關概念,分析了規則抽取的方法,模式匹配的抽取方法,基于關系分類的抽取方法和基于聚類的抽取方法,最后對幾種抽取方法進行了比較,為后續數據結構化的研究奠定基礎。

關鍵詞:屬性抽取;模式匹配;機器學習

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2019)33-0234-01

1信息抽取簡介

隨著云計算、大數據、移動互聯網等信息技術的飛速發展,互聯網上保存了海量的數據。信息抽取就是對海量的,非結構化或半結構化的數據進行處理,從而根據一定的目的結構化的抽取出相關的實體和屬性。所謂實體也就是事物或者對象,屬性就是事物或者對象的特征或者特性。通過實體一屬性抽取從網絡中海量的非結構化信息中獲得事物對象及其特征,從而利用和理解這些非結構化信息。目前實體一屬性抽取已經成為理論研究者和產業實踐者關注的熱點領域。

2基于規則匹配的實體一屬性抽取方法

基于模式匹配的抽取方法也叫基于規則的抽取方法,顧名思義就是基于事先構造一系列規則來抽取文本中實體一屬性的方法。這種方法首先定義相關抽取規則,如,在網頁中定義相關的規范的tag標記,或人工編寫正則表達式,然后將這些規則與文本進行匹配,通過匹配的結果得到抽取的實體及其屬性。基于規則的抽取方法接近于人的思維方式,其對知識的表示方法看起來相對直觀。基于規則的抽取系統一般由兩部分組成,一個是一系列關于抽取規則的集合,第二是一系列定義匹配策略的集合。基于規則的抽取系統運行速度比較快,維護和優化相對比較容易。

3基于模式匹配的實體一屬性抽取方法

基于模式匹配的方法根據其定義模式的方法可以分成三種:基于手工定義的抽取、基于有監督學習的抽取和基于迭代的抽取。基于手工定義方式就是具有通過相關領域專業知識的人員進行人工的定義一系列模式。基于學習的方式就是,首先收集相關語料組成大規模的語料庫,然后通過人工標準的非結構化例子訓練自動獲得模式,構建具有大量實體一屬性的知識庫。基于迭代的方法是首先定義模板元組,讓后對這些模板元組進行迭代,自動產生模式,從而進行對實體一屬性的抽取。

4基于關系分類的實體一屬性抽取方法

基于關系分類的方法就是將屬性抽取問題轉化成關系分類問題。首先將抽取的兩個實體視為一個樣本,實體直接的關系視為標簽,然后通過手工的方式構建樣本特征,最后依據這些特征對樣本進行分類,分類的結果便是實體之間的關系,也就是屬性。基于關系的抽取方法通常借助機器學習的方法來進行,如支持向量機(SVM)、神經網絡等,通過對大量語料庫的訓練來學習分類模型,從而對實體一屬性進行抽取。基于關系分類的方法按照其語料庫的建設方式可以分為遠程監督的方法和全監督的方法。基于遠程監督的方法基本由機器構建語料庫,而基于全監督的方法則由人工構建語料庫。由于由人工來構建語料庫耗費大量的時間和精力,因此通常目前更熱衷于使用遠程監督的方法構建語料庫。

5基于聚類的實體一屬性抽取方法

基于聚類的方法就是將屬性抽取問題轉化成聚類問題。首先構建實體特性向量,然后基于相關方法對這些特征特征向量進行聚類,最后得到的聚類就是實體的屬性。例如對于類別屬性可以采用弱監督的聚類方法,對應產品屬性可以采用無監督的聚類方法等。不過聚類的方法需要首先構建聚類的中心點,所以用來構建初始化中心點的種子實體一屬性的選擇好壞直接影響到抽取的結果。

6各個方法的比較

從當前的應用廣泛程度來看,基于規則的方法是早期使用的方式,由于其理解簡單,易于操作,準確率高,一直到現在都比較流行。但是這種方法需要專業的人員來定義規則,隨著技術的發展慢慢正被其他方法取代。基于模式匹配的抽取方法和基于關系分類的抽取方法是當前應用比較廣泛的方法。基于模式匹配的方法可以看作基于規則的升級方法,既可以人工構建模式,也可以借助機器構建模式,所以既擁有準確率高的有點,也在一定程度上克服了召回率低的缺點。基于關系分類和聚類的方法不需要專業人員或太多的背景知識,但是需要構建用來訓練的語料庫支持,在大數據時代,這種方式能充分利用數據,減少人工,保證準確率和召回率,是未來實體一屬性抽取的發展方向。

【通聯編輯:梁書】

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲精品第一页不卡| 91青青视频| 91成人免费观看在线观看| 欧美人与牲动交a欧美精品| 国产精品白浆在线播放| 国产精品尹人在线观看| 精品视频一区二区三区在线播| 视频在线观看一区二区| 精品久久久无码专区中文字幕| 99re经典视频在线| 国产网站免费观看| 人妻免费无码不卡视频| 日韩国产高清无码| 亚洲午夜18| 1769国产精品免费视频| 蝌蚪国产精品视频第一页| 国产精品性| 亚洲激情区| 国产精品性| 中文字幕久久波多野结衣| 国产午夜无码片在线观看网站| 国产黄色片在线看| 国产精品亚洲а∨天堂免下载| 国产91麻豆视频| 日韩天堂视频| 丝袜亚洲综合| 亚洲国产精品成人久久综合影院| 欧美日韩免费在线视频| www.av男人.com| 国产69精品久久久久妇女| 亚洲av无码人妻| 亚亚洲乱码一二三四区| 国产精品美女自慰喷水| 一级福利视频| 欧美色视频日本| 无码一区二区波多野结衣播放搜索| 在线日韩日本国产亚洲| 黄色网页在线播放| 久久熟女AV| 嫩草影院在线观看精品视频| 五月天综合网亚洲综合天堂网| 激情网址在线观看| AV在线麻免费观看网站| 欧美在线三级| 久久精品亚洲中文字幕乱码| www.99在线观看| 欧美国产精品拍自| 国产成人精品男人的天堂| 欧美国产三级| 国产偷国产偷在线高清| 伊人久久婷婷五月综合97色| 国产精品无码一二三视频| 国产微拍一区| 91综合色区亚洲熟妇p| 无码人中文字幕| 青青青国产免费线在| 国产一国产一有一级毛片视频| 萌白酱国产一区二区| 欧美成人免费| 久久免费精品琪琪| 免费人成黄页在线观看国产| 亚洲免费人成影院| 国产精品女在线观看| 超清无码一区二区三区| 三上悠亚精品二区在线观看| 影音先锋丝袜制服| 国产国产人成免费视频77777| 国产v精品成人免费视频71pao| 国产香蕉在线视频| AV无码无在线观看免费| 免费激情网站| 色婷婷电影网| 少妇精品久久久一区二区三区| 国产精品人莉莉成在线播放| 国产AV无码专区亚洲精品网站| 狠狠v日韩v欧美v| 国产成人精品在线1区| 欧美午夜精品| 精品视频福利| 三级国产在线观看| 国产欧美日韩精品综合在线| 99这里精品|