999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從知識圖譜到認知圖譜及電信行業應用

2021-07-19 11:11:50劉永生李亞夢
信息通信技術 2021年3期
關鍵詞:智能方法

劉永生 廖 軍 李亞夢 王 巍

中國聯通研究院 北京 100048

引言

知識圖譜是一種表示、處理和應用知識的技術,最早由谷歌公司在2012年提出,用來提升搜索引擎的智能。知識圖譜由節點和邊組成,節點表示實體,邊表示實體與實體之間的關系。近幾年深度學習的熱潮對知識圖譜發展起到了強大的推動作用,同時知識圖譜也被認為是感知智能向認知智能過渡的關鍵技術之一。

目前國內外已經開發了一大批知識圖譜。國外具有代表性的大規模知識圖譜有DBpedia、Freebase、Knowledge Vault等;國內具有代表性的大規模知識圖譜有Zhishi.me、OpenKN、CN-DBpedia等。同時,行業知識圖譜也相繼出現,具有代表性的有電影領域的IMDB、醫藥領域的DrugBank、學術領域的acemap等[1]。

知識譜圖的價值主要可以歸納為以下三點:1)智能高效的知識檢索能力,得益于自然語言處理和互聯網的發展,知識圖譜能夠提供智能搜索、智能問答、智能推理等能力;2)廣泛的行業應用,很多行業發展了行業知識圖譜,應用普遍的行業包括金融、電商、醫療等,各個行業嘗試使用知識圖譜實現知識的積累和靈活使用[2];3)認知智能的基石,近幾年蓬勃發展的深度學習屬于感知智能階段,存在的一個主要問題是“黑箱”的不可解釋,解決該問題的方式之一是知識驅動,因此知識圖譜被認為是從感知智能向認知智能發展的基石,最新的研究進展包括認知圖譜[3-4]。

電信行業正在進行數字化轉型,實現企業的高質量發展,知識圖譜在數字化轉型過程中發揮重要作用。網絡的自動駕駛是未來5到10年的演進目標,行業內已經提出了自動駕駛網絡的分級標準[5],網絡運營維護知識積累形成網絡知識圖譜,將助力自動駕駛網絡的演進。同時,知識圖譜在企業服務和管理方面也具有重要作用,典型的代表是知識圖譜的智能問答代替人工服務等。

1 知識圖譜

1.1 知識圖譜定義及表示

目前對知識圖譜沒有統一的定義,文獻[6]給出的定義為:知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系。其基本組成單位是“實體-關系-實體”三元組,以及實體及其相關屬性,實體間通過關系相互聯結,構成網狀的知識結構。

知識圖譜中知識的表示方法主要有3類[7]:1)基于數理邏輯的知識表示,較早期的知識表示方法,該方法以符號邏輯為基礎的表示知識,優點是易于表達顯性、離散的知識,缺點是很難使用機器生成推理規則,數據規模大時計算效率低;2)基于語義網絡的知識表示,工業界使用廣泛的一種表示方法,W3C制定的資源描述框架,使用三元組(s,p,o)來記錄各種事物及其相互關系,s和o表示實體,p表示關系,則(s,p,o)表示實體s和實體o之間存在關系p的知識;3)基于向量空間的分布式知識表示,將知識圖譜中的實體和關系嵌入到低維連續的向量空間,并且在該向量空間中完成語義計算。這種表示方法可以有效地挖掘隱形知識,對知識庫的構建、推理、融合以及應用具有重要意義,具有代表性的方法包括TransE模型[8]和RESCAL模型[9]。

1.2 知識圖譜構建技術

知識圖譜的構建是從原始的數據開始,經過知識抽取、知識融合、知識加工的步驟,最終得到知識圖譜的過程,每個步驟中涉及具體的操作內容,如圖1所示,下面對每個步驟的內容及研究進展進行詳細介紹。

圖1 知識圖譜構建技術

1.2.1 知識抽取

知識抽取是指從海量的結構化、半結構化或非結構化的數據中提取知識的過程,涉及的技術包括:實體抽取、關系抽取、屬性抽取。其中,實體屬性可以看作是實體與屬性值之間的關系,可以采用關系抽取的方法來獲得。

1)實體抽取

實體抽取是指從數據中識別實體。文獻[1]將實體抽取的方法分為3種:①基于規則與詞典的方法,利用人工制定的規則與詞典從數據中識別出實體。該方法抽取的實體準確率高,通常面向單一領域,但是擴展性比較差,難以滿足數據變化的需求。②基于統計機器學習的方法,利用數據對機器學習中模型進行訓練,使用訓練好的模型來識別實體。比如Liu等將K臨近算法和線性條件隨機場模型結合來識別實體[10]。該方法需要足夠數量的訓練數據,當數據量較小時,準確率會受到影響。③面向開放域的抽取方法,針對海量網絡數據識別實體。該方法需要建立一個科學完整的命名實體分類體系。

2)關系抽取

關系抽取是指從海量數據中提取出實體之間的關系。關系抽取可以分為3類[7]:1)基于模板的關系抽取,使用模板通過人工或機器學習的方法抽取實體關系。該方法準確率高且針對性強,但是對大規模數據效果差,召回率低;2)基于監督學習的關系抽取,使用人工標注的數據集訓練模型,使用訓練好的模型抽取關系。比如Sun等提出的FTK模型,計算關系相似度并通過支持向量機對關系進行分類[11];3)基于半監督或無監督學習的關系抽取,使用少量人工標注的數據或者無標注數據來學習關系。比如Feng等提出了基于強化學習的關系分類模型CNN-RL[12]。

1.2.2 知識融合

通過知識抽取獲得了大量的知識,因為數據來源不同等原因,同一實體、關系、屬性的描述信息存在差異,知識存在冗余信息。有必要對知識抽取的結果進行清理和整合,這就是知識融合。另外,知識融合也包括引入第三方知識庫來增加知識的存量。

1)實體消岐

同一名稱在不同的語境下存在指代不同實體的情況,比如,李寧既可以指運動員,也可以表示品牌。實體消岐就是為了保證每一個實體具有清晰的名稱。實體消岐的方法大致可以分為2類:①基于聚類技術的消岐方法,基本思路是度量實體的名稱和語境相似度,將指向同一實體的名稱聚為一類。傳統的方法采用詞袋模型,后續的研究主要針對如何挖掘準確全面的語義知識來尋找突破;②基于實體鏈接技術的消岐方法,基本思路是將數據中實體鏈接到知識庫中的正確詞條,來明確其真實含義,從而達到實體消岐的目標。

2)共指消解

與歧義相對應,在抽取的知識中可能存在不同名稱表示同一實體,比如:“中國聯通”和“中國聯合網絡通信有限公司”其實是一個實體的兩個不同的名稱。共指消解技術就將這些不同的名稱指向同一實體的技術。研究進展大致可以分為3類:①以特征為基礎的消解,特征可以是詞匯、距離、一致性、語法、語義等;②以句法分析為基礎的消解,代表方法是Hobbs算法和向心理論;③以統計機器學習為基礎的消解,典型的方法包括C4.5決策樹算法的引入和實體相似性測度模型。

3)知識合并

知識合并是現有知識庫的引入技術,擴充知識圖譜的容量。知識合并主要涉及2方面的內容[6]:①合并外部知識庫,將外部知識庫合并到本地的知識圖譜,Mendes等提出了開放數據集成框架用于知識庫合并的標準化;②合并關系數據庫,企業現存的關系數據庫是知識圖譜的重要知識來源,將關系數據庫轉化成資源描述框架的形式是一種流行的操作,目前已經出現了大量轉化的工具(比如Triplify、OpenLink等)。

1.2.3 知識加工

知識加工專注于優化知識圖譜的邏輯關系,經過知識加工后的知識圖譜具有較高的邏輯性。知識加工的技術主要包括:本體構建、知識推理和質量評估。

1)本體構建

本體是一個通用的數據模型,相當于知識圖譜的模具,通過定義規則和約束條件等來規范實體、關系以及實體的類型和屬性等之間的聯系。本體構建的技術主要分為兩種:①人工構建,依靠本領域專家和眾包的方式,人工構建工作量大而且適合的專家難以尋找;②數據驅動的自動化構建,主要包括實體并列關系相似度計算、實體上下位關系抽取、本體生成的步驟[6]。

2)知識推理

知識推理是指從已有的實體關系出發,經過邏輯計算,建立實體間的新關聯,從而拓展和豐富知識。知識推理的方法可以分為4類:①基于規則的推理,利用簡單的規則、統計特征等進行推理,該方法可解釋性強,準確率高,但是規則不易獲得,抗干擾比差;②基于分布式表示的推理,將知識圖譜映射為低維向量表示,通過向量操作進行推理,該方法計算方便,但是未深入考慮語義信息推理能力受限;③基于神經網絡的推理,利用神經網絡計算得到最優的實體和關系,該方法推理能力強,但是復雜度高可解釋性差;④混合推理,混合以上推理方法,該方法綜合各個方法的優勢,但目前只是簡單的淺層混合。

3)質量評估

質量評估是在知識加入知識圖譜之前,對知識的可信度進行評估,舍棄低質量的知識。現有質量評估方法主要是利用數據來源的可信度來判別知識的質量。谷歌提出了一種依據用戶貢獻歷史和領域,以及問題的難易程度進行自動評估用戶貢獻知識質量的方法,使用該方法對大規模用戶貢獻知識評估準確率達到91%,召回率達到80%[6]。

2 認知圖譜

人工智能的發展正在處于感知智能的階段,即數據驅動的智能,三要素是數據、算法和算力,主要研究深度神經網絡及其應用,并且在聲圖文等某些領域達到甚至超過了人類的識別水平,但是以深度神經網絡為代表的深度學習算法存在不可解釋的“黑箱”和不安全等問題,這些問題來自于數據驅動的智能的先天性缺陷。為解決上述問題,人工智能將邁向認知智能階段,也被稱為第三代人工智能[13],核心是知識和數據共同驅動的智能,技術上可以將深度學習與大規模知識結合起來,實現認知推理和邏輯表達,最新的成果是認知圖譜。

2.1 認知圖譜的定義

認知圖譜是一個全新的概念,文獻[14]提出認知圖譜可以被解釋為基于原始文本數據,針對特定問題情境,使用強大的機器學習模型動態構建的,節點帶有上下文語義信息的知識圖譜。認知圖譜主要內容包括以下4個方面[15]:①融合表示學習與符號邏輯的知識表示;②多源、動態、異質碎片化知識的在線獲取和動態融合;③基于時空特性的知識演化和多粒度知識推理;④富知識的用戶理解和交互式知識適配。

2.2 認知圖譜的研究進展

文獻[3]提出了一種認知圖譜的應用框架,如圖2所示,由2個系統組成,系統1負責經驗性的直覺判斷,這一黑盒過程提取重要信息,并動態構建認知圖譜;系統2則在圖上進行關系推理,由于認知圖譜保留了實體節點上語義信息的隱表示,所以在符號邏輯之外,也可以使用圖神經網絡。本質上,認知圖譜的改進思路是減少知識圖譜構建時的信息損失,將信息處理壓力轉移給檢索和自然語言理解算法,同時保留圖結構進行可解釋關系推理。

圖2 認知圖譜的應用框架

文獻[16]基于認知圖譜構建了一個電商領域的推薦系統:認知智能計算平臺。該平臺主要包括基礎數據層、推理引擎層和用戶交互層。基礎數據層在構建跨領域知識圖譜的同時理解數據背后的含義,推理引擎層使用超大規模圖神經網絡對消費者意圖進行推理,用戶交互層基于用戶交互的視覺智能和文本智能,理解消費者意圖,助力消費者決策。

3 電信行業前沿應用

電信行業正在進行數字化轉型,實現企業的高質量發展,以知識圖譜和認知圖譜為代表的人工智能技術在電信行業擁有廣泛的應用前景。一方面,政府報告多次要求電信企業“提速降費”,電信企業需要主動降低運營成本,知識圖譜等新技術的引入將會提升企業運行效率、替代部分人力。另一方面,國內市場已經進入存量競爭的時代,不斷提升服務質量成為競爭的關鍵所在,知識圖譜等新技術的引入將為客戶提供更加人性化和周到的服務。

3.1 企業服務

1)電信詐騙預防與挖掘

隨著互聯網金融的發展,電信詐騙行為呈現爆發式增長,給用戶帶來巨大的經濟損失,知識圖譜為解決電信詐騙提供了新的手段。文獻[4]基于事理認知圖譜實現了一個預防網絡詐騙系統,測試數據為運營商的10萬條用戶群在線交互信息,采用事理相關性推斷分析、博弈演化評估等技術,代替人工審核,進而總結出各種網絡電話詐騙手段運作規律,從歷史序列值和當前序列值中合理推斷出未來發生可能的概率,找出欺詐者的蛛絲馬跡,挖掘其數據的矛盾點和可疑點,結果顯示預測準確率達到95%。文獻[17]使用電信詐騙的數據構建了知識圖譜,然后使用圖遍歷及圖算法、混合高斯模型,從聯系鏈路、必要人物、核心人物的發現以及社會關系識別的維度進行分析挖掘。

2)疫情防控

2019年突發全球性的新冠疫情,嚴重影響了人們的生產和生活習慣,剛開始由于對新冠病毒的不了解,導致了人們的恐慌,同時每天有大量來自于官方、媒體、研究的新冠信息,對這些信息進行整合,構建新冠知識圖譜將極大的助力疫情的防控。電信運營商為用戶提供了互聯網的接入服務及相關的增值服務,利用新冠知識圖譜,電信運營商可以為用戶提供疫情的查詢服務,包括新冠病毒知識、辟謠信息、疫情人數、患者車次等疫情相關的知識問答,國內中高風險地區查詢,國內外疫情人數查詢。疫情查詢服務為知識普及、疫情防控、社會穩定做出重要貢獻。同時還可以結合人工智能的語音識別技術,依靠多輪對話機器人可以更加方便為用戶提供服務。

3.2 網絡運營

電信運營商管理著非常龐大和復雜的網絡,為了更加便利的管理,劃分成了接入網、承載網、傳輸網、核心網等不同的網絡域,不同的網路域具有專業的知識,近年來隨著SDN/NFV、云原生、人工智能等新技術的引入,網絡結構出現更多的變化。專業的知識和復雜的網絡為網絡故障的診斷帶來了極大的困難。網絡知識圖譜可以將網絡各個專業知識、運維專家的經驗、設備的產品信息等數據進行積累,對于新技術的數據可以進行及時補充,形成強大的網絡知識庫。一方面,網絡知識圖譜可以為運維人員提供即時的智能查詢服務,包括各類基礎知識和常見運維知識,提供多輪查詢功能,不斷的明確問題。另一方面,文獻[18]利用網絡知識圖譜的知識推理功能,設計了一種智能化的故障診斷系統,融合專家經驗和文檔知識,實現智能化的根因推導。

3.3 企業管理

電信行業的數字化轉型也改變了企業的人才結構,由以CT人才為主轉向CT和IT的更多領域人才,云計算、大數據、人工智能、區塊鏈等人才不斷涌現,人才專業跨度在增大。同時人才的能力層次各不相同,來源渠道各異。知識圖譜為人才高效管理提供了可行方法,文獻[19]提出基于知識圖譜構建的人才能力標簽圖譜,有效挖掘深層次的人才能力,發揮專家人才支撐服務一線、經驗技術分享的作用,為人力在人崗匹配和晉升培養等方面提供幫助。

4 結語

深度學習的發展為知識圖譜的研究帶來了新的思路,特別是在知識抽取和知識推理過程中具有很好的泛華能力,但仍然存在可解釋性差的問題。同時,知識圖譜也被認為從感知智能向認知智能發展的技術之一,將深度學習和知識圖譜結合在一起出現了認知圖譜,在學術界和產業界引起了廣泛關注。電信行業正在進行數字化轉型,知識圖譜和認知圖譜具有廣闊的應用前景,主要體現在企業運營的降本增效,本文列舉了幾項電信領域的典型應用,包括:電信詐騙預防與挖掘、疫情防控、網絡故障智能查詢和診斷、人才管理。

猜你喜歡
智能方法
智能制造 反思與期望
學習方法
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
智能制造·AI未來
商周刊(2018年18期)2018-09-21 09:14:46
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 亚洲国产精品无码AV| 91 九色视频丝袜| 国产美女一级毛片| 国产99热| 久久精品国产亚洲麻豆| 91视频区| 国产黄色爱视频| 国产免费观看av大片的网站| 久久国产黑丝袜视频| 亚洲欧美一区二区三区图片| 欧洲高清无码在线| 久久久久久久蜜桃| 青青青视频免费一区二区| 亚洲女同一区二区| 欧美人在线一区二区三区| 国产精鲁鲁网在线视频| 亚洲精品国产乱码不卡| 日本三级黄在线观看| 青青操国产视频| 色男人的天堂久久综合| 婷婷午夜影院| 久久99国产综合精品1| 国产美女叼嘿视频免费看| 欧美一级夜夜爽| 国产精品免费p区| 在线网站18禁| 亚洲日韩国产精品综合在线观看| 天堂成人在线视频| 国产伦精品一区二区三区视频优播 | 97久久精品人人| 99伊人精品| 毛片免费在线视频| 亚洲无码视频图片| 国产免费久久精品44| 99精品在线视频观看| аⅴ资源中文在线天堂| 国产美女精品在线| 日本精品αv中文字幕| 素人激情视频福利| 老司机久久99久久精品播放| 成人无码一区二区三区视频在线观看| 亚洲av无码牛牛影视在线二区| 日韩小视频网站hq| 激情网址在线观看| 奇米影视狠狠精品7777| 午夜丁香婷婷| 成年午夜精品久久精品| 91po国产在线精品免费观看| 国产色伊人| 亚洲欧美自拍视频| 亚洲一区二区无码视频| 成人福利在线免费观看| 亚洲成网站| 久久亚洲高清国产| 五月激情综合网| 9久久伊人精品综合| 中文字幕首页系列人妻| 亚洲乱码在线视频| 18禁不卡免费网站| 成人亚洲视频| 亚洲第一精品福利| 国产区成人精品视频| 国产精品一线天| 日韩中文字幕免费在线观看 | 久久天天躁狠狠躁夜夜2020一| 亚洲码一区二区三区| 黄网站欧美内射| 内射人妻无套中出无码| 少妇被粗大的猛烈进出免费视频| 国产精品女在线观看| 特级做a爰片毛片免费69| 亚洲综合亚洲国产尤物| 亚洲91在线精品| 在线播放国产99re| 国产一区二区三区在线精品专区| 精品超清无码视频在线观看| 国产一级α片| 成人欧美在线观看| 国产精品福利社| 熟妇人妻无乱码中文字幕真矢织江| 999精品免费视频| 国产特级毛片|