999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于自然語言處理的智能操作票技術的研究

2020-08-11 07:43:36王乾張毅梁凱王立峰孫巖浦朔白揚
中國電氣工程學報 2020年4期
關鍵詞:語義單詞規則

王乾 張毅 梁凱 王立峰 孫巖 浦朔 白揚

摘要:近年來,隨著信息技術的發展,人工智能已經成為信息時代的一個熱門話題。自然語言處理(NLP)是計算機科學、人工智能和語言學的一個研究領域,主要研究計算機和人類語言之間的相互作用。該領域產生了大量的人工智能研究成果和產品,是人工智能領域的一個熱點。調度操作票的智能自動生成是一項既有技術又有經驗的綜合性工作。本文結合自然語言處理技術和機器學習方法,基于數學理論和中文信息的MMT模型,實現了操作票內容的智能提取和操作票的自動生成。結果表明,基于中文信息的多語言機器翻譯模型是進一步解決當前句法分析問題、減少歧義、提高分析水平的一種參考方法。研究結果的意義在于語法規則可以被測試,句子的語法模型結構可以進一步加工為主體,建立實用工具和模型可以提供深入的理解自然語言,語法知識基礎的擴展和深入研究法語句子的意義。

關鍵字:人工智能;自然語言處理;操作票

Abstract:Inrecentyears,withthedevelopmentofinformationtechnology,artificialintelligencehasbecomeahotresearchtopicintheinformationage.Naturallanguageprocessingisafieldofcomputerscience,artificialintelligenceandlinguisticsthatfocusesontheinteractionbetweencomputerandhumanlanguage.Inthisfield,alargenumberofresearchresultsandproductsofartificialintelligencehavebeenproduced,whichisaresearchhotspotinthefieldofartificialintelligenceatpresent.Usingthetheoryofalgebraiclinguisticstobuildtheexpertsystemofsyntacticanalyzer,theMMTmodelofChineseinformationisusedintheresearch.TheresearchresultsshowthattheMMTmodelbasedonChineseisareferencemethodtofurthersolvethecurrentsyntacticanalysisproblems,reducingambiguityandanalysislevel.Thesignificanceofitsresearchresultsliesinthatitcantestgrammarrules,establishsentencegrammarmodelstructurethroughdeepprocessingofcorpus,providepracticaltoolsandmodelsfordeepunderstandingofnaturallanguage,expansionofgrammarknowledgebase,andin-depthstudyofsentenceFrenchmeaning.

Keywords:Artificialintelligence;naturallanguageprocessing;operationticket

1引言

電力生產過程中經常要進行電氣操作。由于電力系統開關操作失誤,嚴重的人身和設備事故時有發生。如何讓自然語言處理技術與操作票結合,讓操作員方便快捷的開出合規的操作票,就是電力行業一個急需解決的問題。

語義維度是基于自然語言處理(NLP)的句子研究的出發點和重點,是指導句子研究的語義維度。從語義維度構建句子研究框架,從語義維度對句子類型進行分類,形成句子語義類型體系。本文的研究內容包括,一個完整的語法分析操作票信息,還有通過語料庫的處理,提取規則,提取的語法規則和邏輯分析,最后還有基于代數理論實現語義和語篇結構分析,建立中文文本規則匹配工具,包括現代漢語語料庫加工和探索漢語語法的實際模型理論方法和工具。基于構詞的中文分詞方法,分詞用于操作票指令,然后,通過詞性標注部分詞性標注對分詞結果進行標記。最后,根據操作票的語法規則,實現操作票動作、對象和狀態的提取。該方法不僅消除了常規提取所需的大量人工配置工作,而且提高了效率。

2實現方法

  1. 中文分詞

中文分詞的結果是識別和提取的基礎操作票的內容,中文分詞的目標是提高操作票文本分詞的準確性,特別是沒有用的詞語(沒有加入單詞列表的詞),要把其徹底的剔除。

在采用基于詞表的分詞算法時,如正向最大匹配法和n-最短路徑法,最大的問題之一是沒有加入詞典的詞的分詞存在固有的缺陷。一般的解決方案是添加一個沒有加入詞典的詞模塊來處理沒有加入詞典的詞的分割。在中文分詞中,沒有加入詞典的詞的分詞錯誤嚴重影響了整個分詞的查全率。基于構詞的漢語分詞算法將漢語分詞轉化為漢語單詞序列標記,較好地解決了沒有加入詞典的詞的處理問題。根據單詞在單詞中的位置,將單詞的單詞位類別分為四種:單字(S)、單詞前綴(B)、單詞中間(M)和單詞結尾(E)。

  1. 句法分析

句法分析是在給定的語法基礎上,自動識別句子中所包含的句法單位及其相互之間的關系。語法分析工具利用語法符號語言將系統獲取的中文文本轉化為符號語言表達式。利用符號句和中文文本句構成二部圖模型,構成符號句。推理機的工作包括兩個方面:一是確定語言的語法體系,即在操作指令語言中正式定義句子的語法結構;另一方面,句法分析意味著一個句子的語法結構可以自動地從一個給定的語法系統中派生出來,并且可以分析一個句子中所包含的句法單位和這些句法單位之間的關系。基于語料庫的句法分析,是基于語料庫提供的數據資源來分析漢語或英語句子并生成報告的過程。句法分析包括句法功能分析和句法結構分析。語法知識庫的設計采用馮志偉的中文信息MMT模型來構建一本語法詞典。使用初級標準現代漢語語料庫中各語言塊的自動分析結果作為數據集。然后再對對語料庫中的所有句子進行分析和統計分析。

本文構建了一個基于MMT中文信息模型的語法知識庫規則詞典。多分支結構用于描述語法規則。它是一個基于規則的自底向上的集成算法。多標記識別,如漢字的170個部分可分為12類。根據這個分類系統,可以在歸一化的過程中進行分析。相同和不同的漢語構詞理論和實證數據。作為漢字的標記,可分為語音標記、語義標記、、漢字分類標記等。利用漢語信息的MMT模型、多樹語法詞典和帶有部分語音標記的分詞詞典對語料庫文本進行自動分析。

句法分析結果可分為兩組:1)成功組。2)分析故障塊集合。處理部分需要人工檢查,根據系統給出的分析,添加足夠的詞典或語法規則,直到所有的句子、段落或章節自動分析。根據句法規則,我們用遞歸的方法替換句子,得到句子的句法結構。該系統將現代漢語的具體詞匯轉化為語法和短語符號,實現漢語句子復雜特征集的操作。運用符號學理論構建語法符號學句子。本文的核心和關鍵技術是語法符號和句子的遞歸分析的融合操作。

  1. 詞性標注

語音標注部分的輸入為漢語分詞后的操作票文本的輸出,輸出為相應的語音部分。語音部分標注基于HMM實現,中文分詞結果對應于觀測序列(一個詞對應一個觀測值,一個文本對應一個觀測序列),語音序列部分對應于狀態序列。以“合上#5機380V脫硫工作PC端電源6275開關”為例,觀測序列為{合上,#5機,380V,脫硫工作,PC端電源,6257開關},其相應的狀態序列是詞性{動詞、名詞、名詞、名詞、名詞、名詞}的一部分。其狀態空間模型是{s1、s2、s3、s4 ,s5,s6} = { v,n,n,n,n},n,n}},并觀察空間{o1、o2……是所有單詞的非重復集合。這樣就對所有的操作指令進行標注。

  1. 模型訓練

該技術需要使用訓練語料庫對中文分詞和詞性標注兩種模式進行訓練,使用具有代表性的訓練語料庫有助于提高模型的效果。利用收集到的操作票指令數據組成的訓練數據,訓練基于HMM的漢語分詞模型。按照規則的訓練數據進行處理,為后一個詞詞位序列根據詞性標注一節中描述的參數估計方法,遍歷行語句,訓練語料庫統計獲得第一個),每個詞的頻率連續的詞語轉換數,每個單詞對應的詞性,每個單詞的次數歸一化得到π初始狀態矩陣,狀態轉移矩陣和狀態觀測矩陣。遍歷每一行后訓練語料庫,使用相鄰詞的轉換數量,和相應數量每個詞性的出現次數獲得的統計數據,然后就形成初始狀態矩陣,狀態轉移矩陣和狀態觀測矩陣。最后訓練出操作票指令專用的分詞和詞性模型。

  1. 內容提取

結合中文分詞的狀態序列和部分詞性標注,分析了操作票文本的語法語義模型,所有的操作票語句都可以抽象為“動作+設備+初始狀態+最終狀態”的形式。

  1. 智能生成

建立事實和知識規則庫,應用ES推理機制,推理形成實際操作票。該機制由數據庫、知識庫和推理機三部分組成。其中,電站和變電站的主要接線形式及相關設備存儲在數據庫中,與電氣名稱、事實陳述和推理過程中的中間結果有關。將電氣操作的知識規則存儲在知識庫中,利用元規則系統對這些規則進行約束、補充、選擇和控制。在推理機制中,利用MMT訓練模型實現自動匹配和回溯的推理控制機制,在知識庫中搜索與目標任務匹配的規則,最終解決問題。

3關鍵技術點

本文開發的操作票系統在保證系統可靠性的基礎上,具有開放性、通用性、靈活性和實用性的基礎上,綜合分析國內外現有的操作票系統,結合實地調查收集用戶需求,提出使用面向對象的、跨平臺的編程技術相結合的理論專家系統,開發一套具有良好的開放性、通用性、靈活性和實用性的智能操作票專家系統的設計思想和設計一套全面和有效的解決方案。

由于操作票的生成過程是一個需要大量知識和經驗推理的過程,很難建立精確的數學模型,因此傳統的數學分析方法顯然不適合該系統。專家系統是一種弱解方法,適用于解決經驗問題和邏輯問題。因此,本文從機器學習和自然語言處理的角度出發,機器可以學習理解操作票指令的相關內容,然后將理解結果訓練成模型,提供操作票的內容提取和智能生成。

4結論

智能性:利用專家系統理論,建立自動開票模型和錯誤檢查模型。本系統具有智能開票和糾錯功能。系統還可以智能識別各種線路和設備的各種運行狀態。

通用性:本文根據總體思路設計了專家數據庫。該系統通過提供用戶友好的維護工具和增加專家數據庫的知識,可以滿足用戶的開票要求。此外,還使用跨平臺編程工具來開發具有跨平臺執行能力的系統。

可靠性:本系統根據電網實時運行參數,通過專家知識的推理,完成開票流程,操作票準確性高。同時,系統具有綜合糾錯能力,提供操作票預覽功能,進一步保證了系統的可靠性。本系統具有用戶權限管理功能,保證系統不越權操作。

實用性:本系統采用時下流行的IONIC工具包開發用戶界面,界面簡潔美觀;充分考慮用戶的操作習慣等因素,設計操作簡單方便。系統提供了大量的用戶設置,提高了系統的可用性。

該技術提高了效率,具有通用性,可直接應用于不同的變電站。此外,該技術具有機器學習方法的共同優勢,通過對訓練數據的整理,提高模型的效果,具有實用性和可靠性。

參考文獻

[1]宗成慶.中文信息處理研究現狀分析[J].語言戰略研究,2016,1(6):19-26.

[2]楊福義.基于雙語平行語料庫的術語自動抽取[J].中國科技術語,2018(2):13.

[3]馮志偉.自然語言計算機形式分析的理論與方法[M].合肥:中國科技大學出版社,2017:819-820.

[4]鄭志恒.智能信息處理-漢語語料庫加工技術[M].北京:科學技術出版社,2010:168.

[5]曹倩,趙一鳴.知識圖譜的技術實現流程及相關應用[J].情報理論與實踐,2015,38(12):13-18.

[6]鄧莉瓊,張貴新,郝向寧.基于知識圖譜的圖像語義分析技術及應用研究[J].計算機科學與應用,2018,8(9):1364-1371.

[7]李躍鵬,金翠,及俊川.基于Word2vec的關鍵詞提取算法[J].科研信息化技術與應用,2015,6(4):54-59.

[8]Wang,Z.,Kuan,K.Ravaut,M.,etal.(2017)TrulyMulti-ModalYoutube-8MVideoClassificationwithVideo,Audio,andText.ComputerScience,arxivpreprintarxiv2017:1706.05461.

[9]鄧莉瓊,吳吉祥,張麗.從視頻到語義:基于知識圖譜的視頻語義分析技術[J].計算機科學與應用,2019,9(8):1584-1590.

猜你喜歡
語義單詞規則
撐竿跳規則的制定
數獨的規則和演變
語言與語義
單詞連一連
看圖填單詞
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
最難的單詞
主站蜘蛛池模板: 欧美成人午夜视频| 国产爽爽视频| 婷婷中文在线| 亚洲成年人片| 人妻丰满熟妇αv无码| 九九久久精品免费观看| 亚洲精品波多野结衣| 欧美第一页在线| 欧美一级夜夜爽| 亚洲欧美日韩中文字幕在线| 五月丁香伊人啪啪手机免费观看| 中文字幕在线免费看| 伊人久久大线影院首页| 一级全黄毛片| 日本三级欧美三级| 天堂中文在线资源| 亚洲日韩高清在线亚洲专区| 热re99久久精品国99热| 在线欧美日韩| 九九热免费在线视频| 欧洲亚洲一区| 国产成人综合久久精品下载| 色成人综合| 国产福利不卡视频| 成人在线视频一区| 色婷婷在线影院| 一区二区在线视频免费观看| 无码高清专区| 91无码人妻精品一区二区蜜桃| 又爽又大又光又色的午夜视频| 日韩欧美国产三级| 综1合AV在线播放| 一级毛片基地| 99免费视频观看| 国产男人的天堂| 老色鬼欧美精品| 国产精欧美一区二区三区| 热思思久久免费视频| 国产精品毛片一区视频播| 欧美色99| 欧美色伊人| AV在线天堂进入| 992Tv视频国产精品| 亚洲天堂网2014| 成人福利在线视频免费观看| 亚洲福利一区二区三区| 亚洲精品波多野结衣| 精品国产成人a在线观看| 国产午夜无码专区喷水| 久久精品波多野结衣| 日韩黄色在线| 国产高清无码麻豆精品| 一本大道无码高清| 久久久久无码国产精品不卡| A级毛片无码久久精品免费| 国产AV毛片| 国产视频入口| 国产成人综合久久精品尤物| 亚洲 欧美 日韩综合一区| 91视频首页| 夜夜高潮夜夜爽国产伦精品| 2020精品极品国产色在线观看 | 欧美精品黑人粗大| 九色在线视频导航91| 波多野结衣在线一区二区| 亚洲精品大秀视频| 一级做a爰片久久毛片毛片| 欧美特级AAAAAA视频免费观看| 国产在线第二页| 欧美日韩91| 五月综合色婷婷| 国产日韩丝袜一二三区| 国产精品欧美激情| 伊人色在线视频| 91成人免费观看| 亚洲中文字幕无码爆乳| 伊人色在线视频| 亚洲成aⅴ人片在线影院八| 美女黄网十八禁免费看| 国产粉嫩粉嫩的18在线播放91| 国产二级毛片| 亚洲人成电影在线播放|