999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義理解和AI 的電力設備信息檢索方法

2022-11-18 14:01:30余少鋒廖崇陽
電子設計工程 2022年22期
關鍵詞:信息檢索電力設備語義

佘 俊,羅 勇,余少鋒,廖崇陽

(1.南方電網公司調峰調頻發電有限公司信息通信分公司,廣東廣州 511442;2.南方電網公司調峰調頻發電有限公司西部檢修試驗分公司,貴州興義 562400)

在現代智能電力系統中,電力數據結構復雜、類型多、存儲量大。電網大數據通常分為結構化和非結構化兩種,兩種不同結構的大數據在電網中有不同的應用價值[1]。在這種情況下,結構化數據可用于戰略制定和統計分析預測趨勢[2]。非結構化數據所占比例較大,因為其包含大量由“重要內容經常被記錄”所產生的文本數據,這些大容量、高價值密度的有用信息能夠提高企業的效率和收益[3]。對于電力企業來說,如何檢索這部分數據,將對企業的戰略部署和發展方向產生重大影響。因此,實時檢索獲取電力設備運行信息具有現實意義[4]。

在電力設備中,采用基于搜索引擎的信息檢索方法,常常會存在信息超載和詞匯不匹配的現象,使得用戶向搜索引擎提交的查詢語句往往不規范,給查詢過程造成困難。雖然基于語義相似性計算的電力設備信息檢索方法已經取得了很大的進展,但是仍然沒有從根本上提高檢索性能,對詞與詞之間的語義關系缺乏深入研究。同時,由于對語義關系的研究不受語境的限制,從而造成檢索詞的混亂。針對上述問題,該文提出了基于語義理解和AI 的電力設備信息檢索新方法。

1 信息檢索方法設計

1.1 電力設備信息特征提取技術

該研究通過提取文本特征剔除多余虛詞,然后借助分詞工具依次標注電力設備信息中的分詞與詞性[5]。使用詞頻加權方法分析文檔權重,其公式為:

式(1)中,tfik表示想要檢索的電力設備信息在檢索文檔中出現的次數;N表示電力設備信息文檔數量;nk表示電力設備信息全部文檔中出現想要檢索的電力設備信息的文檔數量[6]。

通常,詞組是構成文檔的關鍵部分,一篇文章中最頻繁出現的一組詞為中心主題,通常用TF 詞頻度來衡量類似文本的特點[7]。文字出現的頻率越低,說明文本分類識別的準確率越高。因此,利用文本頻率和詞頻度的乘積可以表示特征空間的測度值,再通過調整權重的方式突出關鍵字。

1.2 基于語義理解的電力設備信息處理技術

基于語義理解就是發現詞和符號所表達的“意義”,根據這一思想,語義理解也需要一個以句子意義作為最終理解和表達的形式符號系統,其描述公式為:

式(2)中,CE表示語句類的表達式;S表示語義塊;C表示描述對象;f()和g()表示約束函數[8-10]。

結合上述公式,設計基于語義理解的電力設備信息處理步驟,如圖1 所示。

如圖1 所示,處理語義信息時,虛線框中的句類假設和檢測、語義塊構成等作為處理環節,輸入自然語言語句,再輸出相應的句類表示和詞描述[11-12]。

具體處理步驟:在信息預處理之后,基于句子中懷疑詞所包含的概念對可能的句型作出假設,并基于所包含的概念性知識來判斷句子的類型?;诖耍谜Z義塊來判斷詞語,假定在處理過程中未能通過上述步驟,將導致追溯,此時需要再次進行“假設”和“探測”[13]。

1.3 查詢擴展技術

查詢擴展技術是語義檢索的關鍵技術,通過添加與原始查詢語言查詢語義相關的詞或概念,使查詢時間較原始查詢長,從而提高了文檔檢索效率、查全率和準確性[14]。通過對相關內容和用戶需求的比較,提取語義信息;對于知識庫中存在的詞組,使用語義詞典對語義進行擴展處理,并以表格形式展現給用戶,供用戶自行識別[15]。查詢字符串被擴展成搜索引擎查詢,查詢結果被聚類并呈現給用戶。查詢擴展流程如圖2 所示。

具體查詢擴展過程:首先應確定原始查詢串r;然后擴展查詢串R,經過分詞處理后,將原始查詢串r分解成n個檢索關鍵詞[16]。其中,關鍵詞語義相似度最為接近的同義詞數量為m1,m2,…,mn,將其擴展為r11,…,r1m1,r21,…r2m2,…,rn1…,rnmn詞組,并確定擴展查詢子串為k=m1×m2×…×mn+1 個;最終得到的各個查詢子串為:

結合式(3),可得到擴展后的查詢子串。

1.4 基于語義理解的AI檢索模型構建

基于上述內容,構建基于語義理解的AI 檢索模型,如圖3 所示。

由圖3 可知,該模型主要是由四個模塊組成的,如下所示:

1)預處理模塊

為便于后續的相似度計算,在用戶查詢之前采用分詞和刪除停用詞的預處理方式,將停用詞轉換成文件矢量形式。

2)語義關系分析模塊

通過預處理模塊搭建語義知識庫,使不同詞語形成語法依賴關系。語義概念空間是一種能將語言進行量化處理的空間,通過語義判斷能夠解決概念間隱含的數據結構問題。量化機制中的事態信息量級如表1 所示。

表1 事態信息量級

3)判別信息空間模塊

在選擇信息空間時,要根據三種不同的語言信息量,通過句法依賴圖進行判斷。

4)語境分析和查詢模塊

識別出信息空間后,對文檔數據庫中的各個數據進行匹配,使得數據可以對應于文檔,然后對文檔進行排序,并返回查詢結果。

2 實驗與分析

為了驗證基于語義理解和AI 的電力設備信息檢索方法的有效性,結合F 供電局供電情況進行實驗驗證分析。

2.1 F供電局概況

F 供電局是某供電公司直屬的企業,主要負責電力供應,目前供電客戶為300 多萬戶,在2020 年該供電局最高供應負荷可達到1 500 萬千瓦。截至到目前,F 供電局共有110 kV、220 kV、500 kV 輸電線路長4 500 km 左右,主變壓器為五百多臺。F 供電局主要電力設備如表2 所示。

表2 F供電局主要電力設備

2.2 電力設備信息集

從F 供電局的變壓器、斷路器、變電站和電源開關四種設備中提取電力設備信息,構成信息集,信息集中保留了電力設備共600 條信息。

2.3 實驗指標確定

1)信息查全率

設檢索出的變壓器、斷路器、變電站和電源開關四種設備電力設備信息為a,總信息量為c,信息查全率計算公式為:

由式(4)可知,總信息量c中除了檢索到的全部信息外,還包含歷史信息庫中的信息,信息查全率越高,說明從全部信息中檢索到的變壓器、斷路器、變電站和電源開關四種設備電力設備信息就越全面。

2)信息查準率

設檢索出的變壓器、斷路器、變電站和電源開關四種設備電力設備信息為a,其余信息量為b,由此計算信息查準率:

由式(5)可知,信息查準率越高,說明從全部信息中檢索到變壓器、斷路器、變電站和電源開關四種設備電力設備信息的精度就越高。

2.4 實驗結果與分析

2.4.1 信息查全率

結合表2 確定檢索到的總信息數量為7 544 條,分別使用基于搜索引擎的電力設備信息檢索方法、基于語義相似度計算的電力設備信息檢索方法和基于語義理解和AI 的電力設備信息檢索方法對信息查全率進行對比分析,結果如圖4 所示。

由圖4 可知,使用基于搜索引擎的檢索方法在前5 次計算過程中,信息查全率大于60%,在后4 次計算過程中,信息查全率大幅度下降,說明該計算過程受到了歷史信息庫中的信息影響;使用基于語義相似度計算的檢索方法在9 次計算過程中,信息查全率大于60%;使用基于語義理解和AI 的檢索方法在9 次計算過程中,信息查全率始終大于80%。

2.4.2 信息查準率

對比分析不同方法的信息查詢結果,如表3所示。

由表3可知,基于語義理解和AI的電力設備信息檢索方法的查準率接近100%,具有精準檢測結果。

表3 不同方法信息查詢結果對比分析

3 結束語

該文提出一種基于語義理解和AI 的電力設備信息檢索方法,有效提高了檢索查全率和查準率。

該方法的主要特點:相對于傳統檢索方法,基于語義理解擴展原始的關鍵字集合,得到新的關鍵字集合。此集合更適合于用戶希望表達的內容,因此使查詢更精確;該方法可以快速建立和優化索引,同時利用查詢擴展模塊對關鍵字集進行檢索,利用索引技術實現快速高效的檢索。

猜你喜歡
信息檢索電力設備語義
加強電力設備運維云平臺安全性管理
語言與語義
電力設備運維管理及安全運行探析
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
基于壓縮感知的電力設備視頻圖像去噪方法研究
基于神經網絡的個性化信息檢索模型研究
認知范疇模糊與語義模糊
基于改進Canny算子的電力設備圖像檢測研究
教學型大學《信息檢索》公選課的設計與實施
河南科技(2014年11期)2014-02-27 14:10:19
主站蜘蛛池模板: 欧美国产日产一区二区| 丝袜久久剧情精品国产| 中文字幕亚洲综久久2021| 中文无码影院| 99视频精品全国免费品| 亚洲色图欧美激情| 一级黄色网站在线免费看| 92精品国产自产在线观看| 欧美自慰一级看片免费| 日韩 欧美 国产 精品 综合| 欧美激情视频一区| 野花国产精品入口| 欧美成人影院亚洲综合图| 91在线一9|永久视频在线| 中文国产成人精品久久| 91精品亚洲| 特级aaaaaaaaa毛片免费视频| 亚洲欧洲国产成人综合不卡| 国产成熟女人性满足视频| 毛片免费试看| 伊人蕉久影院| 国产97色在线| 国产精品一区二区不卡的视频| 香蕉久人久人青草青草| 欧美精品一二三区| 精品视频第一页| 欧美在线综合视频| 91亚瑟视频| 亚洲精品无码久久毛片波多野吉| 中文国产成人久久精品小说| 91无码人妻精品一区| 久久午夜夜伦鲁鲁片无码免费| 国产凹凸一区在线观看视频| 国产在线视频自拍| 欧美在线中文字幕| 热久久这里是精品6免费观看| 亚洲欧洲一区二区三区| 亚洲欧美综合另类图片小说区| 久久99国产乱子伦精品免| 亚洲小视频网站| 欧美亚洲日韩中文| 青草精品视频| 啪啪免费视频一区二区| jijzzizz老师出水喷水喷出| 精品偷拍一区二区| 日韩a级毛片| 中文字幕在线永久在线视频2020| 国产成人调教在线视频| 综合五月天网| 中文无码精品A∨在线观看不卡| a级毛片毛片免费观看久潮| 国产黄网站在线观看| 精品国产中文一级毛片在线看| 亚洲欧美日韩中文字幕在线一区| 国产91成人| 男女性午夜福利网站| 中文字幕无码av专区久久 | 国产男人的天堂| 在线视频97| 欧美日本中文| 亚洲中久无码永久在线观看软件| 亚洲国产精品日韩av专区| 亚洲欧美日韩视频一区| 波多野衣结在线精品二区| 午夜精品久久久久久久无码软件| 免费高清a毛片| 亚洲性影院| 伊人成人在线视频| 麻豆国产在线观看一区二区| 亚洲天堂视频网| 日本午夜影院| 精品国产自在现线看久久| 综合网久久| 呦系列视频一区二区三区| 国产一级在线播放| 国产成人综合日韩精品无码首页| 亚洲精品在线观看91| 久久久精品无码一二三区| 婷婷综合色| 日韩午夜片| 日本人妻丰满熟妇区| 亚洲一区毛片|