999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于綜合語義相似度的化工信息檢索方法

2025-07-24 00:00:00李玉芬劉傳銀
粘接 2025年7期
關鍵詞:信息檢索蝙蝠計算結果

中圖分類號:TQ011;G252 文獻標志碼:A 文章編號:1001-5922(2025)07-0121-04

Abstract:To improve theaccuracyof chemical informationretrieval,acomprehensivesemantic similarityretrieval method was proposed.A comprehensive semantic similarity calculation model was constructed by combining string semantic similarity,node semantic distance similarity,and neighboring nodesimilarity.To determine the weightsof diffrent semantic similarities,a generalized regression neural network(GRNN)optimized bythebat algorithm was used to train and alocate weight values.The comprehensive semantic similarity formula was used to retrieve semanticsinthe fieldof chemical engineering.Theresults indicatethatthesemanticretrieval resultsofchemical information obtained bythe proposed method are close to the expert rating results,with an average Pearson corelation coefficient value ofO.94.Compared to the comparison method,the calculation results of this method are more similar to the expert rating results.

Keywords:comprehensive semanticsimilarity;chemical information;semanticretrieval;bat algorithm;GRNN network

信息檢索是利用標準化知識表達對歷史數據進行復用,為安全分析提供有效信息的重要途徑。目前,化工信息檢索主要依賴于專家評分,這種方式存在時間成本高和主觀性強的問題。近年來,隨著語義相似度計算在智能信息檢索中的發展,為化工信息語義檢索提供了參考。徐捷等通過提取文本信息特征,并使用雙向長短期記憶網絡計算前后語義相似度,實現了長文本語義快速檢索[1]。譚永濱等通過引入詞頻-逆向文件頻率對語義相似度進行動態加權計算,提高了地理要素類別的語義檢索效率,可有效區分不同地理要素類別[2]。于潤羽等通過采用實體識別和關鍵詞抽取獲取科技學術會議信息關鍵詞,并采用雙向編碼器表示網絡進行分析,提高了語義相似度計算精度,為實現科技學術會議語義檢索奠定了基礎[3]。關慧等基于相異性語義相似度計算模型,提高了語義相似度計算精度,并將其應用于化工領域語義檢索,有效提升了化工領域語義檢索精度[4]。基于此,計算語義相似度是實現語義檢索的主要途徑,但其檢索精度還有待提升,其原因是以上方法依賴于單一字符串語義相似度計算或節點語義距離相似度計算,由此可能導致包含的語義信息不夠豐富,從而影響語義檢索精度。為解決該問題,實現更準確的化工信息檢索,結合字符串語義相似度、節點語義距離相似度、鄰節點相似度,提出一種基于綜合語義相似度計算的化工信息檢索方法。

1綜合語義相似度計算

假設存在概念對 A 和 B ,則 A 和 B 的綜合語義相似度計算包括字符串相似度計算、節點語義距離相似度計算、鄰節點相似度計算3個部分,可用式(1)表示[56]:

simAB=γsimD+αsimN+βsimP

式中: simAB 為綜合語義相似度計算結果; simD 為字符串相似度計算結果,可通過式(2)計算; simN 為節點語義相似度計算結果,可通過式(3)計算; simP 為鄰節點相似度計算結果,可通過式(4)計算; 為權重。

式中: EDA,B 為 A 中 i 個字符與 B 中前 j 個字符的距離; max(LA,LB) 表示 A 到 B 的編輯距離最大值;dis(A,B) 為 A 和 B2 2個概念對節點到第1個共同父節點的長度之和; k 為公共對象屬性個數; Nι 為第 l 個公共對象屬性出現次數; N(A∪B) 為 A 和 B 中鄰節點總數;i √ 分別為概念對 A 和 B 中鄰節點。

2基于綜合語義相似度計算優化的化工信息檢索方法

2.1綜合語義相似度計算優化

根據式(1)的計算結果,可確定2個不同概念對的綜合語義相似度,然后選擇綜合語義相似度高的化工領域概念對作為檢索結果,即可實現準確的化工信息檢索。但由于式(1)中權重 通常根據人工經驗進行設定,存在主觀意識賦值,進而可能影響化工信息檢索準確性。為解決該問題,本文采用GRNN網絡對權重 γ,α,β 進行訓練,以確定 γ 、α,β 的最優賦值,提升化工信息檢索準確性。

GRNN網絡是一種基于徑向基函數的神經網絡,具有非線性映射能力和計算量小等特點,可實現權重快速訓練[7-8]。因此,本文選用GRNN網絡對綜合語義相似度中的權重γ、α、β進行訓練。但由于GRNN網絡中的超參數高斯核函數寬度8對網絡性能具有重要影響,因此首先采用具有優異尋優精度的蝙蝠算法對δ值進行確定,以提升GRNN網絡性能,實現GRNN 網絡改進[9-10]。采用蝙蝠算法改進GRNN網絡的步驟如下:

(1)初始化蝙蝠算法種群規模、蝙蝠位置和脈沖頻率等參數,并設定目標函數值;

(2)計算每個蝙蝠的適應度值,并根據當前最優解更新蝙蝠脈沖頻率、速度、位置;

(3)生成隨機數,并對最優解進行隨機擾動,產生新解;

(4)再次計算所有蝙蝠適應度值,并根據適應度值對所有蝙蝠進行排序;

(5)選擇當前最優解,當達到終止條件時,結束算法,輸出結果。該結果對應GRNN網絡的最佳8值。

基于蝙蝠算法改進的GRNN網絡,對綜合語義相似度計算的權重 γ,α,β 進行訓練,確定 γ,α,β 的最優賦值,可更準確地進行綜合語義相似度計算,實現綜合語義相似度計算優化。

2.2基于綜合相似度優化的化工信息檢索流程

基于蝙蝠算法改進的GRNN網絡,對綜合語義相似度計算的權重 γ,α,β 進行訓練,確定 γ,α,β 的最優賦值,進行綜合語義相似度計算;然后根據更準確的化工信息進行檢索。具體操作步驟如下:

(1)獲取化工領域危險與可操作性分析報告,并采用中文命名實體提取關鍵信息,并添加到本體節點樹中,構成概念對數據集,劃分為訓練集和測試集兩部分;

(2)從數據集中任意選取一概念對,分別根據式(2)~式(4),對概念對的字符串相似度計算、節點語義距離相似度計算、鄰節點相似度計算;

(3)重復步驟(2)直至概念對數據集中所有概念對的相似度計算完畢;

(4)利用訓練集對蝙蝠算法改進的GRNN網絡進行訓練,獲取 值;

(5)根據 γ,α,β 值計算概念對的綜合語義相似度,并利用測試集進行測試,輸出結果。

3 仿真實驗

3.1 實驗環境搭建

為驗證本方法的有效性,基于Python和Java軟件進行編程,采用Pycharm和Eclipse軟件進行開發,采用OWL和Eclipse對進行描述,并在Win-dowsl0操作系統上運行。系統硬件環境為:Intel(R)Xeon(R) Gold6152 CPU,NVIDIA Tesla P40顯卡,24GB 顯存,256GB內存。

3.2 數據來源及預處理

本次實驗數據來自自主收集的某化工企業石油合成裝置的危險與可操作性分析報告。首先利用中文命名實體識別提取危險與可操作性分析報告中的關鍵信息,然后將關鍵信息個體添加到本體節點樹中,共獲取1200對概念。最后,任意選取960對概念作為訓練集,剩余240對概念作為測試集。

3.3 評價指標

為評估本方法的應用效果,采用皮爾遜相關系數進行評估。具體操作步驟:首先讓5位專家對實驗數據中的概念進行評分,然后取5位專家評分(0\~10分)的平均值作為專家評分結果,最后計算專家評分結果與本方法計算結果的相關性,以評估本方法的有效性。

皮爾遜相關系數 ρ 的計算方法:

式中: X,Y 為采用本方法計算的2個不同概念對得分; 為2個不同概念對的專家評分結果均值。皮爾遜相關系數的值越大,表明相似度越高,本方法在中的效果越好[11-12] 。

3.4參數設置

設蝙蝠算法的初始種群規模為50,迭代次數為200,最大脈沖音量和最大脈沖率分別為0.8和0.5,音量衰減系數和搜索頻率增強系數為0.5,初始搜索脈沖范圍為0~5,交叉概率和變異概率分別為0.5和0.02[13] 。

權重搜索范圍均為[0,1],蝙蝠算法改進GRNN網絡求解的 值分別為0.28、0.31、0.41;人工設定的 值分別為 0.3、0.3、0.4 。

3.5 結果與分析

3.5.1 GRNN網絡改進驗證

由圖1可知,采用蝙蝠算法改進的GRNN網絡可更快速達到最優適應度值 1.08×10-2 ,表現出更優異的性能,證明了本研究所采用蝙蝠算法改進GRNN網絡的有效性。

3.5.2 綜合相似度計算優化驗證

表1為改進GRNN網絡優化前后,綜合相似度權重 γ,α,β 在訓練數據集上的計算結果與專家評分結果示例。

表1改進GRNN網絡在測試數據集上的計算結果與專家評分結果

由表1可知,改進GRNN網絡優化的綜合語義相似度計算結果與專家評分結果更接近,當概念A和概念B語義相近時,改進GRNN網絡和專家評分結果數值較高;當概念A和概念B語義差異明顯時,改進GRNN網絡和專家評分結果數值較低,與實際結果一致。由此說明,改進GRNN網絡優化的綜合語義相似度,在化工信息檢索中具有效性。

為直觀反映改進GRNN網絡優化前后,綜合語義相似度計算方法效果,基于訓練數據集,統計了優化前后綜合語義相似度計算結果與專家評分結果,具體結果如圖2所示。

由圖2可知,在訓練數據集上,改進GRNN網絡優化后的綜合語義相似度計算結果與專家評分結果變化趨勢一致,且數值更接近;而未優化的綜合語義相似度計算結果與專家評分結果在某些變化趨勢上存在差異。由此說明,采用改進GRNN網絡優化綜合語義相似度計算方法,提高了方法評分結果的準確性,證明了采用改進GRNN網絡優化綜合語義相似度計算方法的正確性和有效性。

3.5.3 化工信息檢索驗證

為分析改進GRNN網絡優化的綜合語義相似度在化工信息檢索中的有效性,統計了改進GRNN網絡優化的綜合語義相似度,在測試數據集上的計算結果與專家評分結果的皮爾遜相關系數,結果如圖3所示。

圖3 皮爾遜相關系數Fig.3 Pearson correlation

由圖3可知,改進GRNN網絡的計算結果與專家評分結果的皮爾遜相關系數大于0.8,具有較高的相似度,說明改進GRNN網絡與專家評分結果一致性較高,可實現化工信息檢索。

為進一步驗證采用改進GRNN網絡優化的綜合語義相似度,在化工信息檢索中的有效性,對比了本方法與文獻[14]和文獻[15]在測試數據集上的計算結果與專家評分結果的皮爾遜相關系數,結果如圖4所示。

圖4不同網絡的皮爾遜相關系數 Fig.4 Pearson correlationcoefficientsofdifferentnetworks

由圖4可知,本方法采用改進GRNN網絡優化的綜合語義相似度計算結果與專家評分結果的皮爾遜相關系數最高,平均皮爾遜相關系數值為0.94;而對比方法的計算結果與專家評分結果的皮爾遜相關系數均低于0.80,說明本方法與專家經驗的檢索的化工安全領域語義結果基本相同,更能實現準確的化工信息檢索。究其原因,本方法采用蝙蝠算法改進的GRNN網絡,求解綜合語義相似度中字符串語義、節點語義距離和相鄰節點相似度的權重,提高了綜合語義相似度計算精度,更豐富的化工領域語義信息,從而使化工信息檢索結果更準確。

4結語

綜上,基于綜合語義相似度計算優化的化工信息檢索方法,通過采用蝙蝠算法改進的GRNN網絡對綜合語義相似度計算方法進行優化,并利用優化后的綜合語義相似度計算方法對化工安全領域語義進行檢索,提高了化工信息檢索的準確性。從實驗結果來看,本方法計算的化工安全領域語義相似度與專家評分結果接近,平均皮爾遜相關系數為0.94,相較于對比方法具有更準確的各要素權重,實現綜合語義相似度計算優化,提高了化工信息檢索精度,為化工領域重用歷史數據,輔助化工數據分析提供了參考。但由于條件限制,本文數據來自危險與可操作性分析報告,而實際化工領域數據量較大,且涉及復雜的化工數據分析,因此,在實際應用中本方法還存在一定的局限性。未來將嘗試結合更多化工領域數據以及化工安全分析現狀,對本方法進行優化,以進一步提升化工信息檢索精度及實用性。

【參考文獻】

[1]徐捷,邵玉斌,杜慶治,等.結合混合特征提取與深度學習的長文本語義相似度計算[J].計算機工程與科學,2024,46(8):1513-1520.

[2]譚永濱,高玲玲,李霖,等.地理要素類別語義相似度動態加權計算方法[J].測繪學報,2023,52(5):843-851.

[3]于潤羽,李雅文,李昂.融合領域特征的科技學術會議語義相似性計算方法[J].智能系統學報,2022,17(4):737-743.

[4]關慧,馬天宇,王廣偉.相異性在語義相似度計算中的應用[J].沈陽化工大學學報,2022,36(2):167-179.

[5]李彬蕙.基于貝葉斯網絡的航空化工材料信息快速檢索方法[J].粘接,2024,51(3):61-64.

[6]馬智勤,廖雪花,鄧威,等.基于分布式ElasticSearch相似內容比對算法研究[J」.計算機與數字工程,2020,48(12):2843-2849.

[7]李靜,張媛,張瑩,等.基于GA-GRNN算法和顯微拉曼光譜的城市河流微塑料識別方法研究[J」.光散射學報,2025,37(1):69-76.

[8]張偉榮,陳學庚,齊江濤,等.基于IPO-VMD-GRNN的田間四足機器人摔倒狀態預測方法[J].農業機械學報,2025,56(2):175-186.

[9]黎峻宇,姚宜斌,劉立龍,等.基于多源數據和廣義回歸神經網絡的ZWD預報模型[J].測繪學報,2023,52(9):1492-1503.

[10]任志玲,王梓行.基于廣義回歸神經網絡的煤礦帶式輸送機模型預測控制[J].遼寧工程技術大學學報(自然科學版),2023,42(1):92-98.

[11]孟靜,胡勇.基于WOA-GRNN的球磨機負荷參數預測研究[J].信息技術與信息化,2025,(2):87-90.

[12]謝曉東,柳月,李孟偉,等.基于廣義回歸神經網絡的裂紋擴展定量監測模型研究[J].兵器裝備工程學報,2025,46(1):197-203.

[13]翟羽婷,王欣,白蕾.基于改進蝙蝠算法的無線傳感器網絡動態任務調度[J].傳感技術學報,2024,37(4):704-708.

[14]韓程程,李磊,劉婷婷,等.語義文本相似度計算方法[J].華東師范大學學報(自然科學版),2020,(5):95-112.

[15]蘇志勇,朱藝媛,陳偉,等.數據業務語義自動識別模型的構建與應用[J].粘接,2025,52(1):145-148.

猜你喜歡
信息檢索蝙蝠計算結果
這些動物都是捕蚊高手
基于改進Kriging模型的大跨度鋼管混凝土拱橋可靠度分析
神奇的超聲波世界
哈哈畫報(2025年4期)2025-08-24 00:00:00
不同長徑比下圓柱套筒的破片初速軸向分布
爆炸與沖擊(2025年8期)2025-08-19 00:00:00
幽深洞穴
弧齒錐齒輪彎曲強度ISO計算標準與有限元分析
機械強度(2025年7期)2025-07-28 00:00:00
涵道螺旋槳氣動特性數值模擬研究
無人機(2025年4期)2025-07-21 00:00:00
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經網絡的個性化信息檢索模型研究
教學型大學《信息檢索》公選課的設計與實施
河南科技(2014年11期)2014-02-27 14:10:19
主站蜘蛛池模板: 91美女视频在线观看| 国产色婷婷| 国产主播喷水| 国产成人做受免费视频| 久久久久久国产精品mv| 国产国语一级毛片在线视频| 日韩第一页在线| 亚洲精品黄| 亚洲欧美日韩动漫| 亚洲黄色高清| 99国产精品国产高清一区二区| 国产欧美在线观看视频| 亚洲综合天堂网| 国产精品亚洲日韩AⅤ在线观看| 亚洲成人免费看| 国产99视频精品免费观看9e| 亚洲天堂区| av免费在线观看美女叉开腿| www.亚洲一区二区三区| 无码专区国产精品第一页| 亚洲va视频| 亚洲国产高清精品线久久| 免费播放毛片| 97se综合| 欧美日韩中文字幕二区三区| 中文字幕 欧美日韩| 亚洲黄色成人| 国模视频一区二区| 99精品视频九九精品| 国产成人免费| 久久婷婷六月| 国产国产人成免费视频77777| 久久综合伊人77777| 欧洲高清无码在线| 人妻丰满熟妇av五码区| 亚洲日韩每日更新| 五月婷婷精品| 99视频在线免费| 国产日韩欧美中文| 欧美成人手机在线观看网址| 日韩高清无码免费| 热思思久久免费视频| 国产精品美女网站| 伊人久久婷婷| 超碰精品无码一区二区| 麻豆精品在线视频| 色爽网免费视频| 国产女人综合久久精品视| 最新国产网站| 一区二区午夜| 永久免费无码成人网站| 国产精品无码作爱| 在线观看欧美精品二区| 日韩成人在线一区二区| 欧美精品啪啪一区二区三区| 国产在线视频欧美亚综合| 国产va在线观看| 国产在线视频导航| 国产主播福利在线观看| 2021天堂在线亚洲精品专区| 熟妇丰满人妻av无码区| 国产欧美日本在线观看| 99热这里只有免费国产精品| 精品无码国产一区二区三区AV| 日本一区二区不卡视频| 波多野吉衣一区二区三区av| 伊人成人在线| 狠狠色狠狠综合久久| vvvv98国产成人综合青青| 男女精品视频| 国产剧情一区二区| 欧美区在线播放| 黄色片中文字幕| 无码丝袜人妻| 亚洲一区二区黄色| 亚洲视频免费播放| 91九色视频网| 亚洲欧美不卡视频| 2021国产精品自产拍在线观看 | 国产精品性| 69视频国产| 国产青榴视频在线观看网站|