999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于圖文多模態(tài)融合的文檔片段語(yǔ)義相似度判定算法

2024-02-27 12:16:54潘媛梁國(guó)迪邵馨葉李芹
電子設(shè)計(jì)工程 2024年3期
關(guān)鍵詞:語(yǔ)義模態(tài)文本

潘媛,梁國(guó)迪,邵馨葉,李芹

(云南電網(wǎng)有限責(zé)任公司信息中心,云南昆明 650214)

圖文多模態(tài)融合是在圖文融合機(jī)制基礎(chǔ)上發(fā)展起來(lái)的新型圖文混排信息標(biāo)注方法,能夠根據(jù)多模態(tài)特征的排列形式,將文本參量與圖片像素點(diǎn)結(jié)合起來(lái);并可以聯(lián)合自然語(yǔ)言、計(jì)算機(jī)視覺(jué)等多項(xiàng)應(yīng)用技術(shù),建立完整的圖文標(biāo)記向量集合,以供網(wǎng)絡(luò)主機(jī)的直接調(diào)取與利用[1-2]。由于圖片像素點(diǎn)的排列始終滿足統(tǒng)一性原則,所以在實(shí)施圖文多模態(tài)融合技術(shù)時(shí),要求文本參量與像素點(diǎn)信息之間的對(duì)應(yīng)性關(guān)系必須保持不變。

相似性文本是指信息權(quán)重部分相同的文本數(shù)據(jù)參量。在互聯(lián)網(wǎng)環(huán)境中,相似性文本存儲(chǔ)于同一數(shù)據(jù)庫(kù)主機(jī)中。由于文檔片段語(yǔ)義遷移行為的存在,如何保障網(wǎng)絡(luò)主機(jī)對(duì)于相似性文本的差異性賦值能力,成為一項(xiàng)亟待解決的應(yīng)用難題[3]。基于半監(jiān)督AP 聚類(lèi)的判定算法通過(guò)精準(zhǔn)定義文檔片段語(yǔ)義特征的方式,確定相似性文本參量之間的細(xì)微差異性,再聯(lián)合互聯(lián)網(wǎng)應(yīng)用主機(jī),完成對(duì)這些數(shù)據(jù)信息參量的按需判別[4]。然而,與此方法相關(guān)的差異性賦值指標(biāo)的均值水平相對(duì)較低,并不能完全保障網(wǎng)絡(luò)主機(jī)對(duì)于相似性文檔片段語(yǔ)義信息的準(zhǔn)確判別能力。為解決上述問(wèn)題,引入圖文多模態(tài)融合技術(shù),并以此為基礎(chǔ),設(shè)計(jì)一種新型的文檔片段語(yǔ)義相似度判定算法。

1 基于圖文多模態(tài)融合的文檔片段標(biāo)注

1.1 圖像區(qū)域檢測(cè)

圖像區(qū)域檢測(cè)決定了圖文多模態(tài)融合技術(shù)的實(shí)踐能力。對(duì)于既定文檔片段參量而言,圖像區(qū)域檢測(cè)指標(biāo)的取值結(jié)果越大,單一文檔片段的待檢長(zhǎng)度值越大。傾斜校正系數(shù)也叫圖像區(qū)域內(nèi)的傾斜校正指標(biāo),為避免局部偏差融合行為的出現(xiàn),在定義圖像區(qū)域的傾斜校正系數(shù)時(shí),應(yīng)同時(shí)考慮局部量差值在x軸、y軸、z軸方向上的數(shù)值分量[5-6]。設(shè)Gx表示圖像局部量差在x軸方向上的數(shù)值分量,Gy表示y軸方向上的數(shù)值分量,Gz表示z軸方向上的數(shù)值分量。聯(lián)立上述物理量,可將圖像檢測(cè)區(qū)域內(nèi)的傾斜校正指標(biāo)G表示為:

規(guī)定ax表示x軸方向上的圖像待檢系數(shù),ay表示y軸方向上的圖像待檢系數(shù),az表示z軸方向上的圖像待檢系數(shù),aˉ表示系數(shù)ax、ay與az的平均值,?表示圖像區(qū)域內(nèi)的文檔片段語(yǔ)義信息檢測(cè)特征。圖像區(qū)域檢測(cè)定義式為:

對(duì)于文檔片段語(yǔ)義信息參量而言,圖像區(qū)域檢測(cè)表達(dá)式?jīng)Q定了待檢數(shù)據(jù)信息的實(shí)際分布形式。

1.2 文本區(qū)域檢測(cè)

文本區(qū)域檢測(cè)決定了圖文多模態(tài)融合技術(shù)對(duì)于待匹配數(shù)據(jù)信息參量的處理能力[7]。在圖文多模態(tài)融合算法的認(rèn)知中,文本區(qū)域檢測(cè)表達(dá)式的定義必須以圖像區(qū)域檢測(cè)結(jié)果為基礎(chǔ),故而后者的定義數(shù)值越大,待檢測(cè)文本區(qū)域內(nèi)所包含的文檔片段語(yǔ)義信息參量也就越多[8]。設(shè)χ表示文檔片段語(yǔ)義信息的區(qū)分系數(shù),α表示語(yǔ)義參量識(shí)別指征,ΔK表示文檔片段語(yǔ)義信息的單位遷移量,A表示文檔片段語(yǔ)義信息的實(shí)時(shí)累積量。在上述物理量的支持下,聯(lián)立式(2),可將文本區(qū)域檢測(cè)條件定義為:

在實(shí)施相似性文檔片段語(yǔ)義信息參量判定處理的過(guò)程中,圖文多模態(tài)融合條件的建立必須同時(shí)參考圖像區(qū)域檢測(cè)表達(dá)式與文本區(qū)域檢測(cè)表達(dá)式。

1.3 詞袋模型

詞袋模型也叫文本信息檢索模型,在圖文多模態(tài)融合算法的作用下,單一詞袋模型中所包含的相似性文檔片段語(yǔ)義信息越多,系統(tǒng)主機(jī)所承擔(dān)的數(shù)據(jù)判別壓力也就越大。為實(shí)現(xiàn)對(duì)文檔片段語(yǔ)義相似度的準(zhǔn)確判定,在建立詞袋模型時(shí),要求圖像區(qū)域檢測(cè)表達(dá)式與文本區(qū)域檢測(cè)表達(dá)式應(yīng)同時(shí)取得最大或最小賦值結(jié)果[9-10]。設(shè)δ1、δ2表示兩個(gè)不相等的相似性文檔片段語(yǔ)義信息檢索系數(shù),f表示基于圖文多模態(tài)融合條件的語(yǔ)義信息檢測(cè)向量,β表示語(yǔ)義信息的相似性度量值,L表示圖文信息匹配特征。基于圖文多模態(tài)融合的相似性文檔片段語(yǔ)義信息詞袋模型表達(dá)式為:

若互聯(lián)網(wǎng)應(yīng)用主機(jī)的處理能力始終保持不變,在判定相似性文檔片段語(yǔ)義信息時(shí),應(yīng)對(duì)詞袋模型表達(dá)式進(jìn)行全局性取值。

2 文檔片段語(yǔ)義相似度判定算法設(shè)計(jì)

2.1 文本數(shù)據(jù)預(yù)處理

相似性文檔片段語(yǔ)義信息文本是大量關(guān)鍵詞數(shù)據(jù)按照?qǐng)D文多模態(tài)融合排列規(guī)則,所形成的關(guān)鍵詞序列條件。在實(shí)施信息操作指令前,應(yīng)對(duì)相似性文檔片段語(yǔ)義信息文本數(shù)據(jù)進(jìn)行初步預(yù)處理[11]。在制定判定指令的過(guò)程中,若相似性文檔片段語(yǔ)義信息為中文文本,則應(yīng)遵循完整性原則對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理;若相似性文檔片段語(yǔ)義信息為英文文本,則應(yīng)遵循時(shí)態(tài)變化規(guī)則對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理[12]。設(shè)p?基于圖文多模態(tài)融合的文本信息取值系數(shù),wmin表示已定義相似度文本的語(yǔ)義判別特征最小值,wmax表示語(yǔ)義判別特征最大值,φ表示相似度語(yǔ)義信息度量系數(shù),ε表示相似度文檔片段語(yǔ)義信息的初始賦值。在上述物理量的支持下,聯(lián)立式(4),可將相似度文檔片段語(yǔ)義信息文本數(shù)據(jù)的預(yù)處理表達(dá)式定義為:

在圖文多模態(tài)融合原則的作用下,文本數(shù)據(jù)預(yù)處理表達(dá)式可以同時(shí)影響關(guān)鍵詞權(quán)值指標(biāo)與相似性度量值的計(jì)算結(jié)果。

2.2 關(guān)鍵詞權(quán)值計(jì)算

關(guān)鍵詞權(quán)值計(jì)算是實(shí)現(xiàn)文檔片段語(yǔ)義相似度判定處理的關(guān)鍵執(zhí)行環(huán)節(jié),在已知文本數(shù)據(jù)預(yù)處理結(jié)果的前提下,關(guān)鍵詞權(quán)值指標(biāo)的物理取值越大,就表示互聯(lián)網(wǎng)主機(jī)對(duì)于相似度文檔片段語(yǔ)義信息的處理能力越強(qiáng)[13-14]。規(guī)定γ、ι表示兩個(gè)隨機(jī)選取的文檔片段語(yǔ)義信息敏感性度量值,且γ≠ι的不等式條件恒成立。設(shè)cγ表示基于度量值γ的語(yǔ)義信息相似度標(biāo)記參量,cι表示基于度量值ι的語(yǔ)義信息相似度標(biāo)記參量。相似度文檔片段語(yǔ)義信息關(guān)鍵詞權(quán)值計(jì)算表達(dá)式為:

式中,κγ表示基于度量值γ的語(yǔ)義信息判別權(quán)限量,κι表示基于度量值ι的語(yǔ)義信息判別權(quán)限量。在實(shí)際運(yùn)算過(guò)程中,要求κγ≠1、κι≠1、κγ≠κι的不等式條件同時(shí)成立。

2.3 相似性度量值

相似性度量值指標(biāo)決定了文檔片段語(yǔ)義信息之間的可替代關(guān)系。在圖文多模態(tài)融合技術(shù)的支持下,只有確保待檢信息參量之間的相似性度量指標(biāo)取值不完全相等,才可以實(shí)現(xiàn)對(duì)文檔片段語(yǔ)義信息的準(zhǔn)確判定[15-16]。設(shè)?表示可替代參量的一般性賦值條件,θ?表示文檔片段語(yǔ)義信息的向量殘差值,θ0表示向量殘差的初始賦值,?表示相似性指標(biāo)的初始賦值,b1、b2、…、bn表示n個(gè)不同的相似度文檔片段語(yǔ)義信息分類(lèi)指標(biāo)。聯(lián)立上述物理量,可將相似性度量值表達(dá)式定義為:

按照?qǐng)D文多模態(tài)融合技術(shù),對(duì)所求得數(shù)據(jù)參量指標(biāo)進(jìn)行處理,實(shí)現(xiàn)文檔片段語(yǔ)義相似度判定算法的順利應(yīng)用。

3 實(shí)例分析

為突出基于圖文多模態(tài)融合的文檔片段語(yǔ)義相似度判定算法的實(shí)用性價(jià)值,設(shè)計(jì)如下對(duì)比實(shí)驗(yàn)。首先,選擇型號(hào)為W4900os 的互聯(lián)網(wǎng)主機(jī)作為實(shí)驗(yàn)設(shè)備,通過(guò)人工調(diào)試的方式,使實(shí)驗(yàn)主機(jī)的各項(xiàng)指標(biāo)示數(shù)趨于穩(wěn)定。然后,利用基于圖文多模態(tài)融合的文檔片段語(yǔ)義相似度判定算法對(duì)實(shí)驗(yàn)主機(jī)進(jìn)行控制,將所得實(shí)驗(yàn)數(shù)據(jù)作為實(shí)驗(yàn)組變量。其次,利用基于半監(jiān)督AP 聚類(lèi)的判定算法對(duì)實(shí)驗(yàn)主機(jī)進(jìn)行控制,將所得實(shí)驗(yàn)數(shù)據(jù)作為對(duì)照組變量。最后,對(duì)比實(shí)驗(yàn)組、對(duì)照組變量指標(biāo),總結(jié)實(shí)驗(yàn)規(guī)律。圖1 為在實(shí)驗(yàn)組、對(duì)照組算法的作用下,互聯(lián)網(wǎng)主機(jī)對(duì)于相似性文檔片段語(yǔ)義信息的處理原則。

圖1 實(shí)驗(yàn)數(shù)據(jù)處理原則

選擇六種不同相似性文檔片段語(yǔ)義信息作為實(shí)驗(yàn)數(shù)據(jù),分別將其定義為“1 號(hào)文本”“2 號(hào)文本”“3 號(hào)文本”“4 號(hào)文本”“5 號(hào)文本”“6 號(hào)文本”。表1 給定了六種不同相似性文檔片段語(yǔ)義信息差異性指標(biāo)的初始取值。

表1 差異性指標(biāo)的初始賦值

分析表1 可知,相似性文檔片段語(yǔ)義信息差異性指標(biāo)賦值的最大值為1.21,與1 號(hào)文本相對(duì)應(yīng)。差異性指標(biāo)賦值的最小值為0.98,與6 號(hào)文本相對(duì)應(yīng),二者之間的指標(biāo)賦值差等于0.23。

在不超過(guò)差異性指標(biāo)初始賦值條件的情況下,所得實(shí)驗(yàn)數(shù)值越大,就表示網(wǎng)絡(luò)主機(jī)對(duì)于相似性文檔片段語(yǔ)義信息的準(zhǔn)確判別能力越強(qiáng)。表2 記錄了實(shí)驗(yàn)組、對(duì)照組相似性文檔片段語(yǔ)義信息差異性指標(biāo)的實(shí)驗(yàn)數(shù)值。

表2 差異性指標(biāo)的實(shí)驗(yàn)數(shù)值

利用表2 中的記錄數(shù)據(jù),計(jì)算實(shí)驗(yàn)組、對(duì)照組相似性文檔片段語(yǔ)義信息差異性指標(biāo)的平均值,具體記錄數(shù)值如圖2 所示。

圖2 差異性指標(biāo)平均值

分析圖2 可知,在整個(gè)實(shí)驗(yàn)過(guò)程中,實(shí)驗(yàn)組、對(duì)照組相似性文檔片段語(yǔ)義信息差異性指標(biāo)平均值都沒(méi)有超過(guò)差異性指標(biāo)的初始賦值。但明顯實(shí)驗(yàn)組指標(biāo)的平均值水平更高,實(shí)驗(yàn)組最大值為1.1,與1 號(hào)文本相對(duì)應(yīng),對(duì)照組最大值為0.9,與1 號(hào)文本、3 號(hào)文本相對(duì)應(yīng)。綜上可知,在圖文多模態(tài)融合技術(shù)的作用下,相似度文檔片段語(yǔ)義信息差異性賦值指標(biāo)的均值水平得到了明顯提升,對(duì)于網(wǎng)絡(luò)主機(jī)而言,其在準(zhǔn)確判別相似性文檔片段語(yǔ)義信息方面的應(yīng)用能力確實(shí)得到了有效保障。

4 結(jié)束語(yǔ)

新型文檔片段語(yǔ)義相似度判定算法在圖文多模態(tài)融合技術(shù)的作用下,通過(guò)建立詞袋模型的方式,對(duì)文本數(shù)據(jù)進(jìn)行初步處理,又根據(jù)關(guān)鍵詞權(quán)值計(jì)算結(jié)果,實(shí)現(xiàn)對(duì)相似性度量值指標(biāo)的按需統(tǒng)計(jì)。在實(shí)用性方面,隨著這種新型判定算法的應(yīng)用,差異性賦值指標(biāo)的最大值達(dá)到了1.10。且在整個(gè)實(shí)驗(yàn)過(guò)程中,賦值指標(biāo)均值始終沒(méi)有超過(guò)其初始賦值結(jié)果,在準(zhǔn)確判別相似性文檔片段語(yǔ)義信息方面具有較強(qiáng)的實(shí)用性價(jià)值。

猜你喜歡
語(yǔ)義模態(tài)文本
語(yǔ)言與語(yǔ)義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
國(guó)內(nèi)多模態(tài)教學(xué)研究回顧與展望
基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識(shí)別
認(rèn)知范疇模糊與語(yǔ)義模糊
由單個(gè)模態(tài)構(gòu)造對(duì)稱簡(jiǎn)支梁的抗彎剛度
如何快速走進(jìn)文本
主站蜘蛛池模板: 国产交换配偶在线视频| 免费国产一级 片内射老| 国产成人精彩在线视频50| 国产成年无码AⅤ片在线| www.亚洲一区二区三区| 999在线免费视频| 国产成人亚洲综合A∨在线播放| 国产精品久久久久久久伊一| 国产精品短篇二区| 在线欧美a| 在线观看免费国产| 欧美国产在线看| 国产精品白浆在线播放| 国产亚洲精品97AA片在线播放| 国产真实二区一区在线亚洲| 国产毛片高清一级国语| a国产精品| aⅴ免费在线观看| 亚洲日韩每日更新| 国内a级毛片| 日韩天堂网| 激情综合五月网| 青草娱乐极品免费视频| 亚洲国产日韩视频观看| 亚洲天堂视频在线观看| 国产在线一区视频| 国产成人精品在线1区| 91青青草视频在线观看的| 亚洲永久色| 国产精品不卡永久免费| 欧美精品在线看| 国产正在播放| 国产91丝袜| 色综合网址| 欧美午夜视频| 拍国产真实乱人偷精品| 97视频免费在线观看| 久草视频一区| 精品国产网| 人人爽人人爽人人片| 一区二区自拍| 国产精品无码AⅤ在线观看播放| 国产日韩精品欧美一区喷| 国产人人乐人人爱| 米奇精品一区二区三区| 婷婷亚洲最大| 国产在线八区| 国产精品无码一区二区桃花视频| 国产第四页| 91高清在线视频| 欧美精品在线视频观看| 国内嫩模私拍精品视频| 99久久精品国产自免费| 夜夜操狠狠操| 色悠久久综合| 国产精品主播| 亚洲最大综合网| 欧美色综合网站| 亚洲第一网站男人都懂| 99久久99视频| 91小视频版在线观看www| 中文字幕欧美日韩| 精品剧情v国产在线观看| 中美日韩在线网免费毛片视频 | 久久天天躁夜夜躁狠狠| 久久77777| 国产菊爆视频在线观看| www.亚洲一区| 人妻无码中文字幕第一区| 亚洲天堂色色人体| 亚洲欧美国产五月天综合| 亚洲性影院| 久久综合激情网| 欧美在线伊人| 九九九精品成人免费视频7| 久草性视频| 免费高清毛片| 久久久精品久久久久三级| 亚洲无线一二三四区男男| 精品亚洲国产成人AV| 爆乳熟妇一区二区三区| 亚洲精品片911|