999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TF-IDF 分類算法的電磁態(tài)勢情報分發(fā)

2022-10-24 13:38:34張明陽劉盼盼文申平
航天電子對抗 2022年4期
關(guān)鍵詞:用戶模型

張明陽,劉盼盼,文申平

(1.電子信息控制重點(diǎn)實驗室,四川 成都 610036;2.中國人民解放軍 91878 部隊,廣東 湛江 524000)

0 引言

隨著電子信息技術(shù)的飛速發(fā)展,各種電子偵察傳感器大量部署于沿海周邊、機(jī)艦平臺,使得戰(zhàn)場電磁態(tài)勢情報的感知手段空前豐富,同時由于電子對抗信息系統(tǒng)的多樣性和復(fù)雜性,戰(zhàn)場電磁態(tài)勢情報的信息量呈現(xiàn)爆炸式增長。一體化聯(lián)合作戰(zhàn)中,戰(zhàn)場電磁態(tài)勢的監(jiān)控和各類電子對抗行動都離不開來自陸海空天立體多維的電磁態(tài)勢情報保障。因此如何從海量的電磁態(tài)勢情報信息中,根據(jù)各類電磁態(tài)勢情報用戶的情報保障需求,進(jìn)行情報個性化推薦,實現(xiàn)“無電不戰(zhàn)、無電不勝”的目標(biāo),是未來戰(zhàn)場致勝的關(guān)鍵。

目前國內(nèi)外電磁態(tài)勢情報分發(fā)的主要方法是基于中心的順序匹配法,分為自動匹配分發(fā)和人工手動分發(fā)。自動匹配的策略比較粗放,一般是電磁情報處理中心設(shè)置策略,滿足策略要求的電磁態(tài)勢情報進(jìn)行自動分發(fā),不滿足要求的不發(fā)送,對特殊的電磁態(tài)勢情報可以進(jìn)行手動上報。該方法缺點(diǎn)比較明顯,主要體現(xiàn)在不主動采集情報用戶節(jié)點(diǎn)的數(shù)據(jù)要求,沒有分析各類情報用戶節(jié)點(diǎn)的保障要求,難以實現(xiàn)有效保障。本文提出基于詞頻-逆文件頻率(TF-IDF)分類算法的電磁態(tài)勢情報分發(fā)方法,實現(xiàn)電磁態(tài)勢情報的推薦分發(fā),滿足情報分發(fā)靈活性要求。

1 TF-IDF 分類算法

TF-IDF 分類算法是一種用于咨詢檢索與咨詢探勘的常用加權(quán)技術(shù)。TF-IDF 是一種統(tǒng)計方法,用以評估單個字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。也就是說一個詞語在一篇文章中出現(xiàn)次數(shù)越多,同時在所有文檔中出現(xiàn)次數(shù)越少,越能夠代表該文章。其基本思想是將文檔表示為1個空間向量,向量的每一維由文檔中的詞語i及其權(quán)重w組成,故相似內(nèi)容的文檔有相似的向量。每個詞語的權(quán)重w為:

式中,詞頻(i,)指詞語的頻率,表明詞語i出現(xiàn)在文檔中的次數(shù),以詞語在文檔中出現(xiàn)的頻率表明詞語的重要性,如詞語在文檔中出現(xiàn)次數(shù)越多則越重要;逆文檔頻率(i)指詞語出現(xiàn)在其他文檔的頻率,以此權(quán)衡詞語的重要性。當(dāng)詞語出現(xiàn)在其他許多文檔中時,則表明其代表性較低;反之,如只出現(xiàn)在少數(shù)文檔中,則表明詞語對文檔本身具有較高代表性。||為文檔的總數(shù)量;(i)為文檔頻率,是詞語i在文檔中至少出現(xiàn)1 次的文檔數(shù)目。

該方法先將屬于同一類的所有文檔向量歸為一類,每個類具有表達(dá)自身興趣的特征向量,再計算文檔和特征向量的相似度。該相似度最大類向量所屬類即為文檔類別。

2 電磁態(tài)勢情報用戶的層次向量空間表示

用戶興趣模型是個性化推薦技術(shù)的基礎(chǔ)和核心,是個性化推薦系統(tǒng)的主要知識源。它的工作原理是:以用戶為主體,按照用戶的興趣與需求,分別為每個用戶推薦其感興趣的資源。所以用戶興趣模型的質(zhì)量直接關(guān)系到個性化推薦服務(wù)的質(zhì)量,也就是推薦給情報用戶情報的質(zhì)量。

向量空間模型是大多數(shù)個性化推薦系統(tǒng)中采用的一種用戶興趣模型表示方式,它將用戶興趣模型表示 為 一 個維 的 特 征 向 量[(,),(,),…,(tw)],向量的每一個元素都是由關(guān)鍵詞t和它對應(yīng)的權(quán)重w組成,分別表示了用戶是否對某個關(guān)鍵詞感興趣和對它感興趣的程度。

考慮到電磁態(tài)勢情報用戶多樣性的特點(diǎn),對用戶興趣進(jìn)行分類劃分,根據(jù)電磁態(tài)勢情報的格式化特征,可分為平臺類型、敵我屬性、國家地區(qū)、目標(biāo)型號、平臺型號、工作參數(shù)、位置和方位等,使用戶興趣模型中的用戶興趣是分類,減少不同類別的興趣特征之間不均勻分布產(chǎn)生的干擾,提高電磁態(tài)勢情報分發(fā)的精確度。因此,在向量空間模型的基礎(chǔ)上,提出一種表征電磁態(tài)勢情報用戶興趣的層次向量空間模型,它能有效地和充分地描述情報用戶多個方面的、多種興趣的特征。

電磁態(tài)勢情報用戶層次向量空間興趣模型采用了樹狀結(jié)構(gòu),將用戶的興趣按不同的屬性進(jìn)行劃分,每一個屬性又由此屬性下感興趣的多個關(guān)鍵詞組成的空間向量表示。所以,電磁態(tài)勢情報用戶層次向量空間興趣模型如圖1所示,它是三層的樹狀結(jié)構(gòu),第一層表示電磁態(tài)勢情報用戶,第二層表示電磁態(tài)勢情報用戶的興趣屬性,第三層表示用戶在該屬性下的興趣詞條。基于層次向量空間的用戶興趣模型可表達(dá)為如下特征向量:

圖1 電磁態(tài)勢情報用戶3 層向量空間模型

式中,I為情報用戶的第類興趣屬性。

I屬性可以表示為:

式中,(iQ)為I類屬性的第個興趣約束,i為 第個關(guān)鍵詞,Q為關(guān)鍵詞的i權(quán)重。

3 基于TF-IDF 的電磁態(tài)勢情報保障分發(fā)

3.1 電磁態(tài)勢情報用戶興趣模型建立

利用電磁態(tài)勢情報用戶的定制信息和歷史情報,通過TF-IDF 分類算法,建立情報用戶的興趣模型,對于不滿足用戶定制要求的情報,利用興趣模型,判斷用戶的感興趣程度,如果用戶感興趣程度較高,則將該情報推送給用戶。

該算法的關(guān)鍵是要解決關(guān)鍵詞權(quán)重的計算問題,通過統(tǒng)計目標(biāo)用戶關(guān)鍵詞i在歷史情報中出現(xiàn)的頻數(shù)(i)和計算它在所有用戶定制信息中的逆文檔頻率(i),可求得每一個關(guān)鍵詞的權(quán)重。權(quán)重w的計算式如下:

關(guān)鍵詞i的權(quán)重w越大,說明用戶對其感興趣的程度越強(qiáng);關(guān)鍵詞i的權(quán)重w越小,說明用戶對其感興趣的程度越弱。

頻數(shù)(i)是關(guān)鍵詞i在歷史情報中出現(xiàn)的次數(shù),它反映用戶對關(guān)鍵詞i的感興趣程度。關(guān)鍵詞i在歷史情報中出現(xiàn)的次數(shù)(i)越多,則用戶對它的感興趣程度就越大,反之則小。

逆文檔頻率(i)反映關(guān)鍵詞i在區(qū)分目標(biāo)用戶時的強(qiáng)度。若所有用戶中包含關(guān)鍵詞i的定制信息的數(shù)量越多,關(guān)鍵詞i區(qū)分目標(biāo)用戶時的作用強(qiáng)度越小,那么(i)的值就越小;反之則大。當(dāng)且僅當(dāng)目標(biāo)用戶的定制信息中包括關(guān)鍵詞i時,(i)的值達(dá)到最大。(i)的計算式為:

式中,||為定制信息的總數(shù)量,若情報中心有個用戶,則取所有個用戶的最新定制信息,此時,||=。(i)是定制信息中包含了關(guān)鍵詞i的定制信息的數(shù)量。將達(dá)到一定閾值的權(quán)重所對應(yīng)的關(guān)鍵詞作為用戶感興趣的關(guān)鍵詞。

建立用戶興趣模型的具體步驟如下:

步驟1:計算關(guān)鍵詞i在歷史電磁態(tài)勢情報中出現(xiàn)的次數(shù)(i)。

步驟2:計算關(guān)鍵詞在電磁態(tài)勢情報定制信息間的逆文檔頻率(i)。

步驟3:計算關(guān)鍵詞i的權(quán)重w

步驟4:用戶興趣模型的建立。在用戶的類興趣屬性中,每一類都有一個閾值,它們構(gòu)成一個閾值組={,,…,a}。計算出每個關(guān)鍵詞i的權(quán)重w后,若權(quán)重wa,則關(guān)鍵詞為用戶感興趣的關(guān)鍵詞,與之對應(yīng)的關(guān)鍵詞條(iw)為電磁態(tài)勢情報用戶感興趣的關(guān)鍵詞條,電磁態(tài)勢情報用戶層次向量空間興趣模型就是由這些用戶感興趣的關(guān)鍵詞條組成。

3.2 電磁態(tài)勢情報分發(fā)

建立上述電磁情報用戶的興趣模型后,基于TF-IDF 分類算法的電磁態(tài)勢情報分發(fā)的步驟如下:

1)分析用戶興趣模型。利用用戶的歷史情報信息和定制信息,通過TF-IDF 分類算法,建立用戶的層次向量空間模型,挖掘出用戶感興趣情報的信息。

2)電磁態(tài)勢情報匹配推送。將情報與用戶訂閱信息進(jìn)行順序匹配,匹配成功則主動推送,匹配不成功進(jìn)行步驟3)。

3)電磁態(tài)勢情報推薦推送。將情報同用戶興趣模型進(jìn)行匹配計算,當(dāng)情報的每一個關(guān)鍵詞都是用戶感興趣的關(guān)鍵詞的時候,認(rèn)為該情報是用戶感興趣的情報,并將其推送給用戶,否則不予推薦。

分發(fā)流程如圖2 所示。

圖2 基于TF-IDF 的電磁態(tài)勢情報分發(fā)流程

4 實驗與分析

4.1 實驗數(shù)據(jù)與步驟

模擬電磁態(tài)勢情報用戶提交的定制信息和目標(biāo)情報用戶的電磁態(tài)勢情報信息。利用所有用戶提交的定制信息和目標(biāo)用戶的電磁態(tài)勢情報信息,根據(jù)TF-IDF 分類算法建立目標(biāo)用戶的電磁態(tài)勢情報用戶層次向量空間興趣模型,通過實時情報與用戶興趣模型的匹配運(yùn)算,推送用戶感興趣的情報,不推送用戶不感興趣的情報。然后對分發(fā)給用戶的情報進(jìn)行分析,計算情報分發(fā)的準(zhǔn)確率和覆蓋率,在保證覆蓋率不低于100%的前提下,通過調(diào)整情報窗口和感興趣權(quán)重的大小觀察準(zhǔn)確率的變化情況。

4.2 性能評價指標(biāo)

以覆蓋率(recall)和準(zhǔn)確率(precision)這2 個指標(biāo)來評價基于TF-IDF 情報用戶興趣模型的情報分發(fā)算法的性能。根據(jù)文獻(xiàn)[7-8]對個性化推薦系統(tǒng)的評價方法研究,分類準(zhǔn)確度定義為推薦算法對一個產(chǎn)品用戶是否感興趣判定正確的比例,覆蓋率和準(zhǔn)確率是分類準(zhǔn)確度的2 個指標(biāo)。

覆蓋率定義為正確推送的情報數(shù)目與應(yīng)該推送的情報數(shù)目的比例,反映了系統(tǒng)識別用戶興趣的正確程度。

式中,為已推送的正確情報數(shù),為應(yīng)該推送的情報數(shù)。

準(zhǔn)確率定義為正確推送的情報數(shù)目與推送的情報總數(shù)的比值,反映了系統(tǒng)對用戶興趣不相關(guān)情報的排斥能力。

當(dāng)情報分發(fā)的任務(wù)完成后,計算推薦情報的準(zhǔn)確率如下:

式中,為已推送的正確情報數(shù),為推送的情報總數(shù)。

4.3 試驗結(jié)果與分析

利用C++模擬20 個電磁態(tài)勢情報用戶的定制信息,隨機(jī)生成訂閱信息,確保每個用戶能夠收到2 000 批電磁態(tài)勢情報,利用歷史情報和訂閱信息形成用戶的TF 和IDF 值,再模擬10 000 批電磁態(tài)勢情報向上述20 個用戶發(fā)送。設(shè)定權(quán)重統(tǒng)一為=70%,針對模擬的電磁態(tài)勢情報信息,在不同情報窗口大小下1 號用戶和17 號用戶的推送準(zhǔn)確率如圖3 所示。情報窗口分別是[500,1 000,1 500,2 000]。

圖3 情報窗口大小與推送準(zhǔn)確率關(guān)系

設(shè)定情報窗口大小為2 000,針對模擬的電磁態(tài)勢情報信息,在不同門限大小下1 號用戶和17 號用戶的推送準(zhǔn)確率如圖4 所示。門限大小分別是[0.1,0.3,0.5,0.7,0.9]。

圖4 門限大小與推送準(zhǔn)確率關(guān)系

從上述結(jié)果可以看出,當(dāng)門限為0.7、情報窗口大于1 000 時,可以保證推送的情報準(zhǔn)確率較高且有一定冗余度;情報窗口大小為2 000 時,門限設(shè)置在0.7 附近,可以保證推送的情報準(zhǔn)確率較高且有一定冗余度。

5 結(jié)束語

本文針對電磁態(tài)勢情報分發(fā)不靈活的問題,提出了基于個性化推薦的過濾電磁態(tài)勢情報技術(shù),并根據(jù)電磁態(tài)勢情報用戶興趣多樣性和電磁態(tài)勢情報的格式化特征,提出了用戶層次向量空間興趣模型,在此基礎(chǔ)上利用用戶歷史情報信息和定制信息,實現(xiàn)了基于TF-IDF 分類算法的電磁態(tài)勢情報分發(fā)。該方法可以較好地滿足電磁態(tài)勢情報推薦分發(fā)的需求。

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 免费亚洲成人| av一区二区人妻无码| 国产免费福利网站| 国产成人精品视频一区视频二区| 国产日韩丝袜一二三区| 日韩欧美色综合| 2024av在线无码中文最新| 污网站在线观看视频| 国产一区成人| 欧美五月婷婷| 国产精品3p视频| 福利在线不卡一区| 国产青榴视频| 亚洲成人免费看| 国产日韩av在线播放| 91九色国产porny| 一级毛片免费播放视频| 国产精品太粉嫩高中在线观看| 色成人综合| 97狠狠操| 再看日本中文字幕在线观看| 人妻一区二区三区无码精品一区| 天天激情综合| 日韩 欧美 国产 精品 综合| 秋霞国产在线| 亚洲天堂免费| 亚洲男人在线| 四虎影视库国产精品一区| 欧美特级AAAAAA视频免费观看| 亚洲视频二| 亚洲精品国偷自产在线91正片| 国产日韩精品一区在线不卡| 国产丝袜丝视频在线观看| 亚洲国产日韩视频观看| 亚洲天堂网2014| AⅤ色综合久久天堂AV色综合| 国产精品私拍99pans大尺度| 直接黄91麻豆网站| 天天综合色天天综合网| 亚洲精品国产精品乱码不卞| 日韩精品久久久久久久电影蜜臀| 国产高清无码麻豆精品| 亚洲性视频网站| 色婷婷成人网| 色偷偷一区| 无遮挡一级毛片呦女视频| 成人一级黄色毛片| 中文字幕久久精品波多野结| 91精品最新国内在线播放| 国产在线无码一区二区三区| 97se综合| 亚洲成A人V欧美综合| 亚洲第一视频网站| 亚洲日本在线免费观看| 黄片一区二区三区| 国产美女无遮挡免费视频网站| 中文天堂在线视频| 综合天天色| 欧美日韩国产综合视频在线观看 | 国产熟睡乱子伦视频网站| 免费在线a视频| 久久久精品国产SM调教网站| 国产精品刺激对白在线| 五月天综合网亚洲综合天堂网| 日韩天堂网| 亚洲三级成人| 国产福利拍拍拍| 无码福利视频| 欧美劲爆第一页| 国产精品对白刺激| 无码AV高清毛片中国一级毛片| 色婷婷亚洲综合五月| 国产资源站| 久久精品人妻中文系列| 国产日韩欧美视频| 波多野结衣无码视频在线观看| 亚洲国产欧美中日韩成人综合视频| a毛片在线| 国产青榴视频| 免费无码又爽又黄又刺激网站| 色成人亚洲| 色综合热无码热国产|