999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多模態異構大數據混合屬性特征匹配篩選算法

2024-02-18 05:49:12張燕
現代電子技術 2024年3期
關鍵詞:數據挖掘模態特征

張燕

(新疆師范大學,新疆 烏魯木齊 830017)

0 引言

信息化時代下,大數據挖掘和利用覆蓋了金融行業、醫療保健、交通運輸、電力行業等領域。在大數據挖掘過程中,由于數據模態、來源、屬性不同,數據混合后會得到多模態異構大數據。相比其他類型單一的數據,多模態異構大數據具有數據挖掘難度較大、數據清理和預處理較復雜、數據計算效率較低的特點。因此,多模態異構大數據雖然具有較高的研究價值,但是利用率較低[1]。混合屬性特征匹配與篩選是多模態異構大數據處理中一項不可缺少的工作,該工作旨在對多模態異構大數據進行縮減,降低數據維度,排除冗余數據干擾,以此提高數據挖掘精度、降低數據處理復雜度、提高計算算力[2]。

不同領域的專家和學者都提出了關于多模態異構大數據解決方法。文獻[3]計算了特征的信息增益比,并以此為基礎對特征進行排序,對排序后的特征進行分組,采用二進制編碼方法對排序的特征進行編碼,利用遺傳算法通過不斷迭代篩選出最優特征組合。但是該方法在迭代過程中容易陷入局部最優解。文獻[4]利用FAST 算法將特征點描述成特征描述子,通過改進人工魚群算法進行特征點選取和匹配。但是該方法在特征篩選時沒有考慮到不同特征之間的重要性差異,導致后期特征匹配存在一定誤差。文獻[5]對待研究數據進行預處理,利用核主成分方法降低數據維度并進行特征融合,通過RSP 方法完成特征匹配。但是該方法計算效率有待進一步提高。

基于此,本文提出多模態異構大數據混合屬性特征匹配篩選算法,降維多模態異構大數據實施混合屬性,提取多模態異構大數據混合屬性備選特征,實現混合屬性特征篩選與匹配。通過本文研究以期提高混合數據的利用率,提高多模態異構大數據挖掘精度。

1 多模態異構大數據混合屬性特征匹配篩選

1.1 降維多模態異構大數據混合屬性

多模態異構大數據中混合了多種屬性,其維度較大,因此需要對其進行降維處理[6]。輸入待處理的多模態異構大數據,根據屬性不同,將多模態異構大數據劃分為數值型數據和分類型數據,并組成兩個集合,記為A、B。

計算A中數值型數據之間的距離:

式中:cij代表第i個數值型數據和第j個數值型數據之間的距離;aik代表第i個第k個屬性的數值型數據;ajk代表第j個第k個屬性的數值型數據;N代表混合數據集合數量[7]。

建立距離矩陣:

式中C代表距離矩陣。

根據距離矩陣計算分類型數據相異度:

式中:wk代表第k個分類屬性的權重;bik代表第i個第k個屬性的分類型數據;bjk代表第j個第k個屬性的分類型數據;M'代表分類型數據數量。

根據dij構建相異度矩陣D:

計算混合屬性數據點之間的距離e:

結合條件概率,利用梯度下降法最小化混合屬性數據點之間的距離數據,將混合數據映射到低維度[8],完成多模態異構大數據混合屬性降維。

1.2 提取多模態異構大數據混合屬性備選特征

基于降維后的多模態異構大數據,本節提取多模態異構大數據混合屬性特征[9]。假設降維后的多模態異構大數據是一個具有n個屬性的樣本F,將F進行轉置:

式中m代表多模態異構大數據樣本數量。

對F進行規范化處理,得到規范化后的F':

式中:F'代表規范化后的多模態異構大數據;fij代表原始多模態異構大數據分別代表最大、最小值。

計算F'中每列的均值,記為fˉ,完成均值化處理。

式中代表數據偏離值。利用主成分分析法計算多模態異構大數據樣本的特征值:

計算特征值vi的累積貢獻率:

式中di代表方差解釋率。當ζ≥8.5時,表明主成分為多模態異構大數據樣本濃縮,將這個主成分看作多模態異構大數據樣本的備選特征[10-11]。

1.3 篩選與匹配混合屬性特征

在完成特征提取的基礎上,還需要進一步篩選特征,完成特征匹配。計算主成分之間的互信息[12-13],互信息數值越大,證明該主成分包含的數據信息量越多。互信息計算公式為:

式中:Q代表主成分的數量;p(ri)代表主成分ri的信息熵;R代表主成分集合;p(ri,rj)代表第i個主成分ri與主成分rj之間的聯合概率分布函數;p(ri)代表主成分ri的信息熵;p(rj)代表主成分rj的信息熵。

將J(ri,rj)>1.0 以上的主成分作為多模態異構大數據混合屬性特征,完成特征篩選。將互信息作為權重賦值給每個樣本的特征,記為Y(J1r1,J2r2,…,Jlrl)。計算每個多模態異構大數據樣本特征的平均差異度h(Li)和總體差異度H:

式中:l代表特征數量;T(Li,Lj)代表特征Li與特征Lj之間的距離。

對h(Li)進行從大到小排序,選出其中最大值對應的特征作為第1 個初始匹配中心hi1,將該特征從Y中刪除。從剩余特征中找出h(Li)最大值對應的特征作為第2 個匹配中心hi2,h(Li)的歐氏距離為:

當d≥H時,將特征入選為匹配中心,計算匹配中心余弦相似度,完成混合屬性特征匹配:

至此完成多模態異構大數據混合屬性特征匹配篩選算法的研究。

2 算法應用測試

2.1 多模態異構大數據集

為測試所研究算法在多模態異構大數據混合屬性特征匹配篩選中的應用效果,將UCI 機器學習數據庫中的4 個真實數據集作為測試樣本。多模態異構大數據集基本情況如表1 所示。

表1 多模態異構大數據集描述

2.2 數據特征提取與篩選結果

針對4 個多模態異構大數據集,在降維的基礎上提取每個集合的主成分作為其特征,計算每個特征的互信息完成特征篩選,結果如表2 所示。

表2 數據特征提取與篩選結果

從表2 中可以看出:集合1 篩選出7 個特征;集合2篩選出8 個特征;集合3 篩選出7 個特征;集合4 篩選出9 個特征。

2.3 算法應用效果

基于篩選特征進行每個數據集合中每條數據的特征匹配,根據匹配結果計算特征類中特征之間的緊密度,緊密度越大,代表匹配結果越準確。計算公式如下:

式中:xi、xj代表兩個特征;γ(xi-xj)代表特征之間的相似度。

相同測試數據集合下,選擇文獻[3]方法(融合信息增益比和遺傳算法的混合式特征選擇算法)、文獻[4]方法(改進人工魚群的ORB 特征匹配算法)和文獻[5]方法(一種多特征融合的特征匹配算法)作為對比方法,獲取不同方法下的緊密度結果,如圖1 所示。

圖1 匹配緊密度結果

從圖1 中可以看出,與文獻[3]方法、文獻[4]方法和文獻[5]方法相比,所提算法的匹配緊密度較高,集合1、集合2、集合3、集合4 的匹配緊密度均高于0.8。這是因為所提算法不僅考慮了數據的維度和異構,還考慮了數據屬性之間的互信關系,從而能夠更加準確地進行特征匹配,提高多模態異構大數據混合屬性特征匹配的效果。

3 結語

大數據中隱藏著較多具有價值屬性的信息,這些信息對于決策的制定和規劃具有重要作用。但是面對多模態異構大數據挖掘時,由于混合多種屬性數據的特點,提高了數據挖掘難度。為此,本文提出一種多模態異構大數據混合屬性特征匹配篩選算法,該算法在特征提取、篩選基礎上,將相似屬性的特征匹配,提高數據挖掘效果。在算法實現過程中,由于數據集的規模較大,計算復雜度較高,容易導致算法運行效率較低。因此,在之后的研究中將結合本文研究結果,采用分布式計算方式進一步優化算法的計算效率,提高算法的魯棒性。

猜你喜歡
數據挖掘模態特征
探討人工智能與數據挖掘發展趨勢
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
國內多模態教學研究回顧與展望
一種基于Hadoop的大數據挖掘云服務及應用
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
計算物理(2014年2期)2014-03-11 17:01:39
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 精品成人一区二区三区电影| 91福利片| 成人在线亚洲| 国产第一福利影院| 成人亚洲国产| 在线观看欧美精品二区| 亚洲国产日韩在线观看| 国产在线欧美| 午夜国产在线观看| 午夜电影在线观看国产1区| 天堂网国产| 久久这里只精品热免费99| 国产精品一线天| 亚洲日韩在线满18点击进入| 国产精品尹人在线观看| 在线国产三级| www.99精品视频在线播放| 亚洲日本在线免费观看| 亚洲香蕉伊综合在人在线| 婷婷开心中文字幕| 黄色在线不卡| 亚洲欧美色中文字幕| 啪啪国产视频| 亚洲区一区| 中日韩一区二区三区中文免费视频| 国内视频精品| 无码福利视频| 欧美一级夜夜爽www| 亚洲欧美h| 国产毛片基地| 国产在线自揄拍揄视频网站| 国产一区二区人大臿蕉香蕉| 国产在线欧美| 91久久偷偷做嫩草影院免费看| 国产后式a一视频| 日韩视频免费| 综合久久久久久久综合网| 亚洲高清中文字幕| 77777亚洲午夜久久多人| 国产情精品嫩草影院88av| 亚洲精品片911| 国产精品自在在线午夜区app| 综合色88| 波多野结衣一区二区三视频| 精品精品国产高清A毛片| 72种姿势欧美久久久大黄蕉| 日本亚洲欧美在线| 成人国产小视频| 一区二区三区国产精品视频| a级毛片毛片免费观看久潮| 婷婷成人综合| 欧美人在线一区二区三区| 国产va欧美va在线观看| 欧美啪啪一区| 全免费a级毛片免费看不卡| 不卡无码h在线观看| 亚洲成人黄色在线观看| 国产18在线播放| 欧美成人怡春院在线激情| 国产一级毛片yw| 亚洲欧洲日韩久久狠狠爱| 成人夜夜嗨| 狠狠色香婷婷久久亚洲精品| 香蕉久久国产超碰青草| 色偷偷一区二区三区| 日本精品中文字幕在线不卡 | 欧美精品一区二区三区中文字幕| 国产成人在线小视频| 尤物成AV人片在线观看| 狼友视频一区二区三区| 国产第二十一页| 中文字幕av一区二区三区欲色| 色天堂无毒不卡| 久久99热这里只有精品免费看| 国产h视频在线观看视频| 91在线一9|永久视频在线| 亚洲av无码牛牛影视在线二区| 国产极品美女在线| 午夜不卡福利| 亚洲国产天堂久久综合| 免费观看男人免费桶女人视频| 在线观看亚洲人成网站|