999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

近鄰傳播聚類算法研究

2020-01-01 03:56:15李林陽李高明
數字通信世界 2020年10期

李林陽,李高明,劉 祥,李 笑

(1.武警工程大學基礎部,陜西 西安 710086;2.武警工程大學信息學院,陜西 西安 710086)

AP算法是基于距離的聚類算法,Frey等于2007年在《Science》上發表了一篇論文,首次提出了近鄰傳播聚類算法。該算法具有很多優點,比如聚類速度快、精確度高等,同時也存在一些問題。

1 AP算法存在的問題

(1)偏向參數的選擇問題。偏向參數往往需要人工設置,然而事實上這種設置未必能找到最合理的聚類結果。因此考慮p值的自適應,避免人工設置的麻煩和因此導致的聚類結果的不合理,從而使算法更加便捷和準確,提升聚類性能。人工設置比較繁瑣,若采用合適的策略,自適應調整阻尼因子,則可以加快算法收斂速度。

(2)相似度函數的選擇問題。不同結構的數據其相似度函數的選擇也不同,如對于球形數據,選擇歐氏距離可以取得好的效果,但對于結構復雜的非球狀簇,選擇基于密度的相似度計算方法的效果會比較理想;對于多重尺度的數據,存在奇異數據的數據集,以及高維數據,歐氏距離不能準確刻畫數據之間的距離。

(3)相似度函數的選擇問題。不同結構的數據其相似度函數的選擇也不同,對于多重尺度的數據,奇異數據,以及高維數據,歐氏距離不能準確反映數據之間的距離,且相似度矩陣會以根據維數的增加而呈幾何倍數增長。

(4)其他問題。其他問題包括該算法的集成研究較少的問題,半監督的問題,對于大規模數據集,該算法的時間復雜度高的問題等。

2 AP算法發展現狀

近鄰傳播聚類算法(Affinity Propagation Clustering Algorithm,AP)于2007年由Frey等 在《Science》雜志上第一次提出。作為一種有效的聚類算法,AP算法此后得到了較大發展。2008年,肖宇等 將半監督思想與近鄰傳播聚類算法結合在一起,詳細介紹了近鄰傳播算法,根據成對約束先驗信息提出了基于約束的半監督近鄰傳播聚類算法,該研究成果得到了廣泛的認可,該文獻一度被數百篇論文引用,證實了半監督AP算法的科學性和可行性。然而,該算法在聚類過程中存在相似度適用范圍不夠廣泛、偏向參數和阻尼因子(也叫阻尼系數或者迭代因子)需要人工篩選、處理大規模復雜數據集時算法復雜度高、不適用于高維數據和多尺度數據等問題,針對以上問題,專家學者進行了一系列改進。

2.1 AP算法負歐氏距離的問題研究

董俊等 提出了可變相似性度量的方法,其基本思想是根據數據在觀測空間中的流形分布規律,對不同分布的數據采取不同的處理策略;對于全局數據,采取函數變換策略對不同流形分布的數據對進行相似度的縮放,而對于局部數據,則采取映射的策略,搜索識別數據的不同流形分布并將其映射成超球形或超橢球形,再使用AP算法進行處理,從而提出了基于可變相似性度量的AP算法(AP-VSM),取得了良好的聚類效果。周世兵等 構造了樣本聚類距離和樣本離差聚類距離。邢艷等根據K-最近鄰的內含提出了互近鄰的概念,繼而提出了互近鄰一致性的定義并將其作為相似度度量的調整依據,最后提出了基于互近鄰一致性的AP算法。同樣采用最近鄰概念和最近鄰的傳遞性的還有蘇亞然等 ,他們提出了近鄰傳播的快速掃描算法,優化搜索過程并嘗試簡化最近鄰居的判定過程和計算過程,從而實現了更加快速的聚類。廖予良 通過分析路徑相似度,提出了基于最短路徑的聚類方法,用最短路徑取代傳統的歐氏距離,實現了對不同形狀數據集的有效聚類。胡晨曉等 借助稀疏表示來作為樣本數據的相似度度量,提出了基于稀疏表示的AP算法。張利 基于模糊函數提出了將距離貼近度引入相似度函數的算法,很好解決了奇異樣本數據的量綱和過大過小值干擾問題,得到了良好的聚類結果。姬強 通過構造一個采用核低秩表示的優化問題,挖掘數據的低維度流形結構,從而構造出結構相似度,作為歐氏距離的替代相似度度量,一定程度上解決了復雜結構數據的內部結構不易識別和挖掘的問題。唐丹 采用改進的馬氏距離來替代歐氏距離。趙昱 通過求解鄰域半徑得出鄰域密度并最終計算出鄰域相似度,作為近鄰傳播聚類算法的新的相似度度量,不僅提高了算法對復雜數據集的適應能力,也提高了算法的自適應特性。房驍 提出了量子近鄰傳播聚類算法,為解決高維數據的聚類問題,引進高斯核函數來構造相似度函數。

2.2 偏向參數的選擇問題和阻尼因子的使用問題研究

有關學者也提出了一些解決方案。張利 針對偏向參數需要人工選擇的問題,提出了基于布谷鳥優化算法的自適應尋找最優偏向參數的方法,提出了CS-SAP算法。周治平等 利用Silhouette聚類有效性指標來確定偏向參數。姬強 針對偏向參數難以調節的問題,提出了基于煙花爆炸智能優化算法的最佳偏向參數選擇算法。覃華等 提出采用概率無向圖模型來解決偏向參數的自適應問題。趙昱 采用聚類有效性指標和下降步幅相結合的方法,實現了偏向參數的自適應,提出了PGZC-AP算法,提高了算法的運行效率。房驍 采用量子智能優化算法對偏向參數進行優化,參數初始化階段采用量子編碼方法,參數的更新階段使用旋轉量子門,最后獲得近優參數,將其代入算法運行過程,從而解決了偏向參數的篩選問題,提高了聚類精度,減少了迭代次數。鄭凱月 采用布谷鳥優化算法對偏向參數和迭代因子同時進行優化,提高了算法的自適應性;還采用人工蜂群智能優化算法對偏向參數進行了自適應計算的優化。

2.3 近鄰傳播聚類算法的聚類有效性指標研究

周世兵等 采用近鄰傳播聚類算法作為聚類的研究對象,比較了6中聚類有效性指標,并改進了IGP指標作為最佳聚類數確定的方法。周世兵等 提出了BWP聚類有效性指標。

2.4 高維數據的聚類問題復雜的大數據集具有高復雜度的問題研究

多種不同類型的并行近鄰傳播聚類算法、一些與層級聚類相結合的近鄰傳播聚類算法以及多階段近鄰傳播聚類算法等被相關專家學者分別提出。劉曉楠等 提出了專門針對大規模數據集的分層聚類方案,文章將原始數據集劃分為多個較小的獨立子集,對各個子集進行算法執行,得到每個子集的聚類中心,而后將得到的聚類中心集合再次進行算法執行,得到全部數據集的類代表點,最后用得到的全局類代表點實現原始數據集的劃分,從而解決了大數據集聚類效率的優化問題。錢雪忠等 根據先驗約束實現高維數據投影矩陣的獲取,在低維空間中進行聚類,從而實現了高維空間數據的近鄰傳播聚類。其中,高維數據投影到低維數據時,要求原來的數據集結構不能改變。周治平等 同樣提出了基于局部投影方法實現對復雜結構數據和高維數據的聚類,減少了信息冗余,保持了數據內部的結構。張利 使用熵權法和主成分分析法對高維數據進行降維,而后在低維空間中進行聚類。

3 結束語

AP算法還有較大的改進空間。可以與半監督方法結合。AP算法針對相似度的改進可以考慮與密度聚類的研究成果相結合,提高算法對于復雜結構數據的適應度,采用基于密度的近鄰傳播聚類算法。對于高維數據的處理還需要進一步加強。對AP算法聚類集成的研究比較少,可以進一步加強。

主站蜘蛛池模板: 亚洲精品国偷自产在线91正片| 欧美啪啪网| 亚洲国产中文精品va在线播放| 五月婷婷综合网| 亚洲成aⅴ人在线观看| 亚洲黄色片免费看| 精品成人免费自拍视频| www欧美在线观看| 无码日韩视频| a在线亚洲男人的天堂试看| 国产理论最新国产精品视频| 无码国产偷倩在线播放老年人| 日本尹人综合香蕉在线观看| 99这里只有精品6| 尤物亚洲最大AV无码网站| 国产人前露出系列视频| 国产好痛疼轻点好爽的视频| 欧美α片免费观看| 日韩一级二级三级| 黄色片中文字幕| 中文字幕无码制服中字| 国内嫩模私拍精品视频| 潮喷在线无码白浆| 日韩无码黄色| 中文字幕资源站| 成人一区专区在线观看| 白浆视频在线观看| 原味小视频在线www国产| 毛片最新网址| 69av免费视频| 国产成+人+综合+亚洲欧美| 午夜天堂视频| 国产资源免费观看| 日本爱爱精品一区二区| 久久人体视频| 国产精品视频导航| 一级成人a毛片免费播放| 精品国产福利在线| 国产精品99久久久| 国产一线在线| 狠狠做深爱婷婷综合一区| 国产不卡网| 亚洲精品国产日韩无码AV永久免费网 | av色爱 天堂网| 国产第一页免费浮力影院| 欧美在线伊人| 精品中文字幕一区在线| 91无码人妻精品一区| 久久鸭综合久久国产| 九九九精品成人免费视频7| 久久国产高潮流白浆免费观看| 亚洲无线一二三四区男男| 91视频免费观看网站| 亚洲欧美自拍中文| 第一页亚洲| 免费国产在线精品一区| 成人噜噜噜视频在线观看| 精品一区二区三区自慰喷水| 婷婷综合亚洲| 欧美日在线观看| 激情综合婷婷丁香五月尤物| 久久频这里精品99香蕉久网址| 日本国产精品| 久久青青草原亚洲av无码| 91黄视频在线观看| 国产成人免费视频精品一区二区| 白浆视频在线观看| 精品视频一区在线观看| 伊人AV天堂| 日本成人福利视频| h视频在线观看网站| 国产精品自在自线免费观看| 夜夜拍夜夜爽| 伊人查蕉在线观看国产精品| 女同久久精品国产99国| 亚洲 欧美 偷自乱 图片| 亚洲人免费视频| 成人免费一级片| 久无码久无码av无码| 久久久久国产一区二区| 国产女人18毛片水真多1| 一级毛片a女人刺激视频免费|