李春梅,陳秀明,劉文文,周永芹
(安徽新華學院信息工程學院,安徽合肥 230088)
基于熵權的區間猶豫模糊集用戶聚類方法研究
李春梅,陳秀明,劉文文,周永芹
(安徽新華學院信息工程學院,安徽合肥 230088)
本文針對群體中用戶采用區間猶豫模糊信息表達興趣偏好的情況,在推薦過程中對于區間猶豫模糊集用戶聚類的方法進行研究。考慮到屬性權重未知的情況,提出熵權模型來確定屬性權重;基于相關性和最小距離思想,利用傳遞閉包算法和凝集型層次聚類算法對用戶聚類,在此基礎上研究群推薦方法,建立科學合理的群推薦模型。
區間猶豫模糊集;相關系數;熵測度;屬性權重;用戶聚類
在現實世界中,數據用于聚類可能是不確定的和模糊的,處理各種類型的模糊數據,大量的聚類算法對應不同的模糊環境.作為模糊集的擴展,區間猶豫模糊集能夠表達決策者在決策過程中區間性、猶豫性的模糊問題.通過距離和相似性計算,進行用戶聚類,能夠為用戶合理地推薦.在以往的聚類問題中,用戶評價信息多為語言評價信息和語言算子;對于用戶聚類的研究,主要從用戶訪問行為和訪問內容兩個方面對訪問數據進行研究;但是,對于區間猶豫模糊集用戶聚類方法的研究還比較少.本文著重研究了區間猶豫模糊集用戶聚類問題,在文獻[1]的基礎上,考慮了屬性權重已知和完全未知的情況,并在文獻[2]的基礎上,提出了熵權重模型用以確定屬性權重,最后利用傳遞閉包算法和凝集型層次聚類算法對用戶進行聚類.
1.1 相關概念








基于區間猶豫模糊集的性質和運算,給出區間猶豫模糊集的算術加權平均算子和幾何加權平均算子.

(1)區間猶豫模糊集的加權算術算子.



(2)區間猶豫模糊集的幾何加權平均算子.

1.2 區間猶豫模糊集的相關系數


在區間模糊集相關系數的基礎上,給出區間猶豫模糊集的相關系數定義[1,3-4].



當考慮到該元素xi∈X的權重時,進一步得到:




1.3 一種區間猶豫模糊熵公式的構造


在具體的決策中,不同的決策者的重要程度通常是有區別的,所以在處理區間猶豫模糊熵時,要依據決策者的重要性賦予決策者的信息不同的權重ωj(ωj>0).為此,在猶豫模糊集的熵和對偶猶豫模糊集的熵的基礎上,給出區間猶豫模糊集的熵的公式[5-6,8-9].




證明 由于














聚類是指一個過程,使一組對象(可選方案、人、事件等)進入有數據特點和對象的集群,比不同的集群具有更高的相似性集群.在模糊聚類分析中,聚類的方法有很多,目前典型的聚類算法有傳遞閉包算法、K-Means、迭代自組織數據分析方法等.本文采用傳遞閉包算法和凝集型層次聚類算法進行用戶聚類.
2.1 Algorithm-IVHFSC算法
基于直覺模糊聚類算法[10],本文提出一種新的區間猶豫模糊凝聚型層次聚類算法,通過最小距離對用戶進行聚類。


定理4 設C是一個相關矩陣.那么對于任意非負整數m1和m2,衍生矩陣Cm1+m2來源于Cm1+m2=Cm1°Cm2仍然是一個相關矩陣.

定理5 設C=(ρij)m×m是相關矩陣,然后組成的有限次數C→C2→C4→…→C2k→…,必然存在一個正整數k,使得C2k=22k+1,C2k也是一個等價的相關矩陣.
定義9 設C=(ρij)m×m是等價的相關矩陣,稱Cλ=(λρij)m×m為C的切割矩陣,其中,

2.2 屬性權重未知的用戶聚類
在決策過程中,屬性權重有時是已知的,有時是全部未知或者部分未知的,在區間猶豫模糊多屬性決策條件下,如何依據決策矩陣以及屬性權重信息獲取屬性權重已成為現階段研究的熱點問題之一.下面著重解決屬性權重已知和權重完全未知的區間猶豫模環境下的用戶聚類問題.
屬性權重完全未知的多屬性決策問題是專家權重和屬性權重完全未知,根據區間猶豫模糊熵和熵權重模型[8]求解屬性權重,并基于備選方案與理想方案間的相關系數,提出一種用戶聚類的算法.

基于區間猶豫模糊相關系數和傳遞閉包技術對用戶進行聚類:
步驟1 依據用戶提供的區間猶豫模糊信息構建決策矩陣M=(αij)m×n;
步驟2 依據區間猶豫模糊熵的權重模型,計算屬性的權重ω=(ω1,ω2,…,ωn)T;
步驟3 基于區間猶豫模糊集的相關系數計算,構造相關矩陣;
步驟4 利用傳遞閉包技術進行用戶聚類.

步驟1 依據用戶提供的區間猶豫模糊信息構建決策矩陣M=(αij)m×n;
步驟2 依據區間猶豫模糊熵的權重模型,計算出屬性的權重ω=(0.2026,0.3856,0.0980,0.3137)T;
步驟3 基于區間猶豫模糊集的相關系數計算公式,得到相關系數矩陣(表1).

表1 用戶對六種渠道的區間猶豫模糊集綜合決策矩陣M=(αij)6×4

顯然,C8=C4,這表明C4是一個等價的相關矩陣.


表2 聚類結果
本文以用戶聚類分析問題為研究重點,在不同區間猶豫模糊集的信息環境下,結合相關系數、熵測度模型和距離相似性公式,構造了區間猶豫模糊熵模型和權重確定模型,討論了屬性權重完全已知和完全未知的情況,并進行用戶聚類.
針對區間猶豫模糊環境下用戶聚類方法的研究,可以運用到群決策、群推薦系統中,對電子商務、投資決策和人才選拔等都有一定的幫助.但是,針對聚類方法中的凝聚型層次聚類算法和傳遞閉包技術聚類算法,每次只合并兩個類,具有迭代次數高、時間復雜度高的缺陷,有待進一步的研究.
[1]Chen N,Xu Z,Xia M.Interval-valued hesitant preference relations and their applications to group decision making[J].Knowledge-Based Systems,2013,37(2):528-540.
[2]Zhang Z M,Wang C,Tian D,et al.Induced generalized hesitant fuzzy operators and their application to multiple attribute group decision making[J].Computers & Industrial Engineering,2014,67(1):116-138.
[3]W L Huang,A note on entropy of intuition fuzzy sets[J].Internation Journal of Uncertainty,Fuzziness and Knowledge-Based Systems,2003,11(5):627-633.
[4]吳婉瑩.猶豫模糊信息的相關系數和熵測度及其在群決策中的應用[D].合肥:安徽大學,2014.
[5]王培,魏翠萍.一種區間直覺模糊熵的構造方法[J].計算機工程與應用,2011(2):43-45.
[6]李香英.區間猶豫模糊熵和區間猶豫模糊相似度[J].計算機工程與應用,2014(19):227-231.
[7]魏翠萍,高志海,郭婷婷.一個基于三角函數的直覺模糊熵公式[J].控制與決策,2012(4):571-574.
[8]金飛飛,裴利丹,陳華友,等.區間猶豫模糊三角相似度及其多屬性群決策[J].計算機工程與應用,2015(4):41-45.
[9]王毅,雷英杰.一種直覺模糊熵的構造方法[J].控制與決策,2007(12):1390-1394.
[10]Z S Xu,J Chen,J J Wu.Clustering algorithm for intuitionistic fuzzy sets[J].Inform. Sci.,2008,178(19): 3775-3790.
Clustering Analysis of Interval-valued Hesitant Fuzzy Sets Based on Entropy Weights
LI Chun-mei,CHEN Xiu-ming,LIU Wen-wen,ZHOU Yong-qin
(School of Information Engineering, Anhui Xinhua University, Hefei Anhui 230088, China)
Methods of clustering analysis of interval-valued hesitant fuzzy sets have been proposed, considering the weight of the properties is unknown, we use the entropy measures to calculate the attribute weights. Based on the minimum distance, we use the transitive closure algorithms and hierarchical clustering algorithm. The example verifies the effectiveness of the proposed method.
interval-valued hesitant fuzzy sets; correlation coefficient; entropy measures; attribute weights; clustering analysis
2017-04-12
安徽省教育廳自然科學基金重點項目“猶豫模糊語言環境下的群推薦方法研究”(KJ2015A300);安徽省教育廳自然科學基金重點項目“指紋IRLRD特征加密技術在手機支付中的研究與應用”(KJ2015A309);安徽省教育廳自然科學基金重點項目“基于鏈路預測的關系推薦研究”(KJ2016A304);國家級大學生創新性訓練計劃項目“基于社團發現的個性化推薦系統研究”(201212216035);國家級大學生創新性訓練計劃項目“群推薦中偏好信息集結方法研究”(201312216006);國家級大學生創新性訓練計劃項目“基于模糊語言的群興趣偏好集結方法研究”(201412216026);國家級大學生創新性訓練計劃項目“猶豫模糊語言集在大學生素質評價中的應用”(201512216009)。
李春梅(1978- ),女,講師,碩士,從事數據挖掘研究。
陳秀明(1972- ),男,副教授,博士,從事智能決策研究。
C934
A
2095-7602(2017)08-0040-07