范玉蕊, 王惠文
(云南師范大學 數學學院,云南 昆明 650500)
在處理模糊不確定性的問題時,模糊集理論顯示出其優越性和有效性。在日常的經濟生產活動中,遇到決策者在幾個數值間徘徊的情況時,直覺模糊集不能夠進行精確描述。為了解決這個問題,Torra[1]將猶豫這一概念融入到模糊集理論中,并給出猶豫模糊集的概念,用于反映出決策者的猶豫情況。之后,Chen等[2]又提出了區間值猶豫模糊集,用區間數來表示隸屬度情況。在此基礎上,文獻[3-4]研究了其相關性質和基本運算。
相關系數一直是模糊理論中的重要研究對象,在聚類分析中有著廣泛的應用。2013年,Chen等[2]定義了猶豫模糊集的相關性度量,并討論了相關性質,但是默認猶豫模糊元具有相同的長度,其值按遞增順序排列;次年將相應公式推廣到區間值猶豫模糊集上。2015年,Liao等[5]提出猶豫模糊集的相關系數也應具有一定的猶豫性,在一定的區間內并非是一個準確的數。2018年,Guan等[6]提出綜合相關系數,從均值、方差、長度3個角度綜合考量,克服了之前要求對應猶豫模糊元具有相同長度的局限性,但是覆蓋了一定的內部信息。2019年,Yang等[7]提出的相關系數公式同樣不要求對應猶豫模糊元長度相等,但是存在的特殊情況(分母為0)沒有被考慮在內。另外,文獻[8-12]細節性地闡述了相關系數在聚類分析中的應用,文獻[13-14]展示了2種其他類型的相關系數。本文繼承了Yang等人的思想,并對其進行補充,提出帶有猶豫度的猶豫模糊集相關系數計算公式,并推廣到區間值猶豫模糊集上,最后證明其良好性質,并應用于數值算例說明其合理性和有效性。
定義7 考慮到各屬性權重不同以及決策者對猶豫模糊集隸屬度差異部分和猶豫度差異部分的偏好程度不同,定義相關系數公式為
其中,
α,β≥0且α+β= 1。ρWHFSX1(A,B)和ρWHFSX2(A,B)分別代表猶豫模糊集隸屬度部分的相關性和猶豫度部分的相關性。
為保證其普適性,需要考慮分母為0的特殊情況,即2個猶豫模糊集中各個屬性對應元中的隸屬度值的個數都為1或其中一個為1的兩種特殊情況。當屬性相對應的兩個猶豫模糊元中數值個數都為1時,則規定在猶豫度部分其相關性為1;當各個屬性對應元hA(xi)中的數值個數都為1,在hB(xi)中其數值個數不都為1時,其猶豫度部分的相關系數定義如下:
當各個屬性對應元hB(xi)中的數值個數都為1,在hA(xi)中其數值個數不都為1時,其猶豫度部分的相關系數定義如下:
其中lAi代表hA(xi)中數值的個數,lBi代表hB(xi)中數值的個數。
定理1[2]設A、B、C是非空集合X={x1,x2,…,xn}上的3 個猶豫模糊集,ρ(A,B)為A和B之間的相關系數,則ρ(A,B)滿足以下3個性質:1)0 ≤ρ(A,B) ≤1;2)ρ(A,B) =ρ(B,A);3)ρ(A,B) = 1, 如果A=B。
證明 改進的猶豫模糊集相關系數計算公式顯然滿足定理1 中性質的后兩條,根據柯西-施瓦茨不等式,性質(1)證明如下:
由于給予兩個部分偏好程度之和為1,所以綜合可得
應用文獻[2]中的數值算例,為了更好地評估不同類型的軟件Ai(i= 1, 2,…, 7),根據功能性(x1)、可用性(x2)、可移植性(x3)、成熟度(x4)這4 個屬性對軟件進行聚類。分別對4 個屬性賦予不同的權重ω={0.35,0.3,0.15,0.2}T,考慮到不同的評價專家具有不同的水平、背景、經驗,會導致評估信息具有差異,為了準確反映專家意見,其評估信息用猶豫模糊集的形式表示在表1中。針對不同的偏好情況,將改進的新型相關系數計算公式(1)應用于HFSC算法[2],得到的聚類結果如表2所示。

表1 文獻[2]算例的決策矩陣Table 1 The decision matrix of the example in reference [2]

表2 文獻[2]算例的各偏好對應聚類情況Table 2 The clustering of each preference of the example in reference [2]
通過對比可以發現,在使用本文改進的相關系數公式進行聚類時,當賦予猶豫模糊集隸屬度差異部分和猶豫度差異部分的權重比大于等于1時,聚類效果與文獻[2]的聚類效果相近,當賦予兩部分的權重比小于1時,聚類效果差異較大。造成差異的原因一方面在于計算相關系數時,文獻[2]中的相關系數公式需要人為主觀填充數據,而改進的相關系數公式則避免了這一過程,保證了數據的真實準確性;另一方面,文獻[2]中的相關系數只考慮一個影響相關系數的特征,如果只強調猶豫模糊元中數據的個體影響,其在一定程度上是正確的,當既考慮數據個體影響又考慮總體影響時,本文的聚類方法已涵蓋了文獻[2]中的情況,因此本文所提出的相關系數公式更為全面。
定義8 將改進的猶豫模糊集相關系數的計算公式推廣到區間值猶豫模糊集上,定義區間值猶豫模糊集相關系數計算公式為
其中,
α,β≥0且α+β= 1。ρWIVHFSX1(A,B)和ρWIVHFSX2(A,B)分別代表區間值猶豫模糊集隸屬度部分的相關性。
對于區間部分的減法,采用左右端點部分等偏好的方法,具體形式如下:
根據改進相關系數公式的定義,為了保證其普適性,需要考慮分母為0的特殊情況.即2個區間值猶豫模糊集中各屬性對應元中的區間個數都為1或其中一個為1這兩種情況。當屬性對應的區間值猶豫模糊元中區間個數都為1時,則規定在猶豫度部分其相關性為1;當各個屬性對應元中的區間個數都為1,在中其數值個數不都為1時,其猶豫度部分的相關系數定義如下:
其中lAi代表中區間的個數,lBi代表中區間的個數。
證明 改進的區間值猶豫模糊集相關系數計算公式顯然滿足定理1中性質的后兩條,性質(1)證明如下:根據柯西施瓦茨不等式可以得到:
對0 ≤ρWIVHFSX2(A,B) ≤1的證明與對0 ≤ρWHFSX2(A,B) ≤1的證明類似,綜合可得0 ≤ρWIVHFSX(A,B) ≤1。
一個汽車市場想要將6 輛不同的汽車Ai(i= 1, 2,…, 6)進行分類, 以下面4 個屬性為衡量指標:安全性(x1)、燃油經濟性(x2)、設計(x3)、價格(x4),分別對4 個屬性賦予不同的權重,權重向量為ω={0.35,0.2,0.2,0.25}T,每輛車的評估數據用區間數的形式表達,如表3所示,表中數據代表專家對各個備選方案中各屬性的滿意程度,因此記為[0,1]內的區間值數字。

表3 本文算例的決策矩陣Table 3 The decision matrix of the example in this paper
針對不同的偏好情況,將改進的新型相關系數計算公式(2)應用于HFSC算法[2],得到的聚類結果如表4所示。

表4 本文算例的各偏好對應聚類情況Table 4 The clustering of each preference of the example in this paper
將得到的猶豫模糊集之間的相關系數計算公式推廣到區間上,通過數值計算可以得到,在區間值猶豫模糊集中當賦予ρWIVHFSX1和ρWIVHFSX22個部分不同的偏好時得到的聚類情況也有所不同。對比已有研究中只考慮了對應區間值猶豫模糊元之間的隸屬度值對總體相關性帶來的影響,本文還將對應區間值猶豫模糊元的內部差異作為衡量相關性的指標,考慮了2個影響相關系數的特征,比傳統相關系數只考慮單一特征更為全面。
改進的相關系數計算公式彌補了現有公式中需要進行主觀填充的不足,另外,將猶豫度作為衡量相關性的另一指標加入公式中,把內部偏差考慮在內,用于衡量內部總體差異。無論是猶豫模糊集還是區間值猶豫模糊集,通過數值計算可以發現,當賦予隸屬度差異部分和猶豫度差異部分不同的權重偏好時得到的聚類結果不同。本文的聚類方法已涵蓋了只考慮單一特征的情況,另外,通過理論證明了新公式的科學性,因此本文改進的相關系數公式是合理有效的。