摘 要:傳統粒的表示上存在其局限性導致粒的適用性不強,難以滿足用戶對粒描述的興趣點。在傳統粒計算理論的基礎上,對粒的表示方法加以改進,從而使粒更具適用性,進而定義了新表示方法下粒的幾個運算,研究了新表示方法下粒的距離及相似度。這種理論方法注重從粒的語法上去研究粒的運算、距離及相似度,更清晰準確地揭示了粒的本質。
關鍵詞:粒計算; 表示方法; 距離; 相似度; 粒熵
中圖分類號:TP18文獻標志碼:A
文章編號:1001-3695(2010)06-2034-03
doi:10.3969/j.issn.1001-3695.2010.06.010
New description method of granular and its distance computing
XU Jiu-cheng, CHENG Wan-li, SUN Lin
(Key Laboratory for Intelligent Information Processing, College of Computer Information Technology, Henan Normal University, Xinxiang Henan 453007, China)
Abstract:The represention of traditional granule exists limitations which leads to low application, so it is difficult to meet users’points of interest about granule discription. Based on the theory of traditional granular computing, this paper improved the representation method of granular, making granular more applicable. Besides, defined several operations between granulars by the new method. Finally, studied granular’s distance and similarity. This theory emphasizes on researching granular’s operations, distance and similarity in granular’s grammar, which reveals the essence of granular more clearly and accurately and makes grannular computing better used in solving the problems about uncertainty relation.
Key words:granular computing; representation method; distance; similarity; granular entropy
0 引言
粒計算是一種新的基于問題概念空間劃分的智能計算方法[1~4]。關于粒計算的問題,通常可以從兩個方面進行研究,即粒子的結構和粒子的計算。前者主要是解決粒子的形成、表示和解釋;后者主要是解決粒子的使用問題。在目前粒計算的研究中,對粒的結構描述,文獻[3]中把一個基本粒表示為m(a,v)的形式。其中(a,v)是一個原子式。而實際應用中,如在數據庫中,屬性v的取值可能有數百個,僅一個屬性就對應數百個原子式,而要考察的是屬性在某個取值區間上的情況,如在數據庫檢索時,如果描述一個類似“av>x且av 本文在傳統粒計算理論的基礎上,對粒的表示方法進行改進,把一個原子式(a,v)重新定義為(a, M)。其中M不再是一個值,而是一個值域,從而使新定義的粒更具有適用性,進而定義了新表示方法下的粒的運算。在這些運算的基礎上本文定義了粒的距離和相似度并研究了其相關性質,最后將粒的距離計算應用到粒熵計算與屬性取值重要度的計算上。這種理論方法滿足了用戶對粒描述的興趣點,從而使粒計算更好地用于解決不確定性關系問題。 1 基本概念 定義1[3] 在信息系統S=(U,A,V,f)中,令a∈A, v∈Va,(a,v)為一原子式,以下簡寫為av,定義如下的rough邏輯公式: a)av是原子式,原子式是公式; b)如果A和B是原子式,那么~A、A∧B、A∨B、(A)、A→B是公式; c)按a)和b)定義的公式,使用連接詞~、∨、∧、→、 進行有限次運算所組成的式子是公式。 根據以上定義可以看出,在等價關系下,某個屬性集上的屬性值相等的對象可以構成一集合,且這些對象在該屬性集上滿足等價關系,可以利用這個集合來定義粒。 定義2[3] 粒的定義。函數h(a,v)表示在屬性a(a∈A)上的值為v的對象集,信息系統S=(U,A,V,f)中粒的定義為Gr=((a,v),h (a,v))。其中(a,v)為粒Gr的語法,Gr被稱為信息系統中的原子粒。設ω和Ψ是形如(a,v)的原子式使用邏輯連接詞~、∨、∧、→、所得邏輯組合,h(ω)表示滿足邏輯組合ω的對象集合。Gr=(ω,h(ω))被稱為滿足邏輯組合ω的組合粒。 2 一種粒表示方法及運算 定義3 公式的定義。在信息系統S=(U,A,V,f)中,令a∈A, MVa,(a,M)為一原子式,以下簡寫為aM,定義如下的rough邏輯式: a)aM是原子式,原子式是公式;若M=Va,則aM對應的對象為整個論域,并把該類原子式記為T;若M=,則稱aM為空公式。 b)如果A和B是原子式,那么A∧B是公式,使用連接詞∧進行有限次運算所組成的式子是公式。 定義4 粒的定義。函數h(a,M)表示所有在屬性a(a∈A)上的值屬于M(MVa)的對象集,即h(a,M)={x|a(x)∈M}。其中:x∈U,則信息系統S=(U,A,V, f )中粒的定義為Gr=((a, M), h(a, M))。其中,原子式(a, M)為粒Gr的語法,Gr被稱為信息系統中的原子粒。設ω是形如(a1,M1)∧(a2,M2)∧…∧ (an,Mn)的由原子式使用邏輯連接詞∧所得邏輯組合,h(ω)表示滿足邏輯組合ω的對象集合。Gr=(ω,h(ω))被稱為滿足邏輯組合ω的組合粒。函數F(Gr)表示滿足粒Gr的對象集合。 定義3與4是在文獻[3]基礎上對公式和粒重新定義,其主要區別是將原子式(a,v)重新定義為(a,M) (a∈A,v∈Va, MVa),意義在于擴大粒的適用范圍。同時,為了簡化粒的運算,公式的邏輯組合所用連接詞只取“∧”。 性質1 設ω是公式,對原子式aM,若M=,則h(a, M)=;若M=Va,則h(a, M)=U,且滿足ω∧aM=ω,ω∨aM=aM。 定義5 粒分解。一個粒Gr=(ω,h(ω))。其中:ω=(a1,M1)∧(a2,M2)∧…∧(an,Mn),則Gr的分解dec(Gr)={Gr1,Gr2,…,Grn}。其中,Gr1=((a1,M1),h(a1,M1)),Gr2=((a2,M2),h(a2,M2)),…,Grn=((an,Mn),h(an,Mn))。 定義6 交運算。對于任意兩個粒Gr1=(ω1,h(ω1)),Gr2=(ω2,h(ω2))。其中:ω1=(a1,M1)∧(a2,M2)∧…∧(an,Mn),ω2=(a1,K1)∧(a2,K2)∧…∧(an,Kn),則定義其交運算(∧)為Gr1∧Gr2=(ω3,h(ω3))。其中ω3=(a1,M1∧K1)∧(a2,M2∧K2)∧…∧ (an,Mn∧Kn)。 定義7 并運算。對于任意兩個粒Gr1=(ω1,h(ω1)),Gr2=(ω2, h(ω2))。其中:ω1=(a1,M1)∧(a2,M2)∧…∧ (an,Mn),ω2=(a1,K1)∧(a2,K2)∧…∧(an,Kn),則定義其并運算(∨)為Gr1∨Gr2=(ω3,h(ω3))。其中ω3=(a1,M1∨K1)∧(a2,M2∨K2)∧…∧ (an,Mn∨Kn)。 定理1 對于任意兩個組合粒Gri=(ωi, h(ωi)),Grj=(ωj,h(ωj))。其中ωi=(a1,M1)∧(a2,M2)∧…∧(an,Mn),ωj=(a1,K1)∧(a2,K2)∧…∧(an,Kn),則滿足Gri∧Grj=∧{Gr|Gr∈dec(Gri)∪dec(Grj)},Gri∨Grj=∨{Gr| Gr∈dec(Gri)∪dec(Grj)}。 證明 由定義5可得dec(Gri)={Gri1,Gri2,…,Grin}。其中:Gri1=((a1,M1), h(a1,M1)),Gri2=((a2,M2),h(a2,M2)),…,Grin=((an,Mn),h(an,Mn));dec(Grj)={Grj1,Grj2,…,Grjn},Grj1=((a1,K1),h(a1,K1)),Grj2=((a2,K2),h(a2,K2)),…,Grjn=((an,Kn),h(an,Kn))。所以∧{Gr| Gr∈dec(Gr1)∨dec(Gr2)}=∧{Gri1,Gri2,…,Grin,Grj1Grj2,…,Grjn}=Gri1∧Grj1∧…∧Grin∧Grjn=((a1,M1∧K1),h(a1,M1∧K1)) ∧…∧((an,Mn∧Kn),h(an,Mn∧Kn))。由定義12可得Gri∧Grj= (ωk,h(ωk))。其中ωk=(a1,M1∧K1)∧(a2,M2∧K2)∧…∧ (an,Mn∧Kn),所以得Gri∧Grj=∧{Gr| Gr∈dec(Gri)∨dec(Grj)}。 同理可得Gri∨Grj=∨{Gr|Gr∈dec(Gri)∨dec(Grj) }。 性質2 對于任意兩個粒Gr1=(ω1,h(ω1)),Gr2=(ω2,h(ω2)),Gr1=Gr2當且僅當Gr1∧Gr2= Gr1∨Gr2。 證明顯然成立。 定義8 對于任意兩個粒Gr1=(ω1,h(ω1)),Gr2=(ω2,h(ω2)),若滿足Gr1∨Gr2=Gr1且Gr1∧Gr2=Gr2,則稱粒子Gr1是Gr2父粒,或者稱Gr2是Gr1的子粒,記為Gr2Gr1。 性質3 對于任意組合粒Gr=(ω,h(ω)),其中ω=(a1,M1)∧(a2,M2)∧…∧ (an,Mn),N∈dec(Gr),則GrN。 證明 由N∈dec(Gr),所以令N=((ai,Mi),h(ai,Mi)),因為ω∧(ai,Mi)=ω,所以Gr∧N=Gr;又有ω∨(ai,Mi)=(ai,Mi),得Gr∨N=N,再由定義8可得GrN。 例1 設S=(U,A,V,f)為一信息系統(表1),其中U={x1,x2,x3,x4,x5,x6},A={a,b,c}。 a)描述在屬性a上取值大于0,屬性b上取值不等于0,屬性c上取值等于1的粒Gr1; b)描述在屬性a上取值小于3,屬性c上取值大于0的粒Gr2; c)求Gr1∧Gr2和Gr1∨Gr2。 表1 信息表S UabcUabc x1130x4004 x2-10.51x5501 x3312x6211