摘 要:通過分析概念格在數據處理中所存在的局限,根據信息的不同存在方式及不同應用領域對概念格的不同要求,在三種數據類型上擴充了經典概念格;討論了三類擴充概念格之間相互轉換的方法,進而提出了擴充概念格與經典概念格的融合原理,使概念格在多種數據的處理上有了更靈活的應用。
關鍵詞:概念格; 單值背景; 多值背景; 語言標度分割原理
中圖分類號:TP18 文獻標志碼:A
文章編號:1001-3695(2008)07-2033-02
Different types of manyvalued context in concept lattice
YANG Lia,XU Yangb
(a.Intelligent Control Development Center,b.Dept. of Mathematics, Southwest Jiaotong University, Chengdu 610031, China)
Abstract:This paper analyzed the limitation of concept lattice applied in data handling. According to the different information existence and the different request of concept lattice in relevant applied realm,extended the classical concept lattice on three kinds of data types, discussed the convert method among theseextensive concept lattices, and then put forward the amalgamating principle of the classical and extensive concept lattice. Thus concept lattice has more flexible application on the processing of various data.
Key words:concept lattice; singlevalued context; manyvalued context; language scale division theory
概念格也稱為Galois格,是由德國的Wille教授于1982年作為一種數學理論首先提出的。近年來,概念格理論被認為是數據分析的有力工具,作為概念格形成所依賴的形式背景正是這些數據的體現方式。然而,起源于單值屬性形式背景(簡稱單值背景)的經典概念格理論卻在某種程度上限制了不同類型數據的存在。為此本文在不同應用背景下,根據信息存在方式的不同,首先定義了擴充概念格形成所依賴的三類多值屬性形式背景(簡稱多值背景);其次引入區間數和三角模糊數討論了三類多值背景之間的相互轉換方法;最后提出語言標度分割原理實現了多值背景向單值背景的轉換,使經典概念格在理論和應用方面得到了發展。
1 概念格[1]
經典概念格理論通常由一類特殊的形式背景即單值背景這一基本概念開始,它重點體現對象集、屬性集以及它們之間的關系。
定義1[2] 一個單值背景是一個三元組(G,M,I)。這里G和M是集合,二元關系IG×M,G和M的元素相應地被稱為對象和屬性。通常用g Im表示(g,m)∈I,意思是對象g有屬性m。
對于AG和BM,定義
因此,A′是A中所有對象所共有的屬性,B′是具有B中所有屬性的對象之集,則形式背景
(G,M,I)的概念定義為元素對(A,B)。這里AG,BM,A′=B和B′=A;概念(A,B)的外延是A,而它的內涵是B。
對于單值背景中的每個屬性項,若只關心它是否有值,則將有值的項稱為該對象具有此屬性,否則就稱該對象不具有此屬性。利用這種單值背景可以十分方便地對事務型數據進行處理。然而在進行數據處理的過程中,更多的情況是,對象與屬性之間不能簡單地用“對象具有或不具有某些屬性”這樣的關系來描述[3,4],如以顏色、質量、年級、性別等為屬性的形式背景,對象與屬性之間就不能只用是與否來表示。
2 不同類型多值背景
2.1 數值型多值背景
定義2 一個數值型多值背景(G,M,I)。其中:G是對象集;M是屬性集;是數值型屬性值的集合,而I-是它們之間的一個三元關系,I-G×M×。當且僅當對任意g∈G,m∈M,有且只有一個數值∈滿足(g,m,)∈I-,即(g,m,)∈I-和(g,m,)∈I-總蘊涵有=,表明相同對象的同一個屬性項的數值應該相等;用(g,m,)∈I-表示對于屬性m,對象g具有數值型屬性值。一個數值型多值背景如表1所示。
2.2 區間型多值背景
記=[wL,wU]={x|wL≤x≤wU,wL,wU∈R(實數集)},稱為一個區間數。特別地,若wL=wU,則退化為一個實數。
以下給出區間數的運算法則[3]。設=[wL,wU]和=[vL,vU],且β≥0,則
c)β=[βwL,βwU]。其中β≥0,特別地,若β=0,則β=0。
定義3一個區間型多值背景(G,M,,I~)。其中:G是對象集;M是屬性集;是區間型屬性值的集合;I~是它們之間的一個三元關系,I~G×M×。當且僅當對任意g∈G,m∈M,有且只有一個區間數∈滿足(g,m,)∈I~,即(g,m,)∈I~和(g,m,)∈I~總蘊涵有=,也即wL=vL,wU=vU。其中=[wL,wU],=[vL,vU],表明相同對象的同一個屬性項的區間數應該相等;用(g,m,)∈I~表示對于屬性m,對象g具有區間型屬性值。一個區間型多值背景如表2所示。
2.3 語言型多值背景
定義4 一個語言型形式背景(G,M,W^,I^)。其中:G是對象集;M是屬性集;W^是語言型屬性值的集合;I^是它們之間的一個三元關系,I^G×M×W^。當且僅當對任意g∈G,m∈M,有且只有一個語言值W^∈W^滿足(g,m,)∈I^。
對于語言型屬性值集W^,根據實際情況,可事先設立語言評估標度[5],使得
W^={α|α=-L,…,L,L為實數}。對于語言標度的選定須滿足以下條件[5]:
一個語言型多值背景如表3所示。根據語言型多值背景中屬性值取值的情況,可令語言評估標度集為W^={-4,…,4}={極差,很差,差,較差,一般,較好,好,很好,極好},則表3可轉換為表4。
3 不同類型多值背景的轉換
3.1 區間型多值背景的轉換
定義5[6] 設兩區間數=[wL,wU]和=[vL,vU],定義
ρq(,)為實數間的距離。
有了區間與區間之間的距離公式,區間型多值背景就可以通過距離的大小變換為數值型多值背景。因為形式背景中屬性集內的屬性有可能不是同一個物理量綱的,所以在變換之前應首先消除不同物理量綱對最終結果造成的影響,本文采用文獻[5]中所提到的公式對其進行規范化處理。為了便于說明,將進行規范化處理后的區間型多值背景記為(G,M,W~′,I~),在轉換為數值型多值背景之前,引入如下定義:
定義6對于規范化區間型多值背景(G,M,W~′,I~)。其中:G是對象集;M是屬性集;W~′是規范化的數值型屬性值集,′ij∈
定義7 對于規范化區間型多值背景(G,M,W~′,I~)。其中:G是對象集;M是屬性集;W~′是規范化的數值型屬性值集,′ij∈W~′(i=1,2,…,m;j=1,2,…,n),稱-j=[w-Lj,w-Uj]=[mini(w′Lij),mini(w′Uij)]為屬性mj的負理想區間數。
定義8 對于規范化區間型多值背景(G,M,W~′,I~)。其中:G是對象集;M是屬性集,W~′是規范化的數值型屬性值集;′ij∈W~′(i=1,2,…,m;j=1,2,…,n),稱Nij=D-ij/(D+ij+D-
數的距離和負理想區間數的距離。
區間型多值背景轉換為數值型多值背景的具體步驟歸納如下:
a)對于某一區間型多值背景(G,M,W~,I~),利用規范化公式將其轉換為規范的區間型多值背景(G,M,W~′,I~);
b)根據定義6和7計算每個屬性的正理想區間數+j和負理想區間數-j;
c)根據定義5計算每個對象分別到正理想區間數和負理想區間數的距離D+ij和D-ij;
d)根據定義8計算每個對象關于所有屬性的理想區間數的貼近度Nij,作為所得數值型多值背景的屬性值。
3.2 語言型多值背景的轉換
為了使語言型屬性值具有量化上的可比性,引入三角模糊數的定義。
定義9[7] 設=[wL,wM,wU]。其中0<wL≤wM≤wU,稱為一個三角模糊數,其特征函數可表示為
0其他
有了三角模糊數,可以將語言值轉換為相應的三角模糊數,如語言型屬性值集W^={極差,很差,差,較差,一般,較好,好,很好,極好},與集合中語言標度相對應的三角模糊數的表達形式為:極差=[0,0.1,0.2];很差=[0.1,0.2,0.3];差=[0.2, 0.3,0.4];較差=[0.3,0.4,0.5];一般=[0.4,0.5,0.6];較好=[0.5,0.6,0.7];好=[0.6,0.7,0.8];很好=[0.7,0.8,0.9];極好=[0.8,0.9,1]。相應地便可以對語言值進行量化運算。
4 語言標度分割原理
作為擴充概念格與經典概念格的融合原理——語言標度分割原理,是根據語言評估標度的特點而提出的。對于一個要轉換為單值背景的多值背景而言,具體的步驟可歸納如下:
a)根據各屬性的類型和對象在各屬性下所取屬性值的具體情況,給出各個屬性的語言標度集以及與該標度相對應的三角模糊數的表達形式;
b)根據對象在每個屬性下的屬性值所屬的三角模糊數區間,確定其所對應的語言值;
c)分割每個屬性,以對象在各屬性下所取得的語言值不同標度的個數作為各個屬性的分欄數;根據三角模糊數(圖1)的特點,每個對象最多只能同時歸屬于同一個屬性下的兩欄。
由此,一個多值背景(G,M,CW,IC)就轉換成了一個單值背景(G,M′,I′)。其中:G是對象集;M′=∪nj=1Sj=∪{sjt|sjt∈Sj},Sj是對于屬性mj的語言標度集,t∈T是屬性mj的分欄數;I′G×M′,用(g,sjt)∈I′表示對象g具有屬性mj下的標度sjt。此方法將屬性進行了合理的分欄,給出了每個欄的上界和下界,不僅使得對象之間得到了較精細的劃分,而且也使得對象最多同時屬于同一個對象下的兩欄。
5 結束語
形式背景是概念格形成的基礎。針對于以往只能對事務型數據進行處理的較單一的單值背景,本文根據信息的存在方式以及多值背景中屬性值取值類型的不同,分別提出了數值型多值背景、區間型多值背景以及語言型多值背景,以此擴充了概念格理論;引入區間數和三角模糊數研究了不同類型多值背景轉換為同一類型多值背景的方法;提出語言標度分隔原理使基于不同類型多值背景的擴充概念格在研究方法上與經典概念格相融合,這樣概念格將會在較多的領域得到應用。
參考文獻:
[1]GANTER B,WILLE R.Formal concept analysis:mathematical foundations[M].Berlin:Springer,1999.
[2]GANTER B,WILLE R.Conceptual scaling[M]//ROBERTS F.Applications of Combinatorics and Graph Theory to the Biological and Social Sciences.New York:Springer,1989:139167.
[3]孫舒楊,劉大有.背景格的若干性質及其完備性證明[J].計算機應用研究,2005,22(3):34-36.
[4]張毅,李懷璋,馬波.一種信息系統服務可擴展機制[J].計算機應用研究,2007,24(2):79-82.
[5]徐澤水.不確定多屬性決策方法及應用[M].北京:清華大學出版社,2004:36-37.
[6]劉華文.基于距離測度的模糊數排序[J].山東大學學報,2004,39(2):30-36.
[7]王熙照,趙雅倩.一種新的三角模糊數算子在加權模糊推理中的應用[J].模糊系統與數學,2006,20(1):18-23.
[8] 周宏安,劉三陽.區間數互補判斷矩陣排序的一種新方法[J].西安電子科技大學學報:自然科學版,2006,33(2):292-295.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文?!?/p>