李進金,孫 文
(1.閩南師范大學 數學與統計學院, 漳州 363000;2.汕頭大學 理學院, 汕頭 515000)
知識空間理論(knowledge space theory,簡稱“KST”)[1]是由美國數學心理學家J P Doignon和J C Falmagne于1983年首先提出的一種數學理論。其通過分析學生對不同水平的一系列有關問題解答情況來確定學生在不同知識中的認知水平。基于教育學和心理學等理論,KST建立了一套數學理論來反映教育規律,為教育評價提供了一種有效的科學方法,也是一種測試學生知識水平和構建學生知識結構的理論。1990年Koppen和Doignon研究了基于專家問詢生成知識空間的方法[2]。1993年Dowling在有限知識空間中提出了一種構建知識基的方法,同時研究了根據有限狀態族生成知識空間的另一種不同方法[3]。1994年,Albert提出了一種由問題系統構建知識空間的方法[4-5],隨后Albert和Lukas又從理論到應用系統地研究了知識空間[6]。發展至今,KST已經成為了自適應教學和測試系統中最有效的知識表示理論[7],并在計算機輔助教學中得到了廣泛應用。例如,基于網頁在線學習和評估的計算機知識診斷系統ALEKS(assessment and learning in knowledge space的簡稱)已使得美國數百萬學生受益(https://www.aleks.com/)[8]。
知識基是知識空間的核心要素, 其元素個數通常遠小于知識空間元素個數。知識基可生成知識空間, 它蘊含了知識空間的所有信息。事實上,知識基是知識空間的最小生成組,它反應了學生能掌握的最基本的問題集族,為刻畫整個知識空間以及尋找學習路徑都提供了依據。因此,研究知識基具有豐富的理論和現實意義。對于知識基生成知識空間的算法,Dowling的算法對選擇狀態的順序比較敏感[3]。2011年Falmagne和Doignon改進了Dowling的算法,使得算法效率提高10%~30%[9]。
形式概念分析(formal concept analysis,簡稱“FCA”)是由德國數學家R Wille于1982年提出的一種數學理論[10]。它作為一種知識發現的有力工具已被廣泛地應用于信息檢索,知識評價等領域。在FCA中,概念是一個由外延和內涵構成的二元組,其中外延是對象集,描述概念所涵蓋的對象; 內涵是屬性集,描述概念所具有的特征。在某種偏序關系確定下,所有概念組成的集合稱概念格[11]。概念結構如何表征與存儲,概念格如何構建以及知識約簡等是形式概念分析研究的熱點問題。值得注意的是,1996年Rusch和Wille建立了知識空間與概念格之間的聯系,提出了另一種由知識基生成知識空間的方法[12]。這為FCA在教育與心理學等領域的應用奠定了基礎。形式概念分析在數學教育和心理學等領域中也有著廣泛的應用[9,13]。
本文旨在闡述知識空間理論和形式概念分析之間的聯系,進一步豐富形式概念分析理論及其在知識空間中的應用,以及為通過知識基建立知識空間和形式背景之間的聯系提供一種思路。
定義1[1]設某個領域的知識都能通過一些問題來反應,將這些問題組成的集合稱為問題域,簡稱為域(domain),用符號Q表示。
通常,令Q={q1,q2,…,qn}為所討論知識的問題域,其中qi表示問題,i≤n。
值得注意的是:
1) 知識由問題來刻畫,學生能夠解決某個問題表示其掌握了相應的知識。因此,問題的選擇需具有代表性。
2) 一般情況下只考慮論域Q有限的情形。
例1若要測試某中學生關于一元二次方程αx2+βx+γ=0求解的知識掌握情況,則只需采用如下3個問題,其中
q1:x2-3x+2=0 (Δ>0),
q2:x2-2x+1=0 (Δ=0),
q3:x2-2x+3=0 (Δ<0),
這3個問題分別代表了解一元二次方程的3種情形。因此,問題域為Q={q1,q2,q3}。
定義2[1]學生在理想條件下能夠正確回答問題域Q中的問題所構成的集合稱為知識狀態(knowledge state),記為K。
所謂理想狀態即指學生在沒有受到外部壓力或任何躁動情緒干擾的情況下,沒有由粗心導致的錯誤和由對問題沒有真正理解而幸運猜對的情況。
定義3[1]設Q為問題域,K是由Q的一些子集構成的知識狀態集族,并且K至少包含了空集?和全集Q,稱(Q,K)為知識結構(knowledge structure),記為
K={?,K1,K2, …,Q},
其中每一個Ki?Q。
在問題域Q明確的情況下,有時也只用K表示知識結構。
例2續例1,若K1={?,Q},則(Q,K1)為Q上最粗的知識結構; 令K2=P(Q)表示取Q的全冪集,則(Q,K2)為Q上最細的知識結構; 令K3={?,{q1,q2},Q},則(Q,K3)為Q上通常的知識結構。顯然有:
(Q,K1) ?(Q,K3)?(Q,K2)。
定義4[14]設(Q,K)為知識結構,若K對有限并封閉,即
?Ki,Kj∈K?Ki∪Kj∈K,
則稱(Q,K)為知識空間(knowledge space),或直接稱K為知識空間。
定義5[9]若G′包含G中所有有限個元素的并組成的集合,則稱集族G′是G的張成(span),記為S(G) =G′,或稱G張成G′。
由S(G)的定義知S(G)是并封閉的。
定義6[9]設集族F是并封閉的,若B是張成F的最小子集族,則稱B為F的基(base),即S(B) =F。
通常,?可看作是B中空子集族的并,因此約定??B。其次,定義6中最小子集族是指關于包含關系“?”的最小子集族:即對于任意H?B且S(H) =F,則有H=B。此外B中的任何一個集合K,均不能由B中其它集合的并集表示。
本文稱知識空間的基為知識基(knowledge base)。
一般來講,我們考慮的對象是K,即包含空集?和全集Q的知識狀態集族,因此,即使Q取無限問題域,只要K取有限的知識狀態集族,這樣的知識結構也是我們考慮的重要對象。
定義7[9]當Q有限時,稱知識結構(Q,K)是有限的(finite)。當K有限時,稱知識結構(Q,K)是實質有限的(essentially finite)。
由定義7可知: 若知識結構(Q,K)是有限的,則它也是實質有限的,反之不然。如取Q=Z,Z是全體非負整數的集合,取K={?, {2k:k∈Z},Q},則(Q,K)是實質有限的,但不是有限的知識結構。
定理1[9]任何實質有限的知識空間有知識基。
定理2[9]設B為知識空間(Q, K)的知識基,則對任意張成K的集族F,都有B?F。
由定理1和定理2可知: 有限知識空間和實質有限知識空間都存在唯一的知識基。然而,下面例3說明了并非所有知識空間都存在知識基。
例3實數R中所有的開子集構成的集族K是一個知識空間。K可由所有端點為有理數的開區間所構成的集族F1張成,也可由所有端點為無理數的開區間所構成的集族F2張成。若K有知識基B,則由定理2知B?F1且B?F2,則B?F1∩F2=?,矛盾。故知識空間K沒有知識基。
定理3設B為知識空間(Q, H)和(Q,H ′)的一個知識基,則H=H′。
證明設K∈H,因為B為知識空間(Q, H)的一個基,所以存在B的子集族F使得K=∪F。又因為B同時也為知識空間(Q, H′)的一個基,所以K=∪F∈H′,故H=H′。
由定理3知,當知識基B確定時,由該知識基可生成唯一的知識空間(Q, K),這為下文由知識基生成知識空間提供了理論依據。
定義8[3]設F是問題域Q的非空子集族,q∈∪F,F中包含q的最小集合稱為元素q的一個原子(atom)。
例4在知識空間
K={?, {a}, {a,b}, {b,c}, {a,b,c}}
中,知識狀態{b,c}是元素b的一個原子,同時也是元素c的一個原子。元素b有兩個原子:{a,b}和{b,c}。元素a只有一個原子{a}(雖然a也屬于原子{a,b},但知識狀態{a,b}不是元素a的原子)。
然而,對于知識空間的知識基B,問題域的每個問題在B中不一定有原子。

定理4[3]如果知識空間(Q, K)的知識基B存在,則B可由所有的原子組成的集族構成。
由此可知,尋找知識基的過程就是找出知識空間的所有問題的原子。
本子節介紹1993年Dowling[3]提出的計算知識基的方法。如下所述:
第1步記知識空間為(Q, K),其中
Q={q1,q2,…,qm}
有m個問題,K={K1,K2, …,Kn}有n個知識狀態,按下標從小到大的順序列出所有問題元素q1,…,qm作為矩陣的列,列出所有的知識狀態K1,…,Kn作為矩陣的行,且滿足:當Ki?Kk時有i≤k對任意i,k∈{1, …,n}成立(根據包含關系按照單調不減的順序列出知識狀態,狀態之間沒有包含關系的,可以隨機排列),這樣形成一個n×m的矩陣,記為T=(Tij)(1 ≤i≤n,1 ≤j≤m)。
第2步初始化,若qj∈Ki,則Tij取“*”;否則,Tij取“-”。
第3步對于第二步中得到的值T=(Tij),若存在一個p,1≤p
第4步取至少包含一個“*”的行對應的知識狀態Ki作為構成知識基的一個元素,所有這樣的Ki構成的集族就是知識基,每一個Ki都是原子。
例6設知識空間
K={{?}, {a}, {a,b}, {b,c}, {a,b,c}}。
其中Q={a,b,c}。
初始化形成的矩陣如表1所示。

表1 初始化得到矩陣TTab.1 The initial values of the array T
根據算法的第3步: 從a這一列來看,有{a} ?{a,b}和{a} ?{a,b,c},所以把T31和T51的值由“*”變為“+”。而對于b這一列來看,有{a,b}?{a,b,c}({b,c}?{a,b,c}),所以把T52的值由“*”變為“+”,因{a,b}與{b,c}之間沒有包含關系,所以T32,T42的值“*”保持不變。從c這一列來看,有{b,c}?{a,b,c},所以把T53的值由“*”變為“+”。

表2 最終得到矩陣TTab.2 The final values of the array T
根據算法的第4步至少包含一個“*”的知識狀態Ki作為構成知識基的一個元素,如表2所求的知識基是
B={{a}, {a,b}, {b,c}}。
本節我們總結由Doignon給出的一個由知識基生成知識空間的算法。該算法受到Dowling[15]的啟發,Doignon[7]改進了思想并提高了效率。
設B是某個知識空間(Q, K)的知識基,B包含n個知識狀態,記作
B={B1,B2, …,Bn}。
該算法由一系列的步驟生成關于包含關系單調遞增的狀態序列的集族,最后得到相應的知識空間。
第1步把這些知識狀態按照其元素個數由小到大排序,若狀態中元素個數相同則可以任意排列。
第2步設G0={?},對于i=1, …,n,取Gi為Gi-1∪{Bi}生成的知識空間,重復出現的知識狀態只保留一個。
第3步經過n次歸納得到Gn為B={B1,B2, …,Bn}所生成的知識空間。
例7設B={{a}, {b}, {a,c}, {b,d}}為某個知識基。下表給出知識空間G的值。如表3經過上述3步我們得到:由基
{{a}, {b}, {a,c}, {b,d}}
生成的知識空間是
G={{?}, {a}, {b},{a,b}, {a,c}, {b,d}, {a,b,c},{a,b,d}, {a,b,c,d}}
還有一種方式在具體操作過程中每一步只需保存與上一步的不同集合,最后再把所有狀態放在一起構成知識基,這樣就避免重復存儲[9]。

表3 G值的連續變化表Tab.3 The successive values of G
1999年B Ganter和R Wille[16]從減少行與列的角度提出了概念的約簡理論。2005年張文修[17]等提出了概念格的屬性約簡理論。約簡就是尋找最小的屬性子集,它能夠完全確定原始形式背景上的概念及其層次結構,概念格約簡使得形式背景中隱含知識的發現變得更容易,也使得這些知識的表示變得更簡潔。這樣最小的屬性子集可看作形式背景的最小生成組(知識基)。
形式概念與形式背景是形式概念分析的兩個基本定義,概念的基本觀點是從哲學中發展而來。
定義9[10]稱三元組(U,A,I)為一個形式背景,其中U={x1,x2, …,xn}為對象集,A={a1,a2, …,am}為屬性集,每一個xi(i≤n)稱為一個對象,每個aj(j≤m)稱為一個屬性,I為U和A之間的二元關系,I?U×A,若(x,a)∈I,則稱x具有屬性a,記為xIa。
定義10[10]設(U,A,I)為形式背景,在對象集X?U和屬性集B?A上分別定義運算
X*={a|a∈A, ?x∈X,xIa};
B*={x|x∈U, ?a∈B,xIa}。
如果一個二元組(X,B)滿足X*=B且X=B*,則稱(X,B)是一個形式概念,簡稱概念,其中X稱為概念的外延,B稱為概念的內涵。
定義11[10]形式背景(U,A,I)上的所有概念可以用“≤”來定義它們之間的偏序關系:
(X1,B1)≤(X2,B2)?X1?X2(B1?B2)
形式背景(U,A,I)的所有概念的集合記為L(U,A,I),稱為概念格,其上下確界定義如下:
(X1,B1)∧(X2,B2)=((X1∧X2), (B1∨B2)**),
(X1,B1)∨(X2,B2)=((X1∨X2)**, (B1∧B2))。
容易驗證概念格L(U,A,I)是完備格。
定義12[17]設L(U,A1,I1)和L(U,A2,I2)是兩個概念格,如果(X,B)∈L(U,A2,I2),總存在(X′,B′)∈L(U,A1,I1),使得X=X′,則稱L(U,A1,I1)細于L(U,A2,I2),記作L(U,A1,I1)≤L(U,A2,I2)。
如果L(U,A1,I1)≤L(U,A2,I2)且
L(U,A2,I2)≤L(U,A1,I1),那么這兩個概念格同構,記作L(U,A2,I2)?L(U,A1,I1)。
注1)L(U,A1,I1)≤L(U,A2,I2)當且僅當LU(U,A1,I1)?LU(U,A2,I2);
2)L(U,A2,I2)?L(U,A1,I1)當且僅當LU(U,A1,I1)=LU(U,A2,I2)。
定義13[17]對于形式背景(U,A,I),如果存在屬性集D?A使得
L(U,D,ID) ?L(U,A,I),
則稱D是(U,A,I)的協調集。若進一步?d∈D,有
L(U,D-g0gggggg,ID-g0gggggg) ≠L(U,A,I),
則稱D是(U,A,I)的約簡。
形式背景(U,A,I)的所有約簡為{Di|i∈τ},τ為指標集,可將屬性A分為3類[17]:
絕對必要屬性 (核心屬性)
相對必要屬性
絕對不必要屬性
需要注意的是:任何形式背景(U,A,I),其約簡集一定存在且不一定唯一。2005年張文修[17]等給出了概念格約簡的判定定理,并通過構造辨識矩陣給出了約簡的方法。
定義14[17]設(U,A,I)為形式背景,(Xi,Bi),(Xj,Bj)∈L(U,A,I),稱DISFC((Xi,Bi), (Xj,Bj))=Bi∪Bj-Bi∩Bj為(Xi,Bi)與(Xj,Bj)的可辨識屬性集。稱
ΛFC={DISFC((Xi,Bi), (Xj,Bj)) |
(Xi,Bi),(Xj,Bj) ∈L(U,A,I)}
為形式背景(U,A,I)的可辨識屬性矩陣。
定理5[17]設(U,A,I)為形式背景,?D?A,D≠?,若(Xi,Bi)≠(Xj,Bj),且
(Xi,Bi), (Xj,Bj)∈L(U,A,I),
則下列命題等價:
1)D是協調集;
2)Bi∩D≠Bj∩D;
3)D∩DISFC((Xi,Bi), (Xj,Bj)) ≠?(?DISFC((Xi,Bi), (Xj,Bj)) ≠?);
4) 任意B?A,若B∩D=?,則B?ΛFC。
由形式背景的可辨識屬性矩陣ΛFC,可找出所有的核心屬性[17]。
定理6[17]設(U,A,I)為形式背景,對于a∈A,a為核心屬性當且僅當存在
(Xi,Bi), (Xj,Bj)∈L(U,A,I),
使得
DISFC((Xi,Bi), (Xj,Bj))={a}。
以上辨識矩陣約簡理論可具體參考張文修等關于概念格的屬性約簡理論[17]。2014年李進金、 張燕蘭等[18]從交運算封閉性角度提出了一種基于知識基的約簡理論。
由形式背景(U,A,I)產生的概念格L(U,A,I),首先是作為概念集合
{(X,B)|X*=B,B*=X,X?U,B?A},
然后又具有偏序關系,在此基礎上引入交、并運算而形成格。為了確定L(U,A,I),可先確定LU(U,A,I)即每個形式概念(X,B)的外延X的集合:
LU(U,A,I)={X|X?U,X**=X},
還可將LU(U,A,I)描述成
LU(U,A,I)={B*|B?A,B**=B},

下面我們考慮基于知識基的概念格屬性約簡方法。
定義15[18]設(U,A,I)為形式背景,a∈A,若存在D?A,a?D使得
則稱a為交式可約元。
關系R={(a,b) ∈A×A|a*=b*}是A上的等價關系,由此得到A上的一個劃分:其中
A/R={[a]R|a∈A},
[a]R={b∈A|(a,b) ∈R}。
定理7[18]設(U,A,I)是形式背景,a∈A,若[a]R不是單元素集合,則[a]R中元素皆為交式可約元,而且(A-[a]R) ∪ {a}為協調集。
定理8[18]設(U,A,I)是形式背景,對任意a,b∈A,若a*=b*,則
{B*|B?A}={B*|B?A-{a}}。
推論1[18]設(U,A,I)是形式背景,若a1,a2,…,ak∈A且a1*=a2*=…=ak*。記
A1={a1,a2,…,ak},
則(A-A1) ∪ {ai} (1 ≤i≤k)皆為協調集。
推論2[18]設(U,A,I)是形式背景,則核心屬性是A/R中等價類為單元集的屬性。

定理10[13]設(U,A,I)為形式背景,若A/R={[ai1], [ai2], …, [aik]}的等價類皆為單元素集(從而k=|A|),則形式背景(U,A,IA)的屬性約簡集唯一。

根據前面得到的結果,可以給出求形式背景(U,A,I)約簡集的一種方法:
1) 求出{a*|a∈A};
2) 求出A/R={[ai1], [ai2], …, [aik]};
3) 從[ait]中選一個代表元ait(1 ≤t≤k)組成屬性集A′={ai′| 1 ≤t≤k}。從{a*|a∈A}中找出{a*|a∈A′}。
4)對{a*|a∈A′}中的a*依|a*|由大到小排序,|a*|相等的次序可隨意。排在后面的可由排在前面的經交運算生成反之不一定成立。

6)如果前面若干個a*的交生成后面某個b*,則將b從A′中刪去,將b*從
{a*|a∈A′}
中刪去。
總之,在通過{a*|a∈A′}交運算生成{B*|B?A′}的過程中,發現可約元而約去,得到LU(U,A,I)的最小交式生成組D(知識基),即是(U,A,I)的屬性約簡集,并可由它得到所有屬性約簡集。這就是基于知識基的概念格屬性約簡方法。
對偶地,可以討論形式背景(U,A,I)導出的概念格L(U,A,I)的所有形式概念的內涵組成的集合,記為LA(U,A,L),則
LA(U,A,I)={B?A|B**=B}=
{X*|X?U, |X**=X}。
LA(U,A,I)作為交封閉系統有交式生成組{x*|x∈U},討論LA(U,A,I)的對象約簡問題,亦即探討LA(U,A,I)的交式最小生成組問題,引入U上的等價關系
R*={(x,y) ∈U×U|x*=y*},
其中
U/R*={[xi]R*|xi∈U},
[xi]R*={y∈U|(x,y) ∈R*}。


則稱x′是可約對象,去掉可約對象的過程也是一種約簡過程。
{x*|x∈U}構成A的覆蓋,{a*|a∈A}構成U的覆蓋,{x*|x∈U}是LA(U,A,I)的交式生成組,{a*|a∈A}是LU(U,A,I)的交式生成組。
借助于粗糙集中的上、下近似算子概念,用□表示下近似,用◇表示上近似,對于X?U及B?A有
X□={a∈A|a*?X},
X={a∈A|a*∩X≠?},
B□={x∈U|x*?B},
B={x∈U|x*∩B≠?}。
定義16[19]設(U,A,I)為形式背景,若X=B,B=X□,稱(X,B)為面向對象概念;若X=B□,B=X,稱 (X,B)為面向屬性概念。
更多有關面向對象概念格,面向屬性概念格的協調集、約簡集、基于知識基的約簡方法等可參考有關文獻[20-22]。
Rusch和Wille[12]指出知識空間理論和形式概念分析之間可以建立有效的聯系。2010年Spoto和Stefanutti[13]在此基礎上繼續將KST與FCA相結合,通過一個病人診斷的實際例子來闡明已獲得的知識結構有效性的方法。并引入BLIM(基本局部依賴模型)來估計已獲知的知識結構,提出對于BLIM參數新的解釋,適用于測試的可靠性和有效性。2017年Wild[23]通過對比Doignon關于學習空間的構造和D Gainer關于最小問題的形成[24],強化形式概念分析在學習問詢方法中的應用,將Wille等人關于構建知識空間的方法加強到學習空間中[23]。J P Doignon和J C Falmagne從教學方法論觀點出發提出學習空間的概念[25],這是對知識空間的一種特殊化處理,Doignon接著又研究了怎樣構造學習空間[26]。Eppstein研究了具有良級性質的并封閉集族[27],Cosyn和Uzun從良好級配性對學習空間進行性質研究[28]。
按照FCA的相關理論,在形式背景(P,Q,I)中,為保持形式上的對應,稱P為對象集,Q為屬性集,只要二元關系I確定,那么就能由知識空間(Q, K)構造出形式背景(P,Q,I)即(Q, K) →(P,Q,I) 。由于形式背景內涵是交封閉的,形式背景內涵的補集總是并封閉的,那么對形式背景(P,Q,I),內涵的補集形成Q上的一個知識空間,即(P,Q,I) →(Q, K)。本文的形式背景又稱為知識背景,它是賦予教育意義下一種特殊的形式背景。現只需闡明知識背景中概念、外延和內涵的表現形式,就可以由知識背景(P,Q,I)誘導出知識空間(Q, K)。
定義17[12]設有限集P={p1,p2, …,pn},其中pi(1 ≤i≤n)是被測試的對象,Q是問題集,I是P和Q之間的二元關系,pIq表示對象p不能解決問題q,稱三元組(P,Q,I)是知識背景(knowledge context)。
定義18設有限集P={p1,p2, …,pn},其中pi(1 ≤i≤n)是被測試的對象,Q是問題集,Ic是P和Q之間的二元關系,pIcq表示對象p能解決問題q,稱三元組(P,Q,Ic)是相對于(P,Q,I)的反知識背景。
Rusch和Wille在此定義了一種特殊的形式背景。接下來的問題是如何通過知識空間(Q, K)轉化成知識背景(P,Q,I),并且這樣的轉化恰好使得該知識空間(Q, K)的知識狀態由所形成的知識背景(P,Q,I)的所有概念內涵的補集組成。為了解決這一問題,需假設知識空間(Q, K)中的每一個知識狀態代表某個測試對象能解決的問題集,這樣就建立了K的所有知識狀態與測試對象集P之間的一一對應。由知識空間(Q, K)構造知識背景(P,Q,I)的過程為:
設K={K1,K2, …,Kn},其中K1=?,Kn=Q,Ki(1 ≤i≤n)表示對象pi對應的知識狀態,由此就將知識空間中的每一個狀態和被測試的對象之間建立一一對應關系。于是有以下定理。
定理11[12]知識背景(P,Q,I)與形式背景(K,Q, ?)是同構的。其中K是知識狀態集族,Q是問題集,?是K×Q上的二元關系,表示某個問題q?K,其中q∈Q,K∈K。
定義19[12]設知識背景為(P,Q,I),且A?P,B?Q算子A*={q∈Q|pIq,?p∈A},B*={p∈A|pIq,?q∈B},若A=B*并且B=A*,則稱二元組(A,B)是一個知識概念(knowledge concept),簡稱概念,A是概念的外延,B是概念的內涵。
對于由知識空間構造的形式背景,還可對其進行約簡,這里舉一個例子說明。1993年Korossy[29]通過實際測試,選取了初等幾何學中與畢達哥拉斯定理有關的五個問題,記為Q={1, 2, 3, 4, 5},這里不對這五個問題的具體內容闡述,1999年Korossy從能力和技能方面對知識空間進行研究[30]。Korossy通過實驗驗證分析得到知識空間(Q, K),其中
K={?, {1}, {3}, {1, 2}, {1, 3}, {1,4}, {2, 3}, {3,4}, {1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4},{1, 2, 3, 4}, {1, 2, 3, 5}, {1, 2, 3, 4, 5}}
由該知識空間導出的知識背景如表4所示。

表4 由K導出的知識背景Tab.4 The knowledge context of K
定義20[12]對于“”、“”和“”,pq表示pIcq并且{p}*是不包含q的極大集。
pq表示pIcq并且{q}*是不包含p的極大集。

例如,在上述知識背景表4中,滿足(p21):
{p1}*={1, 2, 3, 4, 5}
{p2}*={2, 3, 4, 5}
{p3}*={1, 2, 4, 5}
{p4}*={3, 4, 5}
?
{p14}*={4}
{p15}*=?
滿足 (p21):
{1}*={P1,P3,P7,P8,P12}
{2}*={P1,P2,P3,P5,P6,P8,P11}
{3}*={P1,P2,P4,P6,P10}
{4}*={P1,P2,P3,P4,P5,P7,P9,P14}
{5}*={P1,P2,P3,P4,P5,P6,P7,P8,P9,P10,P11,P12,P13}


表5 約簡后的知識背景Tab.5 The reduced knowledge context
顯然,為了獲得知識空間(Q, K)所對應的知識背景,只需要對p2,p3,p4,p6,p7,p8,p14進行測試。這樣由知識空間(Q, K)構造出知識背景(P,Q,I)與約簡后的知識背景有同樣的概念格結構。
Rusch和Wille指出:在知識背景(P,Q,I)中,“”、“”和“”運算不僅可以對知識背景約簡,還可以結合知識空間中原子的定義,通過原子構造知識基,進而生成知識空間。
通過專家問詢學生作答[31-32]而形成的知識背景(P,Q,I)中問題q的原子可定義為不包含q的最大內涵的補集,記為σ(q) ={Q{p}*|p∈P,q∈Q,pq}。那么,知識背景(P,Q,I)可以由所有原子σ(q)來描述。
在上述知識空間(Q, K)中,由KST知問題2的原子是{1, 2}和{2, 3}。由表4知在知識背景(P,Q,I)中p42,{p4}*={3, 4, 5}和p72,{p7}*={1, 4, 5},因此2的原子是p4與p7分別對應的知識狀態,也即是{1, 2}和{2, 3}。由此可總結出:知識空間的所有原子構成的知識基可以在對應的知識背景下通過運算“”,“”和“”完全決定。反之,如果所有原子σ(q),q∈Q構成的知識基已經確定,那么對應的約簡知識背景可由與(P,Q,I)同構的形式背景Q, ?)完全確定[33]。表6是由Korossy通過測試所得的知識背景為例。

表6 由知識背景導出原子Tab.6 The knowledge context derive atoms

σ(1) ={1}
σ(2) ={{1, 2}, {2, 3}}
σ(3) ={3}
σ(4) ={{1, 4}, {3, 4}}
σ(5) ={{1, 2, 3, 5}}
由此構成的集族
{{1},{3},{1,2},{2,3},{1,4},{3,4},{1,2,3,5}}
就是所生成知識空間的知識基。由此知識背景構造的知識空間是:
K={?, {1}, {3}, {1, 2}, {1, 3}, {1,4}, {2, 3}, {3,4}, {1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4},{1, 2, 3, 4}, {1, 2, 3, 5}, {1, 2, 3, 4, 5}}
本文介紹了尋找知識空間的基和由給定的基生成知識空間的方法,基于知識基的概念格屬性約簡理論,以及通過知識基建立了形式背景與知識空間的一些聯系。如何進一步將形式概念分析方法應用到知識空間,以及如何進一步挖掘它們之間更深遠的聯系有待將來的工作中不斷完善。