摘要:為對異構(gòu)數(shù)據(jù)庫中的大量孤立、沒有語義描述的數(shù)據(jù)進(jìn)行自動歸類及本體建模,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫數(shù)據(jù)的知識獲取,提出了一個基于本體與Web服務(wù)的異構(gòu)數(shù)據(jù)庫知識獲取框架,給出了通過Web服務(wù)包裝異構(gòu)數(shù)據(jù)庫的訪問機(jī)制,設(shè)計(jì)出貝葉斯分類器并應(yīng)用該分類器對獲取的異構(gòu)數(shù)據(jù)自動映射到相關(guān)的本體。該方法能夠通過貝葉斯分類器自動對異構(gòu)數(shù)據(jù)歸類,實(shí)現(xiàn)了異構(gòu)數(shù)據(jù)庫的交互知識獲取。
關(guān)鍵詞:本體;Web服務(wù);異構(gòu)數(shù)據(jù)獲?。回惾~斯分類器
中圖分類號:TP391文獻(xiàn)標(biāo)志碼:A
文章編號:1001-3695(2007)05-0200-04
0引 言
隨著數(shù)據(jù)庫技術(shù)的快速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,人們不得不面對如下問題:①數(shù)據(jù)庫中積累的數(shù)據(jù)越來越多,數(shù)據(jù)爆炸但知識貧乏;②知識獲取的局限性目前主要體現(xiàn)在知識獲取仍停留在人的手工勞動階段[1];③存在各種異構(gòu),如平臺的差異、編程語言的差異、數(shù)據(jù)格式的差異等,形成了“信息孤島”現(xiàn)象,制約了數(shù)據(jù)共享[2];④數(shù)據(jù)庫中的數(shù)據(jù)缺乏語義描述。
為能夠?qū)Ξ悩?gòu)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行高層次的分析,以更好地利用這些數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,必須挖掘隱藏在數(shù)據(jù)背后的知識。目前,大部分的解決方案主要是利用XML及其相關(guān)技術(shù)完成異構(gòu)數(shù)據(jù)庫的互相轉(zhuǎn)換工作以及利用Web服務(wù)技術(shù)集成異構(gòu)數(shù)據(jù)庫。但在實(shí)際運(yùn)作過程中,采用上述方案處理異構(gòu)數(shù)據(jù)庫時也存在一些問題,即沒有實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫資源中異構(gòu)、分布式、多元化數(shù)據(jù)的自動獲取和從數(shù)據(jù)到知識庫的知識單元的轉(zhuǎn)換。本文提出一種基于本體和Web服務(wù)并結(jié)合貝葉斯分類器實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫數(shù)據(jù)向知識單元轉(zhuǎn)換的知識獲取方案:用Web服務(wù)的動態(tài)性、松散耦合和非綁定性來解決數(shù)據(jù)庫的異構(gòu)性,并同時保證異構(gòu)數(shù)據(jù)庫的各個組成部分具有自身的自治性、完整性和安全性控制;利用本體建模工具在語義和知識層次上描述信息系統(tǒng)的概念模型,描述概念及概念之間的關(guān)系以及通過概念之間的關(guān)系來描述概念的語義[3];結(jié)合貝葉斯分類器將獲取到的異構(gòu)數(shù)據(jù)庫數(shù)據(jù)歸類到相關(guān)的本體,對獲取的異構(gòu)數(shù)據(jù)庫資源進(jìn)行語義上的刻畫與描述,從而實(shí)現(xiàn)向知識單元的轉(zhuǎn)換,使異構(gòu)信息在語義上實(shí)現(xiàn)機(jī)器可理解。異構(gòu)數(shù)據(jù)在本體的協(xié)助下,易于發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系和規(guī)則,便于語義檢索和推理檢索,從而挖掘出隱藏在數(shù)據(jù)后的知識。
1相關(guān)技術(shù)及解決思路
目前企事業(yè)機(jī)構(gòu)中已經(jīng)存在大量異構(gòu)數(shù)據(jù)庫,要通過擴(kuò)展對數(shù)據(jù)庫模式和記錄的描述來加強(qiáng)知識的獲取。首先要構(gòu)建領(lǐng)域本體。由于領(lǐng)域本體提供了一系列的語義結(jié)構(gòu),借助一種機(jī)器學(xué)習(xí)手段將數(shù)據(jù)庫中的數(shù)據(jù)模式和實(shí)體歸類到相應(yīng)的領(lǐng)域本體類,將領(lǐng)域本體所體現(xiàn)的概念模式映射到數(shù)據(jù)模式,領(lǐng)域本體有相應(yīng)的實(shí)體完整性約束,被定義的模式可認(rèn)為具有知識表示的能力;對分布式異構(gòu)數(shù)據(jù)庫系統(tǒng),采用Web服務(wù)技術(shù)封裝來屏蔽各種異構(gòu)性;采用一個學(xué)習(xí)機(jī)制使得系統(tǒng)自動或交互地抽取知識。本文使用貝葉斯統(tǒng)計(jì)原理來產(chǎn)生分類規(guī)則并誘導(dǎo)分類。一個分類規(guī)則預(yù)測一個樣本應(yīng)該歸于哪個類。異構(gòu)數(shù)據(jù)庫知識獲取的主要流程如圖1所示。
(1)數(shù)據(jù)獲取
由位于不同地點(diǎn)、不同平臺或不同數(shù)據(jù)庫系統(tǒng)之上的Web服務(wù)采用公共數(shù)據(jù)模型對局部共享數(shù)據(jù)進(jìn)行封裝,隱藏了內(nèi)部結(jié)構(gòu),并統(tǒng)一以XML格式提供一致的對外公共訪問接口,屏蔽了不同數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)源位置、模式和訪問方法等異構(gòu)信息,即獲取異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)對用戶和調(diào)用該服務(wù)的系統(tǒng)而言是透明的。
(2)特征建立
在實(shí)際使用貝葉斯模型進(jìn)行分類決策前需要進(jìn)行特征建立。貝葉斯分類器的分類決策即在特征空間中運(yùn)用統(tǒng)計(jì)方法把待識別對象歸為特定類型。其核心技術(shù)是在樣本訓(xùn)練集基礎(chǔ)上確定一個判決規(guī)則,使按這種規(guī)則對被識別對象進(jìn)行分類,所造成的錯誤識別率最小或引起的損失最小。
(3)貝葉斯分類
基于小子樣的貝葉斯在理論上為解決數(shù)據(jù)分類提供了理論途徑。貝葉斯分類的目標(biāo)是通過機(jī)器學(xué)習(xí)功能將異構(gòu)數(shù)據(jù)庫中的記錄按數(shù)據(jù)模式及記錄的屬性值歸類到預(yù)先定義的領(lǐng)域本體類別,形成知識庫的知識節(jié)點(diǎn)。
2系統(tǒng)框架及模塊介紹
框架的執(zhí)行流程是由異構(gòu)模式數(shù)據(jù)收集器調(diào)用相關(guān)的包裝器(Web服務(wù)接口)收集異構(gòu)數(shù)據(jù)源數(shù)據(jù)模式信息;由貝葉斯分類器訓(xùn)練,對該記錄進(jìn)行模式及屬性特征分析,在領(lǐng)域本體和分類器的幫助下實(shí)現(xiàn)歸類,作為知識節(jié)點(diǎn)存入知識庫中,實(shí)現(xiàn)知識獲取。其框架如圖2所示。
該框架的模塊功能描述如下(從下至上描述):
(1)數(shù)據(jù)庫。具體負(fù)責(zé)異構(gòu)數(shù)據(jù)資源的存儲,包括Oracle、MySQL、SQL Server等關(guān)系/對象數(shù)據(jù)庫等。其與知識管理層之間通過統(tǒng)一的包裝器(Web服務(wù)服務(wù)集成接口)進(jìn)行訪問,用戶不必關(guān)心具體的存儲細(xì)節(jié)。
(2)包裝器。對異構(gòu)數(shù)據(jù)源按照統(tǒng)一的模式進(jìn)行封裝,屏蔽了數(shù)據(jù)源的諸多異構(gòu)性;向調(diào)用程序或客戶端提供統(tǒng)一的接口。包裝器用于與其他應(yīng)用系統(tǒng)進(jìn)行相互協(xié)作時提供服務(wù),如數(shù)據(jù)、應(yīng)用的集成調(diào)用等。通過該包裝器接口,其他系統(tǒng)可調(diào)用相應(yīng)數(shù)據(jù)庫中的數(shù)據(jù),實(shí)現(xiàn)真正松散耦合、動態(tài)重構(gòu)能力。包裝器是本框架的核心之一。
(3)異構(gòu)模式數(shù)據(jù)收集器。該模塊的功能是調(diào)用包裝器以獲取各異構(gòu)數(shù)據(jù)模式及數(shù)據(jù)源的內(nèi)容并保存調(diào)用結(jié)果以供貝葉斯分類器使用。
(4)貝葉斯分類器。它是連接異構(gòu)數(shù)據(jù)源與知識庫的橋梁,是本框架的核心之一。通過該分類器從信息資源體系中獲取知識信息,構(gòu)建知識庫中的知識節(jié)點(diǎn),體現(xiàn)為知識庫中的本體與實(shí)例之間的關(guān)系,即類—類及類—實(shí)例關(guān)系。該模塊是知識發(fā)現(xiàn)與積累的基本環(huán)節(jié)。
(5)本體庫和知識庫。本體庫中的本體目標(biāo)是捕獲相關(guān)的知識,提供該知識共同的理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的概念;從不同層次的形式化模式給出這些概念以及它們相互間關(guān)系的明確定義,并通過概念間的關(guān)系來描述概念語義。本體在語義關(guān)系揭示程度上普遍進(jìn)行了更深、更廣的挖掘和擴(kuò)展。知識庫中知識節(jié)點(diǎn)的獲取過程需依賴領(lǐng)域本體構(gòu)建的領(lǐng)域模型。知識庫主要存放包含顯性表達(dá)的事實(shí)知識、常識、經(jīng)驗(yàn)等領(lǐng)域知識和啟發(fā)式知識等。特定的知識庫包含了狀態(tài)依賴信息[4],具有數(shù)據(jù)庫所不具備的處理規(guī)則能力,以通過規(guī)則推理出知識庫中隱含的知識。
3系統(tǒng)設(shè)計(jì)
3.1包裝器設(shè)計(jì)
本文中的包裝器是通過將異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)封裝成Web服務(wù),提供統(tǒng)一接口。包裝器包裝的內(nèi)容包括:抽取數(shù)據(jù)源數(shù)據(jù)模式中的數(shù)據(jù)模式及屬性名稱、各屬性的數(shù)據(jù)類型及數(shù)據(jù)長度、屬性內(nèi)容等;以XML形式傳輸?shù)膬?nèi)容包括數(shù)據(jù)源名稱、數(shù)據(jù)源類型、數(shù)據(jù)源的訪問地址、數(shù)據(jù)模式名稱、數(shù)據(jù)模式描述及各屬性名、數(shù)據(jù)類型及屬性約束等內(nèi)容。包裝器的實(shí)現(xiàn)步驟如下:
(1)創(chuàng)建Web服務(wù)。該服務(wù)的目標(biāo)是獲取某個異構(gòu)數(shù)據(jù)源的某個數(shù)據(jù)模式及相應(yīng)數(shù)據(jù)源的內(nèi)容,可通過JavaBean、EJB組件方式實(shí)現(xiàn)。
(2)為Web服務(wù)創(chuàng)建服務(wù)描述文件WSDL。
(3)在應(yīng)用服務(wù)器中布置Web服務(wù)。
(4)將Web服務(wù)發(fā)布到本地UDDI注冊中心。
3.2異構(gòu)模式數(shù)據(jù)收集器設(shè)計(jì)
該模塊是Web服務(wù)的客戶端調(diào)用程序,從包裝器傳來的XML源數(shù)據(jù)中讀取數(shù)據(jù)并解析XML,提取相應(yīng)的子集。該模塊的實(shí)現(xiàn)步驟如下:
(1)應(yīng)用程序客戶端檢索到WSDL文件后產(chǎn)生一個客戶端代理對象,或由已知的Web服務(wù)產(chǎn)生一個客戶端代理對象。(2)調(diào)用包裝器。客戶端通過所產(chǎn)生的客戶端代理對象實(shí)現(xiàn)對包裝器所對應(yīng)的Web服務(wù)的調(diào)用。
(3)對調(diào)用包裝器后返回的信息進(jìn)行融合,以防止有重復(fù)的內(nèi)容,融合后的信息供貝葉斯分類器調(diào)用。
3.3貝葉斯分類器的設(shè)計(jì)實(shí)現(xiàn)
本文的異構(gòu)數(shù)據(jù)庫數(shù)據(jù)的分類基于一個本體分類層次體系,參考文獻(xiàn)[5]。本文中表示本體使用基于圖的模型,以反映概念之間的語義關(guān)系。在對異構(gòu)數(shù)據(jù)庫進(jìn)行知識獲取前,類領(lǐng)域本體結(jié)構(gòu)圖如圖3所示。
異構(gòu)模式數(shù)據(jù)收集器收集了來自異構(gòu)數(shù)據(jù)的數(shù)據(jù)信息,包含數(shù)據(jù)模式信息和記錄信息。為了有效地對用戶感興趣的信息實(shí)現(xiàn)分類識別,在分類前需要對這些數(shù)據(jù)進(jìn)行預(yù)處理以提取和選擇代表數(shù)據(jù)模式的特征值,并對連續(xù)屬性的值進(jìn)行離散化處理。其中部分連續(xù)值的屬性及明顯對分類作用微小的屬性被忽略。異構(gòu)數(shù)據(jù)庫的語義可定義在兩個層次上,即模式層和屬性層。下面就如何從這兩個層次實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫數(shù)據(jù)的分類予以分析。
3.3.1異構(gòu)數(shù)據(jù)模式層分類
數(shù)據(jù)庫模式是某一類數(shù)據(jù)的結(jié)構(gòu)、屬性、聯(lián)系和約束的描述,可被認(rèn)為是數(shù)據(jù)庫中實(shí)例(記錄)的一個知識描述。其缺陷是模式的設(shè)計(jì)不是唯一的,模式的描述可能不是對感興趣的現(xiàn)實(shí)世界準(zhǔn)確或近似的建模[2]。因此本文要求待歸類的數(shù)據(jù)模式是客觀的、與被描述記錄的語義是相符的。只有當(dāng)數(shù)據(jù)模式的描述是對客觀世界的真實(shí)描述,模式層的語義才可借助本體結(jié)構(gòu)進(jìn)行貝葉斯分類,從而將異構(gòu)數(shù)據(jù)模式歸類到某個最相近的本體。
一個數(shù)據(jù)模式由一組元素組成,一般有模式名稱、屬性名、數(shù)據(jù)類型、約束和模式結(jié)構(gòu)等。數(shù)據(jù)模式的歸類是一種結(jié)構(gòu)級的分類,考慮的是模式元素的組合。在分類時要考慮基于語言和約束的分類?;谡Z言的分類中最常用的信息是元素名稱,衡量名稱相似度的標(biāo)準(zhǔn)有等價關(guān)系、同義關(guān)系、上下語義關(guān)系等;另外一詞多義干擾了名稱分類過程,為了減少誤分類,需要借助于領(lǐng)域本體澄清概念?;诩s束的分類通常指分類基數(shù)。分類基數(shù)將一個模式中的一個或多個元素映射到另一個模式中的一個或多個元素。本文中貝葉斯分類將一種數(shù)據(jù)模式歸類到領(lǐng)域本體中具有最高分類相似性的本體中。在歸類時分類基數(shù)是1∶1。
對于每個待分類的數(shù)據(jù)模式特征向量,計(jì)算其屬于某個本體類的概率,取最大值。如果最大值低于某個閾值則停止;否則取最大值的本體作為將要?dú)w類的本體。實(shí)現(xiàn)該算法的具體步驟如下:
(1)設(shè)本體庫中有n類本體訓(xùn)練樣本C={C1,C2,…,Cn},從本體庫中抽取訓(xùn)練樣本的信息集合S(本步驟中的示例數(shù)據(jù)取自圖3)。該集合中包括了本體的ID和該本體的屬性(第一列為本體,其余各列為屬性名):
personIDnameage00
studentIDnameageenroll-year0
employeeIDnameagesalarystatus
teacherIDnameagesalarystatus
statusID0000
courseIDname000
……
(2)統(tǒng)計(jì)S中所有的特征矢量V,確定代表C中每個類別的特征矢量,統(tǒng)計(jì)分類θ的先驗(yàn)分布:π(θ)=屬于類θ的訓(xùn)練樣本數(shù)/總的訓(xùn)練樣本數(shù)。其中θ為分類本體。
(3)將抽取的待分類的各數(shù)據(jù)模式的特征值信息表示成向量的形式。
當(dāng)新的數(shù)據(jù)模式到達(dá)時,根據(jù)特征詞,按下面的公式計(jì)算該數(shù)據(jù)模式sj屬于類θ的概率。由訓(xùn)練樣本估值,參照拉普拉斯光滑法(Laplacian Smoothing)[5]得
具體數(shù)據(jù)模式的歸類在OWL中的實(shí)現(xiàn)是:一個數(shù)據(jù)模式是一個子類,數(shù)據(jù)模式中的屬性名是子類的屬性名。數(shù)據(jù)模式被歸類到領(lǐng)域中的某個本體并作為該本體的子分類后,成為知識庫中的一個知識節(jié)點(diǎn)。若該數(shù)據(jù)模式對應(yīng)的記錄是實(shí)例數(shù)據(jù),將實(shí)例數(shù)據(jù)作為子分類的實(shí)例存入到知識庫中,從而將異構(gòu)數(shù)據(jù)轉(zhuǎn)換為知識節(jié)點(diǎn)。
3.3.2屬性層分類
當(dāng)數(shù)據(jù)模式不是對客觀實(shí)體屬性的客觀描述,如數(shù)據(jù)模式employee(ID,A,B,C)不是對客觀世界正確或恰當(dāng)?shù)谋磉_(dá),該數(shù)據(jù)模式此時無法實(shí)現(xiàn)自動歸類。在這種情況下,若數(shù)據(jù)記錄中描述的是抽象實(shí)體,則可對數(shù)據(jù)記錄進(jìn)行貝葉斯分類。分類步驟類似于數(shù)據(jù)模式的分類。兩者的區(qū)別是屬性層分類中待分類的數(shù)據(jù)為記錄的屬性值;類似數(shù)據(jù)模式的分類,屬性層的分類依照領(lǐng)域本體分類樹。筆者為每個本體提供一定的訓(xùn)練數(shù)據(jù),訓(xùn)練后再對未分類的記錄進(jìn)行統(tǒng)計(jì)分析,將新的記錄數(shù)據(jù)歸類到t=max{h(θ|x)}對應(yīng)的分類本體節(jié)點(diǎn)下。具體記錄的歸類在RDF中的實(shí)現(xiàn)是[6]:一條記錄是RDF的一個節(jié)點(diǎn)(Node),屬性名是RDF中的屬性類型(Property Type),屬性值是RDF三元中的值(Value)。
4實(shí)驗(yàn)分析
在一個具有130個數(shù)據(jù)模式和1 710個記錄的中文數(shù)據(jù)語料庫上測試了分類算法,算法采用Java實(shí)現(xiàn)。語料庫中的數(shù)據(jù)庫信息文本均為新聞電訊稿,將其存入MySQL和SQL Server數(shù)據(jù)庫。所有的新聞稿均由領(lǐng)域?qū)<沂孪冗M(jìn)行分類,按照中圖分類法分成多類。本文中采用OWL本體表示語言將這些分類表示成本體結(jié)構(gòu)。
(1)分別對Windows和Linux操作系統(tǒng)下的MySQL和SQL Server異構(gòu)數(shù)據(jù)庫建立相應(yīng)的Web服務(wù),調(diào)用Web服務(wù)并對數(shù)據(jù)進(jìn)行封裝、處理和分類。Web服務(wù)獲取異構(gòu)數(shù)據(jù)主要是接收上一層的數(shù)據(jù)請求。
(2)貝葉斯分類器分類的性能分析。本文對三種異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)模式及記錄進(jìn)行貝葉斯分類,即運(yùn)行分類算法,執(zhí)行分類操作,計(jì)算其平均值。實(shí)驗(yàn)結(jié)果及分類性能分析如圖5所示。
本文中評估分類的指標(biāo)是準(zhǔn)確率和查全率。準(zhǔn)確率是指分類的正確數(shù)據(jù)模式(記錄)數(shù)與實(shí)際分類的數(shù)據(jù)模式(記錄)數(shù)的比率。通過采用評估指標(biāo)分析可知,該分類器在分類準(zhǔn)確性能方面比較可靠,基本實(shí)現(xiàn)對異構(gòu)數(shù)據(jù)的知識獲取輔助作用。
(3)多策略的異構(gòu)數(shù)據(jù)庫知識獲取的特點(diǎn):
①調(diào)用異構(gòu)數(shù)據(jù)庫中的數(shù)據(jù)時,無須考慮底層數(shù)據(jù)庫的異質(zhì)性;
②實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的自動歸類以從數(shù)據(jù)庫中交互地獲取知識,從而減少了人工操作對異構(gòu)數(shù)據(jù)庫數(shù)據(jù)抽取的工作量;
③利用貝葉斯分類器對異構(gòu)數(shù)據(jù)自動歸類后采用統(tǒng)一的數(shù)據(jù)語義描述與元數(shù)據(jù)描述,最終可實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的語義檢索、推理檢索等。
5結(jié)束語
本文結(jié)合網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)庫資源的分布式、多樣化等異構(gòu)性特點(diǎn),利用本體來輔助異構(gòu)數(shù)據(jù)知識的捕獲,采用了流行的Web服務(wù)技術(shù)進(jìn)行異構(gòu)數(shù)據(jù)的獲取,對獲取的異構(gòu)數(shù)據(jù)采用貝葉斯分類算法將符合條件的數(shù)據(jù)庫模式及記錄自動歸類到相關(guān)的本體,實(shí)現(xiàn)了從異構(gòu)數(shù)據(jù)到知識庫知識節(jié)點(diǎn)的轉(zhuǎn)換及知識節(jié)點(diǎn)的自動獲取。
通過采用多策略的異構(gòu)數(shù)據(jù)庫知識獲取方法較為有效地解決了數(shù)據(jù)泛濫而知識缺乏的局面,并在一定程度上實(shí)現(xiàn)了異構(gòu)數(shù)據(jù)的語義描述。但該方法在語義處理方面還存在不足,將在今后的研究中繼續(xù)予以探索。
參考文獻(xiàn):
[1]滕明貴,熊范綸,吳正龍.一個多形式的知識庫管理系統(tǒng)XFKBMS/V1.0[J].小型微型計(jì)算機(jī)系統(tǒng),2004,25(4):625-629.
[2]CARAGEA D,BAO Jie,PATHAK J,et al.Information integration from semantically heterogeneous biological data sources:proceedings of the 16th International Workshop on Database and Expert Systems Applications[C].[S.l.]:IEEE,2005:580-584.
[3]PARK J. Schema integration methodology and toolkit for hetero-geneous and distributed geographic database[J].Journal of the Korea Industrial Information Systems Society, 2001,16(3):51-64.
[4]WU Zhaohui,CHEN Huajun, XU jiefeng. Knowledge base grid:a generic grid architecture for semantic Web[J].Comput.Sci.Technol.,2003,18(4):462-473.
[5]OLESHCHUK V,PEDERSEN A. Ontology based semantic similarity comparison of documents:proceedings of the 14th International Workshop on Database and Expert Systems Applications (DEXA’03)[C].[S.l.]:IEEE Computer Society,2003:735-738.
[6]LI Xiaoli,JOSHI R,RAMACHANDARAN S,et al.Classifying biomedical citations without labeled training examples:proceedings of the Fourth IEEE International Conference on Data Mining(ICDM’04)[C].[S.l.]:[s.n.],2004:455-458.
[7]LEE T B. Relational databases on the semantic Web[EB/OL].(2002). http://www.w3.org/DesignIssues/ RDB-RDF.html.
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”