權赟
(西安歐亞學院信息工程學院,陜西 西安 710065)
現今的國際互聯網是一個有利于人們相互交流、合作的強大工具。它以HTML的頁面方式向人們提供了大量的信息,人們可以很容易理解網頁上的信息。但是由于這種易于人類理解、交流的設計目的,也就造成了網頁上的內容設計成為專供人類瀏覽的,而不是供計算機理解和處理的工具。所以,國際互聯網應該不單單只是使人類來理解,而且應該讓機器來理解網頁上的內容。為了滿足這種要求,使計算機按照可靠的方法來處理網頁中的語義,智能地理解網頁內容和進行操作,人們就開始研究和開發新一代的國際互聯網--語義網。語義網是一個由大量計算機可以理解的數據所構成的一個分布式的體系結構,在這個體系結構中,數據之間的關系按照特定的術語表達,計算機能夠通過這些術語得到數據的含義,同時這些術語之間又形成一種復雜的網絡聯系,計算機在數據含義的基礎上利用這種聯系應用邏輯來進行推理,從而實現機器對信息的智能自動處理,解決像現在的網頁功能單調、搜索引擎智能化程度低等問題。從功能上看,語義網是一個能夠理解人類信息的智能網絡。
萬維網創始人Tim.Berner-Lee對語義網做了如下的描述:語義網不是一個孤立的,全新的萬維網,而是對當前的國際互聯網的擴展,語義網上的信息具有良好的含義,使計算機之間以及人類能夠彼此合作。根據上面的描述,我們可以給語義網做出如下定義:計算機可以理解信息含義的下一代萬維網,稱之為語義網。
語義網中的信息和知識要求是從眾多的提供者以多種多樣的方式來提供,而且這些知識和信息能夠被各種應用或Web服務實現共同理解,并且按照一定的邏輯規則進行處理。所以語義網上的信息和知識要有創建上的分散性,同時又要有應用上的通用性。
互聯網的創始人Tim.Berners-Lee在2000年提出了語義網的體系結構。下面我們對這個結構從底層到高層,逐層簡單介紹每個部分的概念和功能。
在其體系結構中,第一層是Unicode和URI,它是整個語義網的基礎,Unicode(統一編碼)處理資源的編碼,URI(統一資源定位器)負責標識資源;第二層是XML+名空間+XML模式,用于表示數據的內容和結構;第三層是RDF+RDF模式,用于描述資源及其類型;第四層是本體詞匯,用于描述各種資源之間的聯系;第五層是邏輯,在下面四層的基礎上進行邏輯推理操作;第六層是驗證,根據邏輯陳述進行驗證以得出結論;第七層是信任,在用戶間建立信任關系。第二、三、四層是語義Web的關鍵層,用于表示網絡信息的語義,也是現在語義網研究的熱點所在。因為兩個系統可能采用不同的標識符表示同一概念,也可能用一個標識符表示不同的含義,程序若要在兩個數據庫之間進行信息的比較和合并,就必須了解某些標識符表示的是否是同一事物。對這個問題的一個解決方法就是本體論(Ontology)。本體是概念化的顯式說明,它是對現實世界事物的抽象建模,包括分類和一套推理規則。分類定義對象的類別及其之間的關系,使我們能夠表達實體之間的大量關系,而根據推理規則,程序可以進行自動推理。簡單地說,就是在不同的系統間定義一本字典或者度量表,使它們對實體及其之間的關系達成共識,以便交流和共享。
現今的互聯網上充斥著海量信息,傳統的HTML表示信息的方法使得信息搜索面臨種種困境。現在的搜索引擎大多采用關鍵字搜索方法,耗時而且不準確,垃圾信息太多。語義網能帶給我們全新的搜索方法,能幫助我們高效地找到所需要地準確信息。在企業內部信息處理中,我們可以利用基于Ontology的學習系統將企業的內部信息轉化成為一個龐大的,分類別的,有規則的知識庫。這樣我們就能使企業積累的這些信息服務于企業的日常運作,消除知識壁壘和知識盲區,提高員工的個人素質,從而達到提升整個企業的運行效率。在今后的互聯網服務中,用戶關心的是服務的具體結果和服務質量,而不是具體的服務過程。通過將語義網和Web Service結合起來,可以使得Web Service被機器理解,從而自動執行,對用戶透明。同時這種服務能被Agent自動處理,實現Web Service之間的自動交互。
總的來說,有了大量富含語義信息的網頁,就好像有了一個巨大的全球互聯的數據庫。有了語義信息的幫助,人們開發出的軟件代理A-gent程序的智能和自動化將大大提高,它們從不同的資源中收集網頁內容,搜索和處理信息并和其他程序交換信息,真正發揮語義網的力量。當出現更多的機器、可處理的網頁內容和服務(包括更多的代理)時,通過代理之間的信息交換和協同工作,信息處理的效率將呈指數級增長,能更好地滿足用戶的需求。
[1]http://www.xml.com/pub/a/98/10/guide0.html
[2]http://www.w3.org/TR/2000/REC-xml-20001006
[3]Grigoris Antoniou and Frank van Harmelen《A Semantic Web Primer》
[4]http://www.chinakm.com