摘 要:在生物系統中,本體(Ontology)信息的顯示近幾十年中已經成為一個關鍵的因素。然而在單一應用程序中,在比較不同系統的發展前途時并不能通過一種合適的應用程序得到肯定的回答。介紹的本體插件(OntoSlug)是一種容易實現的并能滿足這種需要的應用程序。在教室裝置和生物科學實驗中,本體插件已經被開發利用了。
關鍵詞:本體;動態可視化;圖形用戶界面(GUI);生物學
中圖分類號:TP文獻標識碼:A文章編號:1672-3198(2008)12-0333-02
本體(Ontology)起源于哲學領域,是人類對自然界“存在論”的一種哲學觀點,它意味著知識和知曉。上世紀70-80年代信息科學特別是計算機科學開始了對自然世界認知的形式化的表示,既是可被計算機表示,解釋和利用的知識的形式化的研究-即本體。國外的華人生物信息學家稱為語義(學)。近幾十年中,本體的研究已經延伸到生物學領域。本體的目標是獲取相關領域內共同理解,確定該領域內共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯和詞匯之間相互關系的明確定義。本體的種類,依照領域依賴程度,可以細分為頂層本體、領域本體、任務本體和應用本體四類。頂層本體描述的是最普遍的概念及概念之間的關系,如空間、時間、事件、行為等等,與具體的應用無關,其他種類的本體都是該類本體的特例;領域本體描述的是某個特定領域(如醫藥、地理等)中的概念及概念之間的關系;任務本體描述的是特定任務或行為中的概念及概念之間的關系;計算機研究主要著重于領域本體,因為領域本體是結構化的領域知識,并可以被計算機解釋和利用。領域本體對生物,醫學信息的研究變得越來越重要。
1 開發背景介紹
目前,在遺傳學與蛋白組學中,科學處理的進步已經直接引發了對基因——蛋白質的應用及蛋白質——蛋白質內部反應數據庫(在樣本有機體間進行比較的數據庫)需求的增加。本體論被用作標準化基因及蛋白質的定義和命名及用于代表他們之間的關系。目前在改進本體論的進程中已經證明動態可視的價值。相互作用網絡是我們理解這些系統關鍵,因為他們對復雜的過程進行了提煉和可視化。一份完整的公開的本體片段使用普通的 XML文件來存儲信息。XML是一種載體語言,允許用戶定義自己的文件類型,允許用戶定義任意復雜的信息結構,但是XML只具有語法性,它不能說明所定義的結構的語義。大部分中心本體應用程序能夠顯示與控制復雜的數據,但是缺少能夠用可視化信息輕易表示出不同系統與數據集發展前途的應用程序。大多數的可用的應用程序局限于特別的標記格式而不是一種友好地集成的界面。這些各種各樣的因素導致了生物學領域被分成主要依靠數據可視化的領域和其他的并不經常使用這些工具的更傳統的領域。

2 本體插件程序(OntoSlug)的使用和特點
本體插件程序(OntoSlug)可以被用來顯示和融合各種已存在的本體系統(圖1)。數據間的相互作用發生時主要通過圖形用戶界面(GUI)中的四種主要概念來顯示關系:結點、連線、標注和層。當結點和連線不是新的概念時,在不同的系統之間動態連接的結點的特殊功能就使得系統之間的重疊更加緊湊而不丟失信息。在元素之間可變的相互作用的范疇產生了一個數據(該數據可能在多路數據集中出現)的快速的適應性變化。這種需要保留數據集唯一性的過程可能在輸入一個靜態輸入格式時被丟失。
本軟件的主要使用方法:雙擊OntoSlug.exe進入程序,單擊出現主界面。在命令輸入屏上輸入所需要的指令,然后同時單擊shit——enter鍵,即可在圖形用戶界面上顯示數據結點及其關系等信息。同時如果需要還可以加載其他文件或過濾器,命令語法如下表(表1),其中vat指結點,group指組名,type指類型名,3種類型包括:組,標簽與個人屬性;個人屬性可以是任何通過指令預先添加的標注。label指標簽。
舉例如下:當在命令輸入屏上輸入以下所需要的指令:new_vat:A:group1 new_vat:B:group1 new_vat:a:group2 new_vat:b:group2 group_col:group1:909000 group_col:group2:900090 new_lingol:A:':B:example 1 new_lingol:a:':b:example2 new_lingol:A:?:a:example 3 new_lingol:B: ——-:b:example 4,該段程序顯示的是不同組中不同結點之間的關系,運行即可看到如下圖(圖2):
用panel:on顯示所有元素的總表如下圖(圖3):
本體插件程序能夠讓用戶快速輸入來自各種數據源(數據源使用已存在的數據過濾器)或者通用的特制過濾器(可接受并列或重疊的數據結點)的數據信息。在操縱元素時需要很少或者不需要預先得到輸入輸出應用程序系統或運作的知識。為了方便結點的管理,表示不同元素的關系,圖形用戶界面應運而生了。連接功能實現了不同數據集元素的可視化融合。它能夠在這個結點中被一個補充文件或人工地使用。連接結點
的關聯適用于新的連接結點。從結合的結點分為單個結點時的分支也可能通過補充文件或人工的相互作用形成。標記屬性實現從一個結點組向具有相同特征簇的轉變,而不是通過連接聯合在一起。標簽組顯示的發生是伴隨著以下的過程的發生而發生的:褪色成一個更透明的有色陰影區,一次波動的加強顯示,一個改變顏色的方案。所有這些實現了一個簡單的區分,從而把不包括在該組的其他結點區分開來。層使完整的本體顯示繞過本體段,標簽組,結點類型和連接類型。圖型的信息輸出是動態的:可以使信息的分布更簡單,同時在改變了相互作用以后能夠快速適應而且不需要改變結點的分布。更進一步的說,在本體插件程序中,高級搜索,比較,顯示和工具的功能和為一體,同時,結合通用巨指令的可能性將成為將來發布版本中不可缺少的組成部分。

3 結語
總的來說,本體插件程序使研究數據及思維過程輕而易舉的在共同研究者之間共享,同時動態的適應業已存在的相互作用范例。當向其他人介紹該應用程序時,其方便簡單的數據顯示方式使本體插件在這種環境下非常有用。而且它容許獨立的規則溶入到內部相互聯系的作用網絡中。本體插件程序根據特定的需求支持跨平臺的版本(MAC或者Linux)。
參考文獻
[1]高濟.基于表示本體論的智能系統開發[J].計算機研究與發展,1996.
[2]耿麗麗,余雪麗.基于本體的WEB語義服務通信協議的研究[J].電腦開發與應用,2007.
[3]金芝.知識工程中的本體論研究.世紀之交的知識工程與知識科學[M].北京:清華大學出版社,2001.