摘要:在建設微生物菌種資源平臺的基礎上, 設計開發微生物菌種資源數據庫管理系統,實現基于內容的Web圖像智能檢索系統。該檢索系統采用B/S體系架構,可根據微生物菌種文本信息或圖像的形狀、紋理和顏色特征進行檢索,有效提高了微生物菌種圖像信息搜索的查準率、查全率和查找速度。
關鍵詞:微生物菌種資源;基于內容的圖像檢索;瀏覽器/服務器
中圖分類號:TP391文獻標志碼:A
文章編號:1001-3695(2007)07-0286-03
微生物信息網站可以為用戶提供翔實、共享的微生物資源數據等信息。為更好地實現微生物菌種資源共享, 科技部已立項建立國家自然科技資源E-平臺。其中包括微生物資源數據的信息共享。開發性能良好的微生物菌種資源平臺及微生物菌種圖像資源智能檢索系統是其有效途徑。本檢索系統是微生物菌種資源平臺的重要構件,基于分布式微生物菌種資源庫為用戶提供智能化的微生物菌種圖像資源搜索服務,可有效提高微生物菌種圖像信息搜索的查準率、查全率和查找速度。圖像信息的智能檢索采用基于內容的圖像檢索技術實現,提取圖像形狀、紋理、顏色等方面的特征[1]。
1圖像特征的提取
特征提取算法必須尋求適合微生物菌種圖像的特點。一般微生物菌種的形態各異、差別較大,如酵母菌形態接近橢圓,赤霉菌形態似鏈狀、線形,螺旋菌形態為紡椎形等,所以可以使用形狀索引[2]從整體上提取形態特征參數。另外通過研究微生物菌種顯微圖像,可以看出圖像中微生物分布集中。對于稠聚現象較嚴重的圖像,可以使用共生矩陣[3]的方法提取圖像的紋理特征參數。由于微生物細胞含有大量水分,對光線的吸收和反射與水溶液的差別不大,與周圍背景沒有明顯的明暗差,都必須經過染色后才能在顯微鏡下進行觀察和鑒別。可以使用顏色矩[4]的方法提取圖像的顏色特征參數。但是無論是使用顏色、形狀還是紋理特征,每種特征都有各自的不足之處。在實際應用中,可以采用多種特征檢索相綜合的方法,即給每種方法賦予一定的權值,再結合用戶檢索時的反饋信息,不斷調整這些參數以達到最優效果,提高檢索精度。
1.1形狀特征的提取
為了表達圖像中各種目標的形狀信息,一般需要先對圖像進行分割,然后對提取出來的獨立目標進行形狀描述。由于微生物菌種圖像往往比較復雜,并且圖像內容本身是多種多樣的,很難有一個很好的分割算法適合于不同類型的圖像。本系統試圖從整體上提取形狀特征,采用形狀索引(Shape Index)來提取全局形狀特征。
圖像對不同尺度的高斯導數濾波器的響應很好地刻畫了圖像的強度信息[2]。L. Florack認為圖像的局部特征可以由該圖像對一系列不同尺度的高斯導數濾波器的響應來表示[5]。通過計算圖像的局部特征,然后比較不同圖像的局部特征的分布可以獲得圖像之間的全局相似性[2]。這種方法的思想就是:用一系列不同尺度的高斯導數濾波器對圖像進行濾波,得到邊緣信息;把不同尺度下的這些邊緣信息組合成一個特征向量,就可以用來描述圖像的全局形狀信息。算法步驟如下:
2圖像智能檢索系統結構
本文采用以上算法設計了一個基于內容的圖像檢索系統,結構如圖1所示。
圖1基于內容的圖像檢索系統結構
該系統由以下四個模塊組成:
(1)用戶模塊。它是用戶和檢索系統間的接口。用戶通過用戶模塊向系統提交要檢索的圖片,檢索結果也將呈現在用戶模塊的界面上。用戶模塊具有一定的交互功能,可不斷改變圖像各特征的檢索權值,以此獲得越來越好的檢索結果。
(2)交互查詢模塊。接收來自用戶模塊的檢索圖像后,先送到圖像分析模塊進行圖像分析,提取圖像的特征;然后將查詢的特征向量與圖像庫中的特征向量進行相似性計算,選出最相似的幾幅(根據情況而定)圖像作為檢索結果,從圖像庫中提取出來送給用戶模塊。
(3)圖像分析模塊。圖像庫中的圖像和待查詢圖像的特征提取由此模塊來完成。這個模塊采用了相關的設計模式[6]來進行設計,具有很強的復用性和可擴展性。
(4)圖像數據庫模塊。包括各種表,主要有圖像位置表、形狀特征表、紋理特征表、顏色特征表。圖像位置表記錄數據庫中圖像的路徑;每個圖像抽取出的形狀特征、紋理特征和顏色特征分別記錄在形狀特征表、紋理特征表和顏色特征表中。
3系統實現及展望
以國家制定的微生物菌種資源共性描述規范為基礎,建立微生物菌種多媒體信息數據庫。微生物菌種資源庫圖像智能檢索系統采用.NET技術開發, C#編程語言和當前最先進的B/S三層體系架構[7,8],以Windows 2000 Server作為操作系統運行平臺, IIS為Web服務器, 相關支持庫采用SQL Server 2000數據庫管理系統,實現了微生物菌種資源庫的多媒體信息的智能檢索,如圖2所示。它不僅滿足了用戶的需求, 而且提高了菌種管理的水平,取得了比較滿意的結果。所有圖像信息資源可供眾多用戶在線快速查詢搜索,能通過信息交流平臺,使用戶實現分布式數據庫訪問。
今后需要做的工作主要有以下兩點:
(1)圖像數據庫模型的建立。本系統的解決方案主要是圖像的存儲由文件系統來實現,圖像的特征存儲與管理仍然由關系數據庫來完成。這種解決方案在處理圖像時會遇到很多問題,如怎樣快速地讀寫圖像數據、查詢優化、抽取和存儲圖像特征、相似度計算等。這些問題較好的解決方法是建立面向對象數據庫。但也有不少問題,如面向對象數據庫技術還需要完善;即使完善了,面向對象數據庫和關系數據庫還會共存,它們之間相互存取操作問題還需解決。
(2)反饋技術。用戶的反饋信息在檢索計算中不可忽視,它可以提高檢索的效率和效果。本系統的檢索算法也用到反饋技術,但只是將其作為輔助手段,反饋技術不能很好地優化檢索算法。怎樣設計用戶的反饋方式并充分利用反饋信息將是要重點研究的課題。
(a) 待檢索圖片
(b) 上傳待檢索圖片并進行特征匹配
(c) 檢索結果頁面(按匹配相似度順序排列)
參考文獻:
[1] 李向陽,莊越挺,潘云鶴.基于內容的圖像檢索技術與系統[J].計算機研究與發展,2001,38(3):344-354.
[2]RAVELA S,MANMATHA R.On computing global similarity in images[C]//Proc of the 4th IEEE Workshop on Applications of Computer Vision.Princeton, USA:[s.n.],1998.
[3]HARALICK R M,SHANMUGAM K,DINSTEIN I.Texture features for image classification [J].IEEE Trans on Sys Man and Cyb,1973,3(6):768-780.
[4]STRICKER M,ORENGO M.Similarity of color images[C]//Proc of IST/SPIE Conference on Storage and Retrieval for Image and Video DatabasesⅢ.San Jose,CA:[s.n.],1995.
[5]FLORACK L.The syntactical structure of scalar images[D].Holland:University of Utrecht, 1993.
[6]GAMMA E,HELM R,JOHNSON R,et al.設計模式——可復用面向對象軟件的基礎[M].英文版.北京:機械工業出版社,2002.
[7]馮芳芳.ASP.NET精講[M].北京:清華大學出版社,2004.
[8]鄭阿齊.SQL Server實用教程[M].北京:電子工業出版社,2003.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”