摘要:結合Web和數據庫技術,以種子植物(科級)的形態特征建庫,使用二叉式檢索原理實現在Internet/Intranet上進行種子植物分類信息的查詢與未知種類的鑒定,這對綜合開發和合理利用種子植物資源具有指導意義。重點介紹了系統的總體結構、特征庫和二叉式檢索的建造,并給出了系統的運行實例。
關鍵詞:種子植物; 分類特征; 二叉式檢索; Web
中圖分類號:TP3;S4文獻標志碼:A
文章編號:1001-3695(2007)11-0169-03
0引言
種子植物是植物界中最進化和最繁茂的類群。要對種子植物資源進行綜合開發和合理利用,必須首先對其進行分類、識別。這不僅能對已認識的種子植物進行分門別類,還能對一個不認識的植物通過檢索確定該種植物的名稱和分類地位,甚至發現新植物種類。但如何從龐大復雜的傳統紙質分類檢索信息中快速、準確地判斷種子植物的科、屬、種,多年來一直是困擾廣大植物工作者的一大難題。目前常用的方法是手工查證+專家經驗鑒定,這種方法往往周期較長、費用較高、操作繁瑣。隨著計算機的普及與運用,特別是近年來網絡和數據庫技術的迅速發展,給植物形態信息管理工作提供了新的手段和方法。新的計算機技術不僅能夠記錄植物分類的所有信息,而且具有靈活檢索、多性狀檢索、快速檢索等諸多優點。而Web 數據庫技術則能夠使各地不同的用戶在Internet/Intranet上方便地查詢數據庫中的內容,有利于種子植物分類資源的全面共享[1]。因此開發和研制具有這種功能的植物分類檢索系統就顯得尤為迫切和重要。
目前,國內許多學者對此進行了有益的嘗試,取得了不少成果。例如,周堅和葛長偉開發的種子植物(科級)形態信息系統[2];利用信息技術判別種子植物科屬的研究[3];田興軍等人開發的江蘇植物資源信息系統[4];張潤娟、李偉開發的世界水生植物科屬檢索系統[5];徐妍、臧紹剛建立的野生植物資源信息檢索數據庫[6]等都具備一定的檢索功能。遺憾的
是,這些系統大多是單機版本,只能在本機上運行,不能通過Internet/Intranet為更多的用戶服務。另外,大部分系統在檢索方面的功能不足,只可以實現單向檢索即通過植物的科、屬、種名或有限的條件查找植物的性狀;而無法根據植物的性狀特征找到植物所在科、屬、種信息。這使得某些科目的檢索工作局限在一些專業人員的身上,科學技術的普及受到了一定的限制。鑒于此,本文提出一種利用Web數據庫技術開發的種子植物分科檢索系統。該系統的開發,為我國種子植物種類的識別和相關信息的共享提供了快捷、高效的網絡工具,可供有關學者或部門在進行種子植物分類研究、資源調查及開發利用中參考。
1系統設計
系統平臺設計時,采用Dreamweaver作為系統界面開發工具,ASP為Web開發語言,Microsoft Access 2000作為后臺數據庫。整個系統運行在Windows 2000 Server操作系統上,Web服務器使用IIS 5.0。客戶端使用IE 4.0以上或其他通用瀏覽器。
1.1系統總體結構
系統采用了B/S 三層體系結構,即表現層、應用層和數據層,其運行模式如圖1所示。在實際運行時,用戶在表現層(客戶端)瀏覽器中以提交表單的方式向應用層提出請求;Web服務器接到請求并通過服務器端ASP程序處理相關請求;若接到數據請求,則通過ADO對象調用ODBC數據源中的數據,并利用特征庫中的特征知識進行查詢檢索;然后將結果以HTML的方式返回到客戶端瀏覽器中[8]。
Web數據庫技術選擇ADO(activex data object),可以用它方便地集成數據庫到Web頁面。ADO與ASP緊密結合,能夠建立提供數據資訊的網頁內容;在網頁中執行SQL指令,可以讓用戶方便地在瀏覽器界面中輸入、更新和刪除Web服務器上的數據資料。
系統設計成既可以在網絡環境下運行,也可以在單機環境下運行,在這兩種環境下源代碼幾乎不需要作任何改動。這種設計適應了目前不同檔次網絡環境的需求,有利于在基層進一步推廣和應用本系統。
1.2系統檢索特征庫構建
植物檢索表是鑒定植物種類的工具。它采用二歧歸類方法編制而成,即選擇某些植物與另一些植物的主要區別特征編列成相對的檢索條目,然后又分別在所屬項下再選擇主要的區別特征編列成相對應的條目。如此類推編列條目直到分類等級結束。在參考檢索表時,系統主要以耿以禮等人主編的《中國種子植物分科檢索表及圖解》[9]為依據,收錄了國產種296科、外來引種22科共318科種子植物。在分類檢索表中,各檢索條目之間具有不可分割的必然聯系,在將這些條目錄入數據庫中時必須加以考慮,這不同于一般關系數據庫,各記錄之間內容上并無必然聯系。如何將上述數量大、層次關系復雜的兩項式檢索表以數據庫形式表示則成為本研究需要解決的首要問題。為此,系統根據各檢索條目間的層次關系并結合數據庫技術構建表1所示的分科檢索特征表。主要設置特征編號、性狀特征、下一級特征號和科名稱四個字段,并將相對立的特征性狀編為同一編號。如果此特征下面還存在相對立特征,則將下一級的相對立特征編號分別賦值予字段下一級特征號,由此控制檢索路徑,引導檢索進入下一個二叉樹分枝;否則賦值為-1,表示分科檢索完成,并在字段科名稱中給出相應的最終檢索出的植物科名稱。
上述特征表中包含了全部種子植物分類檢索表中描述的植物性狀的文字特征,同時以“科名稱”為關鍵字段關聯多媒體數據表,為鑒定結果提供豐富的植物特征圖片、視頻等多媒體信息。
1.3系統檢索原理
系統利用計算機數據結構中二叉樹結構[10]的分支節點搜索技術來實現分科檢索過程。將表1中種子植物檢索項目表示成二叉樹的節點,則其數據結構如圖2所示。其檢索過程實際上就是完成對上述二叉樹結構每個分支節點的搜索過程。在進行分科鑒定檢索時,系統頁面提供兩個選項,用戶根據未知種的形態特征選擇其中一項,然后點擊“繼續檢索”。如此循環往復,直至搜索至下一級特征號為-1的節點,則表示到達二叉樹的終節點,得出某一分科單元。
同時,用戶也可點擊“上一步”返回到前一級二叉樹的另一節點,進入新的鑒定。鑒定的過程中不能跳過一項而檢索下一項,結束時系統會給出相應的分科檢索表及其分類地位。
1.4系統數據安全設計
系統數據庫存保存著318科種子植物分科鑒定信息及相關多媒體信息,不允許用戶隨意修改或刪除。因此在對系統數據進行查詢、修改、添加或刪除的操作過程中,設計了訪問控制方式進行數據庫的管理。即在系統數據庫中,建立一個合法用戶表,包括登錄名、密碼、用戶名及訪問權限四個字段,讓通過身份認證的合法用戶根據自己的權限來訪問數據庫。這樣既進行了身份驗證又對用戶訪問權限進行了區分,大大增強了系統數據的安全性。
1.5后臺管理模塊
種子植物分科鑒定文字信息量非常大,對文字信息的收錄需要較長時間;加之圖片信息量相對缺乏,大量的圖片信息需在野外工作中采集和收錄,這就使得植物分類鑒定信息需要進行不斷的更新、完善。因此,系統設計了后臺管理模塊,可在網絡上進行遠程在線更新和維護。
2系統實現
系統界面部分是用戶與系統直接交流的地方,對于用戶來說,它定義了系統的外觀,也是系統用戶友好性的直接體現。系統設計時在Dreamweaver軟件中使用CSS樣式,保證所有界面風格的一致。
2.1系統檢索過程的主要代碼
系統用HTML設計界面部分,使用ASP與外部數據庫進行數據的查詢操作。其中檢索過程的關鍵代碼如下:
′打開后臺數據庫
Connstr=\"DSN=Seedplant; PWD=\"
set Conn=Server.CreateObject(\"ADODB.Connection\")
Conn.open Connstr
′創建記錄集
set RS=Server.CreateObject(\"ADODB.RecordSet\")
′獲取特征編號
FeatureID=Form.Request(\"id\")
if FeatureID is Nothing then FeatureID=\"001\"
′從特征表中檢索符合特征編號的記錄
Sql=\"select * from feature where FID= \" FeatureID
RS.Open Sql,Conn,1,1
′循環檢索,直至下一級特征號為-1
while Not NextID <>-1
while Not RS.EOF
Response.Write RS.(\"Tezheng\")
NextID=RS.(\" NextID \")
RS.Movenext
end
end
if NextID =-1 then
ShowResult()
end
2.2分科檢索鑒定實例
由于裸子植物的科目相對被子植物要少,其檢索過程也簡單,下面以裸子植物的分科為例來說明系統的檢索過程。當用戶進入檢索界面時,系統顯示檢索特征庫中特征編號為“001”的兩條特征供選擇(圖3),用戶須將待鑒定種子植物的枝、葉、花、果實所具有的形態特征與系統提供的形態特征逐條對照,選擇相符合的特征,然后點擊“繼續檢索”,系統顯示下一級特征選項(圖4)。當用戶選擇的某項特征不具有下一級特征時,系統彈出“分科檢索結果”提示框,告知用戶最終檢索結果,在用戶確定后再給出詳細的鑒定結果信息,包括所屬門類、檢索過程、科屬、形態特征、生長習性、利用價值、資源現狀和相關性狀圖片(圖5),供用戶核對鑒定結果。
3結束語
本系統首次在植物分類鑒定中運用Web技術設計和實現了種子植物的分科檢索。實現了傳統分類資料的數字化、網絡化,使人們可利用計算機對分類資料進行信息化和分布式查詢檢索,從而提高傳統形態分類的工作效率,并實現分類資源的網絡共享。系統運行可靠,檢索準確、高效、快速是手工檢索無法比擬的。隨著計算機在植物學中的應用,網絡技術和計算機鑒定技術必將成為植物信息管理和物種鑒定強有力的工具。系統的主要特點如下:
a)系統設計基于Web,跨越平臺,具有B/S架構的所有優點;分類資料充分共享,用戶擁有網絡環境和一個瀏覽器即可操作,同時界面簡單、直觀、操作方便。
b)使用二叉式檢索原理,易于編程實現,而且檢索快速、準確。該模式具有一定的通用性,可以應用于其他的生物檢索鑒別領域。
c)實現分類特征庫與推理過程的分離,使得系統的結構十分簡單,更新、維護方便。
系統的關鍵技術是分科特征庫的建立以及二叉式檢索鑒定,但由于種子植物的多樣性和分類特征的模糊性使得本系統存在著一定的局限性:系統只能在科級水平上進行種子植物的識別鑒定,不能鑒定到屬、種等更高級水平。需要在系統的不斷推廣使用中,規范分類特征數據,建立分屬、分種特征庫,使系統完善,能更好地為植物工作者服務。
參考文獻:
[1]章英才,侯子寧.寧夏野生經濟植物信息系統的結構和功能[J].植物學通報,1999,16(6):705-707.
[2]周堅,葛長偉.種子植物(科級)形態信息系統的建立及其應用[J].南京林業大學學報,1999,19(3):60-64.
[3]蔣宏民,孟付榮.利用信息技術判別種子植物科屬的研究[J].醫學信息學,2005,18(9):1141-1142.
[4]田興軍,張慧仁,張立新.江蘇植物資源信息系統[J]. 植物研究,2002,22(1):125-28.
[5]張潤娟,李偉.世界水生植物科屬檢索系統的設計與建立[J].武漢植物學研究,2002,20(6):481-484.
[6]徐妍,臧紹剛.野生植物資源信息檢索數據庫的建立和使用[J].山地農業生物學報,2000,19(6):457-459.
[7]高靈旺,沈佐銳,劉志琦,等.基于二叉分類推理的昆蟲分類輔助鑒定多媒體專家系統通用平臺TaxoKeys的設計與開發[J].昆蟲學報,2003,46(5):644-648.
[8]謝珩,盧顯良.基于Web的高性能瘦客戶/服務器網絡計算模式的實現[J].計算機應用研究,2006,23(7):239-241.
[9]耿以禮,耿伯介,王正平.中國種子植物分科檢索表及圖解[M].南京:南京大學出版社,1988.
[10]張靜芳,李智慧,劉學和.信息檢索中改進二叉樹優化檢索算法[J].情報學報,1999,18(5):389-392.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”