胡為群,張小斌,鄭可鋒,祝利莉,姚旭國
(浙江省農業科學院,浙江 杭州 310021)
農林生物種質資源是生物資源的重要組成部分,是農作物品種選育和維持生物多樣性的重要物質基礎[1]。浙江省各農林科學研究單位長期專業從事資源收集、保存與利用工作,積累了大量農作物種質資源及相關的農藝性狀、經濟性狀數據。利用這些資源數據,能為種質資源的保存與評價、農作物品種選育的親本選擇提供快速有效的手段,為提高品種選育的效果,降低成本,更好地為農作物品種選育和利用生物技術創制新型種質提供支撐。我們在建立農作物種質分類體系的基礎上,根據不同農林生物品種的物種性狀描述建立各自的信息表述結構和編碼體系,實現農林生物種質資源數據庫和配套管理系統的開發。
根據浙江省農林生物種質資源開發和利用的現狀,建立涵蓋作物、林木、林特、畜禽等生物種質資源的多級分類描述體系,參考國際植物遺傳資源研究所發布的作物描述符表和我國現行的近130多類種質資源描述規范和數據標準,構建農林種質資源數據的元數據集,并據此設計種質資源數據庫結構定制與自動生成的軟件機制,最終形成各類農林種質資源數據庫結構集和數據存儲倉庫[2]。基于瀏覽器/服務器(B/S)模式建立由種質資源分類管理、種質資源數據管理、種質資源數據查詢等模塊組成的農林種質資源數據庫管理系統,實現對種質資源的保存、信息檢索查詢和應用,向各科研單位及各相關育種生產部門提供在線信息服務。數據庫系統的總體設計如圖1所示,由兩級數據庫組成,一級數據庫是物種種質資源性狀指標數據庫,二級數據庫是用戶在一級庫下自定義動態生成的特定農林生物種質的二級性狀指標庫及其種質資源管理信息數據庫。

圖1 農林生物種質資源數據庫管理系統總體設計
根據浙江省農林生物種質資源現狀,基于農林生物的功能性質進行分類,搭建三級數據框架。第1級分為農作物(AG)、林業(FG)、牧業(AH)、漁業(FG)、其他種質資源(OG)五大類;每個大類下面又再分為一級分類和二級分類二級。如農作物包括糧食作物、豆類作物、油料作物、纖維作物、糖料作物、瓜果類作物、水果類作物、干果類作物、根莖類作物、蔬菜作物、嗜好作物、花卉作物、藥用作物、原料作物、牧草與綠肥作物等;糧食作物中又包括水稻、大麥、小麥、玉米等(表1)。數據編碼格式為“大類+一級分類+二級分類”,如農業種質資源糧食作物中的水稻,用AG01001表示。物種種質資源分類描述體系使用國家制定的自然科技資源平臺種質資源規范化的描述語言,名詞術語與國家或國際標準保持一致,確保數據的規范性、嚴密性、科學性。

表1 農林生物種質資源數據庫框架示例
由于農林生物種質資源數量繁多,特征特性、抗逆性、抗病性等生物學特征差異較大,每種物種數據庫結構不同,數據庫管理系統必須適用于眾多農林生物物種種質資源數據庫管理,以動態方式自定義數據庫結構,采用對象—關系數據庫,通過接口程序與檢索系統、統計分析系統、互聯網信息發布系統聯結。另外,為了適應數據的不斷更新,系統采用了表結構和表數據分離的導入方式,如果該表在數據庫中不存在,則執行創建新表和導入表數據兩步驟,如果該表已經存在則只需執行附加數據。
參照中國農業科學院作物科學研究所研制的《農作物種質資源信息處理規范》對農作物的性狀和屬性進行了規范化和標準化處理。對標準化后的各項種質資源性狀指標數據結構進行綜合分析和合理抽提,定義形成完整的數據結構表(表2)。以茭白為例,將其分為5個部分:第1部分為基本信息,包括統一編號、種質圃編號、引種號、采集號、品種名稱、外文名、科名、屬或亞屬名、種名、原產地、保存單位等;第2部分為生長習性,包括株型、秋茭株高、秋茭薹管高、秋茭薹管節數、秋茭葉片長、秋茭葉片寬、秋茭葉鞘長、葉鞘顏色、葉頸顏色、秋茭殼色、秋茭單重、秋茭產量、秋茭有效分蘗、秋茭分蘗總數、秋茭有效分蘗率、雄茭株率、灰茭株率等;第3部分為品質信息,包括秋茭皮色、秋茭質地、冬孢子堆、夏茭凈茭皮色、夏茭質地、干物質、水分、可溶性糖、維生素C、粗蛋白質、粗纖維、耐貯藏性;第4部分為抗性,包括苗期耐冷性、耐旱性、耐澇性、茭白銹病抗性、胡麻葉斑病抗性、紋枯病抗性、茭白瘟病抗性;第5部分為其他,包括核型、分子標記、備注。
遠程數據訪問采取動態Web數據庫的策略、B/S體系結構,通過接口程序為用戶提供格式統一、直觀高效、易學易用、功能完備的人機交互圖形界面,用戶通過瀏覽器即可實現對數據庫的訪問、檢索與查詢(圖2),用戶可根據已知信息選擇分類查詢,快速獲取已知特定信息的物種種質資源資料。系統選用 C#、.NET2.0作為主導設計語言,并基于Windows2003 Server操作系統的Internet Information Server 6.0與SQL Server 2008數據庫服務器,提供數據庫平臺高效網絡服務。

表2 農林生物種質資源數據表示例

圖2 農林生物種質資源查詢界面示例
浙江省農林生物種質資源數據庫管理系統是集成數據庫技術和網絡技術構建的基于 B/S結構的生物種質資源數據標準化及管理平臺,為浙江省的生物種質資源的收集、評價、利用和研究提供了一套局域網和互聯網環境下生物種質資源數據管理技術方案。目前,系統已建立浙江省農林生物種質資源數據框架50多個,建成大豆、沙梨和家蠶3個實例數據庫,包含近10 000份品種/種質/基因信息。建成后的農林生物種質資源數據庫管理系統有利于農林生物種質資源的統一和規范管理,在此基礎上建立的浙江省農林種質資源系統能更好地為科研人員和生產部門服務。種質資源數據庫管理系統的完善是一個信息不斷更新的過程[3],由于該系統所涵蓋的作物品種繁多,涉及單位多,作物種質資源相關資料的收集是一項龐大而艱巨的任務,要想建立種類齊全、資源信息豐富的統一農作物種質資源數據系統需要建立一個長期、有效的資源共享機制。
[1]劉健宏.基于 Internet的種質資源數據庫平臺建設研究[J].農業網絡信息,2006(12):81-82.
[2]肖菁,宋羽,張金波.基于Internet的新疆農作物種質資源數據庫平臺的構建[J].北方園藝,2010(10):241-242.
[3]朱建淼,熊興平,江用文,等.基于Internet的多年生無性繁殖作物種質資源數據管理系統的設計與實現[J].中國農學通報,2009,25(6):252-256.