伊六喜,賈霄云,高鳳云,周 宇,斯欽巴特爾
(1.內蒙古農業大學農學院,呼和浩特 010019;2. 內蒙古農牧業科學院,呼和浩特 010031)
【研究意義】亞麻花和葉片相關性狀不易受環境條件的影響,屬于質量性狀。花色的差異是由于其所含花色素種類和含量的不同導致,是植物適應環境的表型性狀之一[1]。花色一般指花瓣的顏色,可作為蟲媒植物引誘昆蟲進行授粉的一個重要視覺信號[2]。亞麻花色多為藍色、深藍色、白色、淡藍色、紫色或粉藍色,也有罕見的黃花和紅花;花冠形狀分為漏斗形、五角星形、碟形、輪形;花藥顏色多為微黃、淺灰、藍[3]。亞麻花相關性狀遺傳穩定,易于觀察,不僅可作為標記性狀,在提高雜交種純度和檢測種間性狀轉移方法的可行性等生產實踐方面發揮重要的作用,而且還可作為旅游資源,用于開發田園生態旅游,對地方經濟發展和人民增收具有重要的意義[4-6]。亞麻種子萌發、幼苗出土時展開的是1對子葉,見到陽光后呈現為綠色,后期形成真葉,狹小細長,一般分為線形或披針形。葉色呈淺綠色、綠色或深綠色。【前人研究進展】植物花作為繁殖后代的生殖器官,其性別分化不僅影響作物產量與品質[7],而且在制種方面產生影響。例如一般白花亞麻種皮顏色為淡黃色,亞麻酸含量較高,適合保健食品開發,但易感病,抗性弱;藍花亞麻種皮顏色通常為褐色,一般含油率較高,適合榨食用油,抗性較強。目前,作物花性狀關聯基因的報道研究較少,利用 BSA 和全基因組重測序技術, 甘藍型油菜橙花性狀隱性基因BrOF定位到 A09 染色體 41.5 kb 區間[8]; 桔黃花性狀基因定位在 C09 染色體區域[9], 并獲得了 2 個連鎖的分子標記 BnaC09和 BnaC09; 白花性狀基因定位在 C03 染色體 52 ~55 Mb區間[10]。 葉片是作物光合作用的主要場所,可把光能轉化成化學能,為營養生長提供所需能量,其形態結構影響著光能利用效率和干物質積累,與作物產量緊密相關,而葉片顏色差異對植物捕獲光能和使光合組織免受光氧化傷害等方面具有重要作用[11]。Xu等[12]對水稻的葉寬性狀的基因定位研究,發現FLW7基因調控水稻劍葉寬度,可使光合葉面積增大,葉片態勢得到改善。【本研究切入點】目前亞麻產量和品質相關性狀的遺傳多樣性分析及其相關基因的挖掘研究已有較多報道[13],但有關亞麻花和葉片相關性狀的研究報道仍較少,尤其是關于亞麻種質花和葉片相關性狀的全基因組關聯分析尚未見報道。【擬解決的關鍵問題】本研究利用內蒙古農業大學亞麻課題組前期開發獲得到的全基因組SNP數據,通過花和葉片相關性質的全基因組關聯分析,挖掘目標性狀顯著關聯的位點和候選基因,為亞麻種質創新提供基礎。
269份亞麻種質材料來自21個國家和地區,其中國內種質占46.09%,包括內蒙古33份、河北15份、山西14份、甘肅42份、新疆8份、寧夏12份。國外種質占53.91%,包括美國21份、加拿大19份、阿根廷8份、荷蘭21份、匈牙利19份、法國12份、俄羅斯6份、巴基斯坦13份、伊朗6份,埃及、印度、波蘭、摩洛哥、新西蘭、阿富汗、土耳其、奧地利、烏拉圭、羅馬尼亞、西德等11個國家種質20份。具體編號、名稱、來源見表1。
269個亞麻種質材料種植于內蒙古農牧業科學院實驗田,在開花期,按參考文獻[3]調查記載花色、花形、花藥色、葉色、葉形等表型,用Excel表格整理,對每個性狀轉換阿拉伯數字(表1)。

表1 269份亞麻品種名稱及來源

續表1 Continued table 1

續表1 Continued table 1

續表1 Continued table 1

續表1 Continued table 1

續表1 Continued table 1

續表1 Continued table 1
花色:在盛花期,以實驗小區全部植株為觀測對象,在一致的光照條件下(一般在晴天上午7:30 —10:00),觀察完全開放花朵的花瓣顏色,不同花色用阿拉伯數字替代(1:藍色;2:深藍色;3:白色;4:淡藍色;5:紫色;6:粉藍色)。
花冠形狀:在盛花期,上午7:30—10:00從實驗小區隨機取樣20株,觀察每朵花的花冠形狀,并參照花冠形狀模式圖,確定亞麻種質的花冠形狀。不同花冠形狀用阿拉伯數字替代(2:漏斗形;3:五角形;4:碟形;5:輪形)。
花藥色:在盛花期,以實驗小區的全部植株為觀測對象,在一致的光照條件下(一般在晴天上午7:30—10:00),觀察完全開放花朵的花藥顏色。不同花藥色用阿拉伯數字替代(1:微黃;3:淺灰;4:藍)。
葉色:在現蕾期,以實驗小區全部亞麻植株為觀測對象,在一致的光照條件下,觀察植株中部葉片正面的顏色。不同葉色用阿拉伯數字替代(1:淺綠;3:綠;4:深綠)。
葉形:在現蕾期,從實驗小區中部隨機取樣10株,觀測每株中部完全展開的10片完整葉片的形狀。根據觀察結果并參照葉形模式圖,確定亞麻種質的葉形。不同葉形用阿拉伯數字替代(1:線形;2:披針形)。
內蒙古農業大學亞麻課題組前期對269份亞麻品種進行Hiseq測序,得到1.37 Tb的有效序列數據(Clean data),與已公布的亞麻參考基因組(http://phytozome.jgi.doe.gov/)平均比對率為96.32%,平均測序深度為12.55,平均覆蓋度為95.25%。采用SAMtools[14]軟件對參考基因組進行比對,獲得1069 106個有效SNPs進行花和葉片性狀的全基因組關聯分析。
用GEMMA(http://www.xzlab.org/software.html)軟件的混合線性模型(Mixed Linear Model,MLM)對群體結構主成分分析和親緣關系矩陣做協變量進行關聯分析,顯著性P的閾值-log10(0.05/標記數)確定為P=6.00。用R語言繪制曼哈頓圖和QQ圖。筆者前期研究發現亞麻連鎖不平衡度(LD值)為15 Kb[15],因此,基因組序列上15 Kb為窗口篩選了候選基因,并進行NR[16]、Swiss-port[17]、KEGG[18]、GO[19]功能注釋。
對269份亞麻種質的花色統計分析表明,152份種質為藍花,占56.50%;52份種質為深藍花,占19.70%;26份種質為白花,占9.66%;30份種質為淡藍花,占11.15%,7份種質為粉藍花,占2.60%,1份材料為紫花(圖1)。

圖1 花色分布比率
從圖2可見,花色性狀的SNP觀測值與期望值前端基本重疊,僅在末端翹起,說明群體結構和親緣關系對關聯分析結果產生的假陽性較低[15],得到的SNP位點可靠。在圖3中,虛線對應的閾值為-log(P)=6.00,在混合線性模型(MLM)模式下,共檢測到3個顯著SNP位點,分別為scaffold701:840107、scaffold736:250888、scaffold1639:8420(表2)。通過NR、Swiss-port、KEGG、GO等四大數據庫注釋到8個候選基因。其中Lus10033621基因功能為果膠酯酶,該酶中的纖維素酶和半乳糖苷酶可協同作用于細胞壁,從而促進花色苷等酚類物質的釋放,而本研究中檢測到的另外一個基因Lus10007409功能為β-半乳糖苷酶,因此,推測Lus10033621和Lus10007409基因是亞麻花顏色調控的主效基因。

表2 花色性狀關聯區域候選基因信息

圖2 花色性狀的QQ分析

圖3 花色性狀的曼哈頓分析
對269份亞麻種質的花冠形狀統計分析表明,漏斗形花冠種質48份,占17.84%,五角形花冠種質115份,占42.75%,碟形花冠種質92份,占34.20%,輪形花冠種質14份,占5.20%(圖4)。

圖4 花色分布比率
花冠形狀關聯的SNP觀測值與期望值前端重疊,但在末端未翹起,因此,花冠形狀關聯分析結果可能產生假陽性SNP位點(圖5)。-log(P)=6.00時(圖6),共檢測到3個顯著SNP位點,分別為scaffold811:44136、scaffold1370:15031、scaffold695:22509(表3)。通過NR、Swiss-port、KEGG、GO等四大數據庫注釋到6個基因。其中Lus10000554基因起始位置在顯著SNP位點上,該基因編碼為富含亮氨酸PPR基序的蛋白質,該蛋白在植物中分布廣泛,是線粒體和葉綠體中轉錄的RNA前體,PPR基序的蛋白缺失影響植物表型性狀。

圖5 花冠形狀QQ分析

圖6 花冠形狀曼哈頓分析

表3 花冠形狀關聯區域候選基因信息
亞麻花藥色統計分析表明, 花藥為微黃色的種質16份,占5.94%,淺灰色的種質20份,占7.43%;藍色種質233份,占86.61%(圖7)。從圖8可見,觀測值與期望值前端翹起,對關聯分析結果產生的假陽性較低,得到的SNP位點可靠。-log(P)=6.00時(圖9),共檢測到1個顯著SNP位點,為scaffold910:31728(表4),通過NR、Swiss-port、KEGG、GO等四大數據庫注釋到了5個基因。其中Lus10010403基因功能為花青素還原酶,該基因直接參與植物花青素的代謝途徑。

圖7 花藥色分布比率

圖8 花藥色的QQ分析

圖9 花藥色的曼哈頓分析

表4 花藥色關聯區域候選基因信息
對269份亞麻葉色性狀的調查分析結果表明,葉片淺綠色的種質為13份,占4.83%,綠色的種質98份,占36.43%,深綠色的種質158份,占58.73%(圖10)。觀測值與期望值前端開始翹起(圖11),對關聯分析結果產生的假陽性較低,得到的SNP位點可靠。-log(P)=6.00時(圖12),共檢測到1個顯著SNP位點,為scaffold211:69126(表5)。通過NR、Swiss-port、KEGG、GO等四大數據庫分別注釋到4個基因。其中Lus10005600功能為富含亮氨酸的PPR基序蛋白,與花冠形狀關聯的Lus10000554基因和花藥色關聯的Lus10010407基因功能相同。

圖10 葉色分布比率

圖11 葉色QQ分析

圖12 葉色曼哈頓分析

表5 葉色關聯區域候選基因信息
對269份亞麻葉形調查分析結果表明,線形葉片的種質116份,占43.12%,披針形葉片的種質153份,占56.87%(圖13)。葉形性狀的SNP觀測值與期望值前端基本重疊(圖14),僅在末端翹起,因此,假陽性低,得到的SNP位點可靠。在圖15中,虛線對應的閾值-log(P)=6.00時,共檢測到3個顯著SNP位點,分別為scaffold67:579267、scaffold76:1474090、scaffold51:1093344(表6)。通過NR、Swiss-port、KEGG、GO等四大數據庫注釋到5個基因。其中Lus10033007基因功能為凱氏帶膜蛋白,可以推測亞麻葉片結構中存在凱氏帶,吳小琴等[20]植物凱氏帶研究進展中提出了白皮松針葉內皮層細胞壁具有凱氏帶結構。

表6 葉形狀關聯區域候選基因信息

圖13 葉形狀分布比率

圖15 葉形狀曼哈頓分析
亞麻花和葉片是一個重要的表型性狀,在品種鑒別和純度檢測及其雜交育種等方面具有重要意義。通過基因組學研究篩選亞麻花和葉片性狀關聯的候選基因,不僅有利于了解亞麻植物學特征,而且為亞麻種質創新提供豐富的遺傳標記。柳麗等[21]對油菜花色基因的定位研究獲得控制花色性狀的2個主效基因。 Zhang等[22]對芥菜花色突變基因定位研究發現控制芥菜花色的候選基因BjuB27334,該基因編碼具有植酸酯合成和二酰基甘油酰基轉移酶活性。陳麗等[23]跳枝碧桃花色性狀的全基因組關聯分析,得到3個核酸內切酶DCL2基因。耿慶河等[24]通遺傳圖譜定位,將菜豆花色基因FC6定位在 6 號染色體末端 0.15 Mb 的區域內。上述研究表明,植物花色形成基因調控網絡比較復雜,不同植物花色性狀關聯到不同基因。本研究對亞麻花色性狀關聯分析未發現類似功能的編碼基因,但花色顯著關聯的SNP位點區域注釋到2個關于ABC轉運蛋白G家族成員編碼基因,推斷這2個基因可能是控制亞麻花色的候選基因。申慧敏等[25]ABC轉運蛋白在植物花器官生長發育中的研究進展中提出了ABC轉運蛋白對玉米、擬南芥、水稻、葡萄等植物花色形成中定位于液泡膜上負責向液泡轉運花青素的轉運體。亞麻花藥色性狀關聯的Lus10010403基因編碼為花青素還原酶。該酶是類黃酮物質合成途徑中與原花青素相關的一個關鍵酶[26]。魯丹丹等[27]在紅花的根、莖、葉、花中花青素還原酶基因的定量分析表明,在花中的表達量最高。盧甜甜等[28]對124份菜豆花色全基因組關聯分析,在6號染色體 322.67 kb 的區域內共鑒定到8個候選基因,其中,花青素調控的MYB 轉錄因子基因Phvul.006G020200在不同花色材料中差異性表達。Han等[29]將蘋果的花青素酶基因克隆轉入煙草中進行表達,結果顯示,這2種基因能抑制煙草花冠中花色苷的積累,從而調節不同植物組織顏色的呈現。說明花青素還原酶對亞麻花色苷合成有直接的調控作用,認為Lus10010403基因是亞麻花藥顏色調控關鍵基因。
葉子是光合作用的主要器官,它產生的同化物是作物產量形成的主要因素。作物葉片中葉綠體細胞越多,葉綠體中基粒類囊體數量多,光合作用強度最高,作物產量高。因此,植物葉子表型及其相關的關鍵基因挖掘研究對植物的遺傳改良具有重要意義。姚儉昕等[30]利用90K小麥SNP芯片對小偃81、西農1376構建的重組自交系群體進行旗葉長QTL定位,檢測到2個QTLs均位于5A染色體上。Tu等[31]利用20828/SY95-71重組自交系群體進行QTL定位,定位到控制旗葉長和寬的QTLs分別位于2B(2個)、5B和2B、2D染色體上,且位于2B染色體上的2個QTLs不重疊。曹廷杰等[32]對96分小麥品種旗葉性狀全基因組關聯分析,檢測到59個與旗葉顯著關聯的SNPs位點。彭芳芳等[33]櫻桃種質SCoT分子標記與葉片表型性狀關聯分析,篩選出了葉片表型顯著關聯54個SCoT標記。本研究中亞麻葉色表型關聯到了1個顯著SNP位點和4個候選基因,其中Lus10005600基因功能為富含亮氨酸的PPR基序蛋白,目前其他植物的葉色與該基因之間的關聯性尚未報道。亞麻葉形表型的關聯分析獲得了3個顯著SNP位點和5個候選基因,其中功能為凱氏帶膜蛋白基因(Lus10033007)與葉子發育形成密切相關。
本研究中花色分為藍色、深藍色、淡藍色、紫色、粉藍色、白色6個顏色,其中藍花種質最多(152份),占供試材料的56.5%,說明亞麻花顏色主要藍花為主。除這些花顏色以外,據報道還有紅花、淡紅花和黃花的亞麻種質[1],但本研究中未見紅花或黃花的亞麻。花藥顏色一般以藍色較多,本研究中233份種質花藥色為藍色,占供試材料的86.61%,說明亞麻花藥色主要以藍色為主。本研究中葉片顏色分深綠色(158份)、綠色(98份)、淡綠色(13份),葉形分為線形(116份)和披針形(153份)。說明亞麻葉子主要以深綠披針形為主,但是葉子顏色綠色和深綠色、綠色和淡綠色之間沒有明確的界限,對于葉片顏色的確定因不同時間或不同研究者均會產生一定的差異。
亞麻花和花藥主要以藍色為主,葉子主要以深綠披針形為主。通過全基因組關聯分析檢測到11個SNP位點和28個候選基因。其中,亞麻花色顯著關聯的SNP位點3個,候選基因8個;花冠形狀顯著關聯的SNP位點3個,候選基因6個;亞麻花藥色顯著關聯的SNP位點1個,候選基因5個;亞麻葉色顯著關聯的SNP位點1個,候選基因4個;葉形顯著關聯SNP位點3個,候選基因5個。對28個候選基因功能的NR、Swiss-port、GO、KEGG數據進行注釋,NR注釋到15個基因,其中糖苷酶、轉移酶、還原酶相關基因3個,假設蛋白、結合蛋白、結構域旋蛋白、凱氏帶膜蛋白等12個蛋白。Swiss-port注釋到22個基因,KEGG注釋到20個基因,GO注釋到13個基因。