鄭司浩,尚興樸,鄧庭偉,曾燕,王繼永
中國(guó)中藥有限公司,北京 102600
甘草為豆科甘草屬常用大宗中藥材,《中華人民共和國(guó)藥典》2020 年版規(guī)定甘草為甘草Glycyrrhiza uralensisFisch.、脹果甘草G.inflataBat.或光果甘草G.glabraL.的干燥根和根莖,味甘,性平,歸心、肺、脾、胃經(jīng),具有補(bǔ)脾益氣、調(diào)和諸藥等功能,多用于治療脾胃虛弱、倦怠乏力等[1]。現(xiàn)代藥理研究表明,甘草及其提取物具有抗氧化、抗炎、抗?jié)儭⒔舛究拱⒖垢卫w維化等藥理作用[2]。植物甘草為甘草藥材的主要來(lái)源,分布在內(nèi)蒙古自治區(qū)、新疆維吾爾自治區(qū)、甘肅省、寧夏回族自治區(qū)等地,東北地區(qū)也有少量分布。
甘草在中醫(yī)臨床中使用量較大,歷來(lái)有“十方九草”之說(shuō)。同時(shí),其也是藥食同源品種之一,廣泛用于食品、保健食品及化妝品。自20 世紀(jì)60—70年代開始,甘草被大規(guī)模栽培,據(jù)不完全統(tǒng)計(jì),全國(guó)甘草栽培面積約50 萬(wàn)畝(1 畝≈666.67 m2),年使用量近6 萬(wàn)t[3]。研究表明,不同產(chǎn)地甘草不僅外觀性狀特征存在一定差異,甘草酸、甘草苷、總黃酮及總皂苷含量也存在顯著差異[4-5]。因此,不同產(chǎn)地甘草藥效成分與藥理作用存在差異。受市場(chǎng)因素及產(chǎn)業(yè)機(jī)械化程度不同影響,不同產(chǎn)地甘草種子、種苗、藥材及飲片價(jià)格差異較大,存在相互摻雜、異地調(diào)種等情況。傳統(tǒng)鑒別方法對(duì)于種內(nèi)鑒別研究較少,多借助性狀鑒別等主觀經(jīng)驗(yàn),很難復(fù)制與產(chǎn)業(yè)化推廣。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)指發(fā)生在染色體基因組水平上單個(gè)核苷酸變異引起的DNA 序列多態(tài)性。本研究通過(guò)對(duì)不同產(chǎn)地甘草進(jìn)行基因組重測(cè)序,參考甘草全基因組序列,分析比較不同產(chǎn)地基因組序列差異,獲得各主產(chǎn)區(qū)特有的SNP 位點(diǎn)信息,作為鑒別不同產(chǎn)地甘草的依據(jù),為規(guī)范甘草產(chǎn)業(yè)、促進(jìn)市場(chǎng)健康發(fā)展提供參考。
由中國(guó)中藥有限公司自建甘草種質(zhì)資源圃采集內(nèi)蒙古自治區(qū)、新疆維吾爾自治區(qū)、甘肅省等甘草主產(chǎn)區(qū)野生種質(zhì)資源葉片樣本共24 份,經(jīng)國(guó)藥種業(yè)有限公司李進(jìn)瞳副研究員鑒定為甘草Glycyrrhiza uralensisFisch.,標(biāo)本存放于中國(guó)中藥有限公司,樣品信息見表1。
MGISEQ-2000RS型高通量測(cè)序儀(深圳華大智造科技股份有限公司);1-14 型離心機(jī)(德國(guó)Sartorius公司);NanoDrop One型超微量分光光度計(jì)(美國(guó)Thermo公司)。
FCL PE150MGISEQ-2000RS 高通量測(cè)序試劑套裝(批號(hào):1000012555,深圳華大智造科技股份有限公司);異丙醇(批號(hào):20190605)、無(wú)水乙醇(批號(hào):20190507)均購(gòu)自國(guó)藥集團(tuán)化學(xué)試劑有限公司。
采用改良十六烷基三甲基溴化銨(mCTAB)法對(duì)甘草葉片材料DNA 進(jìn)行提取,具體步驟如下:1)取新鮮植物葉片100 mg 放入2.0 mL 離心管,加入少量石英砂和磁珠1 顆,浸入液氮中凍存約1 min,置研磨機(jī)中打磨至細(xì)小的粉末狀;2)在研磨好的材料中加入buffer A[0.1 mol·L-1Tris-HCl(pH 8.0)、5 mmol·L-1乙二胺四乙酸(EDTA)、0.25mol·L-1NaCl、1%聚乙烯吡咯烷酮-40(PVP-40)]溶液1.5 mL,反復(fù)顛倒離心管使溶液與材料粉末均質(zhì)混勻,冰浴10 min,其間將沉淀下的粉末重新均質(zhì)混合幾次。10 000×g離心2 min 后,棄掉上清液;3)重復(fù)步驟2)1 次,在沉淀中加入預(yù)熱的2% CTAB[0.1 mol·L-1Tris-HCl(pH 8.0)、1.4 mol·L-1NaCl、25 mmol·L-1EDTA、2%CTAB;0.2%β-巰基乙醇;1% PVP-40]溶液800 μL,將沉淀均質(zhì)懸浮于溶液后置于65 ℃水浴鍋中保存1.5~2.0 h,其間顛倒均質(zhì)溶液若干次;4)10 000×g室溫離心2 min 后,將上清液小心倒入新的2.0 mL 離心管中,加入等體積CI[三氯甲烷-異戊醇(24∶1)]溶液,在顛倒搖床上混合10 min;5)10 000×g離心2 min 后,以移液槍小心吸取上層水相至新2.0 mL 離心管中,加入等體積CI 溶液,顛倒搖床上混合10 min;6)10 000×g離心2 min 后,以移液槍小心吸取上層水相至新的1.5 mL 離心管中,加入0.6 倍體積的冰冷異丙醇,顛倒混合后置于-20 ℃冰箱保存1 h 以上;7)取出冰箱中的離心管,10 000×g離心2 min,棄去上清液,倒置于干燥紙上,加入100 mg·L-1核糖核酸酶(RNase)溶液100 μL,37 ℃保存0.5 h;8)在離心管中依次加入ddH2O 150 μL、5 mol·L-1NaCl 溶液50 μL 和無(wú)水乙醇700 μL,充分混合后10 000×g離心2 min,棄去上清液;9)加入70%乙醇600 μL,彈底混合后10 000×g離心2 min,,棄去上清液,重復(fù)1 次;10)真空干燥去掉乙醇,加Tris-EDTA 緩沖液100 μL 溶解DNA,根據(jù)NanoDrop One 測(cè)定要求將樣品DNA 濃度并稀釋至50 ng·μL-1備用。
檢測(cè)合格的DNA 樣品隨機(jī)打斷成300~400 bp的片段,采用華大基因試劑盒進(jìn)行建庫(kù)。庫(kù)檢合格后,根據(jù)文庫(kù)的有效濃度和實(shí)際產(chǎn)出需求進(jìn)行BGI-SEQ高通量測(cè)序,獲得DNA測(cè)序原始數(shù)據(jù)。
測(cè)序得到的原始reads包含接頭序列,低質(zhì)量和包含N的reads。使用SOAPnuke 1.5.6對(duì)原始reads進(jìn)行過(guò)濾以保證信息分析質(zhì)量。過(guò)濾參數(shù):-n 0.02-l20-q 0.4。
以甘草在http://ngs-data-archive.psc.riken.jp/Gur-genome/download.pl 中的基因組作為參考序列,利用BWA 軟件進(jìn)行序列比對(duì),比對(duì)參數(shù)為mem-t 8-M-R。比對(duì)獲得的.bam 文件利用Samtools軟件進(jìn)行排序,并用picard 移除聚合酶鏈?zhǔn)椒磻?yīng)(PCR)引起的重復(fù)reads。
得到.bam 文件后,利用GATK 軟件獲得個(gè)體的SNP基因型,進(jìn)一步對(duì)SNP進(jìn)行過(guò)濾,保留QUAL>100&&FS<10&&MQ>40的SNP。通過(guò)比較不同產(chǎn)地樣本的SNP 基因型,找到各主產(chǎn)區(qū)穩(wěn)定的SNP 鑒別位點(diǎn)信息,結(jié)合SNP 位點(diǎn)在基因組的位置,根據(jù)其前后150~200 bp 的堿基序列設(shè)計(jì)引物,利用經(jīng)典的SANGER 測(cè)序?qū)Σ煌a(chǎn)地樣品的SNP 位點(diǎn)堿基進(jìn)行驗(yàn)證與確認(rèn)。在產(chǎn)地鑒別時(shí),建議待檢樣品與產(chǎn)地鑒別SNP位點(diǎn)滿足95%以上的比對(duì)標(biāo)準(zhǔn)。
通過(guò)對(duì)甘草不同產(chǎn)地樣品的重測(cè)序數(shù)據(jù)進(jìn)行分析比對(duì),找到可穩(wěn)定鑒別內(nèi)蒙古杭錦旗產(chǎn)甘草的20 個(gè)SNP 位點(diǎn)信息,同時(shí)結(jié)合SNP 位點(diǎn)前后序列設(shè)計(jì)引物,通過(guò)SANGER 測(cè)序的方式,驗(yàn)證與確認(rèn)SNP 位點(diǎn)準(zhǔn)確性,信息見表2。SNP 周邊序列是指該SNP 位點(diǎn)前5 bp 起始共計(jì)10 bp 的堿基序列。
通過(guò)提取鑒別內(nèi)蒙古杭錦旗產(chǎn)地甘草SNP 位點(diǎn)周邊300~500 bp 堿基序列設(shè)計(jì)引物,通過(guò)SANGER測(cè)序方式進(jìn)行測(cè)序驗(yàn)證,第一次設(shè)計(jì)引物擴(kuò)增成功率為90%(擴(kuò)增不成功的加長(zhǎng)序列長(zhǎng)度重新設(shè)計(jì)引物直到擴(kuò)增成功),SNP 位點(diǎn)堿基均正確。基于表2中SNP 位點(diǎn)信息,將待檢測(cè)樣本按照2 項(xiàng)下方法進(jìn)行實(shí)驗(yàn),最終得到待檢樣品SNP 基因型。相同染色體位置處的SNP位點(diǎn)信息與表2進(jìn)行比對(duì),如有19~20 個(gè)SNP 位點(diǎn)信息與表2 中所列的位點(diǎn)信息相同,則可判定該待檢樣品為內(nèi)蒙古杭錦旗產(chǎn)甘草。

表2 內(nèi)蒙古杭錦旗產(chǎn)甘草鑒別SNP位點(diǎn)信息
通過(guò)對(duì)甘草不同產(chǎn)地樣品的重測(cè)序數(shù)據(jù)進(jìn)行分析比對(duì),找到可穩(wěn)定鑒別新疆產(chǎn)甘草的40 個(gè)SNP 位點(diǎn)信息,結(jié)合SNP 位點(diǎn)前后序列設(shè)計(jì)引物,通過(guò)SANGER 測(cè)序的方式,驗(yàn)證與確認(rèn)SNP 位點(diǎn)準(zhǔn)確性,信息見表3。
通過(guò)提取鑒別新疆產(chǎn)地甘草SNP 位點(diǎn)周邊300~500 bp 堿基序列設(shè)計(jì)引物,通過(guò)SANGER 測(cè)序方式進(jìn)行測(cè)序驗(yàn)證,第一次設(shè)計(jì)引物擴(kuò)增成功率為95%(擴(kuò)增不成功的加長(zhǎng)序列長(zhǎng)度重新設(shè)計(jì)引物直到擴(kuò)增成功),SNP 位點(diǎn)堿基均正確。基于表3 中SNP 位點(diǎn)信息,將待檢測(cè)樣本按2 項(xiàng)下方法進(jìn)行實(shí)驗(yàn),最終得到待檢樣品SNP 基因型。將相同染色體位置處SNP 位點(diǎn)信息與表3 進(jìn)行比對(duì),如有19~20個(gè)SNP基因與表3中SEQID No.1~No.20相同,同時(shí)有19~20個(gè)SNP基因與表3中SEQID No.21~No.40 不同,則可判定該待檢樣品為新疆產(chǎn)甘草。

表3 新疆產(chǎn)甘草鑒別SNP位點(diǎn)信息
通過(guò)對(duì)甘草不同產(chǎn)地樣品的重測(cè)序數(shù)據(jù)進(jìn)行分析比對(duì),找到可穩(wěn)定鑒別甘肅產(chǎn)甘草的40 個(gè)SNP位點(diǎn)信息,結(jié)合SNP 位點(diǎn)前后序列設(shè)計(jì)引物,通過(guò)SANGER 測(cè)序的方式,驗(yàn)證與確認(rèn)SNP 位點(diǎn)準(zhǔn)確性,信息見表4。
通過(guò)提取鑒別甘肅產(chǎn)地甘草SNP 位點(diǎn)周邊300~500 bp 堿基序列設(shè)計(jì)引物,通過(guò)SANGER 測(cè)序方式進(jìn)行測(cè)序驗(yàn)證,第一次設(shè)計(jì)引物擴(kuò)增成功率為90%(擴(kuò)增不成功的加長(zhǎng)序列長(zhǎng)度重新設(shè)計(jì)引物直到擴(kuò)增成功),SNP 位點(diǎn)堿基均正確。基于表4 的SNP 位點(diǎn)信息,將待檢測(cè)樣本按2 項(xiàng)下方法進(jìn)行實(shí)驗(yàn),最終得到待檢樣品SNP 基因型。相同染色體位置處的SNP位點(diǎn)信息與表4進(jìn)行比對(duì),如有19~20個(gè)SNP基因與表4 中SEQID No.1~No.20 相同,同時(shí)有19~20個(gè)SNP 基因與表4 中SEQID No.21~No.40 不同,則可判定該待檢樣品為甘肅產(chǎn)甘草。

表4 甘肅產(chǎn)甘草鑒別SNP位點(diǎn)信息
藥材甘草在中醫(yī)處方中用藥頻次較高,又是藥食同源的中藥大品種,隨著甘草在食品、化妝品及保健食品等產(chǎn)品中使用量逐漸增多,其需求量將會(huì)不斷增加。當(dāng)前,甘草是甘草藥材的主要植物來(lái)源,新疆、內(nèi)蒙古、甘肅等地是其主要產(chǎn)區(qū)。不同產(chǎn)區(qū)的甘草種子、種苗及藥材存在較為明顯的價(jià)格差異,特別是甘草種子。由于新疆面積廣闊、利于機(jī)械化作業(yè),該地區(qū)甘草種子價(jià)格普遍比內(nèi)蒙古、甘肅等地低近50%。巨大的經(jīng)濟(jì)利益驅(qū)使商販進(jìn)行異地調(diào)種、產(chǎn)地?fù)诫s,嚴(yán)重影響甘草藥材的質(zhì)量穩(wěn)定和產(chǎn)業(yè)健康有序發(fā)展。
中藥材產(chǎn)地鑒別一直是中藥產(chǎn)業(yè)技術(shù)難點(diǎn)和痛點(diǎn)。有經(jīng)驗(yàn)的藥農(nóng)與中藥材種植戶多依靠主觀經(jīng)驗(yàn)加以判斷。隨著分子生物學(xué)的加速發(fā)展,其在居群及生態(tài)型鑒別方面的研究技術(shù)和方法可在中藥材產(chǎn)地鑒別中加以探索和應(yīng)用。SNP 分子標(biāo)記是第三代分子標(biāo)記技術(shù)的代表,以基因組序列為基礎(chǔ),具有通量大、多態(tài)性豐富、分析速度快、易建立標(biāo)準(zhǔn)化操作等特點(diǎn)[6]。SNP分子標(biāo)記技術(shù)在中藥物種鑒別中已有廣泛應(yīng)用[7-11],在同一藥材不同產(chǎn)地或居群的鑒別方面也有部分研究[12-13]。本研究以甘草全基因組序列為參考,通過(guò)對(duì)不同主產(chǎn)地甘草的測(cè)序數(shù)據(jù)進(jìn)行分析比較,挖掘新疆、甘肅和內(nèi)蒙古杭錦旗產(chǎn)地甘草的SNP 鑒別位點(diǎn)信息,可用于鑒別甘草的產(chǎn)地來(lái)源,為甘草藥材質(zhì)量穩(wěn)定和產(chǎn)業(yè)健康有序發(fā)展提供科學(xué)依據(jù)。研究結(jié)果表明,鑒別新疆與甘肅產(chǎn)地的SNP 位點(diǎn)組合各含有40 個(gè)堿基,鑒別內(nèi)蒙古杭錦旗產(chǎn)地甘草的SNP位點(diǎn)為20個(gè)堿基。從SNP堿基分布來(lái)看,以堿基A 和T 為主,占比高達(dá)74%。運(yùn)用基因組重測(cè)序方法,分析樣本的各SNP位點(diǎn)堿基信息,并與產(chǎn)地鑒別SNP 位點(diǎn)信息進(jìn)行比較,可初步判斷該樣本的產(chǎn)地來(lái)源。同時(shí),也可通過(guò)根據(jù)鑒別各產(chǎn)
地的SNP位點(diǎn)所在序列設(shè)計(jì)的引物進(jìn)行擴(kuò)增與測(cè)序,通過(guò)測(cè)序結(jié)果比較SNP 位點(diǎn)對(duì)產(chǎn)地來(lái)源進(jìn)行判斷。但是,目前該方法工作量較大、成本較高,后續(xù)研究工作重點(diǎn)應(yīng)加大樣本驗(yàn)證數(shù)量及減少SNP 位點(diǎn)數(shù)量,降低技術(shù)成本、擴(kuò)大技術(shù)推廣利用范圍。
中藥材產(chǎn)地鑒別技術(shù)的研究和產(chǎn)業(yè)化應(yīng)用是當(dāng)前中藥產(chǎn)業(yè)亟待解決的難題。中藥資源豐富,野生資源和各種栽培類型分布相對(duì)分散,給中藥產(chǎn)地鑒別帶來(lái)巨大的挑戰(zhàn)。傳統(tǒng)的性狀鑒別受個(gè)人主觀判斷影響,無(wú)法產(chǎn)業(yè)化推廣和應(yīng)用。基于基因序列和基因組的鑒別技術(shù)具有通量高、鑒別準(zhǔn)確及穩(wěn)定性強(qiáng)等優(yōu)點(diǎn),對(duì)于傳統(tǒng)鑒別方法是較好的補(bǔ)充,可應(yīng)用于中藥產(chǎn)地鑒別。但是,由于藥用植物基因組學(xué)基礎(chǔ)研究起步較晚、研究和檢測(cè)費(fèi)用相對(duì)較高,分子標(biāo)記技術(shù)的應(yīng)用還存在一定限制性。隨著測(cè)序成本不斷下降及相關(guān)技術(shù)、設(shè)備的迭代更新,分子標(biāo)記技術(shù)在中藥產(chǎn)地鑒別中的應(yīng)用將越來(lái)越普遍,并逐漸形成可產(chǎn)業(yè)化推廣的鑒別技術(shù),為中藥產(chǎn)業(yè)的監(jiān)督、監(jiān)管及健康發(fā)展提供技術(shù)支撐。