王 晶,李 茜,高雪芹,3,伏兵哲,3
(1. 寧夏大學農學院,寧夏 銀川 750021;2. 寧夏草牧業工程技術研究中心,寧夏 銀川 750021;3. 寧夏優勢特色作物現代分子育種重點實驗室,寧夏 銀川 750021)
多倍體是指擁有兩個以上完整染色體組的個體[1],可以通過自然發生和人工誘導產生。自然發生多倍體是指具有不同倍性水平的物種間進行天然雜交或未發生減數分裂的配子與種間或種內配子結合而形成的多倍體[2],其產生過程相對緩慢且較為罕見,根據前人統計,在被子植物中自然形成的多倍體物種僅有2%~4%[3]。隨著育種技術的不斷創新及多倍體誘導技術的深入研究,人們通常利用生物、化學、物理等人工誘導方法處理以提高植物多倍體的發生頻率,從而克服在自然界中由于一些物種倍性水平不同而不能進行種間雜交、雜交后代不育以及某些屬只有一個物種等所導致的植物基因庫狹窄、經濟價值性狀低等難題[4]。多倍體植物一般表現為植株高大、抗逆性強,因此可將人工誘導多倍體形成作為一種策略以響應環境變化產生的遺傳變異來提高植物的適應性[5-6],但與此同時誘導形成的多倍體往往也伴隨著育性低、生長慢、矮生等特征[7],所以多倍體育種技術在以收獲營養體為主的植物種質創新、性狀改良及其品種選育中具有重要意義。綜上,多倍體誘導技術被認為是促使生物多樣性增加的一個有價值的工具,它增加了種質的多樣性,為育種工作的延續奠定了基礎[8-11]。
從20 世紀90 年代至今,信息技術極速發展,大數據時代逐漸到來,同時伴隨著數據產生速度、方式、類型、體量的大幅提高,使得傳統文獻分析方法遇到巨大挑戰[12];而文獻計量學作為文獻計數的統計方法在此挑戰下應勢而生,為從海量文獻中發現知識結構與學科發展提供了新的路徑,該方法不僅可以評估和量化特定主題的文獻增長趨勢,揭示其歷史發展和研究現狀以及前沿趨勢[13],而且提供了從微觀(期刊和機構)到宏觀(國家和全球)觀點的橋梁功能。
Citespace 是由陳超美教授團隊研發的一款基于Java 平臺,利用多元、歷時、動態的信息可視化技術顯現動態知識圖譜,并能兼容中英文主流文獻數據庫的文獻計量分析可視化軟件[14],通過其可確定某特定研究領域的主要研究重點和熱點[15]。通過文獻檢索發現,目前關于多倍體誘導方面的綜述文獻數量有限,還未檢索到利用文獻計量法對該研究領域進行系統全面地綜合分析的文章。而近年來多倍體誘導相關研究文獻數量逐漸增加,且研究來源于不同物種和角度。因此,本研究借助Citespace 文獻計量軟件,從發文趨勢、引文次數、國家合作關系、核心機構、發文期刊、高被引文獻和高頻共現關鍵詞等角度對當前的研究進行分析和總結,有助于全面了解全球多倍體誘導相關研究現狀和前沿趨勢,更好地把握最新的研究動態,旨在為該研究領域的學者提供理論參考與借鑒。
本研究使用的數據來源于中國知網(China National Knowledge Internet, CNKI)數據庫[包括北大核心、中國科學引文數據庫(Chinese Science Citation Database, CSCD)、工程索引(The Engineering Index,EI)、中文社會科學引文索引(Chinese Social Sciences Citation Index, CSSCI)和科學引文索引(Science Citation Index, SCI)來源的文獻] 以及Web of Science 核心合集(WOS) 數據庫[ 包括社會科學引文索引(Social Sciences Citation Index, SSCI)、科學引文索引(Science Citation Index Expanded, SCI-E)、會議錄引文索引(Conference Proceedings Citation Index -Social Sciences & Humanities, CPCI-SSH)、會議錄引文索引科技版(Conference Proceedings Citation Index -Science, CPCI-S)、化學索引數據庫(Index Chemicus, IC)和化學數據庫(Current Chemical Reactions Expanded,CCR-E)收錄的文獻]。具體檢索時間為2021 年1 月3 日,時間跨度為2000 - 2020 年。CNKI 中,以“染色體加倍”或“多倍體誘導”作為檢索主題,以“期刊”作為檢索大類,共檢索到839 篇有效文獻,之后以refworks 格式輸出其信息作為分析數據源;WOS 中采用基本檢索,文獻類型選擇“article”和“review”,語種選擇 “English”,檢索主題為 “chromosome doubling”或“polyploidy induction”或“polyploidy inducting”,共檢索出615 篇有效文獻,之后以“全記錄與引用的參考文獻”格式輸出文獻信息作為分析數據源。
本研究利用Citespace 5.7.R1 文獻數據挖掘和可視化分析軟件,基于“path finder (尋徑網絡算法)”和“co-citaion (共引分析理論)”對多倍體誘導研究領域的相關文獻進行計量分析,以探尋出該研究領域演化的主要路徑及其關鍵知識轉折點,并通過繪制一系列不同的可視化知識圖譜來分析學科演化和前沿趨勢。本研究中計量指標的分析通過Excel 2016 完成,可視化知識圖譜采用Citespace 構建,其中node types (節點類型)的選擇為合作網絡分析中的institution (機構)和country (國家)、共現網絡分析中的keyword (關鍵詞)、共被引分析中的cited journal(期刊共被引)。可視化圖譜中每個節點(node)代表一個關鍵詞,節點的不同圈層為年輪,根據年輪層的不同顏色展現出該關鍵詞的引用歷史記錄,節點的大小顯示出關鍵詞出現頻次的多少,節點之間連線(link)越多表明關鍵詞之間的共現次數越多,并且連線粗細程度顯示出相互關系的強弱[16]。因此,可視化圖譜中節點大小、連線多少、連線粗細、年輪顏色及厚度均能體現出該文獻發表至今被引用歷史情況及其學術貢獻度[17]。
文獻的定量分析包括每年的發文數量和被引次數,用于表示近年來相關領域的研究活動趨勢,是反映相關研究程度的重要指標[18]。在一定程度上,引文數量能夠反映出文獻的認可度和貢獻率。2000 -2020 年,CNKI 中多倍體誘導研究領域總發文量為839 篇,年平均發文量為42 篇,2000 - 2010 年發文量整體逐漸上升,2001 年發文量最少,僅15 篇,2010 年發文量最多,高達65 篇,之后2010 - 2020 年發文量逐漸下降(圖1)。值得注意的是,雖然早期發表的文章數量相對較少,但它們充分描述了多倍體誘導的方法、原理與問題,因此被更頻繁地引用。總被引頻次和篇均被引頻次的峰值分別出現在2003 年和2000 年,近10 年來被引頻次呈穩定的下降趨勢。

圖1 中國知網中植物多倍體誘導相關研究發文量時間序列變化Figure 1 Temporal trends in the number of plant polyploidy induction papers and associated citations in China National Knowledge Infrastructure (CNKI)
2000 - 2020 年WOS 中有關多倍體誘導方面研究文獻量雖然有輕微波動,但整體呈增加趨勢(圖2)。年均發文量為29 篇,2001 年發文量最少,僅12 篇,2020 年發文量最多,達到了62 篇,這與許多國家近年來的科研基金支持程度、重視程度、期刊數的不斷增加有一定的關系,同時這也符合科技論文質量與數量不斷增長的大趨勢[19-20]。總被引頻次呈逐漸上升趨勢,與每年發文量整體趨勢相一致,篇均被引頻次在2000 - 2010 年呈穩定上升趨勢,但在2010 - 2020 年起伏波動較大,總被引頻次和篇均被引頻次的峰值分別出現在2020 年和2018 年,由此可看出近年來諸多學者加深了對該研究領域的重視程度。

圖2 WOS 中植物多倍體誘導相關研究發文量時間序列變化Figure 2 Temporal trends in the number of plant polyploidy induction papers and associated citations in Web of Science (WOS)
一個機構或國家收錄在WOS 中的論文數量和質量可以反映其在特定科學領域的研究水平[21]。2000 - 2020 年,WOS 中發文量前10 的國家依次為中國(181 篇)、美國(96 篇)、日本(55 篇)、巴西(23篇)、波蘭(21 篇)、伊朗(21 篇)、印度(21 篇)、德國(19 篇)、法國(13 篇)和西班牙(12 篇)。這10 個國家的總發文量為462 篇,占全球發文總量的75.1%,其中中國占發文量前10 國家發文總量的39.2%,是美國的1.89 倍,遠遠領先于其他國家,并且其2020 年發文量高達29 篇,與1999 年相比增加了16 篇。從發文時間走勢看,中國和美國起步較早,而其他國家依次于2 年或3 年后才陸續發文,伊朗更是8 年以后才開始刊文(圖3)。整體來看,中國不僅發文量明顯較多,而且每年發文的連續性較強,美國次之,而其他國家間斷性較強,發文不連貫。近年來,國際交流和合作已經成為科學研究中的一個重要方面,有助于促進學術出版物的發展并深化其影響。本研究繪制了各國家間的合作關系網絡圖譜,可以看出在該研究領域,中國(China)、美國(USA)和日本(Japan)處于全球科學研究水平的領先地位,是合作貢獻較多的前3 個國家,它們的中介中心性依次為0.30、0.67 和0.18 (圖4),說明美國在各個國家合作間居于重要地位。

圖3 WOS 中植物多倍體誘導發表量前10 的國家發文趨勢Figure 3 Trends in plant polyploidy induction papers published per year by the top 10 countries in Web of Science (WOS)

圖4 WOS 中文獻發表國家間合作Figure 4 Cooperation among countries in Web of Science (WOS) publications
綜合CNKI 和WOS,累積發文量前15 的研究機構中有11 所研究機構來自中國,發文量居第一的機構為北京林業大學(84 篇),占累積發文量前15 研究機構發文總量的23.48%,是中國學術機構中最重要的科學貢獻者之一,其次為南京農業大學(34 篇)和華中農業大學(31 篇) (圖5)。總被引次數排名前3 的機構分別為華中農業大學、北京林業大學和法國國家農業食品與環境研究院,各占累積發文量前15研究機構刊文被引總量的18.82%、15.74%和12.55%。篇均被引次數排名也有所不同,法國國家農業食品與環境研究院、華中農業大學和西北農林科技大學位居前3,篇均被引次數分別為96、56、33,其中法國國家農業食品與環境研究院的刊文具有明顯的優勢。

圖5 國內外發文量前15 的研究機構Figure 5 Top 15 research institutions in terms of number of articles published in China and abroad
學術期刊是科研學者學術成果展示的主要平臺,因此對某一特定研究領域的核心期刊進行統計分析,有助于研究者快速準確地選擇相應期刊進行文獻查閱和論文寫作[22-23]。CNKI 中發表文獻總數靠前的3 個期刊依次為《北京林業大學學報》(22篇)、《核農學報》(17 篇)和《園藝學報》(11 篇),分別占發文量前10 期刊發表文獻總數的21.15%、16.35%和10.58% (表1)。《北京林業大學學報》刊文的總被引次數最高,達691;《園藝學報》刊文的平均被引次數高達52,占發文量前10 期刊平均被引次數總數的15.49%。WOS 中發表文獻總數排名第1 的期刊是《Euphytica》,發文量為53 篇(21.9%),《Plant Cell, Tissue and Organ Culture》次之,發文量為51 篇(21.1%),其次為《Plant Breeding》。總被引次數和平均被引次數最高的期刊分別為《Plant Cell, Tissue and Organ Culture》(1 060)和《Theoretical and Applied Genetics》(25.6%)。

表1 多倍體誘導研究國內外發文量前10 的期刊Table 1 Top 10 journals in terms of number of articles published for polyploidy induction in China and abroad
文章的被引次數一定程度上可以反映出研究的熱點和潮流,還可作為衡量其學術影響力高低的重要指標[18,24-25]。表2 列出了有關多倍體誘導研究的出版物中被引用次數最多的10 篇論文,CNKI 中,郭啟高等[26]在2000 年發表于《生物學通報》的“植物多倍體誘導育種研究進展”,其被引次數最高,共引220 次,占被引次數排名前10 的文獻總被引次數的15.92%。WOS 中,被引次數最高的文獻是Chalhoub 等[27]在2014 年 發 表 于《Science》的 “Early allopolyploid evolution in the post-NeolithicBrassica napusoilseed genome”,總被引905 次,遠高于其他論文被引量;排名第2 的文獻為Shaked等[28]在2001 年發表于《Plant Cell》的“Sequence elimination and cytosine methylation are rapid and reproducible responses of the genome to wide hybridization and allopolyploidy in wheat”,總被引536 次;排名第3的文獻為Kashkush 等[29]在2002年 發 表 于《Genetics 》 的“Gene loss, silencing and activation in a newly synthesized wheat allotetraploid”,以上3 篇高被引文獻占被引次數排名前10 的文獻總被引次數的65.25%。

表2 多倍體誘導研究排名前10 的高被引文獻Table 2 Top 10 of references with high citations for polyploidy induction research in China and other countries
為全面了解多倍體誘導相關研究現狀和前沿發展趨勢,更好地把握最新的研究動態,提取出2000 -2020 年收錄在CNKI 和WOS 中的有關多倍體誘導的文獻關鍵詞并進行時區視圖分析。關鍵詞高度概括了論文主題[30],它的出現頻率和每個詞間的關聯程度能揭示出某領域的研究熱點及其內在關系[31],而時區視圖(timezone)主要側重于在時間維度上顯示知識演進過程,可清晰展示出文獻的更新和相互之間的聯系,因此對文獻中的關鍵詞進行時區視圖分析具有重要意義[32-33]。CNKI 中共有165 個節點(nodes),334 條連線(links),模塊化度量值(modularity,Q) = 0.541 5 > 0.3,聚類結構顯著;同質化程度(mean silhouette) = 0.676 > 0.5,聚類結果合理(圖6)。“秋水仙素”共出現250 次,出現頻次最多,其次為“多倍體”和“染色體加倍”,分別出現242 次和119 次,此外這兩個關鍵詞節點外部的紫色圈較明顯,表明具有較高的中介中心性[34],其值分別為0.37 和0.32。突現詞是指在一定時間內使用頻率突然增加的關鍵詞或術語,可以進一步反映該領域的研究前沿動向[35-36]。從CNKI 數據庫中提取出10 個突現詞,“倍性鑒定”的突現強度達到4.933 5,可見該詞受到了學者們的廣泛關注,可作為多倍體誘導研究的重要方面,也被認為是具有一定影響力的研究前沿,最早的“快速繁殖”是一種植物組織培養技術,這個研究熱點從2000 年起持續到2003 年,而“甘藍型油菜(Brassica napus)”從2001 年起持續到2005 年;之后“藥用植物(2005 - 2011 年)”也相對突出,而近7 年來的研究熱點主要顯示為“流式細胞儀(2014 -2020 年)”和“倍性鑒定(2016 - 2020 年)”(圖7)。

圖6 基于中國知網的多倍體誘導研究前沿時區視圖Figure 6 Temporal representation of the frontiers of research in polyploid induction based on China National Knowledge Infrastructure (CNKI)

圖7 中國知網中引用率最高的10 個突現詞圖譜Figure 7 Knowledge map of the top 10 burst terms with the strongest citation bursts in China National Knowledge Infrastructure (CNKI)
WOS 中 共 有285 個 節 點(nodes),1 230 條 連線(links),模塊化度量值(modularity,Q) = 0.475 7 > 0.3,聚類結構顯著;同質化程度(mean silhouette) = 0.721 8 >0.7,聚類結果令人信服(圖8)。出現頻次前5 的關鍵詞依次為colchicine (秋水仙素)、chromosome doubling (染色體加倍)、plant (植物)、polyploidy (多倍體)、induction (誘導),出現次數分別為164、133、117、104 和92 次。從WOS 數據庫中提取突現詞10 個,“tetraploid (四倍體)”突現強度最大,高達5.19;“wheat”小麥(Triticum aestivum),2000 - 2010 年作為研究熱點持續了11 年,之后是“allopolyploid(異源多倍體,2004 - 2008 年)”、“genetic diversity(遺傳多樣性,2006 - 2009 年)”和“plant regeneration(植株再生,2006 - 2010 年)”,而近幾年的研究熱點是“gene expression (基因表達,2014 - 2017 年)”以及“induction (誘導,2018 - 2020 年)”(圖9)。由此可知,多倍體誘導方面的研究不僅涉及了宏觀和微觀兩個層面,而且呈現出從單一到多元化的趨勢。

圖8 基于WOS 的多倍體誘導研究前沿時區視圖Figure 8 Temporal representation of the frontiers of research in polyploidy induction based on Web of Science (WOS)

圖9 WOS 中引用率最高的10 個突現詞圖譜Figure 9 Knowledge map of the top 10 burst terms with the strongest citation bursts in Web of Science (WOS)
植物多倍體誘導相關論文數量的增長趨勢符合科技論文數量普遍增長的大趨勢[20]。這與其他研究方向的論文增長規律相對一致[37-40],但僅從CNKI數據庫分析,近幾年的相關文獻量逐年下降,而WOS數據庫中呈逐年增加趨勢,一方面代表學者越來越追求在國際平臺發表高質量文章,另一方面很可能與SCI 期刊數的快速增長有關,同時也可說明近年來國際上諸多學者對該研究領域的重視程度,這在王超等[19]對直鏈藻屬的研究趨勢分析中也有所體現。隨著科技全球化的發展,國際合作成為科研領域不可或缺的重要支撐,從各個國家的發文量與國家間合作關系來看,近20 年間植物多倍體誘導研究領域發文量高產的國家有中國、美國和日本,且三者間合作貢獻率較高,其研究者更注重于此方面的研究,因而研究成果相對較多。發文機構、期刊之間差異較大,累積發文量前15 的研究機構中有11 所研究機構來自中國,其中北京林業大學發文數量最多,遠超其他機構,該機構主要由康向陽、張金鳳等帶領的研究團隊開展了一系列關于楊樹(Populus)、杜仲(Eucommia ulmoides)等林木多倍體育種的研究[41-42],這在推動人工誘導多倍體發展的過程中扮演著極其重要的角色,相較而言其他機構發文數量較少,因此各機構間存在的差異還需不斷改善,合作程度也應進一步加強。植物多倍體誘導研究成果廣泛分布在各個期刊,且期刊間的總發文數量參差不齊,發文量排名前10 的期刊受學者的關注度較高,在學術界具有一定的影響力。目前該領域的研究熱點仍主要著重于秋水仙素、多倍體、染色體加倍、植物等方面,這在許多相關研究中均有所體現[43-44]。秋水仙素作為化學加倍試劑高效且可靠,因而被普遍應用;多倍體被認為是物種進化的重要因素之一[45],可創造出植物的形態變異和生理變化[46],是育種中一個獨特的領域,人工誘導多倍體是利用秋水仙素阻止細胞內的染色體后期分離并移向兩極而導致染色體加倍,具有提高植物對環境的適應性以及豐富物種遺傳多樣性等方面的優勢。多倍體誘導在植物育種中最為常見,主要是因為誘導形成的多倍體具有器官巨大、抗逆性強、營養物質含量豐富等特點[47]。因此,對多倍體誘導研究領域進行深入探究顯得尤為重要。
總體來看,植物多倍體誘導的研究熱點是利用秋水仙素誘導染色體加倍形成多倍體,并準確鑒定出誘導率,研究前沿動向主要是流式細胞儀在倍性鑒定中的應用。但目前多倍體誘導方法與鑒定方法相對局限,主要集中在如何提高誘導率上,而多倍體誘導的成功率高度可變,至今還沒有一個系統的多倍體化方案,并且對于多倍體誘導率的評估系統,也還沒有特定的標準,所以各國科研人員應廣泛關注該領域的研究,在各個國家、機構、期刊、作者之間建立緊密的合作關系,在已有研究基礎上拓寬多倍體誘導的研究范圍與內容,制定一個完整的多倍體化方案并解決誘導多倍體形成時出現的嵌合體問題。此外,闡明多倍體在植物基因組中的作用,深入了解多倍化后新表型表達與基因組變化之間的關系,將發生在基因組與轉錄組水平上的遺傳變化和發生在物種表型水平和個體適應性水平上的變化聯系起來,以確定在多倍體中觀察到的表型和遺傳變化是否具有適應性,總之仍有一系列問題需深入研究[48]。這些研究不僅在植物改良方面具有較好的發展前景,同時可以使育種學家更精準地掌握多倍體基因組并取得顯著成效,從而推進多倍體誘導的發展。就研究前沿趨勢而言,整體研究范圍較局限,且持續時間不久,利用流式細胞儀鑒定植物倍性可能是未來多倍體誘導研究的重要方向和突破口。未來多倍體誘導產生的新品種將對高產、速生、優質、抗逆性強等特征更加重視,而現代育種技術的快速發展也終將解決這些難題,使植物多倍體育種工作更加穩定而高效的開展。
綜合CNKI 和WOS 數據庫,對近20 年間植物多倍體誘導研究領域的學術論文進行文獻計量分析發現,每年發表文獻量整體呈波動增長趨勢;發文量高產的國家有中國、美國和日本,其中中國在國際合作方面處于領先地位;發文機構中北京林業大學最為突出;期刊《Euphytica》發文數量最多,在該領域具有較大的影響力。目前有關植物多倍體誘導的研究內容仍側重于基礎性研究,利用化學方法中的秋水仙素進行誘導依然是形成植物多倍體的主要研究方法。