吳蕾 梁曉賀 宋紅燕
關(guān)鍵詞:協(xié)同演化分析;跨學科研究;技術(shù)關(guān)鍵詞分析;聚類分析;學科領(lǐng)域分析;農(nóng)業(yè)動物生殖細胞和干細胞調(diào)控
隨著數(shù)據(jù)、信息、知識融合的進一步加深,學科之間的跨領(lǐng)域合作、知識交叉現(xiàn)象出現(xiàn)的越來越頻繁。學科領(lǐng)域發(fā)展不再局限于自身知識網(wǎng)絡(luò)變化,還會受到其他學科領(lǐng)域發(fā)展變化的影響。多種學科領(lǐng)域通過相互影響、共同發(fā)展,最終實現(xiàn)知識的成長。
學科領(lǐng)域的協(xié)同演化分析關(guān)注跨學科知識在時間維度上發(fā)展變化的相互關(guān)系。1964年協(xié)同演化分析首次在《演化》雜志上被提出,用來描述蝴蝶與其食物在演化過程中的相互關(guān)系。即當一個物種發(fā)生演化時,由于選擇壓力發(fā)生改變,其他物種也將隨之發(fā)生相適應(yīng)的演化變化。最終系統(tǒng)將達到高度適應(yīng)的動態(tài)穩(wěn)定狀態(tài)。現(xiàn)在協(xié)同演化分析已經(jīng)逐漸由生態(tài)學延伸到經(jīng)濟學、管理學等社會科學領(lǐng)域。學科領(lǐng)域協(xié)同演化分析認為協(xié)同演化的動力是相互依賴的學科之間相互變化和相互影響的關(guān)系,每個學科的演化影響著其他學科的演化發(fā)展。當兩個學科對彼此的演化存在相互影響的因果關(guān)系時,那么這兩個學科就是協(xié)同演化發(fā)展的。本文利用協(xié)同演化分析方法研究學科領(lǐng)域技術(shù)關(guān)鍵詞結(jié)構(gòu)的發(fā)展軌跡.通過學科之間的交互性和繼承性,以及優(yōu)先發(fā)展學科領(lǐng)域的技術(shù)方法,發(fā)現(xiàn)落后發(fā)展學科領(lǐng)域技術(shù)空白點。
2016年,農(nóng)業(yè)領(lǐng)域?qū)<彝ㄟ^預測研究,研判提出“農(nóng)業(yè)動物生殖細胞和干細胞調(diào)控技術(shù)”將成為未來(2030年)農(nóng)業(yè)領(lǐng)域重大前沿技術(shù)之一。但是當前農(nóng)業(yè)領(lǐng)域動物生殖細胞和干細胞調(diào)控研究的論文量較少,發(fā)文量增長緩慢.甚至有的年度發(fā)文量較前一年略有下降(見圖1)。這些現(xiàn)象都在說明當前農(nóng)業(yè)領(lǐng)域生殖細胞和干細胞調(diào)控研究還正處于萌芽期(嬰兒期)。為研究帶來一定困難。黃魯成等采用基于創(chuàng)新性、獨創(chuàng)性和功能分析的方法識別萌芽期的顛覆性技術(shù)。該方法采用統(tǒng)計指標和SAO結(jié)構(gòu),從學科領(lǐng)域自身出發(fā)衡量技術(shù)發(fā)展初期技術(shù)關(guān)鍵詞的顛覆性并預測其未來影響。但是該類方法忽略學科之間相互影響對技術(shù)發(fā)展的引導作用。
與農(nóng)業(yè)領(lǐng)域動物生殖細胞和干細胞調(diào)控研究相比,醫(yī)學領(lǐng)域生殖細胞和干細胞調(diào)控研究起步較早并且科技文獻研究已經(jīng)具有一定規(guī)模(見圖1)。從1995年以來全領(lǐng)域和醫(yī)學領(lǐng)域生殖細胞和干細胞調(diào)控技術(shù)相關(guān)論文均呈現(xiàn)穩(wěn)定且逐年增長態(tài)勢,表明該領(lǐng)域的基礎(chǔ)研究與技術(shù)仍在快速發(fā)展之中。另外醫(yī)學領(lǐng)域論文量占據(jù)全領(lǐng)域論文總量的較大比例,說明醫(yī)學領(lǐng)域是該研究的主流研究學科領(lǐng)域。
因此,本文在探索領(lǐng)域技術(shù)關(guān)鍵詞結(jié)構(gòu)及演化趨勢的同時,考慮了醫(yī)學領(lǐng)域(輔助領(lǐng)域)對農(nóng)業(yè)領(lǐng)域(目標領(lǐng)域)的影響和促進作用。挖掘醫(yī)學動物生殖細胞和干細胞調(diào)控領(lǐng)域當前熱門的研究技術(shù),有利于為農(nóng)業(yè)動物生殖細胞和干細胞調(diào)控領(lǐng)域未來技術(shù)方法發(fā)展走向提供預測。
1相關(guān)工作
在技術(shù)演化分析數(shù)據(jù)源選擇方面,由于專利數(shù)據(jù)是技術(shù)方法、法律狀態(tài)和商業(yè)信息的載體,因此有許多研究針對專利數(shù)據(jù)進行技術(shù)演化分析。然而.科技文獻作為長久以來最主要的科學技術(shù)信息傳播交流方式,其客觀地記錄著對于科學問題研究所取得的最新進展或重要知識創(chuàng)新。這些記錄對研究技術(shù)演化趨勢和預測未來發(fā)展同樣具有重要意義。因此,本文使用科技論文作為數(shù)據(jù)源進行技術(shù)關(guān)鍵詞和摘要文本分析,從而挖掘當前技術(shù)研究空白點。
在技術(shù)演化定量分析研究方面,學者借助技術(shù)關(guān)鍵詞或者技術(shù)主題的時間信息對技術(shù)研究發(fā)展趨勢進行研究。謝志明等、伊惠芳等、喻登科等、李欣等學者使用技術(shù)生命周期和技術(shù)進化路線對各學科研究方向技術(shù)演化脈絡(luò)進行分析。技術(shù)生命周期表示一種以周期變化為特征的技術(shù)主題演化模式,一般劃分為萌芽期、成長期、成熟期和衰退期4個階段。李柏洲等學者使用偏聯(lián)系數(shù)方法對技術(shù)依賴演化趨勢進行了分析。祝清松等、羅雙鈴等、Martinelli A利用引文分析進行技術(shù)主題演化分析和技術(shù)預見研究。引用關(guān)系反映了技術(shù)基礎(chǔ)和科學基礎(chǔ)的發(fā)展脈絡(luò)。引文關(guān)系主要包括直接引用關(guān)系、同被引關(guān)系和引文耦合關(guān)系等,不同類型的引文關(guān)系的側(cè)重點有所不同。方曙等、Chang P L等、陳亮、Huang Y等學者使用文本挖掘方法對文本信息進行整理、分析與挖掘,從而進行主題演化分析。其中SAO和主題模型等方法成為當前文本挖掘分析主題演化的流行方法。本文在基于時間對技術(shù)關(guān)鍵詞進行分析的同時,對技術(shù)關(guān)鍵詞進行了兩個方面的擴展。即加入從摘要擴展來的技術(shù)關(guān)鍵詞.同時加入從跨領(lǐng)域擴展來的技術(shù)關(guān)鍵詞。通過對技術(shù)關(guān)鍵詞進行擴展有助于發(fā)現(xiàn)目前出現(xiàn)頻次較低甚至沒有出現(xiàn)過,但是未來有發(fā)展?jié)摿Φ募夹g(shù)方法。
2研究方法
本文從科技文獻中的關(guān)鍵詞出發(fā),對技術(shù)關(guān)鍵詞進行跨領(lǐng)域協(xié)同演化分析。首先通過人工篩選出量高質(zhì)優(yōu)型技術(shù)關(guān)鍵詞。這些關(guān)鍵詞中包含了研究者關(guān)注的主流技術(shù)關(guān)鍵詞,同時排除了大量非技術(shù)類關(guān)鍵詞。但是漏掉了一些潛在的重要技術(shù)關(guān)鍵詞。這些關(guān)鍵詞出現(xiàn)頻次較低,通過計量方法很難識別出來。因此,第二步需要擴展技術(shù)關(guān)鍵詞。本文從兩方面對技術(shù)關(guān)鍵詞進行擴展:一方面.使用Word2vec詞向量方法量化摘要文本中的詞.并使用相似性計算從摘要詞向量中獲取與量高質(zhì)優(yōu)型技術(shù)關(guān)鍵詞相似性較大的新技術(shù)詞;另一方面,加入醫(yī)學領(lǐng)域中的質(zhì)優(yōu)型技術(shù)關(guān)鍵詞。第三步,對擴展的技術(shù)關(guān)鍵詞進行語義聚類分析。最后,基于時間對擴展技術(shù)關(guān)鍵詞及其聚類進行演化分析。
3技術(shù)關(guān)鍵詞協(xié)同演化分析
3.1數(shù)據(jù)來源
基于Web of Science的SCI數(shù)據(jù)集對全球2013—2017年“動物生殖細胞和干細胞調(diào)控技術(shù)”論文進行檢索,得到農(nóng)業(yè)領(lǐng)域571篇文獻,醫(yī)學領(lǐng)域34604篇文獻。農(nóng)業(yè)領(lǐng)域共包含4712個摘要語句,醫(yī)學領(lǐng)域共包含268183個摘要語句。
3.2技術(shù)關(guān)鍵詞擴展及聚類分析
通過在農(nóng)業(yè)領(lǐng)域和醫(yī)學領(lǐng)域同時提取量高質(zhì)優(yōu)型關(guān)鍵詞和量低質(zhì)優(yōu)型關(guān)鍵詞.并對兩者同時進行關(guān)鍵詞及其數(shù)量對比,可以在優(yōu)先發(fā)展且知識更為豐富的醫(yī)學領(lǐng)域發(fā)現(xiàn)當前還沒有應(yīng)用到農(nóng)業(yè)領(lǐng)域的技術(shù)方法。同時,可以在避免使用論文給出的全部關(guān)鍵詞的同時,從非高頻關(guān)鍵詞中提取語義相近關(guān)鍵詞擴充聚類簇的關(guān)鍵詞。本文擴展的關(guān)鍵詞只關(guān)注與農(nóng)業(yè)領(lǐng)域相關(guān)的,而沒有將針對某些人體病癥(例如癌癥、心肌炎等)進行治療(例如核磁共振、心理療法、中醫(yī)療法等)的相關(guān)技術(shù)關(guān)鍵詞擴展進來。
通過擴展農(nóng)業(yè)動物生殖細胞和干細胞調(diào)控領(lǐng)域的技術(shù)關(guān)鍵詞并對其進行相似性聚類,可以將該領(lǐng)域關(guān)鍵詞劃分為8個聚類(如圖3所示),包括:組織工程、發(fā)育遺傳學技術(shù)、形態(tài)學技術(shù)、表觀遺傳學技術(shù)、體外培養(yǎng)與保存、免疫細胞學技術(shù)、基因組學研究和統(tǒng)計分析。被矩形框框出的節(jié)點表示的關(guān)鍵詞是擴展而來的。可見,農(nóng)業(yè)領(lǐng)域論文的高頻關(guān)鍵詞主要集中在免疫細胞學技術(shù)、基因組學研究等關(guān)鍵詞簇。
3.3基于時間的擴展技術(shù)關(guān)鍵詞分析
圖4顯示了農(nóng)業(yè)領(lǐng)域和醫(yī)學領(lǐng)域各年8個關(guān)鍵詞簇的篇均詞頻。可以發(fā)現(xiàn)與醫(yī)學領(lǐng)域趨勢相似,農(nóng)業(yè)領(lǐng)域的組織工程、形態(tài)學技術(shù)、體外培養(yǎng)與保存、免疫細胞學技術(shù)和統(tǒng)計分析5個關(guān)鍵詞簇詞頻數(shù)相對較小。尤其是農(nóng)業(yè)領(lǐng)域的統(tǒng)計分析詞簇,2017年以前的出現(xiàn)次數(shù)屈指可數(shù)。可見在農(nóng)業(yè)領(lǐng)域這些研究目前還比較薄弱。相比之下,發(fā)育遺傳學技術(shù)、表觀遺傳學技術(shù)和基因組學研究3個關(guān)鍵詞簇的詞頻數(shù)相對較大,且呈現(xiàn)增長趨勢。可見這3個研究方向是當今農(nóng)業(yè)領(lǐng)域生殖細胞和干細胞調(diào)控領(lǐng)域的主流方向。
另外,由于只選取了和農(nóng)業(yè)領(lǐng)域有可能相關(guān)的醫(yī)學領(lǐng)域關(guān)鍵詞,因此其篇均詞頻小于對應(yīng)的農(nóng)業(yè)領(lǐng)域篇均詞頻。但是從結(jié)果來看,組織工程和統(tǒng)計分析兩個關(guān)鍵詞簇在農(nóng)業(yè)領(lǐng)域的數(shù)值要小于在醫(yī)學領(lǐng)域的數(shù)值。結(jié)合關(guān)鍵詞簇的詞頻說明這兩個關(guān)鍵詞簇表示的研究方向不但薄弱,而且其在農(nóng)業(yè)領(lǐng)域的研究比醫(yī)學領(lǐng)域的研究更少。
通過分析發(fā)現(xiàn):組織工程關(guān)鍵詞簇中包括的關(guān)鍵詞有組織工程Tissue Engineering、生物材料Bio.materials、生物醫(yī)學Biomedical、生物工程Bioengi.neering等,其中生物工程在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn),屬于醫(yī)學領(lǐng)域擴展而來。醫(yī)學領(lǐng)域?qū)M織工程的研究比農(nóng)業(yè)領(lǐng)域的研究更多。但是考慮到其研究方向包括種子細胞、生物材料、構(gòu)建組織和器官的方法和技術(shù)等,所以不排除今后在農(nóng)業(yè)領(lǐng)域有其發(fā)展空間的可能。
統(tǒng)計分析關(guān)鍵詞簇中包括的關(guān)鍵詞有多變量分析Multivariate Analysis/Multivariable Analysis、統(tǒng)計分析Statistical Analysis、統(tǒng)計學STATISTICS、前瞻性研究Prospective Study、回顧性研究RetrospectiveStudv、回顧性分析Retrospective Analysis、單變量分析Univariate Analysis、元分析METAANALYSIS、生存分析Survival Analysis、危害比Hazard Ratio、回歸Regression、邏輯斯蒂Logistic和卡普蘭邁爾估計Kaplanmeier,這些關(guān)鍵詞在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn),全部屬于醫(yī)學領(lǐng)域擴展而來。隨著大數(shù)據(jù)時代的到來.原始處理數(shù)據(jù)的方法逐漸顯現(xiàn)出劣勢,因此可以預見在今后研究中各種統(tǒng)計方法,甚至人工智能方法將大量涌現(xiàn)。而目前農(nóng)業(yè)領(lǐng)域在這方面的研究非常薄弱,因此首先可以借鑒醫(yī)學領(lǐng)域生殖細胞和干細胞的數(shù)據(jù)分析方法,然后融合統(tǒng)計計量方法、人工智能方法等進行數(shù)據(jù)表示、優(yōu)化、挖掘和分析等工作。
除了這兩個關(guān)鍵詞簇.其他關(guān)鍵詞簇的篇均詞頻在農(nóng)業(yè)領(lǐng)域上的值均大于在醫(yī)學領(lǐng)域上的值,符合數(shù)據(jù)集設(shè)定。其中發(fā)育遺傳學技術(shù)關(guān)鍵詞簇中去分化和趨化性在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn);表觀遺傳學技術(shù)關(guān)鍵詞簇中母體效應(yīng)、低甲基化、超甲基化、三甲甲基化、核小體和表觀基因組在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn):體外培養(yǎng)與保存關(guān)鍵詞簇中生物反應(yīng)器在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn):免疫細胞學技術(shù)關(guān)鍵詞簇中MTT法、免疫抑制療法和光譜法在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn):基因組學研究關(guān)鍵詞簇中高通量、全基因組關(guān)聯(lián)、基因表達譜、生物信息學和增強子在農(nóng)業(yè)領(lǐng)域近5年文獻中幾乎沒有出現(xiàn)。這些關(guān)鍵詞屬于醫(yī)學領(lǐng)域擴展而來.同時可能成為未來農(nóng)業(yè)領(lǐng)域研究關(guān)注點。
4結(jié)論
本文使用基于技術(shù)關(guān)鍵詞的協(xié)同演化方法分析農(nóng)業(yè)動物生殖細胞和干細胞調(diào)控領(lǐng)域的文獻生態(tài)系統(tǒng),發(fā)現(xiàn)目前農(nóng)業(yè)領(lǐng)域動物生殖細胞和干細胞調(diào)控研究中對組織工程和統(tǒng)計分析的研究相對較少,屬于研究空白。另外,對發(fā)育遺傳學技術(shù)、形態(tài)學技術(shù)、表觀遺傳學技術(shù)、體外培養(yǎng)與保存、免疫細胞學技術(shù)和基因組學研究方向也上存在技術(shù)空白點。這些空白點可能成為未來農(nóng)業(yè)研究的潛力點。