嚴 舒,陳 娟,歐陽昭連
(中國醫學科學院醫學信息研究所,北京 100020)
合成生物學是以工程化設計為理念,利用基因組測序、計算機模擬、生物工程和化學合成等技術對生物體進行有目標的設計、改造或重新合成的前沿交叉性學科,近20 年來發展較快[1]。在合成生物學中不僅有對基本科學原理的創新,更有跨學科、跨領域的集成創新,該技術在工業生產流程中的應用具有顛覆性,被認為是能創造新的經濟增長點的“第三次生物科學革命”[2]。通過對生物組件及代謝路徑的設計改造、細胞工廠和生物工程化平臺的建設,合成生物學技術已在生物醫藥、農業生產、化學品合成、生物能源等領域應用[3-4]。生物醫藥是合成生物學的重要應用方向之一,受到以美國、英國為代表的典型科技及醫療強國的重視[5]。目前,合成生物學在生物醫藥中的應用主要集中在疾病診斷[6-7]、治療[8-9]、藥物制造[10-11]等方面。合成生物學在醫藥制造的應用上綜合運用了其跨學科理論與技術,面向不同類型疾病方向,具有強交叉特性,全球典型科技與醫藥強國在該領域均做出前瞻性布局,并已積累了一定的研究成果。本研究中從全球科技基金項目入手,通過項目成果論文與期刊領域的映射關系,測度藥物合成生物學領域的學科交叉程度與趨勢,識別關鍵及重點學科,以期為我國藥物合成生物學頂層設計與科學研究提供參考。現報道如下。
于2023 年7 月6 日在Dimensions 全球項目數據庫中檢索藥物合成生物學基金項目,獲得項目1 232 個。提取項目成果論文,去重,除去預印本、會議論文等非期刊論文和未被Web of Science(WOS)數據庫收錄、無法利用WOS 學科分類進行學科領域識別的成果論文,最終納入論文10 702篇。
統計并分析科技項目資助方和資助情況。利用上述數據庫期刊引證報告(JCR)學科分類體系,對項目成果論文的學科大類(group)和學科小類(category)進行統計與分析,以了解藥物合成生物學項目所研究內容涉及學科。
采取豐富度(variety,V)、均勻度(balance,B)和專業化指數(specialization index,S)從不同角度測度學科交叉情況[12-13],并識別該領域的重點學科。豐富度指研究對象中涉及的不同學科類別的數目[14],豐富度越高,研究對象的學科交叉特性越顯著,公式為(其中,i表示學科大類);均勻度指在研究對象中進行交叉融合時,不同學科類別分布的均勻程度,不同學科知識融合的均勻度越高,研究對象的學科交叉程度越深,公式為(其中,xi表示屬于第i個學科論文的數量);專業化指數用以測度研究對象所屬學科的集中程度,研究對象的成果論文集合越集中于某一個或某幾個學科,則該研究對象的專業化指數越大,公式為(其中,fi為學科i中的論文數量,S值為0~1,分值越低表明學科交叉程度越高)。
美國是資助該領域項目最多的國家(463 項),其次為英國(295 項)、中國(100 項)。從項目資助機構來看(圖1,圖中豎線表示項目平均資助金額,柱狀長度表示項目數量),隸屬于英國研究與創新機構(UKRI)的生物技術與生物科學研究理事會(BBSRC)是資助藥物合成生物學項目最多的機構(181 個),同屬于UKRI 的工程與自然科學研究理事會(EPSRC)也資助該領域多個項目(75個),2個機構平均項目資助金額接近,均每個項目約為110萬美元。我國國家自然科學基金委員會(NSFC)也資助了該領域的大量研究項目(項目數近100個),但單個項目資助金額較低(每個項目約為11 萬美元)。美國資助項目主要來自美國國家科學基金會(NSF)和美國國立衛生研究院(NIH)的下設機構,其中NIH 下設的國立綜合醫學研究所(NIGMS)、變態反應與感染性疾病研究所(NIAID)和NSF 的工程學部和生物科學部資助的項目相對較多(分別為72 個和28 個),且NIH 平均項目資助金額高于NSF(163萬美元比84萬美元),反映出該領域熱點為綜合性疾病和感染性疾病,主要應用的是工程類和生物科學類理論和技術。值得注意的是,NIH 中僅少部分機構資助了該領域項目,而NSF中超半數學部對該領域進行布局,側面反映出藥物合成生物學中應用的學科技術較多,學科交叉明顯,但在醫療領域應用還不廣,僅在少量疾病領域有應用。歐盟的機構也對該領域進行了布局,雖然資助項目總量不多,但單個項目資助金額較高(超180萬美元)。歐洲其他國家及加拿大、日本在該領域也有布局。

圖1 藥物合成生物學研究項目資助方Fig.1 Funders of research projects in pharmaceutical synthetic biology
最早的成果論文發表于1988 年,直至1999 年,每年相關論文量不足10 篇。2001 年至2022 年,藥物合成生物學領域項目成果論文量呈波動上升又小幅回落的趨勢,2000 年至2005 年的成果論文較少,2006 年至2010 年有所增加。2011 年至2020 年,成果論文量快速增長(見圖2),在2020年達峰值(1 342篇)。從篇均學科量來看,2000 年至2005 年涉及學科量在1.5 個上下波動,2006 年達峰值(1.9 個),在2013 年回歸至1.5 個后基本保持平穩。反映出藥物合成生物學領域研究方向及學科劃分經歷了小幅波動、急劇擴張和趨于成熟穩定3個階段。

圖2 藥物合成生物學研究項目成果論文量及對應學科量Fig.2 Quantity of relevant papers of project outcome and corresponding disciplines in pharmaceutical synthetic biology
2000 年至2022 年,藥物合成生物學涉及學科的豐富度在前10年呈上升趨勢,在2011年達20個后呈波動態勢,在2021 年曾一度達到22 個學科,體現出藥物合成生物學涉及學科較豐富。但同時可以看到,隨著豐富度的上升,該領域在2000 年至2011 年涉及學科間的均勻度持續下降,且在2011年后保持穩定,說明其涉及學科雖然較多,但部分學科僅少量涉及,大量研究仍集中于少數幾個學科。此外,該領域的專業化指數在2003年達峰值(0.34)后穩定在0.23左右,值較高,說明藥物合成生物學學科分布較集中且穩定。詳見圖3。

圖3 藥物合成生物學學科交叉特征與趨勢Fig.3 Interdisciplinary characteristics and change trends of researches in pharmaceutical synthetic biology
納入論文被分為22 個大類和254 個小類,每個期刊可被劃分在1個或多個學科大類及小類中。
從學科大類的角度看(見圖4),生物學與生物化學是藥物合成生物學研究中的核心學科,占主導地位,還有大量該領域的成果論文發表在交叉學科期刊上,也體現出該領域明顯的跨學科屬性。此外,化學也是該領域研究的重要組成部分,與傳統藥物研究領域存在一定相似性和共通性。藥物合成生物學部分成果論文發表在臨床醫學相關期刊上,體現出其應用領域及應用進展,側面反映出該領域技術已逐漸向臨床應用轉化,但轉化進程較慢。物理學、材料科學、動植物科學、工程學、計算機科學等學科也有一定涉及,反映出藥物合成生物學的研究所跨學科領域較多。
美國、英國和中國項目成果論文分別有4 945 篇、2 962 篇、1 732 篇,學科分布見圖5。生物學與生物化學在3個國家的研究中均為最核心學科,但美國和中國該學科的占比均高于英國,而英國跨學科占比則遠高于前兩者。在其他學科中,中國的藥物合成生物學研究更偏重于化學領域,美國在臨床醫學和材料科學方面有明顯優勢,英國的優勢則體現在物理學方面。

圖5 典型國家藥物合成生物學涉及學科(大類)論文分布(篇)Fig.5 Distribution of papers related to disciplines of pharmaceutical synthetic biology in typical countries
學科小類論文分布情況見表1,生物化學與分子生物學是藥物合成生物學最主要的核心學科。生物學、生物化學領域中的生物技術與應用微生物學、微生物學、細胞生物學等,化學領域中的跨學科化學、有機化學、物理化學和藥物化學等也是主要的學科小類。而生物化學研究方法、藥理學與藥劑學等學科本就具有跨學科屬性,融合了生物學、化學、臨床醫學等學科特性。此外,材料科學中的聚合物科學、納米科學與納米技術,臨床醫學中的基因與遺傳學、腫瘤學、免疫學,工程科學中的生物化學工程、化學工程等也是藥物合成生物學研究中起到主導作用的學科小類。
合成生物學作為一項具有重要學術和經濟價值的顛覆性科學,其在藥物領域的應用受到以美國、英國和中國為代表的生物醫學強國關注,從國家層面給予大量項目支持,支持的方向主要針對理論基礎和技術發展,臨床應用轉化較少。藥物合成生物學領域研究所涉及學科較多,在生物學與生物化學、化學、臨床醫學、材料科學、動植物科學、工程學、計算機科學等學科大類均有涉及,但在所涉及學科間分布不均,學科大類仍主要集中在生物學和化學;少量涉及臨床醫學、物理學和材料科學,在其他學科方向上的研究更是零星分布,且各國在藥物合成生物學領域重點研究方向有差異。該領域的具體學科方向包括生物化學、分子生物學、微生物學、有機化學、細胞生物學、物理化學等,在臨床方面的應用體現在藥理學與藥學、基因與遺傳學、腫瘤學、免疫學等學科方面。
近20 年來,我國逐漸重視對合成生物學領域的規劃布局。2010 年,科技部發布的《國家重點基礎研究發展計劃、國家重大科學研究計劃2010 年重要支持方向》中強調,在蛋白質研究創新方面要特別關注合成生物學的新技術和新方法,《國家重大科技基礎設施建設中長期規劃(2012 - 2030 年)》《“十三五”國家科技創新規劃》《國務院關于全面加強基礎科學研究的若干意見》等國家級科技政策規劃文件中均強調,要提前規劃合成生物學的發展,對其主要定位是基礎前沿技術、共性生物技術、可促進產業發展的顛覆性技術,在具體領域應用中首先提到的是農業制造。除支持國家自然科學基金面向基礎科學問題的研究外,我國“十三五”時期還設立了合成生物學重點研發計劃,并在“十四五”時期延續了該計劃,旨在以物質轉化、生態環境保護、醫療水平提高、農業增產等重大需求為導向,突破不同場景下的重大科學問題。截至2022年,該專項已資助項目超過100 個,在藥物領域的研究方向主要是疫苗的研發和腫瘤免疫微環境的構建。
我國在藥物合成生物學領域的布局和研究積累居全球前列,但與美國、英國等典型科技強國仍有一定差距。我國在化學學科的研究方面具有較強優勢,但在臨床醫學、材料科學等學科方面仍需加強。應緊密結合藥物合成生物學學科交叉特性進行合理布局,一方面加強生物學、生物化學、微生物學、細胞生物學、物理學等基礎性研究,另一方面強化材料科學、工程科學、計算機科學等共性技術研究,同時推動前沿理論和技術向免疫、腫瘤、藥物研發等臨床相關方面轉化,加快實現合成生物學對藥物和醫療產業的顛覆性技術驅動。
本研究中以藥物合成生物學基金項目為切入點,通過項目成果論文與JCR 期刊學科分類的映射測度該領域的學科交叉情況,可作為直接檢索領域論文進行分析的補充與拓展。但以期刊作為學科識別途徑仍有局限性,其類別劃分也會有階段性調整,會使統計產生偏差。為保證各國項目檢索標準一致,本研究使用Dimensions 全球項目數據庫,但該數據庫在不同國家項目資源和信息獲取方面存在差異,對中國、日本、德國等非英語國家的項目可能存在遺漏,未來在基于項目的研究方面可探索多源數據融合途徑,以增強研究的全面性。