藺麗英 陳丹丹 河北地質大學
十三五期間,河北省加快產業(yè)結構調整,已將生物醫(yī)藥產業(yè)列為戰(zhàn)略性新興產業(yè)之一。現代生物醫(yī)藥產業(yè)是指將基因工程、細胞工程、酶工程、發(fā)酵工程及蛋白質工程等現代生物技術的研究成果應用于制藥行業(yè),制造可流通藥品并規(guī)模化生產的經濟實體的總和。目前現代生物醫(yī)藥產業(yè)的主要藥物開發(fā)品有基因工程藥物、抗體、人用疫苗、血液制品和診斷試劑等。生物醫(yī)藥研發(fā)是生物醫(yī)藥產業(yè)的基礎,因此,發(fā)現生物醫(yī)藥領域內重要研究主題的知識圖譜,并篩選出其研究前沿、研究熱點,對于布局我省生物醫(yī)藥領域的基礎研究,提升研究水平具有重要指導作用。
基于對《國家中長期科學與技術發(fā)展規(guī)劃綱要(2006~2020)》和《醫(yī)學科技“十二五”發(fā)展規(guī)劃》等生物醫(yī)藥發(fā)展戰(zhàn)略相關政策文件的分析,確定了生物醫(yī)藥領域的基因治療作為本文研究主題。
本主題研究的數據來源于Pubmed數據庫。檢索途徑為MeSH Major Topic,檢索詞“genetic therapy”,時間范圍“5 years”。共獲得4346條記錄,將檢索結果以“.xml” 格式儲存,數據下載日期為2019年7月6日。
本文利用陳超美博士開發(fā)的科學圖譜與知識可視化軟件Citespace5.3對數據集進行了關鍵詞共現分析。模塊值(Modularity Q)和平均輪廓值(Mean Silhouette)是評判Citespace圖譜繪制效果的依據。一般Q在【0,1)區(qū)間內,Q>0.3說明劃分出來的社團結構是顯著的。當S〉0.7時,聚類是高效的、令人信服的。當S〉0.5時,聚類是合理的。太小時,則無明確主題可言。
基因治療研究主題的關鍵詞共現網絡由140個節(jié)點、297條共現連線組成,Modularity Q=0.7517,Mean Silhouette=0.5513,因此基因治療主題的社團結構式顯著的,聚類是合理的。

圖1 基因治療關鍵詞聚類視圖
Citespace5.3通過LLR(對數似然率算法)聚類,將基因治療研究主題數據集中距離較近的關鍵詞聚集在一起,展現出了基因治療研究內容的分布情況,形成12個分主題:crispr 基因編輯技術、lentiviral vector慢病毒載體、cancer therapy 癌癥治療、transfection轉染、cell therapy細胞療法、apoptosis 細胞凋亡、Duchenne muscular dystrolphy杜氏肌營養(yǎng)不良癥、crispr-cas9一種基因編輯技術、angiogenesis血管生成、neurodegeneration神經退行性疾病、thalassemia地中海貧血、sirna小干擾核糖核酸。12個分主題下聚類的關鍵詞如下:

表1 近五年基因治療研究的關鍵詞聚類
在Citespace關鍵詞共現網絡的聚類視圖中(見圖1),節(jié)點大小代表它的共現次數,節(jié)點越大則出現頻次越高。節(jié)點連線代表節(jié)點之間的共現關系,節(jié)點(關鍵詞)周圍的連線越多則代表其中心度越高。
我們對基因治療研究領域的熱門關鍵詞進行了提取:一類是共現次數高的高頻關鍵詞。這類詞總結并概括了該領域研究的基礎知識結構,有gene therapy(基因治療)、adeno-associated virus(腺相關病毒)、crispr/cas9、microrna(微小核糖核酸)、gene editing(基因編輯)、gene delivery(基因傳遞)、Cancer(癌癥)、rna interference(核糖核酸干擾)。二類是高中心度關鍵詞。這類關鍵詞具有明顯的橋梁作用。如,microrna(微小核糖核酸)連接著nanoparticle(納米粒子)、immune response(免疫反應)、crispr/cas9等。三類是具有高頻次的詞和高中心度的詞,有crispr/cas9(一種基因編輯技術)、gene therapy(基因治療)、microrna(微小核糖核酸)、adeno-associated virus(腺相關病毒)、gene editing(基因編輯)等。這類詞代表了基因治療研究的熱點和未來研究趨勢。

表2 近五年基因治療研究文獻高頻關鍵詞和高中心度關鍵詞

圖2 基因治療關鍵詞共現時區(qū)視圖
在citespace基因治療關鍵詞共現時區(qū)圖中,可以通過時區(qū)之間的連線變化看到基因治療研究的知識流向。2014-2016年時區(qū)內的關鍵詞之間連線緊密,說明這三年之間的基因治療研究的傳承關系較強。2017-2019年時區(qū)內的關鍵詞主要與2014和2015兩年的關鍵詞連線緊密,說明它們之間的研究傳承較強。2017-2019年與2016年時區(qū)內的關鍵詞連線較少,說明它們之間的研究傳承較弱。
在未來研究中,應重點關注2016-2019年時區(qū)內中心度高于0.1的關鍵詞,作為基因治療的研究前沿。