劉瀟钖 ,代 濤,賈曉峰,張 婷
(北京協和醫學院·中國醫學科學院醫學信息研究所,北京 100020)
藥學研究是國際關注的熱點領域。隨著生物醫學的迅猛發展和高新技術的應用,藥學領域取得了許多重大突破,藥學研究也日益得到各國的重視[1-2]。在科技發展突飛猛進的今天,掌握和控制科技前沿領域,成為一個國家或企業獲取競爭優勢的主要手段。當前我國藥學的發展面臨著“仿制藥品為主、研發能力薄弱、創新能力不足”的巨大難題[3-4],因此,科學、準確地識別和把握藥學領域的研究前沿,針對前沿領域科學合理布局、優化資源配置,才能逐步提高我國藥學領域的創新能力。采用定量的文獻計量學分析與定性的專家識別相結合的方法,可以更科學地識別藥學前沿。本研究中探索采用較成熟的文獻計量學方法,宏觀定量地分析了近5年藥學領域的科學引文索引(SCI)文獻,從藥學專業知識的角度進行初步的解讀和闡述,識別出藥學領域當前的研究前沿,旨在為藥學領域研究前沿的識別和相關重點領域的資源配置提供定量的分析基礎。
數據來源于Web of Science數據庫,其為全球最大、覆蓋學科最多的綜合性學術信息資源數據庫,收錄了全球9300份權威、有影響力的學術期刊,可以提供科學的學科分類[5]。檢索策略及限定條件,檢索時間為2013年10月25日,檢索出版年份為2008年至2012年的所有文獻,限定研究方向為Pharmacology&Pharmacy(藥學)。對檢索結果進行精煉,得到相關文獻136 054篇。將其題錄信息和參考文獻信息導入到Thomson Data Analyzer軟件(TDA version 3.0,Thomson Reuters Co.,NY)中進行分析,并進行去重處理,最終獲得由135 970條藥學文獻構成的數據集。
采用頻次分析法對研究論文的題錄信息(出版年、國家)進行分析,得出藥學領域的研究特點。篩選數據集中發表年份為2008年至2012年的被引論文,共得到463 521條記錄。按其被引頻次由高到低排序,選取前120篇作為高被引論文進行共引分析,形成120×120的原始共被引矩陣。利用 Callon等[6]提出的等價系數(equivalence coefficient,簡化為 E)測度文獻之間的關聯值,公式為 Eij= /(Ci×Cj),其中 Cij為兩篇文獻 i和 j同時被其他文獻引用的次數,Ci為文獻單獨被引用的次數,Cj為文獻單獨被引用的次數。據此將共現矩陣轉換為測量文獻之間相關程度的相關矩陣,以排除論文本身被引頻次過高帶來的偏倚[7]。將處理后的矩陣信息導入Ucinet 6.288軟件中進行可視化分析,根據可視化結果并結合專業知識分析、歸納,得到藥學研究前沿。
從SCI論文發表的數量情況來看,2008-2012年藥學領域共發表SCI論文135 970篇。從圖1可見,2008年論文發表量為25 707篇,2012年上升至 29 511篇,增長率為 14.80%,呈現明顯的增長勢頭,表明藥學領域發展較為迅速,近5年藥學研究在國際上一直受到較多關注。

圖1 2008-2012年藥學領域SCI論文發表情況
按論文第一作者所屬國家/地區進行統計,2008-2012年論文發表數量排名前10位的國家/地區發表論文數量及其百分比見表 1。前 10位國家/地區的總發文量為 90 437篇,占全部發文量的66.51%。美國、中國大陸和日本的發文量均在10 000篇以上,遠超其他國家。美國占全部發文量20.73%,數量上占據絕對領先的位置。中國大陸位居第二,但與美國相比仍有較大差距。
2.2.1 研究前沿分析
根據120篇高被引論文之間的相關程度進行可視化分析,得到高被引論文關系圖,見圖2。14個論文類簇共囊括了98篇核心論文,刪除與其他論文之間共引強度低于閾值的22篇論文。14個論文類簇中各個類簇被引頻次最高的核心論文見表2。根據14個論文類簇,結合藥學專業知識對核心論文進行內容分析,進一步分析歸納得到藥學領域的研究前沿,見表3。

表1 2008-2012年藥學領域SCI論文發表數量排名前10位國家/地區統計

圖2 藥學領域高被引論文關系圖

表2 藥學領域高被引核心論文列表(部分)
根據圖2、表2和表3中的信息,分析藥學領域研究前沿。前沿1:癌癥相關的受體和通道研究,與癌癥發生、發展相關的受體和通道的研究;前沿2:IL 28B基因在丙肝治療中的作用機制研究,研究IL28B基因對丙肝治療效果和自然清除率的影響及其作用機制;前沿3:蛋白聚集的影響因素分析,研究蛋白質聚集的途徑、機制和誘導因素,對蛋白質聚集體的結構分析以及防止蛋白質聚集的調控手段;前沿4:轉運蛋白作為藥物載體的應用研究,研究轉運蛋白的結構、功能及轉運機制,轉運蛋白作為藥物載體在臨床中的應用;前沿5:抗生素耐藥機制及其過敏機制的研究,研究ESKAPE病原菌為主的細菌抗生素耐藥機制和過敏反應機制;前沿6:拉替拉韋和馬拉韋羅的抗人類免疫缺陷病毒 -1(HIV-1)感染相關研究,拉替拉韋、馬拉維羅等抗HIV-1感染的藥物治療,以及HIV病毒耐藥性的研究;前沿7:氯吡格雷的藥代動力學相關研究,細胞色素P450 2C19多態性、遺傳藥理學因素、藥物聯用等對氯吡格雷藥代動力學的影響;前沿8:華法林的劑量優化研究,抗凝治療中華法林的劑量研究,如基因多態性以及患者的臨床因素對華法林劑量的影響;前沿9:藥物依賴的神經機制研究,研究藥物成癮的神經生物學基礎,高復吸率的神經機制;前沿10:納米粒子在抗癌藥物中的應用研究,研究納米顆粒,如納米藥物載體、非病毒基因載體在癌癥治療及藥物遞送中的應用;前沿11:不同給藥途徑的藥物劑型研究,側重于以提高難溶性藥物的口服生物利用度為目的的胃腸道給藥系統的研究;前沿12:2型糖尿病及合并并發癥的用藥研究,2型糖尿病的降糖治療,以及糖尿病合并高血壓、高脂血癥等的治療用藥研究;前沿 13:抗真菌藥的臨床應用研究,念珠菌、曲霉菌等真菌引起的侵襲性真菌病治療中的抗真菌藥物,如伏立康唑、阿尼芬凈、米卡芬凈等的相關研究;前沿14:針對谷氨酸受體的抗抑郁癥研究,抑郁癥的神經生物學機制和藥物治療的研究進展,側重于谷氨酸及其受體在抑郁癥發病及治療中作用的研究。
2.2.2 我國在14個藥學前沿領域的研究水平分析
分析14個前沿領域共98篇核心論文的責任作者信息,發現表2中14個前沿領域的核心論文,美國占59.18%(58篇),英國占 8.16%(8 篇),法國占 6.12%(6 篇),加拿大占 4.08%(4篇),中國學者作為責任作者的論文數量為0。說明我國在藥學前沿領域缺乏高影響力的研究產出。

表3 藥學領域研究前沿分析
共引分析法是一種成熟的情報學研究方法,可以從引文的角度分析文獻之間的相互關系,1973年Small H首次提出并論證了其用于識別主題相似性的優勢[8],之后被廣泛運用于科學學、預測學、科學評價和科技管理等眾多領域,在國內外前沿領域研究中發揮著重要作用[9-11]。美國科學情報研究所(ISI)推出的 ESI數據庫采用共引分析法,將全部科學劃分為22個專業領域進行前沿分析,被各國廣泛應用于學科發展動態跟蹤研究中[12]。全球領先的專業情報信息提供商湯森路透公司運用共引分析法識別了2013年的研究前沿,得到自然科學和社會科學的前100個前沿領域,在國際上具有重要影響[13]。
綜合本研究結果,近5年藥學領域發展較為迅速,國際上參與研究的國家/地區眾多,發文量呈現明顯增長勢頭。中國大陸論文發表量位居世界第二,僅次于美國,發文量具有一定優勢。研究識別出的14個藥學領域研究前沿涵蓋藥物的作用機制和臨床應用等在內的許多方面,我國在對應的14個藥學前沿領域中發文數量為0,說明我國在藥學前沿領域的研究實力比較薄弱,與發達國家相比仍存在較大差距。
本研究中研究前沿的遴選順序是先按核心論文的新近程度排序,然后按其被引頻次由高到低排序,因此得到的是當前最熱但不一定是發文數量最多的研究前沿。本研究中識別出癌癥相關的受體和通道研究、IL 28B基因在丙肝治療中的作用機制研究、蛋白聚集的影響因素分析、轉運蛋白作為藥物載體的應用研究等14個藥學領域研究前沿,既往相關研究從不同角度佐證了本研究結果[14-19]。同時,本研究可在一定程度上為前沿領域識別研究的開展提供基于定量分析的參考。
本研究仍存在一定的局限性,高被引文獻選取數量在一定程度上有主觀性,可能導致某些信息缺失;對研究前沿的解讀受主觀性及專業知識的限制;一些較新的文獻由于發表時間較短,其被引頻次不高,可能會被忽略。
參考文獻:
[1]盛 立.生物醫學領域研究前沿識別與趨勢預測[D].北京:中國人民解放軍軍事醫學科學院,2013.
[2]張禮和,李大魁,蔡年生,等 .2020年中國藥學發展研究報告[C].2020年中國科學和技術發展研究 (下),2004.
[3]徐承熊.21世紀我國藥學發展戰略[J].中華醫學信息導報,1995(21):3.
[4]國家科技部.國家中長期科學和科技發展規劃綱要(2006-2020年)[EB /OL].[2014-03-10]http: //www.most.gov.cn /kjgh /kjghzcq /.
[5]陶慧卿,潘 衛,莊 琦.從引文分析的角度比較Google Scholar與Web of Science的優勢與不足[J].圖書館雜志,2008,27(12):29-35.
[6]Callon.Co- Word Analysis For Basic And Technological Research[J].Scientometrics,1991,22(2):155-205.
[7]耿海英.共引分析方法及其應用研究[D].蘭州:中國科學院研究生院(文獻情報中心),2007.
[8]Small H.Co-citation in the scientific literature:A new measure of the relationship between two documents[J].Journal of the American Society for information Science,1973,24(4):265-269.
[9]孫海生.圖書館學高頻被引論文共被引分析[J].現代情報,2012,32(1):107-112.
[10]錢萬強,陳 濤,江海燕.基于文獻計量學的國內外干細胞研究熱點分析[J].中國科技論壇,2012(2):152-159.
[11]連少華,王 宇.近年來我國圖書館學研究熱點與發展趨勢——基于共被引分析[J].圖書情報工作,2013,57(1):221-226.
[12]王立學,冷伏海.簡論研究前沿及其文獻計量識別方法[J].情報理論與實踐,2010(3):54-58.
[13]Research Fronts 2013:100 Top-Ranked Specialties in the Sciences and Social Sciences[R].Thomoson Reuters,2013.
[14]張陽德.我國納米生物技術的醫學應用及研究進展[J].中國醫學科學院學報,2006,28(4):579 -582.
[15]馬 柯,張阿梅,夏雪山.IL28B基因在HCV感染中的作用和應用前景[J].遺傳,2013,35(11):1 244-1 252.
[16]付 娜,王 捷.蛋白質聚集的形成與調控機制[J].生命的化學,2007,27(5):436-439.
[17]錢伯初.第64屆國際藥學大會的藥學科研最新動態[J].中國藥理學通報,2005,20(12):1 438 -1 440.
[18]曹穎新.專家研討藥學發展前沿問題[C].新觀點新學說學術沙龍文集23:新藥發現——尋找維護人類健康的武器,2008.
[19]黃文龍,吳 鐳.藥學科學基礎研究中的重要前沿領域[J].中國科學基金,2002,16(1):12 -16.