荊 麗 徐 娟 杜佳月 張治國 沈麗寧 謝立春
1 華中科技大學同濟醫學院醫藥衛生管理學院,武漢,430030;2 深圳市衛生健康發展研究中心,深圳,518028;3湖北省衛生技術評估研究中心,武漢,430030
引文分析,即對各文獻之間的相互引證關系進行分析,可以從眾多文獻中快速找出更有價值的文獻,提升研究效率。由美國科學信息研究所(Institute for Scientific Information, ISI)創始人尤金·加菲爾德博士設計研發的HistCite是一款高效的引文分析可視化軟件,能快速收集文獻信息并進行有效的管理,使得科學研究評估更加量化[1]。HistCite軟件通過對導入的文獻進行整合,根據整合的結果找出文獻之間的引證關系,并能依據不同指標對文獻進行排序,從而找出更有質量的經典論文、貢獻卓著的權威機構、研究人員及雜志期刊等[2]。
本文采用HistCite軟件,對新生兒遺傳代謝病篩查領域的相關文獻進行引文分析,找出本領域的重要文獻,生成引文編年圖,并對本領域研究的發展歷程進行呈現[3],進而分析新生兒遺傳代謝病的篩查意義、篩查方法和篩查效果,為今后的新生兒篩查工作提供參考。
本文進行引文分析所收集的文獻均源自Web of Science(下文簡稱WOS)核心合集數據庫(包括SCIE、SSCI、CPCI-S、CPCI-SSH、ESCI等)。檢索式主題為“新生兒篩查”和“遺傳代謝性”,英文表達形式為:TS= (“neonatal screening” OR “newborn screening”) AND TS=(“metabolic disease” OR “metabolic disorders” OR “metabolism”);時間限定為“所有年份”;文獻類型限定為“全部文獻”;語言限定為“所有語言”。第一個主題檢索到的文獻數量為7339篇,第二個主題檢索到的文獻數量為583132篇文獻,對兩個檢索式進行邏輯組配后檢索到的文獻數量為1040篇(檢索截止時間為2019年7月17日)。
將檢索到的1040篇文獻導入HistCite軟件中并進行以下指標的分析。LCS(Local Citation Score),本地引用次數,指某篇文獻在本地數據集中的被引用次數或同行引用次數。GCS(Global Citation Score),總被引頻次,表示這篇文獻被整個WOS數據庫中所有文獻引用的次數。LCR(Local Cited References),本地參考文獻數,表示該篇文獻引用到的所有參考文獻中,有多少篇文獻在本地數據集中。CR(Cited References),參考文獻數,指該文章的參考文獻數量。本地總被引次數(Total Local Citation Score, TLCS),是指在當前數據集中該文獻的被引次數之和。總被引次數(Total Global Citation Score, TGCS),指的是在WOS數據庫中的所有文獻被引次數的和。引用頻次(Records,Recs),指的是相關記錄數。
導入HistCite軟件后,共得到1040條有效記錄,涉及4385位作者、347種期刊、20639條參考文獻、2125個關鍵詞,采用前述指標進行文獻引證分析。
將導入的所有文獻按照LCS和LCR兩個指標進行排序,分別得到引用頻次排名前30的文獻列表。進行初步整理后發現,第139篇(LCS=103,LCR=20)、87篇(LCS=43,LCR=18)、388篇(LCS=39,LCR=15)、161篇(LCS=31,LCR=15)這四篇文獻在兩次指標排序中均有名次,說明這4篇文獻的參考價值較大。
第139篇是Chace DH(2003)等人關于用串聯質譜法進行代謝性紊亂篩查的發展歷史的記錄以及對串聯質譜技術的分析,研究結論為:串聯質譜法等分析技術具有更高的靈敏度和特異度,因此適用于新生兒篩查和其他大規模篩查項目;第87篇是Chace DH(2002)等人關于串聯質譜技術應用于新生兒代謝病篩查的實用指南,旨在幫助遺傳病學專家更深入全面地了解新生兒串聯質譜篩查;第388篇是Wilcken B(2009)等人采用隊列研究的方法,分析接受篩查和未接受篩查的兩組6歲兒童患者的臨床結果,結論顯示:采用串聯質譜法進行篩查為患者提供了更好的臨床結果,能夠有效降低兒童死亡率等;第161篇是Pandor A(2004)等人對使用串聯質譜法進行新生兒先天性代謝異常篩查的臨床效果和成本效果的綜述分析,該綜述結果肯定了串聯質譜法具有成本和效果優勢。
采用HistCite軟件對涉及到的4385名作者進行分析,采用Recs、TLCS和TGCS三個指標進行統計。通過對比發現有5位著者都出現在了三個指標的排名中,說明這些學者的研究結果具有更高認可度。他們分別是:Wilcken B(澳大利亞)、Hoffmann GF(德國)、Matern D(美國)、Rinaldo P(美國)和Chace DH(美國)。
按照檢索到的文獻,將各年份的發文數量進行收集并整理(2019年只截至7月),分別采用Recs和TLCS兩個指標進行分析,繪制成圖1。

圖1 1997-2019年發文情況
從折線圖可以看出,1997-2019年間的發文數量總體是波動上升的,其中2018年的相關文獻數量最多(88篇),各年份中文獻總被引次數最高的是2003年(605次)。
將全部文獻按照LCS排序,篩選出前30篇權威文獻,并繪制相應的引文編年圖(圖2)。圖中的圓圈代表結點,其大小與分析時所采用的指標LCS值相對應,若某文獻結點越大,則被本領域其他研究者引用的頻次越高[4]。圓圈中的數字是文獻在本地數據庫中的編號,圖中的箭頭方向表示文獻之間的相互引證關系。被指向的箭頭越多,說明該文獻的引用頻次越高,則研究價值越大。
從圖中可以看出,檢索到的文獻中最早的發文是1997年的第7篇和第8篇,被箭頭指向較多且圓圈較大的文獻是第81篇、第127篇和第128篇,均是對新生兒篩查采用串聯質譜法的研究。
第81篇文獻是Zytkovicz TH(2001)等[5]發表在《CLINICAL CHEMISTRY》上的“Tandem mass spectrometric analysis for amino, organic, and fatty acid disorders in newborn dried blood spots: A two-year summary from the New England newborn screening program”(LCS=107;GCS=335),該文是對新英格蘭地區新生兒代謝病篩查計劃的兩年總結。結論為:使用串聯質譜法篩查23種代謝性紊亂疾病時,其陽性預測值優于其他方法檢測的報告值。
第127篇文獻是Schulze A(2003)等[6]發表在《PEDIATRICS》上的“Expanded newborn screening for inborn errors of metabolism by electrospray ionization-tandem mass spectrometry: Results, outcome, and implications”(LCS=135;GCS=294),該文獻主要是研究采用串聯質譜法進行新生兒代謝病篩查對德國先天性代謝病總體檢出率的影響,并評估被診斷患者的臨床結果。結論為:與常規篩查相比,串聯質譜對多達23種代謝病的篩查使檢出率提高了大概一倍。
第128篇文獻是Wilcken B(2003)等[7]發表在《NEW ENGLAND JOURNAL OF MEDICINE》上的“Screening newborns for inborn errors of metabolism by tandem mass spectrometry”(LCS=160;GCS=385),該文獻研究了串聯質譜法對新生兒31種疾病篩查診斷率的影響。結論為:通過串聯質譜法進行篩查能夠更快診斷出更多的先天性代謝紊亂患者。
從圖中可以看出第45篇文獻是一個獨立的結點,確認文獻信息后發現該篇文獻是Applegarth DA(2000)等[8]發表在《PEDIATRICS》上的“Incidence of inborn errors of metabolism in British Columbia, 1969-1996”,僅是對不列顛哥倫比亞省新生兒遺傳代謝病的流行病學研究,因此在相關文獻中的引用頻次不多,表現為一個獨立的點。

圖2 引文分析編年圖
采用Recs和TLCS兩個指標對期刊的分布進行前十排序,匯總如表1,排名靠前的期刊與分子生物學、遺傳病學、臨床醫學、兒科學等相關。
對數據集中收錄的文獻進行文獻類型分析,結果顯示,無論是按照Recs還是TLCS進行排序,文獻類型數量均為Article>Review>Others,即本領域的文獻以研究型的文章為主(占比72%以上)。
對收錄的文獻的所屬機構和所屬國家采用Recs、TLCS以及TGCS三個指標進行排序,排名前十的所屬機構主要是兒童醫院,其次是大學機構。所屬國家中,美國和德國穩居前兩位,其次是加拿大、澳大利亞和英國等。而中國只有在Recs排序中進入過前十名,其他指標排序均未見。即美國和德國等國家的研究數量多、認可度較高,而中國的研究雖多,但被同行認可的高質量文章有待增加。

表1 發文排名前十的期刊統計表
對收錄的1040篇文獻進行Words排序,選出Recs值≥90的關鍵字,繪制條形圖如圖3所示。接著對根據LCS排序后選出的30篇權威文獻,即圖2引文編年圖中的30篇文獻進行關鍵詞詞頻分析,摘錄出每篇文獻的關鍵詞,篩選出排名前十的關鍵詞(表2)。通過對關鍵字和關鍵詞進行整合分析,快速定位出本領域研究熱點和話題的關鍵詞為:先天性缺陷、串聯質譜、新生兒篩查等。

圖3 關鍵字Recs排序分布圖

表2 排名前十的關鍵詞匯總表
進行引文分析,可以幫助研究者快速確定哪些是值得研讀的文獻,從而將研究者從復雜的文獻分析工作中解放出來,實現文獻閱讀的高效性。并且研究顯示一般跨國家(地區)的大型人群研究較易在高水平的國際期刊上發表,并被多次引用[9]。因此,做好引文分析有利于我們找準高水平期刊和高引用文獻,為以后的科研成果發表做準備。
四項引文分析指標都靠前的熱點文獻均顯示與篩查技術相關。結合熱點詞分析并查看LCS和LCR指標靠前的文章,我們發現,介紹串聯質譜技術和串聯質譜技術在新生兒遺傳代謝病篩查中的應用的相關文獻較多,在同行引用次數中有些甚至達到了百位數以上,說明這些文獻得到了同行的高度認可,也說明串聯質譜技術在新生兒疾病篩查中已經得到了從業人員的認可,在以后的篩查項目中可考慮使用。
相關文獻數量的年份趨勢分析顯示,2000年后新生兒篩查相關文獻量逐步上升, 2018年相關文獻數量最多(88篇),但總被引次數TLCS最高的是2003年(605次),說明2003年左右是在新生兒遺傳代謝病篩查中引入串聯質譜技術關鍵的一年,就同行引用的情況來說,2003年和2006年發表的文獻TLCS值較高,說明這兩年發表的文獻參考價值較高。
熱點文獻的作者、機構和國家分析顯示,串聯質譜技術在本領域的應用和拓展主要是國外學者在做。文獻分析結果顯示美國和德國等國家的研究認可度較高,而中國的研究雖多,但被同行認可的高質量文章不多。相較其他研究,串聯質譜技術的研究主要分布于兒童醫院等醫療機構,其次才是各類研究所,這可能和該技術著重于應用性有關。
本文通過研究發現,在本領域關注度較高的文獻分別是:Chace DH (2003)等人的“使用串聯質譜法對新生兒血斑樣本進行多分析物篩選”、Chace DH (2002)“串聯質譜技術在篩查新生兒遺傳代謝病中的應用”、Wilcken B (2009)“擴大新生兒篩查:篩查和未篩查的6歲患者臨床結果”以及Pandor A(2004)“使用串聯質譜法對新生兒進行先天性代謝病篩查的臨床效果和成本效果:系統評價”,這4篇文獻均為研究串聯質譜法在新生兒篩查中的應用,并肯定了串聯質譜法的優勢和效果。
由引文編年圖可知有3篇文獻的同行被引頻次較高,其主要內容是對串聯質譜法在新生兒遺傳代謝病篩查中的效果進行分析評價,并均肯定了此法相對于其他常規篩查法的優勢:Zytkovicz TH(2001)[5]等人發表的“對新生兒干血斑中氨基酸、有機酸和脂肪酸疾病進行分析”一文中,串聯質譜篩查極大地擴大了篩查病種;Schulze A(2003)[6]等人發表的“通過電噴霧電離--串聯質譜法擴展新生兒先天性代謝病篩查”中的研究顯示串聯質譜法相比于其他傳統方法對多達23種其他疾病的篩查使檢出率提高了大概一倍;Wilcken B(2003)[7]等人發表的“通過串聯質譜法對新生兒先天性代謝病進行篩查”中認為通過串聯質譜法能夠更快診斷疾病。
綜上,早期新生兒篩查采用細菌抑制法以及放射免疫法等,但是隨著科學技術的進步,串聯質譜法被逐漸推崇,它能同時更快檢測多種有機酸代謝紊亂、氨基酸和脂肪酸氧化缺陷病等,進而提升新生兒篩查的檢出率。并且串聯質譜法對樣本要求與傳統篩查方法無異,但靈敏度和特異度卻顯著提高,具有較好的篩查效果和收益[10]。因此,在今后的新生兒遺傳代謝病篩查項目中,建議有條件的地區采用串聯質譜法進行篩查。