鄒昱,朱玉珍,張慶文(上海體育學院體育教育訓練學院,上海200438)
肌萎縮性側索硬化癥研究熱點及前沿的科學計量學分析
鄒昱,朱玉珍,張慶文(上海體育學院體育教育訓練學院,上海200438)
摘要:目的探討當前肌萎縮性側索硬化癥(ALS)的研究特點及研究方向。方法 以amyotrophic lateral sclerosis為主題詞,檢索2005~2014年Web of Science數據庫收錄的ALS相關研究文獻,獲得滿足條件的文獻8 555篇。應用CiteSpace軟件,采用文獻共被引分析方法和詞頻分析方法,繪制ALS文獻共被引網絡圖譜和關鍵詞共現圖譜,分析近10年發文量、研究國家和機構分布、高被引文獻研究方向、高頻次關鍵詞、研究前沿。結果 2005~2014年ALS的發文量呈逐年增加趨勢。美國是ALS研究中最有影響力的國家,大學是ALS研究的主要機構,近年來中國在發文量上有很大突破。被引頻率最高的10 篇文獻研究方向主要集中于SOD1基因突變、TDP-43泛素化、16號染色體上FUS與TLS基因突變、RNA轉錄蛋白FUS突變、C9ORF72基因的六核苷酸重復擴增等。近兩年對于致病機理的研究主要集中于C9ORF72非編碼區的GGGGCC六核苷酸重復擴增以及自噬作用等。結論 與ALS有共性的退行性疾病、病因、發病機制及實驗動物模型是近年來ALS的研究熱點;ALS研究前沿主要集中于對致病機制的研究,如C9ORF72基因六核苷酸重復擴增突變、與ALS相關的突變基因的遺傳學研究及自噬作用等。
關鍵詞:肌萎縮性側索硬化癥;研究熱點;研究前沿;科學知識圖譜;科學計量學;情報學 的突現年份與結束年份也從某種意義上決定了該研究的前沿研究。本研究發現,六核苷酸重復擴增、C9ORF72基因、自噬與遺傳學等關鍵詞的突現年份均出現在2012年之后,且至今仍處于突現階段,同時也都有較高的突現強度,說明其代表了ALS研究的前沿研究領域。因此,綜合來看,ALS研究前沿方向主要集中于C9ORF72基因六核苷酸重復擴增突變、自噬作用以及與ALS相關的突變基因的遺傳學研究,如C9ORF72基因、S0D1基因、TARDBP基因等。
肌萎縮性側索硬化癥(ALS)是一種影響運動神經元的進行性神經變性疾病,目前為神經系統疾病的研究熱點。但從科學計量學角度對該病的研究熱點及研究方向進行分析尚不多見??茖W知識圖譜是以圖形形式展示科學知識發展進程與結構關系的一種科學計量分析方法。2014年10月,我們采用科學知識圖譜方法,對2005~2014年近十年ALS的研究文獻進行分析,繪制ALS研究文獻的共被引網絡圖譜和關鍵詞共現圖譜,探討當前ALS的研究特點及研究方向,為今后的研究提供思路和方向。
1資料與方法
1.1文獻來源及檢索策略文獻數據均來源于美國科學情報研究所(ISI)的Web of Science數據庫,數據庫更新日期為2014年8月27日。以amyotrophic lateral sclerosis為主題詞進行文獻檢索,時間范圍為2005~2014年,每一條數據下載為全記錄格式,語言類型為“English”,文獻類型為“Article”。納入文獻的作者、題目和摘要齊全,排除文獻資料不全的文章。共納入滿足條件的文獻8 555篇。
1.2研究方法應用CiteSpace軟件,采用文獻共被引分析方法和詞頻分析方法,繪制ALS文獻共被引網絡圖譜和關鍵詞共現圖譜進行分析。
1.3研究指標
1.3.1近10年發文量在Web of Science數據庫搜索平臺中通過分析檢索結果得出近十年各年份的發文量。
1.3.2研究國家和機構分布時間確定為2005~2014年,時間跨度為1,節點類型分別選擇國家(Country)、機構(Institution),數據選取為Top50,閾值為(2,2,20)(4,3,20)(4,3,20),其他均為軟件默認,運行CiteSpace軟件,顯示可視化圖,得到研究國家與機構的發文頻次。
1.3.3高被引文獻研究方向時間設置為2005~2014年,時間跨度設置為1,節點類型選擇共引參考文獻(Cited Reference),數據選取為Top50,運行軟件,得到節點Nodes=170,連線Links=300的ALS研究文獻共被引網絡圖譜,將引用頻次為450以上的文獻作為高被引文獻,分析高被引文獻的主要研究方向。以Sigma值的大小衡量研究成果創新性,Sigma值越大表明研究成果的創新性越大,對Sigma值最大的兩篇文獻研究方向進行分析。
1.3.4高頻次關鍵詞時間間隔設為1年,主題詞來源選擇標題(Title)、摘要(Abstract),類型選擇突現詞(Burst),網絡節點選關鍵詞(Keyword),每部分選擇Top50,其他均按默認選擇運行軟件,得到關鍵詞共現知識圖譜,得出關鍵詞頻次、中心性,將頻次為350以上的關鍵詞定為高頻次關鍵詞。將頻次排名較高的熱點關鍵詞按照ALS相關疾病類、特征類、病理機制類、實驗模型類進行分類,得出ALS不同類別領域的研究熱點。
1.3.5研究前沿以突現強度高、突現年份近的關鍵詞表示研究前沿。采用詞頻探測技術,通過考察詞頻的時間分布,探測出頻次增長率快速增加的詞,產生包括突現強度、突現長度、突現年份和結束年份在內的突現列表。突現強度指某一關鍵詞在其突現時間段內出現頻次的權重,體現該關鍵詞的出現頻次突然增加的強度。突現長度指某一關鍵詞所持續的突現時間。突現年份指該關鍵詞開始突現的年份。結束年份指關鍵詞突現結束的年份。不僅依靠頻次的高低,同時關注詞頻的變動趨勢以及其突現時間來確定前沿領域和發展趨勢[1]。
2結果
2.1近10年發文量2005~2014年ALS的發文量分別為540、636、729、765、806、986、1 029、1 168、1 210及686(2014年發文量統計截至2014年8月27日)篇,呈逐年增加趨勢。
2.2研究國家和機構分布①國家分布:8 555篇文獻作者分布于73個國家。頻次超過100的共有15個國家,這15個國家占世界發文量的 95.1%以上,其中美國占總發文量的33.85%;中國發文頻次位居第七,而突現值為10.61,其突現值在所有國家中位居第一。②機構分布:世界范圍內ALS的研究機構為159 所,其中大學129所、科研院所19所、醫院11所。發文頻次排名前15位的機構為大學14所、醫療研究機構1所。見表1。

表1 研究ALS的國家和機構分布
2.3高被引文獻研究方向得到高被引文獻10篇[2~11]及創新性論文2篇[12,13],高被引文獻研究方向集中于SOD1基因突變[2~4]、ALS的診斷標準[5,6]、TDP-43泛素化[7,8]、肉瘤熔合基因(FUS)與脂肪肉瘤基因(TLS)基因突變[9,10]、C9ORF72基因的六核苷酸重復擴增[12,13]等。見表2。

表2 ALS研究高被引文獻情況
另外,有兩篇Sigma與頻次均很高的創新性文獻,分別為Dejesus-hernandez等[12](頻次為355、突現值為111.77、Sigma值為61 936.79)及Renton等[13](頻次為335、突現值為105.18、Sigma值為12 310.03)對ALS患者C9ORF72基因GGGGCC六核苷酸重復突變的研究文獻。
2.4高頻次關鍵詞共得出高頻次關鍵詞26個,見表3。關鍵詞集中于ALS相關疾病、致病機理與實驗模型類。

表3 高頻次關鍵詞排布情況
2.5研究前沿從關鍵詞突現強度看,六核苷酸重復擴增與C9ORF72基因遠高于其他關鍵詞。見表4。

表4 關鍵詞突現排布
3討論
90%的ALS為散發性,10%為家族遺傳,臨床主要表現為肌肉逐漸萎縮與進行性肢體癱瘓,發病率為1/10萬~3/10萬[14],通常在2~5年內致人死亡[15]。20世紀以來,越來越多的科研機構關注此疾病,其研究不斷取得新進展,對該病的病因、發病機制、診斷與治療開展了大量的研究,但目前尚缺乏特效治療藥物。2014年,自美國興起的旨在幫助患有漸凍人癥群體的冰桶挑戰賽再度引發了全世界對于ALS的關注。
隨著信息技術、可視化技術以及科學計量學理論的發展,以圖形的方式揭示學科間的聯系已愈發容易。而如何在準確傳達知識的基礎上,以可視化的圖像直觀、形象地揭示學科與學科之間的聯系已成為近年來科學計量學研究領域興起的熱點之一??茖W知識圖譜是其中一個新的熱點,它是以科學學為基礎,涉及應用數學、信息科學及計算機科學諸學科交叉的領域,是科學計量學和信息計量學的新發展[16]。運用科學知識圖譜不僅能夠預測前沿領域,而且還能夠引領對前沿的理解和對未來的走向。本研究根據科學知識圖譜方法,從以下方面揭示了ALS當前研究的特點。
3.1近10年發文量某領域論文在時間上的分布在一定程度上反映了該學科領域學術研究的理論水平和發展速度[17]。本研究發現,2005~2014年ALS的發文量逐年增加,表明ALS越來越受到關注。
3.2研究國家和機構分布科研成果和著者分析是了解某一學科領域研究力量分布狀況的有效方法[18]。突現是最活躍研究領域的一項指標,是對突發事件的偵測。本研究發現,美國刊文量超過ALS刊文總量的1/3,對ALS的發文量居首位,提示美國對于ALS的研究仍處于領先位置,美國是ALS研究中最有影響的國家;中國發文頻次位居第七,而突現值為10.61,說明中國在ALS的研究上比較活躍,發文量有很大突破;世界范圍內發文頻次排名前15位的機構為大學14所、醫療研究機構1所,提示大學是ALS研究的主要機構,在排名前15位的機構中,美國占7所,分別為哈佛大學、賓夕法尼亞大學、約翰·霍普金斯大學、梅奧診所、西北大學、哥倫比亞大學和埃默里大學。
3.3高被引文獻研究方向通過了解ALS的研究熱點,有助于把握整個研究動向,使研究人員更加明確有關ALS的發展態勢。本研究對被引頻率最高的10 篇文獻分析發現,除了Brooks等[5,6]報道的以“診斷標準”為主的兩篇文獻外,其余均提出了與ALS有關的發病機制學說,包括SOD1基因突變、TDP-43泛素化、16號染色體上FUS與TLS基因突變、RNA轉錄蛋白FUS突變、C9ORF72基因的六核苷酸重復擴增等。
3.4高頻次關鍵詞出現頻次較多的關鍵詞可以在一定程度上代表ALS的研究熱點領域。本研究發現,前兩個頻次最高的關鍵詞均為ALS;阿爾茨海默病與ALS均為漸進性的神經系統退行性疾病,頻次位于第4位;amyloid beta(Aβ)淀粉樣蛋白的沉積是引起阿爾茨海默病的主要原因,病理表現為以大腦額顳葉萎縮為特征的額顳葉癡呆,因此大腦額顳葉萎縮、癡呆均有較高的頻次;ALS是累及脊髓前角細胞的進行性疾病,故脊髓也有很高的頻次。我們認為,與ALS有共性的神經退行性疾病是研究的熱點之一,如阿爾茨海默病、帕金森病等,可能引起ALS疾病的致病機理如各類基因突變、TDP-43聚集和突變、氧化應激損傷機制等也是近10年來的研究熱點。近兩年對于致病機理的研究主要集中于C9ORF72非編碼區的GGGGCC六核苷酸重復擴增以及自噬作用等;按研究側重點分類,可見近十年來研究重點集中于ALS相關疾病、致病機理與實驗模型類。
3.5研究前沿研究前沿代表了一個研究領域的研究現狀,是強調新趨勢和突變的特征。國外研究報道,基因重復擴增可能與部分高加索人群認知功能障礙和運動障礙兩種臨床表型密切相關。C9ORF72基因第一外顯子內部非編碼區六核苷酸重復擴增突變是導致額顳葉癡呆和肌萎縮側索硬化的重要原因。在FALS家族性或散發性ALS和FTD,特別是ALS-FTD患者中,C9ORF72基因GGGGCC六核苷酸重復擴增突變是最常見的遺傳病因。本研究發現,六核苷酸重復擴增與C9ORF72基因的突現排布遠高于其他關鍵詞,提示對于六核苷酸重復擴增與C9ORF72基因方面的研究是當前熱點。細胞凋亡突現強度排名第三。超氧化物歧化酶不僅具有較高的突現強度,也有相當高的Sigma。
綜上所述,ALS研究越來越受到關注,與其有共性的退行性疾病、各類ALS疾病可能的病因、發病機制以及不同類型的動物實驗模型是該領域的研究熱點,研究前沿主要集中于對致病機制的研究,如C9ORF72基因六核苷酸重復擴增突變、與ALS相關的突變基因的遺傳學研究以及自噬作用等。
參考文獻:
[1] 劉則淵,陳悅,侯海燕.科學知識圖譜—方法與應用[M].北京:人民出版社,2008:30-32.
[2] Rosen DR,Siddique T,Patterson D,et al. Mutations in Cu/Zn superoxide dismutase gene are associated with familial amyotrophic lateral sclerosis[J].Nature,1993;362(6415):59-62.
[3] Gurney ME,Pu H,Chiu AY,et al.Motor-neuron degeneration in mice that express a human Cu,Zn superoxide-dismutase mutation[J]. Science,1994,264(5166):1772-1775.
[4] Bruijn LI, Miller TM,Cleveland DW.Unraveling the mechanisms involved in motor neuron degeneration in ALS[J].Annu Rev Neurosci,2004,27:723-749.
[5] Brooks BR. El-escorial world of neurology criteria for the diagnosis of amyotrophic-lateral-sclerosis[J].J Neurol Sci,1994,124(Suppl):96-107.
[6] Brooks BR,Miller RG,Swash M,et al. El Escorial revisited: revised criteria for the diagnosis of amyotrophic lateral Sclerosis[J].Amyotroph Lateral Sc, 2000,1(5):293-299.
[7] Neumann M,Sampathu DM,Kwong LK,et al. Ubiquitinated TDP-43 in frontotemporal lobar degeneration and amyotrophic lateral sclerosis[J].Science, 2006,314(5796):130-133.
[8] Arai T,Hasegawa M,Akiyama H,et al.TDP-43 is a component of ubiquitin-positive tau-negative inclusions in frontotemporal lobar degeneration and amyotrophic lateral sclerosis[J].Biochem Bioph Res Co,2006,351(3):602-611.
[9] Kwiatkowski TJ Jr,Bosco DA,Leclerc AL,et al.Mutations in the FUS/TLS Gene on Chromosome 16 Cause Familial Amyotrophic Lateral Sclerosis[J].Science,2009,323(5918):1205-1208.
[10] Vance C,Rogelj B,Hortobágyi T,et al.Mutations in FUS, an RNA processing protein, cause familial amyotrophic lateral sclerosis type 6[J].Science,2009,323(5918):1208-1211.
[11] Sreedharan J,Blair IP,Tripathi VB,et al.TDP-43 mutations in familial and sporadic amyotrophic lateral sclerosis[J].Science,2008,319(5870):1668-1672.
[12] DeJesus-Hernandez M, Mackenzie IR, Boeve BF, et al. Expanded GGGGCC hexanucleotide repeat in noncoding region of C9ORF72 causes chromosome 9p-Linked FTD and ALS[J].Neuron, 2011,72(2):245-256.
[13] Renton AE,Majounie E,Waite A,et al. A hexanucleotide repeat expansion in C9ORF72 is the cause of chromosome 9p21-linked ALS-FTD[J].Neuron,2011,72(2):257-268.
[14] Rowland LP,Shneider NA.Amyotrophic lateral sclerosis[J].N Engl J Med, 2001,344(22):1688-1700.
[15] Magdalena I, Ivanova SA. Aggregation-triggering segments of SOD1 fibril formation support a common pathway for familial and sporadic ALS[J]. PNAS,2014,111(1):197-201.
[16] 陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學學研究,2005,23(2):149-154.
[17] 張玉雙.我國高校圖書館知識管理研究的文獻統計分析[J].晉圖學刊,2008,1(5):45-48.
[18] 梁立明.科學計量學—指標·模型·應用[M] .北京:科學出版社,1995:166-204.
(收稿日期:2014-12-04)
通信作者:張慶文
中圖分類號:G255.51;R746.4
文獻標志碼:B
文章編號:1002-266X(2015)10-0035-04
doi:10.3969/j.issn.1002-266X.2015.10.012