張靚 齊昊



[摘要] 自閉癥是一種廣泛性發育障礙的疾病,近幾年的自閉癥患者數量不斷增加。該文選取自閉癥相關研究文獻,從PubMed數據庫中抽取自閉癥相關文獻,通過發文量統計發現自閉癥研究文獻呈現指數上漲趨勢且在2016年達到頂峰。運用詞頻分析法截取相關高頻詞制作關鍵詞詞云發現隨著自閉癥患者年齡的不斷增長,研究者較為關注自閉癥的共病問題。利用中心性分析、共詞分析和社會網絡分析方法,通過VOSviewer可視化軟件形成了6個研究主題的聚類,分別為自閉癥的相關基礎理論研究、致病因素研究、表型癥狀研究、臨床診斷研究、干預措施研究、共病研究,并基于知識圖譜對自閉癥研究相關文獻進行主題分析,從發文量和研究熱點角度探究自閉癥的研究現狀及發展趨勢,為科研人員提供參考依據。
[關鍵詞] 自閉癥譜系障礙;知識圖譜;主題分析
[中圖分類號] R749.94 [文獻標識碼] A [文章編號] 1672-5654(2020)07(b)-0191-06
An Analysis of Research Topics on Autism Spectrum Disorder Based on Knowledge Graph
ZHANG Liang1, QI Hao1,2
1.Medical Big Data Center of the First Hospital of Shanxi Medical University, Taiyuan, Shanxi Province, 030001 China; 2.Department of Endocrinology, the First Hospital of Shanxi Medical University, Taiyuan, Shanxi Province, 030001 China
[Abstract] Autism is a disease of widespread developmental disorders. In recent years, the number of patients with autism has been increasing. This article selects autism-related research literature and extracts autism-related literature from the PubMed database. Through the statistics of the number of publications, it is found that the autism research literature has an exponential upward trend and reached its peak in 2016. Using word frequency analysis to intercept relevant high-frequency words to create a keyword word cloud found that as the age of autistic patients continues to grow, researchers pay more attention to the comorbidity of autism. Using centrality analysis, co-word analysis, and social network analysis methods, clusters of 6 research topics were formed through the VOSviewer visualization software, which are related to basic theoretical research on autism, pathogenic factors, phenotypic symptoms, and clinical trials. Diagnosis research, intervention research, comorbidity research, and based on the knowledge map to conduct thematic analysis of autism research related literature, explore the current status and development trend of autism research from the perspective of the number of articles and research hotspots, and provide reference for scientific researchers.
[Key words] Autism spectrum disorder; Knowledge graph; Topic analysis
自閉癥譜系障礙(autism spectrum disorder,ASD),又稱孤獨癥,是一種發育障礙類疾病。美國在2013年頒布了《精神疾病診斷與統計手冊—第5版》(DSM-5),并以自閉癥譜系障礙替代了除雷特氏癥以外的廣泛性發育障礙[1]。目前,自閉癥多高發于兒童,且男女比例差異明顯,男孩多于女孩。其主要特征為社交互動障礙、語言溝通障礙和重復刻板行為等[2]。然而自閉癥的病因尚不明確,但有研究[3]認為與遺傳、免疫、代謝、腸道菌群和環境等因素密切相關。近幾十年來,自閉癥譜系障礙(ASD)的發病率持續上漲,根據美國疾病控制與預防中心CDC估計,大約每59名兒童中就有1名被確診患有自閉癥譜系障礙。隨著醫學技術和醫療信息化等技術的迅速發展,生物醫學數據呈現出爆發式增長的趨勢[4],以此為基礎的生物醫學文獻數量也急劇增長。生物醫學文獻中蘊含著大量的生物醫學知識,及時從中獲取有效的信息就顯得尤為重要。該文基于知識圖譜方法研究自閉癥相關文獻,了解自閉癥研究現狀并探究其發展趨勢,為科研人員提供參考依據。
1? 數據與方法
1.1? 數據來源
該研究數據來自于 PubMed 生物醫學文獻數據庫,通過MeSH詞檢索到9個與自閉癥相關的醫學主題詞分別為autistic disorder(自閉癥);autism spectrum disorder (自閉癥譜系障礙);rett syndrome rett (綜合征);akinetic mutism (動力學緘默癥);macrocephaly autism syndrome (自閉癥綜合征);AUTS2 protein, human AUTS2 (蛋白,人);Auts2 protein, mouse(Auts2 蛋白,小鼠); Adenylosuccinate lyase deficiency(腺苷酸琥珀酸裂解酶缺乏);GoPro49 protein, human(GoPro49 蛋白,人類),以OR并列構建其檢索式,共收集到自閉癥相關的研究文獻29 458篇(檢索時間為2019年5月13日)。
1.2? 研究方法
①詞頻分析法。詞頻分析法是一種文獻計量方法,其中關鍵詞或主題詞是文獻的主要核心內容。因此通過統計關鍵詞、主題詞等核心詞匯在某一領域文獻中所出現的頻次, 進而揭示該領域的研究熱點及發展趨勢[5]。通過詞頻的高低可以反映出一定的社會現象[6]。該文從PubMed數據庫中下載XML題錄數據,利用Kettle軟件進行解析,從中抽取出Title、Year、Keywords關鍵字段。對其進行數據歸一化處理,刪除重復無關數據,從中截取出頻次>10的關鍵詞共769個,根據關鍵詞在自閉癥相關文獻中的詞頻情況,預測自閉癥研究的發展方向及趨勢。
②中心性分析法。中心性分析方法可以反映出節點在網絡中的重要程度。該文選用3種中心性分析方法,分別為點度中心性(degree centrality)、中介中心性(betweenness centrality) 和親近中心性(closeness centrality)。其中點度中心性代表與該關鍵詞節點的連線數量。中介中心性是指節點對網絡的控制能力。親近中心性是指與其他關鍵詞節點的最短距離的大小。
③共詞分析法。共詞分析法是一種基于關鍵詞的共現分析方法,表示某一領域中關鍵詞共同在同一篇文獻中出現的次數,并且次數越多越說明它們關系緊密、距離越短。運用共詞分析方法構建共現矩陣,從而反映關鍵詞之間的緊密程度并進一步分析其領域結構[7]。該文利用關鍵詞共現建立共現矩陣,并以此為依據構建共現網絡。
④社會網絡分析法。社會網絡分析法(social network analysis,SNA)是一種科學的計量方法,主要是對社會關系網絡結構及其屬性進行分析研究從而發現其內在聯系的一種學科交叉的方法[8]。社會網絡由圖中的節點和連線構成,其中節點表示事件中的行動者,連線代表行動者之間的關系紐帶。社會網絡分析的優勢在于可根據網絡結構與網絡位置對多個節點和多個主體網絡進行合理分析并加以預測[9]。該文通過共現關系自建網絡,反映關鍵詞節點之間的關聯關系,并通過VOSviewer軟件進行可視化。
2? 結果與分析
2.1? 發文量分析
由圖1可以看出自閉癥研究相關文獻總體上呈現逐年上漲趨勢,且增長幅度較大呈指數增長趨勢。自閉癥文獻數量從1946年開始緩慢增長,初期較為平穩。從2001年開始持續增長迅速到2008年達到一個小高峰,2008年聯合國將每年的4月2日定為“世界自閉癥日”[10],以提高人們對自閉癥患者的關注度以及對自閉癥早期干預的研究。在2010—2014年間研究人員對于自閉癥的關注度稍有下降,但在2016年迅速上升達到高點,說明近幾年來,隨著自閉癥患者的不斷增長,研究人員對自閉癥研究的關注度越來越高。
2.2? 高頻關鍵詞分析
從自閉癥相關文獻中截取頻次>10的關鍵詞共769個,通過WordArt在線詞云制作工具繪制關鍵詞詞云,見圖2,頻次排名前10的關鍵詞主要有Autism Spectrum Disorder(自閉癥)、Intellectual Disability(智力障礙)、Children(兒童)、anxiety(焦慮)、Schizophrenia(精神分裂癥)、ADHD(注意缺陷多動障礙)、Diagnosis(診斷)、adult(成人)、Development(發展)、Social Cognition(社會認知),可以看出自閉癥多發生于兒童,然而隨著自閉癥患者年齡的增長,研究人員對成人自閉癥患者的關注也逐年增長。同時對自閉癥患者與注意缺陷多動障礙、精神分裂癥、焦慮等的共患病情況也受到了更多關注。
2.3? 研究主題分析
通過自建網絡并采用關聯強度進行主題聚類,同時采用VOSviewer軟件對其進行可視化,圖中節點大小表示關鍵詞頻次的高低,連線代表關鍵詞之間的關聯程度,見圖3,整個研究主題以“Autism Spectrum Disorder自閉癥譜系障礙”為中心構成一個基于關鍵詞共現形成的知識圖譜,并根據關聯強度自閉癥知識圖譜被聚為6個研究主題,分別為如下幾方面。
①自閉癥的相關基礎理論研究。隨著自閉癥患者數量逐年增加,研究人員對自閉癥的關注度不斷上升,在自閉癥的相關基礎理論研究主題下,研究人員主要對自閉癥不同年齡段的患者包括兒童、青少年、成人的患病率、性別差異等基礎信息進行統計學分析,并對患者的心理健康、生活質量和睡眠壓力、情緒調節方面進行評估。根據詞頻和中心性分析可以看出圖中的高頻關鍵詞有“children(兒童)”“diagnosis(診斷)”“adult(成人)”“intervention(干預)”“assessment(評估)“epidemiology(流行病學)”等。其中3種中心性在整個網絡中都處于靠前位置,說明該主題為自閉癥的基礎理論研究,且對其他主題都有支撐作用。主要針對不同年齡段的人群包括兒童、成人及患者的兄弟姐妹的患病情況、診斷情況及生活情況進行宏觀描述,并根據患者的心理健康、社會技巧、睡眠質量。常用的分析方法有Meta分析、隨機對照實驗、流行病學研究等。見表1。
②自閉癥致病因素研究。自閉癥是一種神經發育障礙疾病,目前自閉癥的致病因素尚不明確,可能與多種因素有關,包括遺傳因素、免疫因素、炎癥、環境因素等因素相關。根據詞頻和中心性分析可以看出高頻詞有“intellectual disability(智力障礙)”“neurodevelopmental disorders(神經發育障礙)”“genetics(遺傳學)”“fragile x syndrome(脆性X綜合征)”“inflammation(炎癥)”“environment(環境)”“gut microbiota(腸道菌群)”等。近幾年對于自閉癥的遺傳因素研究較為關注,主要集中基因突變、基因異常、染色體異常等,包括基因的單核苷酸變異和基因拷貝數變異,如脆性X染色體綜合征或結節性硬化癥。腸道菌群是目前的研究熱點,有研究[11]表明腸道菌群與自閉癥有很大關聯,腸道菌群可以通過腦-腸軸影響免疫、代謝、神經及行為,間接地調控大腦功能,影響中樞神經系統,進而影響人的情感、認知和行為。在研究自閉癥致病因素時,科研人員通常采用動物模型和動物實驗方法來用于遺傳因素、生理因素等致病因素研究。見表2。
③自閉癥表型癥狀研究。自閉癥的表現癥狀主要有言語障礙、社交障礙和重復刻板行為。根據詞頻和中心性分析可以看出高頻詞有“anxiety(焦慮)”“social cognition(社會認知)”“attention(注意力)”“social interaction(社交)”“emotion(情緒)”“sensory processing(感覺信息處理)”“eye-tracking(目光接觸)”“face perception(人臉認知)”等。在該主題中焦慮頻次最高,是自閉癥患者的主要癥狀之一,其次表現為社會認知能力下降、注意力不集中、溝通障礙及情緒問題,然而社會交往障礙為自閉癥的特異性癥狀[12],因此,研究人員聚焦于社會交往障礙癥狀來尋找自閉癥患者的病因。社會交往障礙是最典型、最核心的臨床表現,自閉癥患者在社會交往方面存在質的缺陷,表現為回避目光接觸,缺乏與人交往的興趣,正常的交往方式和技巧。見表3。
④自閉癥的臨床診斷研究。自閉癥的診斷主要包括自閉癥的相關量表和影像學的輔助檢查。根據詞頻和中心性分析可以看出高頻詞有“development(發展)”“theory of mind(心智理論)”“FMRI(功能性磁共振成像)”“functional connectivity(功能連接)”“EEG(腦電圖描記器)”“cerebellum(小腦)”“neuroimaging(神經影像)”“MRI(核磁共振成像)”“amygdala(杏仁核)”“diffusion tensor imaging(彌散張量成像)”等。常用的自閉癥心理評估篩查量表有自閉癥行為量表(autism behavior checklist,ABC),共57個項目;常用診斷量表有自閉癥診斷觀察量表第2版(ADOS-2)、自閉癥診斷訪談量表修訂版(ADI-R)和兒童自閉癥評定量表(childhood autism rating scale)。腦發育與自閉癥的關系是目前的研究熱點,科研人員多從大腦的影像學方面進行自閉癥的輔助檢查,其中包括腦電圖、神經影像、功能性磁共振成像等發現自閉癥患者的腦部結構異常[13]。見表4。
⑤自閉癥干預措施研究。目前自閉癥的干預措施包括行為干預治療和藥物治療,其中主要采用行為干預治療,藥物治療是一種輔助措施。根據詞頻和中心性分析可以看出高頻詞有“language(語言)”“communication(交流)”“social communication(社會交流)”“parent training(家長訓練)”“functional analysis(功能分析)”“augmentative and alternative communication(輔助溝通系統)”“video modeling(錄像示范)”等。行為干預一直是自閉癥研究的熱點,常用的行為干預措施有應用行為分析、輔助溝通系統、錄像示范等,研究人員主要通過此類干預措施提升自閉癥患者的語言溝通能力和社會交往能力。同時藥物治療也可以改善患者的情緒癥狀,如情緒不穩、動行為、攻擊行為等[1]。見表5。
⑥自閉癥共病研究。在自閉癥的共病研究中,注意力不集中、抑郁癥、強迫癥、精神病等此類疾病與自閉癥的共病較為常見。根據詞頻和中心性分析可以看出高頻詞有“ADHD(注意缺陷多動障礙)”“depression(抑郁癥)”“comorbidity(共病)”“(treatment)治療”“bipolar disorder(躁郁癥)”“psychosis(精神病)”“obsessive-compulsive disorder(強迫癥)”。科研人員在自閉癥的共病研究中,對注意缺陷多動障礙尤為關注,并且在自我抑制行為方面,共患ADHD的自閉癥患者比自閉癥患者表現出更嚴重的問題。自閉癥合并注意缺陷多動障礙與單純的自閉癥在神經病理學功能方面有著顯著性差異,共患病患者表現出較高的焦慮癥狀和攻擊行為[14]。見表6。
3? 討論
自閉癥作為一種神經發育障礙疾病,以社交障礙、刻板行為、語言障礙等癥狀為主。近些年來,自閉癥患者的數量不斷增加,但其病因尚不明確,可能由多種因素導致[15]。目前的治療方式主要為行為干預,藥物干預相對較少。從發文量統計中可以看出,自閉癥相關研究呈指數增長趨勢,初期發展較為平穩,研究人員對自閉癥領域的研究相對較少;但之后呈現緩慢增長趨勢,并在2018年達到一個小高峰。隨著自閉癥患者的不斷增多,研究人員對自閉癥領域的關注度不斷增加。從詞云圖中可以看出,研究人員對于自閉癥患者的共病問題研究較為普遍,自閉癥與焦慮、精神分裂癥、多動癥等疾病的頻次相對較高,自閉癥與此類疾病的相關研究更為廣泛。該文利用共現分析和中心性分析,并基于知識圖譜對自閉癥譜系障礙進行主題分析,從自閉癥相關文獻中提取關鍵詞,構建共現網絡并聚為6個自閉癥研究主題分別為自閉癥基礎理論研究、自閉癥致病因素研究、自閉癥表型癥狀研究、自閉癥的臨床診斷研究、自閉癥干預措施研究、自閉癥共病研究。對這6個主題進行剖析研究,首先發現自閉癥多發于兒童,而隨著年齡增長成人自閉癥也逐漸增多,研究人員對于自閉癥的患病情況及患者的心理、情緒問題研究較多;同時自閉癥的致病因素尚不明確,可能與多種因素相關包括遺傳、免疫、炎癥等,其中遺傳因素研究是當前研究熱點,主要有基因突變、染色體異常等。其次對于自閉癥的表型癥狀主要表現為焦慮、認知能力下降、注意力不集中等。對于自閉癥的診斷治療方面,研究人員多從自閉癥相關量表和大腦影像學的輔助檢查出發發現自閉癥患者的腦部結構的相關異常信息,同時運用行為干預措施進行自閉癥治療,主要采取行為分析、輔助溝通系統等干預方法。最后自閉癥與注意力障礙缺陷等疾病的共病問題也是當前研究熱點,在此領域中研究人員對于自閉癥與注意力缺陷多動障礙的共病問題研究較為關注。因此,建議研究人員從多角度出發,對自閉癥的成因、診斷治療、干預措施及共病問題等方面做進一步的深入研究,推進自閉癥的臨床診斷與治療。
[參考文獻]
[1]? 鄧明昱,勞世艷.自閉癥譜系障礙的臨床研究新進展(DSM-5新標準)[J].中國健康心理學雜志,2016,24(4):481-490.
[2]? 段云峰,吳曉麗,金鋒.自閉癥的病因和治療方法研究進展[J].中國科學:生命科學,2015,45(9):820-844.
[3]? 李勝,江鴻,費安興,等.孤獨癥譜系障礙的遺傳學研究進展[J/OL].中國兒童保健雜志:1-4[2019-07-26].http://kns.cnki.net/kcms/detail/61.1346.R.20190618.0931.020.html.
[4]? 馬敬東,張學高,李岳峰,等.國內外健康醫療大數據資源標準體系研究進展[J].中國衛生信息管理雜志,2019,16(3):257-262.
[5]? 劉奕杉,王玉琳,李明鑫.詞頻分析法中高頻詞閾值界定方法適用性的實證分析[J].數字圖書館論壇,2017(9):42-49.
[6]? 田丹,劉奕杉,王玉琳.熱點分析類文章的文獻計量分析—以詞頻分析方法為例[J].情報科學,2017,35(8):164-169.
[7]? 李炯.基于共現分析的圖書情報領域可視化研究[D].濟南:山東大學,2014.
[8]? 陳云偉.社會網絡分析方法在情報分析中的應用研究[J].情報學報,2019,38(1):21-28.
[9]? 祁凱,張子墨.基于社會網絡分析的虛擬學術社區知識共享研究[J].知識管理論壇,2018,3(6):335-344.
[10]? 聯合國.世界自閉癥日[EB/OL].[2019-3-10].http://www.un.org/zh/events/autismday/background.shtml.
[11]? 劉天浩,張曉梅,程羽,等.初探腸道菌群與自閉癥的關系[J].遼寧中醫雜志,2018,45(9):1854-1858.
[12]? 吳彥.我國自閉癥兒童干預研究的可視化知識圖譜分析[J].南京曉莊學院學報,2018,34(5):66-70.
[13]? 何瑜玢.兒童孤獨癥的研究進展[J].中國婦幼保健,2016,31(6):1343-1346.
[14]? 鄭毅.孤獨癥的共病問題及其對診療的影響[J].中國兒童保健雜志,2018,26(4):349-351.
[15]? 南潔,崔軍武,董效軍,等.自閉癥研究動向綜述[J].系統醫學,2018,3(11):187-189.
(收稿日期:2020-04-12)
[基金項目] 山西省重點研發計劃項目(201803D31099)。
[作者簡介] 張靚(1993-),女,碩士,研究方向:醫學知識發現。
[通信作者] 齊昊(1975-),男,碩士,主任醫師,研究方向:糖尿病大數據,E-mail:qi-h@163.com。