張桐碩,冀潤利,夏時海,向曉輝
·脂肪性肝病·
近10年非酒精性脂肪性肝病研究熱點共詞聚類分析*
張桐碩,冀潤利,夏時海,向曉輝
目的了解中國近10年在非酒精性脂肪性肝病(NAFLD)領域的研究熱點和主題結構。方法以2014年2月為檢索節點,對“中國科技引文數據庫(CSCD)”中2004年1月~2013年12月所收錄的有關NAFLD研究文獻中的關鍵詞作為研究對象,采用詞頻分析、因子分析和共詞聚類分析等方法,應用Excel 2010和SPSS17.0統計軟件對這些關鍵詞進行統計分析。結果共檢索到標注關鍵詞的NAFLD相關文獻852篇,截取的40個高頻關鍵詞涵蓋全部相關論文數的70.2%;經共詞聚類分析歸納出有關NAFLD研究中的9個研究熱點:胰島素增敏藥物、超聲檢查、流行病學及危險因素、動物模型、發病機制及中醫藥療法、胰島素抵抗、中醫藥研究、基因水平和臨床診治研究。結論本文歸納出的9個研究熱點涵蓋了近10年在NAFLD研究領域的中文文獻,了解它們的進展有助于相關研究的擴展。
非酒精性脂肪性肝病;共詞聚類分析;因子分析;研究熱點
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)是一種無過量飲酒史的肝實質細胞脂肪變性和脂肪貯積為病理學特征的臨床綜合征。NAFLD的疾病譜是由單純性肝臟脂肪變性發展到非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH),最終導致肝硬化甚至肝細胞癌[1]。NAFLD在西方國家正逐漸成為一種主要慢性病日益受到重視,但現即將成為一個全球性流行病[2,3]。近年來,隨著人們生活水平的提高,生活方式的改變以及飲食結構的變化,NAFLD在我國的發病率呈逐年上升趨勢,有報道已占到中國肝硬化病因的第二位[4]。我國近10年NAFLD的研究取得了長足進展,并獨具特色。因此,了解和把握我國NAFLD的研究狀況和特點具有重要意義。共詞分析法屬于內容分析方法中的一種,已日益完善并被廣泛應用于各個研究領域,其原理是通過對能夠表達某一學科領域主題或研究方向的專業術語共同出現在同一篇文獻或論文中的分析,判斷學科領域中主題間的關系,進而展現該學科的研究結構[5]。但到目前為止,未見應用定量方法分析NAFLD方面研究熱點的文章[6,7]。本文擬結合文獻計量分析與內容分析,應用因子分析和共詞聚類分析法,對我國2004年~2013年十年間發表的NAFLD相關文獻進行分析,旨在揭示國內NAFLD領域研究的范圍與熱點,以期為該領域的研究人員提供可資參考的依據。
1.1 資料來源本研究選取中國科技引文數據庫(2004年~2013年)的論文為基本的數據來源。為保證查準率,選取的文獻數據包含了以下兩個檢索結果:(1)“文題”包含“非酒精性脂肪*肝*或NAFLD or NASH”的論文;(2)“關鍵詞”包含“非酒精性脂肪*肝*或NAFLD or NASH”的論文。從得到的檢索結果中剔除會議通知、會議報道、刊物征稿等消息類文獻,并只挑選有關鍵詞的學術論文。最后經過去重后,得到國內相關研究文獻852篇。
1.2 研究方法由于各文獻作者所使用的關鍵詞存在不規范性,所以對關鍵詞加以規范,合并同義詞、近義詞以及中英文不同寫法等,用通用的關鍵詞統一命名[8]。把非酒精性脂肪肝、非酒精性脂肪性肝病、脂肪肝(非酒精性)、NAFLD等統一合并為非酒精性脂肪肝;把甘油三酯、甘油三脂、甘油三酯類、TG等統一合并為甘油三酯;把體質指數、人體質量指數、體重指數、BMI等統一合并為體質指數。通過Excel 2010對這些關鍵詞進行詞頻統計。以1973年Donohue[9]根據齊普夫定律推導出的高頻低頻詞界定公式:為依據,進行先行排列,其中,是詞頻為1的關鍵詞的個數,為高頻詞中的最低頻次值,即高頻、低頻詞頻臨界值。從中截取40個關鍵詞作為高頻關鍵詞。在確定高頻詞匯后,兩兩統計這40個關鍵詞在文獻中的共現頻次,建立一個40×40的共詞矩陣,再依據Ochiia系數將共詞矩陣轉換成相關矩陣,用于因子分析和聚類分析[10]。將相關矩陣導入到SPSS17.0統計軟件,進行因子分析,按照“特征值大于1的因子被保留,特征值小于1的因子被舍棄”,從關鍵詞中提取符合條件的因子個數并進行分析。應用SPSS17.0軟件作共詞聚類分析,繪制高頻主題詞的聚類分析樹圖。
2.1 關鍵詞詞頻分析情況對關鍵詞合并后,共得到1158個規范關鍵詞,其中前40位高頻關鍵詞見表1。這40個關鍵詞涵蓋了相關文獻598篇,占全部相關論文篇數的70.2%。

表12004年~2013年我國有關NAFLD文獻高頻關鍵詞
2.2 因子分析結果按照“提取的因子累積百分比要達到60%以上”的原則,從關鍵詞中提取符合條件的因子9個,見表2。由此可見,在后面所進行的聚類分析中,將本研究所用的高頻關鍵詞分為9類。

表2 因子分析結果
2.3 聚類分析結果經共詞聚類分析,得到40個高頻主題詞的聚類分析樹圖(圖1)。根據聚類結果,并結合專業知識對每一類關鍵詞組合的語義關系加以分析,歸納出我國近10年來有關NAFLD研究中9個研究熱點:(1)胰島素增敏藥物對相關細胞因子的影響,由白介素、抵抗素、二甲雙胍、羅格列酮、胰島素抗藥性、腫瘤壞死因子-α等6個關鍵詞組成;(2)超聲檢查的廣泛應用,由超聲檢查、大鼠、肝纖維化等3個關鍵詞組成;(3)NAFLD的流行病學及危險因素,由代謝綜合征、兒童/青少年、肥胖、高脂血癥、患病率、流行病學、體質指數、危險因素等8個關鍵詞組成;(4)基于動物模型的行為干預研究,由動物模型、非酒精性脂肪性肝炎、小鼠、飲食干預、運動干預等5個關鍵詞組成;(5)NAFLD的發病機制及中醫藥療法的推廣,由發病機制、甘油三酯、胃腸道疾病、氧化性應激、中醫藥療法等5個關鍵詞組成;(6)胰島素抵抗,由非酒精性脂肪肝、糖尿病、胰島素抵抗、脂肪肝等4個關鍵詞組成;(7)中醫藥研究,由肝功能、血脂、中醫藥研究等3個關鍵詞組成;(8)發病機制在基因水平上的研究,由基因、瘦素、胰島素、脂聯素等4個關鍵詞組成;(9)NAFLD的臨床診治研究,由診斷、治療等2個關鍵詞組成。

圖1 高頻關鍵詞的聚類樹狀圖
本研究基于文獻計量法和內容分析法,利用詞頻分析、因子分析、共詞聚類分析,結合具體論文和專業知識較真實客觀地總結了我國近10年NAFLD的研究熱點和領域。以下9個研究熱點在一定程度上體現了這個階段國內NAFLD的研究現狀。
胰島素增敏藥物對相關細胞因子的影響。白介素、抵抗素、腫瘤壞死因子-α這些細胞因子的改變可誘發胰島素抵抗,從而參與脂肪性肝炎和肝纖維化的發病。胰島素抵抗又會引起胰島素抗藥性的發生,因而改善胰島素抵抗的藥物如以二甲雙胍為代表的雙胍類藥物及以羅格列酮成為目前臨床上治療NAFLD較為常用的藥物[11]。大量的動物實驗和臨床研究通過二甲雙胍、羅格列酮等胰島素增敏藥物對上述與NAFLD相關的細胞因子的影響,來探究藥物的作用機制和治療效果,使之成為NAFLD研究領域的熱點之一。
超聲檢查的廣泛應用。B超在脂肪肝定性及定量診斷中具有重要的臨床應用前景,是診斷脂肪肝的首選方法。此外,超聲引導下的肝穿刺活檢是迄今最可靠的脂肪肝鑒別方法,但超聲檢查的敏感率和正確率受肝纖維化程度的影響。有報道認為,在非纖維化的肝臟中,超聲診斷脂肪肝的敏感性達100%[12]。
NAFLD的流行病學及危險因素。由于我國超重和內臟性肥胖的高發,我國NAFLD發病率不斷上升,并越來越呈現出低齡化的趨勢,甚至出現了許多兒童和青少年患者。體質指數(BMI)與人體脂肪含量之間存在明顯的曲線關系,BMI至今仍被廣泛用于診斷肥胖和超重,但需根據性別及種族進行適當的校正。脂肪肝與肥胖關系密切,脂肪肝患者BMI明顯高于非脂肪肝人群。因此,調整飲食,控制體質量,有效干預超重,是降低脂肪肝發病率的重要手段。代謝綜合征、肥胖、糖尿病和高脂血癥已被公認為是導致NAFLD和NASH發生發展的危險因素[13]。
動物模型的行為干預研究。我國對NAFLD的研究主要是通過動物模型實現的[14],而小鼠是NAFLD造模中首選的實驗動物之一。動物模型除了具有評價一些藥物治療效果外,近年來科研人員也在積極探索給予模型動物行為干預研究。在動物模型上證實了運動干預和低熱卡飲食可促進實驗動物肝脂肪變的消退,顯著改善脂肪性肝炎。動物模型研究結果體現了調整飲食和增加運動等非藥物治療措施對于促進NAFLD康復的重要性,對人類尋找NAFLD的防治方法具有啟發意義。
NAFLD的發病機制及中醫藥療法的推廣。NAFLD的病因及發病機制均相當復雜。相比而言,目前對酒精性肝病(AFLD)的發病機制有較多的了解,但對NAFLD的發病機制并未完全明確。我國在NAFLD的研究方面還很膚淺,發病及進展機制有待于醫學工作者去探索。“二次打擊”學說已成為闡明NAFLD發病機制的主要理論。“第二次打擊”涉及氧化性應激,而氧化性應激參與糖脂代謝、胰島素敏感性及炎性反應等多個病理學過程。甘油三酯增高為NAFLD病人的主要特征。貯存于脂肪組織細胞中的甘油三酯分解可提供大量的游離脂肪酸,血漿游離脂肪酸的升高可引起細胞線粒體結構和功能異常,造成氧化和抗氧化系統的動態失衡,即氧化性應激,而氧化性應激與脂質過氧化是非酒精性脂肪肝受到二次打擊進一步發展的重要因素。同時,由胃腸道疾病引起的營養不良,造成肝臟脂肪轉運障礙也可導致NAFLD,這一發病機制正逐漸受到重視。由于NAFLD的發病機制至今尚未完全闡明,缺乏有效的干預方案和藥物。中醫藥對于治療脂肪肝具有療效穩定持久以及不良反應少等優勢。采用中藥多靶點和多環節作用的特點,并與生理學和現代藥理學研究相結合[12],發掘和解釋中藥、膏方、針灸、電針等中醫藥療法的臨床價值,從而為NAFLD提供更多更有效的治療手段,乃是我國NAFLD研究的一大特色。
胰島素抵抗。胰島素抵抗又稱胰島素耐受,是肝、外周脂肪以及肌肉組織對胰島素作用的生物反應低于正常水平。胰島素抵抗干預脂質代謝,引起肝細胞內脂質堆積,形成脂肪肝,即“二次打擊”學說中所謂的“第一次打擊”。胰島素抵抗普遍存在于2型糖尿病中,是糖尿病根本的觸發因素,因此糖尿病患者是NAFLD的高發人群。由于胰島素抵抗在NAFLD發病中起到關鍵作用,一直是國內外NAFLD研究的焦點。
中醫藥研究。NAFLD的中醫藥研究以中醫傳統基礎理論指導作為基本原則,結合辨證論治的中醫理論,運用現代醫學統計學析因分析為主要方法,與肝功能、血脂等指標的檢驗結果進行比對,從而來初步探討NAFLD的舌脈特點、癥狀、證候分型特點,達到為進一歩的臨床辨證、辨病、診斷、以及治療提供理論依據。NAFLD的證候學研究、辨治規律研究等中醫藥研究逐漸興起,尤其是近幾年來中醫對NAFLD的研究進一步深化,取得了一系列新進展[7]。
基因水平上的發病機制研究。NAFLD有家族性發病現象,提示遺傳基因可能起著重要的作用,多種基因與NAFLD發病的易感性有關。瘦素、胰島素和脂聯素都是機體脂質代謝以及糖穩態調控的重要激素。瘦素具有抑制胰島素分泌的能力,瘦素的缺乏及瘦素受體的基因敲除可以導致脂肪肝的形成。現有的研究表明,脂聯素的基因多態性影響著胰島素的敏感性,2型糖尿病和代謝綜合征的易感位點即是脂聯素基因所在位點。對基因進行分析和檢測可以為個體選擇最有效的治療原則,以及針對其基因信息提供特異性的藥物。目前,國內外對NAFLD發病機制的研究均已達到基因水平,并且發展迅速。
NAFLD的臨床診治研究。NAFLD的診斷和治療密不可分。對NAFLD進行及時準確的診斷對提高治療效果、減少肝臟疾患的罹患率及病死率有十分重要的臨床意義。對NAFLD檢測手段的發現、研究的進一步深人將為抗脂肪肝新藥研發提供理論依據。NAFLD的治療仍未發現特效藥物,目前的治療主要包括生活方式調節和藥物治療兩方面。
從整體來看,我國近10年NAFLD領域的研究熱點內容豐富,涵蓋危險因素、發病機制、防治措施等多個方面;研究方式多樣,包括流行病學調查、臨床試驗、動物模型等手段;胰島素抵抗是NAFLD發病機制研究的焦點,對相關因子的研究程度逐漸深入基因和分子水平;代謝綜合征、肥胖、糖尿病和高脂血癥是導致NAFLD的主要危險因素。另外,我國的NAFLD研究熱點反映出以下國情特點:NAFLD患者呈現低齡化的趨勢,兒童/青少年患者受到普遍關注;中醫藥研究逐漸興起,中醫思想對NAFLD的認識日趨成熟,中醫藥療法效果顯著,具有廣泛的研究空間和開發前景。
關鍵詞是文章核心內容的濃縮和提煉,一般而言,關鍵詞出現的頻率可以反映某個研究領域受關注的程度,關鍵詞出現的頻率越高,該關鍵詞所代表的研究領域就越受關注,該研究領域就越有可能是某個學科的研究熱點。因此,按照關鍵詞出現的頻率排序,高頻主題詞就能反映出某個學科的研究熱點。但是單憑詞頻統計還不足以準確判斷該學科的研究熱點及其變化,因此需要在確定高頻詞匯后,兩兩統計這些關鍵詞在文獻中的共現頻次,建立共詞矩陣,再通過Ochiia系數將共詞矩陣轉換成相關矩陣。相關矩陣的數據很重要,它是因子分析和聚類分析的基礎數據。
“因子分析要達到的目標就是用盡可能少的因子去描述眾多的指標或因素之間的聯系,其基本思想是根據相關性大小把研究對象的變量分組,使得同組內的變量之間相關性較高,而不同組的變量相關性較低”。用因子分析法可以將眾多的觀測變量濃縮成少數幾個因子,即根據相關性大小把研究對象的變量進行分組,把相關性比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子,用較少的幾個因子反映原始資料的大部分信息。共詞聚類分析法是將距離較近的主題詞聚集起來,形成概念相對獨立的類團,使類團內屬性相似性最大,類團間屬性相似性最小。
本研究利用共詞分析法對我國2004年~2013年NAFLD的研究熱點和主題結構進行了揭示,充分顯示了共詞分析在探索學科研究熱點及趨勢方面具有的實用性。但本研究也存在一些不足,如只納入了中國科技引文數據庫(CSCD),可能會造成其他研究成果的丟失,但本研究的結果仍為我們了解我國近10年NAFLD的研究熱點提供了線索。此外,共詞聚類分析雖然是探討學科研究熱點的常用方法,但是也存在著在揭示信息內容不夠全面的缺點。下一步可將NAFLD共詞分析法進行拓展和完善,比如利用戰略坐標判定我國NAFLD各個研究熱點的成熟度、核心以及演化情況,利用共詞網絡挖掘NAFLD的核心和邊緣主題,以期更加全面系統地了解NAFLD的研究熱點與發展現狀。
[1]Kleiner DE,Brunt EM,Van Natta M,et al.Design and validation of a histological scoring system for nonalcoholic fatty liver disease.Hepatology,2005,41(6):1313-1321.
[2]de Silva HJ,Dassanayake AS.Non-alcoholic fatty liver disease: confronting the global epidemic requires better awareness.J Gastroenterol Hepatol,2009,24(11):1705-1707.
[3]Loomba R,Sanyal AJ.The global NAFLD epidemic.Nat Rev Gastroenterol Hepatol,2013,10(11):686-690.
[4]段譽.1080例肝硬化患者病因及臨床特點分析.健康之路,2013,12(6):40-42.
[5]李佳.共詞矩陣在聚類結果分析中的作用.中華醫學圖書情報雜志,2009,18(4):77-81.
[6]陳大明,肖宏.基于Web of Knowledge的乙型肝炎文獻計量研究.中國科技期刊研究,2007,14(5):802-808.
[7]陳蓓琪.脂肪肝文獻評價和辨證論治規律探討.南京中醫藥大學博士學位論文,2012.
[8]付瑤,楊畔.基于共詞分析的我國關聯數據研究進展探析.圖書館學研究,2013,24(4):18-24.
[9]Donohue JC.Understanding seientific literatures-a bibliometrie approach.Cambridge:The MIT Press,1973:49-50.
[10]鐘偉金,李佳.共詞分析法研究(一)-共詞分析的過程與方式.情報雜志,2008,34(5):70-72.
[11]王建麗,張斌.非酒精性脂肪肝的研究進展.光明中醫,2013,16(5):1081-1084.
[12]曾民德.脂肪肝.中華消化雜志,1999,16(2):47-49.
[13]趙紫煙,董靜波.非酒精性脂肪肝的危險因素及脂肪肝診斷的研究進展.醫學綜述,2011,24(10):1522-1524.
[14]張瑜,許建華.脂肪肝模型研究進展.海峽藥學,2008,20(3): 10-13.
(收稿:2014-03-17)
(校對:陳從新)
Chinese science citation database based co-words clustered analysis on research hotspots in non-alcoholic fatty liver diseases in China during the past decade
Zhang Tongshuo,Ji Runli,Xia Shihai,et al.Department of Hepatopancreatobiliary and Splenic Medicine,Affiliated Hospital,Logistics University of Chinese People's Armed Police Forces,Tianjin 300162,China
ObjectiveTo explore the research hotspots and subject structure of non-alcoholic fatty liver diseases(NAFLD)in China in the past decade.MethodsThe key words of articles in NAFLD field were retrieved in Chinese science citation database(CSCD)from January 2004 to December 2013.Word-frequency analysis,factor analysis and co-words clustered analysis were applied and statistic analysis was performed using excel 2010 and SPSS17.0.ResultsEight hundred and fifty-two articles in presence of keywords about NAFLD were included and 40 high-frequency words were selected,which accounted for 70.2%of all relevant papers.The co-word clustered analysis showed that there were 9 hot subjects about NAFLD during last 10 years including insulin-sensitizing drugs,ultrasonography,epidemiology and risk factors,animal models,pathogenesis and traditional Chinese medicine,insulin resistance,Chinese medicine research,as well as gene and clinical treatment studies. ConclusionsThe co-word clustered analysis of research hotspots helps to understand the developmental of NAFLD in China.
Non-alcoholic fatty liver disease;Co-word clustered analysis;Factor analysis;Research hotspots
國家自然科學基金項目(81173393);武警后勤學院創新團隊基金項目(WHTD201310)及附屬醫院種子基金項目(FYM201117)
300162天津市武警后勤學院附屬醫院消化二科/肝膽胰脾中心(張桐碩,冀潤利,夏時海,向曉輝);檢驗醫學系(張桐碩)
張桐碩,男,21歲,大學本科。主要從事消化系疾病生物標志物研究。E-mail:zhangtongshuo@yeah.net
向曉輝,E-mail:xiaohuixiang@163.com
10.3969/j.issn.1672-5069.2014.05.007