林燕英 陳 剛
(1.福建省醫學科學研究院,福建 福州 350001;2.福建省立醫院內分泌科,福建 福州 350001)
長鏈非編碼RNA(LncRNA)是一組長度超過200個核苷酸且沒有蛋白質編碼潛力的非編碼RNA,最初被認為是沒有生物學意義的轉錄“噪音”。然而,近年的分子生物學研究顯示,LncRNA可以從多個層面調控基因的表達水平,主要包括表觀遺傳學調控、轉錄調控、轉錄后調控三個層面。LncRNA參與許多生理過程,如細胞周期調節、細胞凋亡、腫瘤的遷移及代謝等[1]。糖尿病是最常見的一種代謝紊亂,越來越多的證據表明,LncRNA在糖尿病及其并發癥中發揮關鍵作用,并有望成為糖尿病新的診斷標志物和治療靶點[1]。LncRNA是近年來糖尿病研究領域的一大熱點,但目前尚缺乏專業的文獻計量工具對糖尿病有關LncRNA的研究現狀和趨勢進行系統分析。引文空間(CiteSpace)軟件是一款科學文獻計量和知識網絡分析的可視化工具[2],通過豐富的知識圖譜直觀展示特定領域的研究狀況和相關熱點,近年來已廣泛應用于探索各學科發展趨勢。本研究利用CiteSpace軟件,對糖尿病有關LncRNA的歷年中文文獻進行知識圖譜繪制和分析,梳理國內該領域研究的發展脈絡,探討研究熱點和學術前沿,以期為潛在的研究人員和機構提供借鑒。
以中國知網中文總庫為檢索數據庫,在“高級檢索”界面,檢索策略為主題=“長鏈非編碼RNA”或“LncRNA”或“長非編碼RNA”與“糖尿病”,檢索時間范圍設定為2021年12月31日之前。共獲得符合檢索條件的文獻363篇,剔除重復文獻及綜述、meta分析、期刊索引、資訊類和明顯不相關文獻,最終共260篇文獻納入研究。
應用CiteSpace V5.8.R3軟件對糖尿病上述文獻進行數據梳理和可視化分析。CiteSpace相關參數設置:時間范圍為2013—2021年,時間切片為1年,分別以作者、機構、關鍵詞為節點,繪制相應的知識圖譜。以軟件生成的作者共現圖展示該領域的主要作者及作者間的合作情況,以關鍵詞共現圖展示研究熱點,以關鍵詞突現圖展示研究前沿。
在260篇文獻中,最早的一篇發布于2013年。2013—2021年的文獻量依次為2、3、5、15、26、35、59、44、71篇,僅2020年文獻量有所回落,2021年又明顯升高,總體呈逐年增高趨勢。
圖1顯示,N(節點)=200,E(連線)=240,表明這260篇文獻來自200位作者,這些作者間共有240次合作。其中,發文量最多的作者為孫艷,共發表5篇;其次是張政,發表4篇;發表3篇的有喬程、易紅、李愛玲、王敏和孫倩;其他作者發文量為1~2篇。根據普賴斯定律,高產作者最低發文量=最高產作者發文量平方根的0.749倍[3],計算得到本研究高產作者最低發文量為3篇,則有7位作者滿足這一條件,為高產作者。高產作者總發文量為24篇,占文獻總數的9.2%。各團隊節點間未見明顯連線,可見團隊間缺乏合作,分散性大。260篇文獻共來自119個研究機構,其中發文2篇的機構有8個,包括中國醫科大學附屬第一醫院腎內科、華南理工大學醫學院等,其他機構都僅發文1篇,機構間有61次合作。

圖1 糖尿病有關LncRNA研究作者共現圖譜
2.3.1 高頻關鍵詞
圖2顯示,N(節點)=246,E(連線)=419,表明260篇文獻共有246個關鍵詞,這些關鍵詞間有419次共現。除了本研究的檢索主題長鏈非編碼RNA和糖尿病之外,排名前二十的高頻關鍵詞依次為糖尿病腎病、2型糖尿病、細胞凋亡、炎癥、mRNA、糖尿病視網膜病變、基因芯片、細胞增殖、MALAT1、妊娠期糖尿病、生物信息學分析、腎小球系膜細胞、高糖、非編碼RNA、足細胞、纖維化、基因表達、氧化應激、1型糖尿病、MEG3。可見,不同類型的糖尿病、糖尿病并發癥、疾病機制、基因篩查、LncRNA部分家族成員等是該領域的研究熱點。

圖2 糖尿病有關LncRNA研究的關鍵詞共現圖譜
2.3.2 突現關鍵詞
不同時區的突現關鍵詞(即引用量激增的關鍵詞)見圖3。

圖3 糖尿病有關LncRNA研究的關鍵詞突現圖譜
2014—2016年的突現關鍵詞為胰島素合成和分泌、基因芯片、胰腺十二指腸同源盒-1(pancreatic duodenal homology box 1,PDX-1)、LncRNA MAFA;2016—2018年為腎小球系膜細胞、纖維化、1型糖尿病、信號通路、微小RNA、生物標記物等;2018—2019年為生物信息學分析、冠心病、LncRNA Dlx6-as1;2019—2021年則為炎癥、吸煙、競爭性內源RNA(competing endogenous RNAs,ceRNA)、非編碼RNA、核因子κB (nuclear factor kappa-B,NF-κB)、愛帕琳受體(APLNR)、LncRNA Arid2-IR,近年的這些突現關鍵詞代表當前國內在該領域的研究前沿。
早在1991年,國際上就有LncRNA的相關報道[4],但直到2007年[5]之后,其熱度才開始居高不下。在國內,LncRNA研究起步較晚,中國知網第一篇有關LncRNA的文獻發布于2007年[6],而第一篇糖尿病有關LncRNA的文獻則發布于2013年[7]。本文計量分析結果顯示,該領域文獻量總體呈逐年上升趨勢,2013—2015年發展比較緩慢,文獻量均為個位數;2016—2019年增長相對加快,穩步上升;2020年文獻量有所回落,考慮與當年突發新冠肺炎疫情吸引了研究者的部分注意力,使研究力量在研究課題間重新分配有關;2021年又重新回歸上升趨勢。隨著我國社會的老齡化,作為老年人重要的常見病之一,糖尿病的相關研究也將得到持續關注,糖尿病有關LncRNA的研究在未來幾年有望得到進一步發展,該領域文獻量將繼續保持增長趨勢。
文獻計量結果顯示,國內糖尿病有關LncRNA領域的研究者不多,只有200人左右,其中發文量3篇以上的高產作者很少,僅有7位;其中孫艷、張政、易紅、李愛玲等形成的團隊在該領域的研究成果較多,但各作者團隊間缺乏合作,分散性很大。文獻的來源機構眾多,以醫學院校附屬醫院的下屬科室為主,每個機構都僅有1~2篇的發文量,機構間雖有61次合作,但大多是兩兩單次合作,未形成多邊、頻繁、緊密的機構間合作。科研的發展不僅需要相關領域的研究者有開闊的橫向視野,也需要其在確定科研方向之后潛心深耕,縱向挖掘,才能在該領域形成更多的高產作者及核心作者群;同時,在作者之間、研究團隊之間、研究機構之間需加強交流和合作,破除學術壁壘,形成科研合力,才能創造出更多跨團隊、跨機構、多中心的高質量科研成果。
研究熱點指在某一時間段內有內在聯系、數量相對較多的一組文獻所探討的學術或專題[8]。關鍵詞是對論文主題的高度概括,共現關鍵詞可代表某一時期的研究熱點[9-10]。本文結果顯示,國內糖尿病有關LncRNA領域歷年的研究熱點,除了本研究的檢索主題長鏈非編碼RNA和糖尿病之外,主要涵蓋以下幾個方面:①不同類型的糖尿病(主要包括2型糖尿病、妊娠期糖尿病、1型糖尿病);②糖尿病并發癥(主要包括糖尿病腎病、糖尿病視網膜病變);③疾病機制(主要包括細胞凋亡、炎癥、細胞增殖、高糖、纖維化、氧化應激等);④LncRNA部分家族成員(主要包括MALAT 1和MEG 3);⑤基因篩查(主要包括基因表達、基因芯片等);⑥生物信息學分析。比如,在被引量最高的文獻中,張傳壽等[11]用小鼠LncRNA表達譜芯片檢測糖尿病db/db小鼠和db/m對照小鼠心肌中LncRNA的表達,并用熒光定量PCR鑒定6個在糖尿病性心肌中高表達的代表性LncRNA。結果顯示,LncRNA AK014842和BF607975在糖尿病性心肌和糖尿病性心肌纖維化細胞模型中一致上調表達。這些研究熱點反映了糖尿病有關LncRNA領域的研究現狀,即研究者主要著力于探討LncRNA在糖尿病及其并發癥中的表達,某些LncRNA家族成員在糖尿病及其并發癥發病或治療中的作用機制及其作為生物標志物在臨床診斷中的意義。
研究前沿是指某一時間內某個領域中涌現的具有發展潛力的研究方向和科學研究中最先進、最新的研究主題[13]。某個領域一段時間內的研究前沿可以通過突現關鍵詞來反映,突現關鍵詞指的是在這段時間內被頻繁引用的某些詞匯[10]。文獻計量結果顯示,隨著糖尿病有關LncRNA研究的深入,研究主題越來越多元化,并出現了一些被引量突然激增的關鍵詞。早期僅出現少量的突現關鍵詞,涉及胰腺生理和小部分LncRNA家族成員;中期突現關鍵詞數量明顯增多,涉及不同類型糖尿病及并發癥、疾病機制、更多的LncRNA家族成員、生物信息學分析等;近年的突現關鍵詞得到進一步豐富,除了涉及基因篩查、機制、LncRNA家族成員等之外,還增加了危險因素、基因功能調控網絡等方面的主題,這些主題是目前國內糖尿病有關LncRNA的研究前沿。比如,在近年引用量較高的文獻中,林曉等[14]報道黃芪三七合劑治療后的小鼠腎功能得到一定程度的恢復,炎癥因子表達呈現劑量依賴性下降,LncRNA Arid2-IR和NF-κB及其下游分子的表達下調,表明黃芪三七合劑可有效減輕糖尿病腎病小鼠的腎炎癥反應,其機制可能與調節Arid2-IR/NF-κB信號軸有關。該文獲得較多的關注和引用,可能與其涉及炎癥、NF-κB、LncRNA Arid2-IR等多個前沿主題有關。根據知識圖譜突現關鍵詞的發展勢頭,可以看出前沿主題熱度不減,并將受到該領域學者的持續關注和重視。
綜上所述,本文利用CiteSpace對國內糖尿病有關LncRNA的研究脈絡進行了系統梳理,通過知識圖譜直觀展示該領域研究的年度走勢、作者及機構分布、研究熱點和前沿主題,以幫助研究人員和機構洞察該領域的發展趨勢,發現更有價值和潛力的研究方向,為后續研究課題的構思和設計提供一定的參考。
由于本文僅搜集中國知網總庫收錄的中文文獻,可能遺漏該數據庫未收錄的小部分中文文獻;同時,未納入國內外發布的外文文獻,暫未對糖尿病有關LncRNA的國際研究動態和趨勢進行分析,尚無法掌握該領域的研究全貌。有待后續進一步搜集國內外文獻資料,對該領域的研究現狀和趨勢做更全面的文獻計量學分析,為研究者提供更有價值的借鑒和指引。