999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本挖掘技術的腦卒中文獻計量分析:以PubMed數據庫為例

2023-12-09 00:00:00葉全偉楊肖光葉麗萍劉靜周萍
中國衛生質量管理 2023年3期
關鍵詞:腦卒中

摘要:目的 回溯并勾勒2010年-2020年全球腦卒中領域研究的主題演化歷程與時空分布規律。方法 從PubMed數據庫中獲取2010年-2020年腦卒中相關文獻,利用R 4.1.2的pubmedR軟件包批量抓取文獻基本信息,通過quanteda軟件包構建語料庫,使用結構主體模型進行分析,并運用ggplot2軟件包進行國家或地區合作網絡分析。結果 全球腦卒中研究2010年-2013年為快速增長期,增長率為11.94%~17.60%;2014年-2018年為增長平緩期,增長率為3%~4%左右;2019年-2020年再次快速增長,增長率為12.81%、17.96%。中國大陸地區在2012年、2020年增長率分別為102.99%、43.85%,在全球兩個階段的高速增長期中均做出了較大貢獻。基于文獻摘要文本,共歸納出11個主題類別,其中“臨床研究”與“卒中康復”占較大比重,合計熱度值為46.66%。我國近年研究熱點主要集中在“分子遺傳病學”與“動物實驗”。結論 全球腦卒中研究熱度持續增長,主題類別逐漸豐富。我國需進一步加強腦卒中前端預防和后端康復研究,優化防治策略。

關鍵詞:文本挖掘技術;文獻計量分析;腦卒中;PubMed數據庫

中圖分類號:R743 文獻標識碼:A

腦卒中是一種急性腦血管疾病,包括缺血性和出血性卒中。從全球趨勢來看,腦卒中是導致患者死亡或殘疾的首要病因,也是我國成人致死、致殘的第一病因,具有高發病率、高致殘率、高死亡率、高復發率、高經濟負擔5大特點。有學者從文獻計量角度分析了腦卒中領域研究的態勢與特點,以期為深化與拓展相關研究、優化政策分析等提供參考。傳統文獻計量分析方法,一是將已結構化的文獻變量(如時間、國別、機構名、作者名等)整合成數據庫,借助相關軟件(如CiteSpace、VOS-viewer等)分析繪圖;二是對尚未結構化的文本(如關鍵詞、摘要、正文等),通過手工信息摘錄相關變量匯集成數據庫,再進行系統分析。前者可處理大量文獻,但難以應對非結構化文本;后者因人力、時間限制,難以應對大量文本信息。

文本挖掘技術是指從文本數據中提取有價值的信息和知識的計算機處理技術,已應用于電子病歷、新聞媒體文本分析、大眾輿情分析等領域。本研究通過文本挖掘技術,結合傳統文獻計量分析方法,回溯并勾勒了2010年-2020年全球腦卒中領域研究的主題演化歷程與時空分布規律。

1 資料與方法

1.1 資料來源

在PubMed數據庫中檢索2010年-2020年發表的標題中含有“腦卒中”的文獻,語言限定為“英文”,類型限定為“期刊論文”。檢索式為:Stroke[Title]AND English[LA] AND Journal Article[PT]AND 2010:2020[DP],共檢出56 083篇文獻。人工進行二次篩選,剔除作者信息、年份、標題以及摘要缺失文獻,經去重,得到49 448篇文獻。

1.2 文本挖掘方法

利用R 4.1.2的pubmedR軟件包批量抓取納入文獻的基本信息,包括標題、作者、期刊名稱、作者國家、發表年份、DOI、摘要、關鍵詞等。同時,利用自然語言處理中的命名實體識別技術,提取每篇文獻第一作者的國家等關鍵信息。對數據進行預處理,統一格式,形成干凈數據集。基于文本分析的序貫詞篩選方法,按關鍵詞共同出現頻次數進行排序,結合人工識別,修正專業術語,構建專業詞表。通過R 4.1.2的quanteda軟件包構建語料庫,生成文檔一特征矩陣,并附加作者、年份、國家或地區等屬性信息。

在主題建模部分,使用結構主題模型(Structural Topic Model,STM)對49 448篇文獻的摘要語料庫進行分析。具體過程:首先,基于文檔一特征矩陣,采用R 4.1.2的stm軟件包進行主題聚類建模與量化指標值計算,參照軟件提供的語義聚類值指標,確定21個主題,考慮到臨床實際與主題同質性,人工歸納形成11個主題類別并命名;其次,對每一個主題類別提取主題熱度值(即單一主題類別在納入分析的文本語料庫中的占比)與前20個高頻關鍵詞,并統計每篇文獻在11個主題類別上的傾向性概率值(即單篇文獻分別在各主題類別上的顯示度);最后,對納入文獻進行量化文本主題分析與挖掘,如不同年份、不同國家或地區在各主題類別熱度值的變化等,以呈現時空發展特點與趨勢。

1.3 統計分析方法

基于python(3.8)的spacy軟件包提取國家或地區和機構信息。運用R 4.1.2的ggplot2軟件包進行國家或地區的合作網絡分析,根據不同年份、不同國家或地區在各主題類別的熱度值變化繪制熱力圖。

2結果與分析

2.1 年發文量與增長率

2010年-2020年,全球腦卒中研究發文量不斷上升,在2020年達6 681篇,年均增長率為9.55%。環比年增長率顯示:2010年-2013年為快速增長期,增長率為11.94%~17.60%;2014年-2018年為增長平穩期,增長率在3%~4%左右,2018年低至0.82%;2019年-2020年再次快速增長,增長率分別為12.81%、17.96%。見圖1。

2.2 國家或地區發文量

發文量位列前10的國家或地區依次為:美國、中國大陸地區、英國、日本、德國、加拿大、韓國、澳大利亞、意大利與中國臺灣地區,累計發文量占比高達66.68%,見表1。其中:美國以9 643篇位列第一,占總發文量的19.50%;中國大陸地區位居第二,為6 750篇,占總發文量的13.65%。進一步分析顯示(圖2),發文量位列前5的國家或地區中,中國大陸地區腦卒中研究占全球總量的比例呈逐年增長趨勢,2020年占比已超過美國;而在增長率上,2012年,中國大陸地區腦卒中研究發文量增速高達102.99%,2020年年增長率達43.85%。由此可見,全球腦卒中研究的兩次增長高峰,主要貢獻均來自中國大陸地區。

2.3 國家或地區合作網絡分析

本研究將單篇文獻中第一作者與通信作者位于不同國家或地區計為一次合作關系,由合作關系組成的網絡稱為合作網絡。利用R語言中的tidytext軟件包繪制合作網絡圖,結果顯示,在全球開展腦卒中合作的國家或地區中,以中國大陸地區與美國開展研究合作最為頻繁,2010年-2020年共有900余條合作記錄;其次是德國與英國,有近600條合作記錄;再次為英國與澳大利亞,有550余條合作記錄。聚焦中國大陸地區,除與美國有大量合作外,還與中國臺灣地區、中國香港、澳大利亞、日本、英國、加拿大等合作較多。見圖3。

2.4文本主題分析

2.4.1 腦卒中研究主題及熱度分析 基于納入文獻的摘要文本,運用STM共歸納出11個主題類別,依據主題在全語料庫中的熱度值占比,降序排列依次為:臨床研究、卒中康復、研究綜述、動物實驗、溶栓治療、危險因素、功能評價、流行病學、院前救護、分子遺傳病學、指南推薦。見表2。

年份分析顯示,2010年-2020年,各主題類別總體均呈不同程度增長,“臨床研究”與“卒中康復”增長尤為明顯。從每年各主題類別熱度值占比來看,“臨床研究”與“卒中康復”始終占據較大比重。

主題熱度值年增長率分析顯示,2010年-2013年與2019年-2020年為兩大增長期。具體來看:“指南推薦”在2012年出現增速高峰;“分子遺傳病學”在2012年與2019年出現兩個增速高位;“院前救護”在2011年出現增速高位,隨后增速下落直至負增長,在2020年再現增速高峰;“功能評價”在2011年-2013年有增長,后進入平臺期,2019年有所回升;“動物實驗”在2012年、2020年出現兩個增長高峰;“研究綜述”在2011年-2012年與2020年出現兩個增長高峰;“卒中康復”與“臨床研究”在2011年-2020年均持續增長,在2011年-2014年、2019年-2020年兩個時期增速明顯。見圖4。

以發文量前10的國家或地區為例,分析不同國家或地區2010年-2020年11個主題類別的熱度值占比情況。結果顯示,雖然發文量存在差異,但各國家或地區在11個主題類別的熱度值分布大體一致。“臨床研究”與“卒中康復”的熱度值占比在各國家或地區均最高,占比分別為27.15%~29.78%、15.95%~22.87%,“流行病學”與“分子遺傳病學”占比較低,分別為3.45%~4.00%、2.45%~3.39%;“指南推薦”最低,為0.85%~1.10%。

2.4.2 典型國家或地區的研究主題熱度值年增長率分析 以美國、中國大陸地區與日本為例,分析不同國家或地區2011年-2020年11個主題類別的熱度值年增長率變化趨勢。結果顯示,美國總體呈現兩頭(即2011年-2012年與2019年- 2020年)普遍高,中間期(2013年-2018年)趨于平緩或有所下降態勢,這說明美國在腦卒中研究領域較活躍。2011年-2012年,其主題熱度增量主要體現在“流行病學”“院前救護”“功能評價”“危險因素”;2019年-2020年,其主題熱度增量主要體現在“院前救護”“溶栓治療”“研究綜述”。

中國大陸地區在2011年-2020年腦卒中研究始終保持正增長,其中2011年-2013年、2019年-2020年為快速增長期。2011年-2013年,中國大陸地區腦卒中研究熱度幾乎在每一研究主題類別領域都處于快速增長階段,以“分子遺傳病學”“流行病學”“動物實驗”“危險因素”“功能評價”“指南推薦”“院前救護”“溶栓治療”“研究綜述”最為突出。2019年-2020年,主題熱度增量主要體現在“分子遺傳病學”“動物實驗”“研究綜述”“功能評價”。

日本在腦卒中研究領域,2011年-2020年各主題類別的年增長率均呈正、負增長交替波動狀態,且部分主題類別波動幅度明顯,如:“動物實驗”在2012年、2014年年增長率高達60.82%、90.22%,2013年、2015年則為-32.87%、-25.81%;“院前救護”在2011年、2012年年增長率高達42.63%、61.77%,2013年則為-36.72%;“卒中康復”在2012年年增長率為-36.39%,2013年則為61.80%。從總體發文量來看,除2012年、2014年、2017年外,日本基本呈正增長,其中2018年-2020年增長較明顯,主題熱度增量主要來自“功能評價”“危險因素”“臨床研究”“動物實驗”。

3討論

本研究初步探索了文本挖掘技術在文獻計量分析中的應用。對比傳統文獻計量分析方法,利用文本挖掘技術可初步形成新式文本分析框架,有助于從海量繁雜的非結構化數據中進行文本主題分析,從而進一步拓展文獻計量分析方法。計算機深度學習與人工結合,為處理海量的非結構化文獻文本數據提供了新路徑。通過文本挖掘技術分析發現,全球腦卒中研究呈現以下特點及啟示:

3.1 全球腦卒中研究熱度持續增長,中國大陸地區貢獻較大

本研究發現,2010年-2020年,全球腦卒中領域的研究熱度持續增長,發文量逐年上升,其中2010年-2013年與2019年-2020年為兩個快速增長期。進一步對比分析各年份國家或地區的發文占比,2010年-2020年中國大陸地區的腦卒中發文量占全球總量的比例顯著上升,在全球兩個階段的快速增長期,中國大陸地區均做出了較大貢獻。2011年,原衛生部啟動腦卒中篩查與防治工程,并成立腦卒中篩查與防治工程委員會。該組織推動全國工作重心由“治療為主”向“防治結合,預防為主”轉移,形成覆蓋全國腦卒中篩查與防治基地醫院,開展腦卒中篩查,明確高危人群并進行預防管理,積極開展腦卒中防治標準化建設、卒中中心建設等工程。這對腦卒中從基礎研究、流行病學研究、臨床研究向應用轉化起到了重要作用。

3.2 腦卒中研究主題類別逐漸豐富

本研究顯示,無論是從全球看,還是從發文量較高的國家或地區看,“臨床研究”與“卒中康復”在主題類別中始終占據較高比重,二者合計熱度值占比達46.66%,且持續保持正增長。與此同時,總體研究發現,“危險因素”“溶栓治療”“功能評價”“院前救護”等主題類別的研究也呈顯著增長,這表明腦卒中全生命周期關鍵環節、關鍵因素、關鍵防控的研究正在不斷加強,腦卒中防治結合研究已成為全球各國家或地區的共同關注重點。

3.3 我國需加強腦卒中防控領域研究

與較早進入老齡化社會的日本、美國不同,中國作為全世界最大的發展中國家,進入老齡化社會相對較晚但進程更快,中國大陸地區在腦卒中研究主題類別上的增長率分布與日本、美國相比有較大差異,但對比美國、日本近年來的主題熱度值增長變化趨勢,也有值得我國借鑒之處。以2020年的主題熱度值增長率為例,美國在“院前救護”的增長率幾乎是臨床研究的10倍。在日本,研究熱度增長率主要體現在“功能評價”。“院前救護”與“功能評價”預示著發達國家更注重“防”。我國近年來研究熱點則集中在“分子遺傳病學”“動物實驗”等。美國、日本的研究趨勢提示,我國可進一步加大對“院前救護”“功能評價”等防控領域的研究投入,拓展腦卒中前端預防與后端康復研究,優化防治策略,從而降低腦卒中發病率,提升腦卒中患者生命質量。

4 本研究局限

首先,本研究僅從PubMed數據庫中截取2010年-2020年與腦卒中相關的文獻,不能代表同期全球腦卒中的全部研究。其次,本研究將“腦卒中”設定在標題中進行相關文獻檢索也存在一定局限。再次,本研究只摘取文獻第一作者作為基本分析單位,以其所屬國家或地區作為該文獻的國家或地區,并未對跨國研究文獻做進一步分析。最后,本研究未對納入文獻的權威性進行分析,即影響因子、被引頻次等。這些將在后續研究中進一步完善。

猜你喜歡
腦卒中
腎小球濾過率下降與腦卒中類型及預后關系探討
綜合干預對首發腦卒中患者生存質量的影響
康復治療對腦卒中患者偏癱肢體預后的影響
腦卒中患者正壓無針連接式留置針的應用及護理體會
今日健康(2016年12期)2016-11-17 13:04:21
早期護理介入在腦卒中患者構音障礙訓練中的作用
早期康復護理在腦卒中偏癱患者護理中的臨床效果
腦卒中合并腦栓塞癥的預防及護理觀察
良肢位擺放結合中藥熏敷降低腦卒中患者肌張力的療效觀察
針灸配合康復臨床對腦卒中偏癱患者肢體功能恢復的效果探析
主站蜘蛛池模板: 97精品久久久大香线焦| 999精品在线视频| 91久久国产综合精品女同我| 色亚洲激情综合精品无码视频| 国产制服丝袜无码视频| 丁香婷婷激情网| 日韩a在线观看免费观看| 国产精品无码翘臀在线看纯欲| 视频二区欧美| 精品国产自在在线在线观看| av天堂最新版在线| 亚洲黄网在线| 亚洲欧美日韩成人高清在线一区| 中文精品久久久久国产网址 | 久久亚洲中文字幕精品一区| 国产高清在线观看91精品| 性做久久久久久久免费看| 国产欧美精品一区二区 | 国产精品专区第1页| 无码日韩视频| 国产亚洲现在一区二区中文| 亚洲AV无码精品无码久久蜜桃| 538精品在线观看| 成人国产精品网站在线看| 日本一区高清| 在线播放国产99re| 永久免费无码日韩视频| 国产美女在线观看| 久久人妻xunleige无码| 美女毛片在线| 波多野结衣在线一区二区| 一级看片免费视频| 国产原创第一页在线观看| 国模私拍一区二区| 久久精品亚洲中文字幕乱码| 97一区二区在线播放| 亚洲中文无码av永久伊人| 伦精品一区二区三区视频| 国产福利拍拍拍| 不卡午夜视频| 性色一区| 欧美无专区| 新SSS无码手机在线观看| 日韩色图在线观看| 亚洲无码精品在线播放| 久久精品这里只有国产中文精品 | 91啦中文字幕| 91精品在线视频观看| 国产内射一区亚洲| 麻豆国产在线观看一区二区 | 欧美日韩激情在线| 免费人成视网站在线不卡| 香蕉视频国产精品人| 九色综合伊人久久富二代| 99精品伊人久久久大香线蕉| 国产精品无码一区二区桃花视频| 日韩高清成人| 日本成人精品视频| 自拍欧美亚洲| 国产一级小视频| 永久毛片在线播| 99久久99这里只有免费的精品| 欧美在线一级片| 久久频这里精品99香蕉久网址| 一本综合久久| 国产精品免费入口视频| 国产9191精品免费观看| 国产一级精品毛片基地| 国产精品va免费视频| 最新午夜男女福利片视频| 亚洲综合在线网| 最新国产你懂的在线网址| 亚洲精品无码抽插日韩| 亚洲国产日韩在线观看| 国产精品3p视频| 在线视频97| 亚洲Va中文字幕久久一区| 玩两个丰满老熟女久久网| 日韩午夜福利在线观看| AV无码一区二区三区四区| 久久国产精品国产自线拍| 国产成人成人一区二区|