999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BERT模型的中醫文本分類研究

2021-11-08 13:26:59王培王亞文盧苗苗
電腦知識與技術 2021年27期
關鍵詞:深度學習

王培 王亞文 盧苗苗

摘要:文本分類是自然語言領域一個重要的研究方向和技術核心,一直受到研究者的熱切關注。在醫學領域,中醫源遠流長,在人類歷史發展中發揮著不可磨滅的作用。中醫語言包含了大量中醫領域術語,且多為表述嚴謹和富含辯證思維的古文,上下文詞語關聯性較強,且大多是結構化、半結構化或非結構化數據的形式,這些特點給中醫病案的智能分析分類造成了很大地困難。該文基于注意力機制的深度學習模型Bert模型實現中醫深層全局語義的特征表示,并進行中醫臨床文本的分類研究。最后通過對中醫臨床文本分類實驗的驗證,該模型達到了非常可觀的分類效果。

關鍵詞:文本分類;深度學習;中醫文本;注意力機制

中圖分類號:TP311? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)27-0013-02

Abstract: Text classification is an important research direction and technical core in the field of natural language, and it has always received eager attention from researchers. In the field of medicine, Chinese medicine has a long history and has played an indelible role in the development of human history. The language of Chinese medicine contains a large number of terms in the field of Chinese medicine, and most of them are ancient texts with rigorous expressions and rich dialectical thinking. The contextual words are strongly related, and most of them are in the form of structured, semi-structured or unstructured data. These characteristics give Chinese medicine The intelligent analysis and classification of medical records caused great difficulties. In this paper, the Bert model, a deep learning model based on the attention mechanism, realizes the feature representation of the deep global semantics of TCM, and conducts the classification research of TCM clinical text. Finally, through the verification of the TCM clinical text classification experiment, the model achieved a very considerable classification effect.

Key words: text categorization; deep learning; TCM text; attention mechanism

1 引言

文本分類是按照一定的分類規則對文本進行自動劃分類別的過程,在很多領域它都有著非常廣泛的應用場景[1]。文本分類分為基于傳統機器學習的文本分類和基于深度學習的文本分類。文本分類的核心是文本的處理分類,它有著非常廣的應用前景。

在中醫領域對于文本分類技術的使用和探索從未停止,常被用于中醫藥文本分類、中醫方劑相似度計算等多項任務之中。中醫是以古時候的“天人合一”為指導思想,以陰陽五行理論為工具,研究人體生命變化規律的一門學問[2]。中醫臨床文本承載了名老中醫的臨床經驗,也是為病人臨床決策的重要依據。中醫臨床文本的正確分類對于中醫的蓬勃發展有著重要的意義。本文使用Bert模型對中醫臨床文本進行文本分類研究,該模型的向量表示會隨著上下文的不同而變動,解決了傳統詞向量無法處理的一詞多義的問題。通過Bert預訓練模型可以生成融合中醫深層全局語義的特征表示,并且進行中醫臨床文本的分類工作,最后輸出分類的結果。

2相關研究

文本分類屬于人工智能技術領域,是自然處理領域一個重要的應用,也是文本處理中一個很重要的模塊。文本分類算法的研究就從未停止,在中醫領域的研究者也進行了深入的研究。

顧錚等人[3]將文本分類相關技術運用到中醫方劑相似度的計算上,為中醫藥研究開辟了新的發展道路。王華珍等人[4]使用傳統分類算法針對數據庫中疾病和癥狀的相關知識進行文本挖掘研究,并在此基礎上構建智能診療模型用于智能證型的分類,該模型為中醫輔助診療決策提供了支持。付釗等人[5]研究了基于語義分塊的中醫病情分類問題,實現基于TF-IDF特征的隨機森林病情分類模型和SVM病情分類模型。陳廣等人[6]研究基于關鍵語義信息的中醫腎病病情文本分類問題,使用N-Grams片段的信息熵和關鍵詞提取算法以及文本關鍵語義信息提取方法應用到中醫腎病病情文本分類上。

3 研究方法

語言模型的研究經歷了one-hot、Word2vec、ELMO、GPT再到Bert模型。Word2vec模型訓練出來的詞向量屬于靜態的詞向量,無法表示一詞多義。GPT屬于單向語言模型,無法獲取一個字或者詞的上下文。ELMO為一詞多義提供了一個很好的解決方案,會考慮更多的文本信息,基于給定的上下文動態的生成每個詞的嵌入。Bert模型是綜合ELMO和GPT兩者的優勢,是一個多層雙向Transformer編碼器語言模型,Transformer可以并行訓練所有的字,不僅計算效率很快,而且通過位置嵌入,模型的語言順序的理解能力也比較好。BERT模型具有很多特點:真正的雙向、解決一詞多義、并行運算、泛化能力強等。Bert是一個兩階段模型:第一階段雙向語言模型預訓練,預訓練過程中,可以學習到每個詞對應的上下文信息。第二階段針對具體的任務進行fine-tine模型,使其學到新特征,因此可以在具體任務上打造一個比較好的效果。

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 免费毛片视频| 一级不卡毛片| 久久一级电影| 伊人丁香五月天久久综合 | 一区二区午夜| 色噜噜狠狠色综合网图区| 亚洲中文字幕日产无码2021| 国产精品.com| 久久国产成人精品国产成人亚洲 | 在线五月婷婷| 天堂在线亚洲| 国产高清在线精品一区二区三区 | 国产成人精品一区二区三区| 色呦呦手机在线精品| 国产肉感大码AV无码| 无码免费的亚洲视频| 71pao成人国产永久免费视频 | 97在线国产视频| 久久这里只有精品免费| 黄色网页在线播放| 欧美一区二区福利视频| 在线精品视频成人网| 亚洲成在线观看| 日本欧美在线观看| 最新加勒比隔壁人妻| 亚洲欧洲国产成人综合不卡| 日韩精品欧美国产在线| 日本成人福利视频| 欧美国产精品拍自| 日本一区二区三区精品国产| 亚洲第七页| 2020国产精品视频| 无码不卡的中文字幕视频| 成人蜜桃网| 国产一区二区丝袜高跟鞋| 亚洲床戏一区| 欧美精品在线免费| 欧美在线综合视频| 国产伦精品一区二区三区视频优播| 日韩最新中文字幕| 欧美精品亚洲二区| 尤物午夜福利视频| 国产成人亚洲精品蜜芽影院| 免费人成视网站在线不卡| 亚洲av片在线免费观看| 亚洲天堂自拍| 色精品视频| 国产一区免费在线观看| 天天躁夜夜躁狠狠躁图片| 亚洲天堂精品视频| 思思热精品在线8| 天天摸夜夜操| 欧美亚洲日韩中文| 亚洲自偷自拍另类小说| 国产视频 第一页| 久久www视频| 久热这里只有精品6| 日韩一级二级三级| 福利在线免费视频| 18禁色诱爆乳网站| 欧美一级专区免费大片| 国产精品国产三级国产专业不| 真人免费一级毛片一区二区| 日韩无码白| 久久91精品牛牛| 国产区在线看| 色综合天天综合中文网| 久操中文在线| 999国产精品| 国产精品九九视频| 亚洲第一区欧美国产综合| 婷婷色中文网| 国产在线拍偷自揄拍精品| 亚洲成a∧人片在线观看无码| 欧美成人二区| 久久夜夜视频| 午夜国产理论| 国产成人精品一区二区不卡| 麻豆国产在线观看一区二区| 久久无码免费束人妻| 亚洲精品图区| 国产成人高精品免费视频|