999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能與中醫診斷技術*

2021-12-05 07:54:15徐佳君雷黃偉高新皓羅志明李紹滋翁慧李燦東
天津中醫藥 2021年5期
關鍵詞:信息研究

徐佳君 ,雷黃偉 ,高新皓 ,羅志明 ,李紹滋 ,翁慧 ,李燦東 ,4

(1.福建中醫藥大學中醫學院,福州 350122;2.福建省中醫健康狀態辨識重點實驗室,福州 350122;3.廈門大學信息學院人工智能系,廈門 361005;4.福建中醫藥大學李燦東岐黃學者工作室,福州 350122)

中醫診斷學是中醫學的基礎學科,它的發展影響著中醫各臨床學科的診療,尤受臨床及科研學者的重視,因此也是現代中醫學發展的前沿學科。目前,制約中醫診斷學發展的瓶頸主要有四診信息規范化客觀化采集、中醫診斷術語規范化等方面[1]。中醫四診信息采集過程具相對主觀性的問題由來已久,在許多中醫學者堅持不懈的努力下,取得了一定進展,但仍存在采集過程不規范、標準不統一等問題。中醫診斷術語規范化工作近幾十年來亦受到高度重視,制定了相應的標準,但所制定標準與歷版教材又有一定出入;中醫工作者受教育時養成的既定習慣更改不易,推廣較難;且在歷代中醫典籍醫案中,術語普遍存在一詞多義、多詞一義等情況,以上種種情況造成了中醫診斷術語仍較難統一,不利于傳承和發展。

人工智能(AI)是當前全球研究熱點,AI不僅能替代有邏輯性、規律性的人工,提高工作效率,還能在某些極精細領域中完成人類無法完成的任務,中國已將AI與醫學的結合上升到國家戰略的高度。而早在20世紀六七十年代,許多學者已經開始了中醫診斷的AI化研究,主要方法是建立基于專家知識庫的邏輯推理系統,取得了一定成績,在特定的條件下有較好的應用效果。但基于象思維的中醫診斷學強調整體性與運動性,因而,單純的邏輯規則并不完全適用中醫診斷的推理過程[2]。2016年,Google公司的AlphaGo橫空出世,擊敗了多名圍棋世界冠軍,這一歷史性事件標記著以大數據與深度學習算法為代表的新一代AI的興起。與傳統相比,新一代AI基于大數據的特性顯然更適合中醫學的整體性,其經深度學習而產生的預判也更適合中醫學的運動性。因此,將新一代AI技術運用于中醫診斷學,應有助于其突破前述發展瓶頸。

1 AI與四診信息規范化客觀化采集

1.1 AI與望診 AI望診,目前研究較多地集中在望面及望舌兩個領域,其主要數據來源為圖像,需要通過圖像分割、圖像識別兩個步驟進行。近年來AI望診的研究取得了一定的突破,如基于力場的輪廓變形算法,使舌象分割不易受初始輪廓影響,提升分割準度[3];再如偏最小二乘法在Lab顏色空間對面部光澤的判別準確率可達89.06%[4];又如聯合運用最大類間方差算法及分水嶺算法能夠實現對舌紫斑的自動識別[5]。然而,AI望診離真正的臨床要求尚存在較大差距,目前亟待解決的是光源問題,AI望診的圖像數據幾乎均基于固定角度、固定強度光源,真實世界光源多變,如何使AI算法適應復雜的光源環境仍需進一步探索。

1.2 AI與聞診 在聽聲音的研究中,目前主要研究方法有空氣動力學法、頻譜分析法等。AI聲診不但能夠分辨出諸如咳嗽、聲嘶、聲低等病理性聲音[6],研究者們還運用樣本熵、小波包變換的近似熵等算法,通過聲音得出病位、病性證素等診斷信息[7]。然則,目前中醫AI聲診研究仍存在采集儀器規格不統一、采樣環境要求較高等問題,從科研到落地仍有一段距離。

氣味是氣體所含分子作用于受體所產生的刺激過程,氣味特征可以通過紅外光譜、直接頂空分析、氣相-液相色譜分析等方法直接判別氣體所含的刺激性分子。目前中醫電子鼻技術已具有較高的穩定性和靈敏度,不僅能較準確地識別2型糖尿病患者口腔氣味判斷其虛實病性[8],在胃病及外感疾病中也得到較好的應用[9-10],未來有望參與各個系統疾病的診斷。但相較于聲診,嗅診更難以量化,暫無太多臨床運用的研究報導,尚存在氣味特征圖譜知識庫不夠全面等問題,有待進一步研究[11]。

1.3 AI與問診 問診AI化的研究起步較早,早期多是基于專家經驗、文獻梳理的量表研究,隨著新一代AI的發展,越來越多學者開始關注問診模型的研究。如基于極值隨機森林算法、極限學習機算法的慢性胃炎中醫問診模型[12];基于隱結構法的啟發式雙重爬山算法中醫脾系病問診模型[13]等。然而筆者認為,制約AI問診的瓶頸或許不在于算法模型,傳統的貝葉斯網絡已能較好地揭示證候之間復雜的聯系[14],中醫診斷術語不能統一規范應才是當前AI問診的研究難點[15]。

1.4 AI與切診 切診的AI化研究主要集中在脈診,研究方向有脈象波形采集(傳感器)、特征提取分類(脈象識別)兩方面。傳感器有壓力脈搏型、多普勒超聲脈搏型、光電脈搏型等類型[16];在脈象識別模塊,采用線性插值算法對三維脈沖圖進行處理,可辨別出平脈、滑脈及弦脈[17];基于BP神經網絡的脈診則可直接得出體質等診斷信息[18]。而目前各類傳感器研究雖然取得一定突破,但仍未成熟,尚不能真實、完整、客觀地提前脈搏信息[19];此外,由于脈象信息量巨大的特性,如何有效篩選有用信息的降噪處理,也是研究的難點之一。

在中醫四診AI化的研究中,除了各診存在上述問題外,也存在“通病”,主要是:1)原始資料采集人員中醫臨床水平參差不齊,歸納、標注不統一、不規范,信息數據可信度未能達到最佳。2)除問診外的其余三診,其信息采集皆需檢測設備,然而,基于不同工作原理設計的設備,其采集的信息參數和表達方法均不相同,沒有統一的規范標準,測量結果表達也不同。3)雖然四診AI化研究在各自領域取得了一定進展,但呈現“各自為戰”的特點,未發揮中醫“四診合參”的特色和優勢。

1.5 AI與四診合參 目前關于四診合參AI化的文獻報導較為少見,說明該研究仍處于初步階段[20]。AI四診合參可通過兩個途徑實現:1)規范統一四診采集標準,分別辨識四診所采集信息后再進行歸納分析,但如前所述,目前各家研究原理和采集標準不同,因此較難實現。2)直接采用多格式、多來源(文字、數字、圖片、聲音等)的原始數據直接進行分析,其優點是數據丟失率低,因而相應準確率高,缺點是對深度學習的算法要求更高,目前尚處于探索狀態。由于各診設備尚未成熟,故而直接分析具有異構性的原始四診信息是現階段較為可行的辦法,這就需要多模態的機器學習。值得一提的是多核學習方法,各子特征空間組合成多個核函數的高維空間,因此高維組合空間也具備各子空間的映射能力,異構數據中不同的特征分量也由此得以分別經最優單函數映射到知識層,使之更準確地表達。在此基礎上,采用協同訓練方法迭代出最佳分類器,對訓練數據進行預測,設計基于知識層和決策層的最優化算法[20-21]。

2 AI與中醫診斷術語規范化

對于AI而言,規范化的中醫診斷術語是極為重要的,其意義在于“使中醫數據說普通話”,統一的術語才便于結構化中醫數據,從而轉化為計算機能夠理解的語言。進入21世紀以來,中醫術語規范化取得了令人矚目的成果,但仍存在諸如標準不統一、各科研組織機構未協調統一等問題。因此,有學者提出在協調各機構的基礎上,采用術語學方法并構建同義詞庫是針對目前問題的解決對策[22]。中國中醫科學院信息所從2002年開始,借鑒統一醫學語言系統(UMLS)的結構應用于中醫藥領域,構建了基于本體論的、建立了多層次語義關聯的中醫藥學語言系統(TCMLS),即包含了大型同義詞庫,然而即使是如此耗時十數年、人力物力投入巨大的工程,仍不能說已完全涵蓋歷史長河中浩瀚如煙的中醫典籍中出現的術語[23]。因此,進行基于基準術語庫的AI自然語言處理(NLP),以便實現對各時代的醫案、文獻進行智能讀取,是目前中醫診斷術語范疇內較為可行的方法之一。

目前中醫診斷進行NLP的對象主要是醫案及文獻,其中包含了許多臨床診斷基礎數據。為通過NLP實現中醫診斷術語規范化,那么對信息的充分利用是非常必要的,故而要對醫案進行信息抽取和中文分詞。目前對中醫文本數據進行智能分析的NLP方法主要有隱馬爾科夫模型(HMM)、條件隨機場模型(CRF)等,然而經常面臨數據標注缺失、訓練數據集少造成的準確率不足的情況[24]。

如今人工神經網絡已經被廣泛使用,其中循環神經網絡(RNN)在處理自然語言任務上有著極大的優勢,RNN是一種特殊的神經網絡結構,它是根據“人的認知是基于過往的經驗和記憶”這一觀點提出的。不僅考慮前一時刻的輸入,同時具有對前面的內容的一種“記憶”功能。長短期記憶(LSTM)[25]是一種特殊的RNN,更是解決了長期依賴問題。LSTM主要設置了門結構來實現重要“記憶”的保留與取舍,內部主要有3個門,遺忘門即忘記階段,這個階段主要是對上一個節點傳進來的輸入進行選擇性忘記,簡單來說就是會“忘記不重要的,記住重要的”。輸入門即選擇記憶階段,這個階段將這個階段的輸入有選擇性地進行“記憶”。輸出門即輸出階段,這個階段將決定哪些將會被當成當前狀態的輸出。而為了對語句的分析更加準確,使用兩個LSTM模型,其語句的輸入方向相反,由此可結合成為雙向長短期記憶(BI-LSTM)[26]。基于此再使用CRF則可以用于構造在給定一組輸入隨機變量的條件下,另一組輸出隨機變量的條件概率分布模型。例如在詞性標注任務中,輸入序列為一串單詞,輸出序列就是相應的詞性。

因此,本團隊也利用BI-LSTM-CRF模型對中醫醫案進行自然語言處理。初期的訓練數據集是由團隊帶頭人李燦東教授十余年的臨床醫案構成,并由中醫專家博士團隊進行了醫案分詞標注。通過訓練相應的分詞模型,得到分詞準確率可達到97%以上,遠高于例如Jieba、PKUseg等開源分詞工具,為后續的醫案信息的自動抽取與理解奠定堅實基礎。

分詞后可得到包括部位、性質、程度等最小粒度的中醫診斷術語,基于此的同義詞匹配可使計算機更好地理解醫案信息,以此完成中醫診斷術語的NLP工作,而非陷入近似無窮盡的同義詞庫構建。該部分可以通過中文相似度計算來實現,中文相似度技術是自然語言處理中的一個重要研究方向,其技術有基于統計的相似度計算方法、基于詞向量的相似度計算方法等。基于統計的相似度計算方法最常用的方法為詞頻-逆文件頻率(TF-IDF)計算方法,將文本轉化為向量。TF(Term Frequency)是詞頻,即一個詞在文中出現的次數。IDF(Inverse Document Frequency)是逆向文件頻率,可以由總文件數目除以包含該詞語的文件的數目,再將得到的商取對數得到。基于詞向量的相似度計算方法最常見的就是使用Word2Vec詞向量,通過網絡模型獲得詞向量。由此將文本向量化后,再通過余弦相似度測量兩個向量之間的夾角的余弦值,度量兩詞語之間的相似度。基于統計的相似度計算方法是字淺層面的方法,而基于詞向量的相似度計算方法考慮詞語語義的深層面方法。因此對兩種方法進行加權,結合起來進行對詞語進行相似度計算,綜合考慮詞語的深淺層面,由此完成相似度計算,實現同義詞匹配。

3 小結

綜上所述,基于大數據的新一代AI技術很好地契合了中醫的整體性與動態性,運用于中醫診斷領域,將有望助推中醫診斷技術實現新的跨越與發展。雖然諸多研究者從不同角度進行了許多研究,并取得進展與成就,但仍存在種種問題。首先,原始信息客觀、準確、全面、規范的采集標準缺失,造成臨床數據雖大,但卻不能發揮大數據應該有的作用,形不成數據驅動的效力。其次,中醫四診信息采集過分依靠醫者,或者采集設備不成熟,試圖建立采集設備標準,反而造成了新的標準不統一,制造了新的瓶頸問題。最后,AI重點在于算法的優勢上,四診的AI化雖然取得了進展,但仍處于“各自為戰”階段,真正體現中醫思維的四診合參算法仍需要很長時間進行優化與完善。

猜你喜歡
信息研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 国产精品大尺度尺度视频| 亚洲va欧美ⅴa国产va影院| 国产人人乐人人爱| 成年看免费观看视频拍拍| 国产成人三级在线观看视频| 国产91线观看| 无遮挡国产高潮视频免费观看| 成人精品在线观看| 亚洲综合九九| 国产91小视频在线观看| 日本国产精品| 久久久波多野结衣av一区二区| 久久精品亚洲中文字幕乱码| 日韩国产 在线| 四虎免费视频网站| 欧美精品伊人久久| 国产h视频在线观看视频| 手机成人午夜在线视频| 污污网站在线观看| 在线国产91| 丰满的少妇人妻无码区| 18禁黄无遮挡网站| 中文字幕有乳无码| 国产亚洲精品97在线观看| 国产激爽大片在线播放| 青青青国产精品国产精品美女| 日本精品中文字幕在线不卡| 亚洲成人在线免费观看| 国产玖玖玖精品视频| 国产精品久久精品| 久草性视频| 欧美一级黄片一区2区| 欧美中文一区| 一级福利视频| 91亚洲国产视频| 无码一区二区波多野结衣播放搜索| 国产av一码二码三码无码 | 国产丝袜精品| 亚洲精品手机在线| 中文字幕在线日本| 91精品国产91久久久久久三级| 国产在线日本| 一级毛片高清| 国产乱论视频| 青青草国产在线视频| a在线亚洲男人的天堂试看| www.国产福利| 国产成人亚洲精品蜜芽影院| 婷婷激情五月网| 乱系列中文字幕在线视频| 亚洲AV无码精品无码久久蜜桃| 精品国产三级在线观看| 久草中文网| 国产本道久久一区二区三区| 一本大道视频精品人妻| 91无码国产视频| 欧美a在线看| 精品久久久久无码| 国产成人调教在线视频| 91久久夜色精品| 国产精品黄色片| 亚洲精品成人片在线观看| 欧美a级完整在线观看| 国内精品久久久久久久久久影视 | 中文无码精品a∨在线观看| 91www在线观看| 免费无码又爽又刺激高| 日韩成人在线网站| 国内精品久久久久鸭| 熟女成人国产精品视频| 成人第一页| 日本国产一区在线观看| 中国黄色一级视频| 欧美在线综合视频| 2021最新国产精品网站| 在线亚洲小视频| 亚洲色中色| 毛片一级在线| 亚洲欧美精品日韩欧美| 亚洲日韩高清在线亚洲专区| 成人免费视频一区| 91无码人妻精品一区|