999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于NLP的醫(yī)療糾紛投訴件分類系統(tǒng)探討

2022-08-06 05:46:20于越董曉睿
中國醫(yī)院院長 2022年12期
關鍵詞:分類文本醫(yī)院

文/于越 董曉睿

基于自然語言算法(NLP)這一智能分析工具,可實現投訴件的快速分類,未來還可生成匹配回復模板,提高工作效率的同時可標準化回復內容。

近年來,醫(yī)患關系成為焦點與熱點,逐年增加的投訴事件使醫(yī)患溝通辦公室壓力倍增,如何快速高效地辨識糾紛類型并給予滿意回復,成為提高醫(yī)院服務滿意度與緩解矛盾的主要途徑之一。然而,目前在這類事件處理中卻存在從事醫(yī)療糾紛解決的溝通人員總量不足、專業(yè)不夠、問題類型繁雜、回復內容有待規(guī)范等諸多問題。

人工智能領域中的自然語言處理技術(Natural Language Processing,NLP),可自動解析語義信息,現已廣泛應用于各行各業(yè),同時也為醫(yī)院業(yè)務處理帶來了便利。通過模型訓練發(fā)現,自然語言處理算法不僅可以對投訴件進行分類、分析和搜索,還可生成匹配的標準化回復模板。

醫(yī)療投訴件分析工具的發(fā)展與挑戰(zhàn)

微軟創(chuàng)始人比爾·蓋茨曾說過,“自然語言處理是人工智能領域皇冠上的明珠”。該技術是由計算機科學、語言學、心理認知學等一系列學科構成的一門交叉學科。自然語言處理技術在醫(yī)院業(yè)務中已經得到廣泛應用,其中最重要的是針對電子病歷(Electronic Medical Record,EMR)的文本處理應用,海量病歷中蘊含了大量信息,電子病歷已成為醫(yī)學研究獲取數據的重要來源之一,自然語言處理算法不僅為研究人員節(jié)省了結構化病例的時間,還可以“讀懂”病歷數據,提高臨床科研效率的同時也能深度挖掘其隱含信息。

IBM在過去6年以來收集了超過100萬名患者近2000萬的病例數據,包含了超過200個參數,通過對電子病歷進行梳理分析,還發(fā)現與疾病發(fā)生十分相關但未在醫(yī)療記錄中輸入的信息,包括患者吸煙盒數、處方藥服用形式、心臟的供血能力等。這些隱含信息可能被醫(yī)生所忽視,但卻無法逃脫自然語言處理技術的分析,其預測算法在一年內發(fā)現了8500名有心力衰竭風險的患者。

自然語言處理不僅可以解析電子病歷,還可處理醫(yī)療糾紛投訴件,協(xié)助答復人員標注內容中的關鍵信息、分類投訴件、自動識別所涉及科室(內科、外科、門急診等)、推薦標準化回復模板等,提高重復和相似投訴的處理速度,完善回復的標準化水平。隨著投訴渠道的完善,近幾年投訴事件逐年提升,以杭州為例,2017—2019年杭州總共受理各類醫(yī)療投訴3155件,并以每年20%的速度增加。北京某三甲醫(yī)院2009—2018年共有5598人次患者進行投訴,也呈現增長態(tài)勢。

第一個醫(yī)療投訴的標準化分析工具(The healthcare complaint analysis tool,HCAT)于2016年誕生,該工具常被用于編纂和評估投訴件中所反映的問題,根據內容進行分類問題、評估嚴重程度、判斷問題所在階段等以便確定對患者的傷害程度,并對問題進行編碼,協(xié)助管理者發(fā)現服務漏洞和管理缺失等。

目前國內對患者投訴分類沒有統(tǒng)一標準,一般將投訴分為臨床診療、醫(yī)院管理和醫(yī)患關系3大類。臨床診療細分為檢查、診斷、治療和護理等小類,醫(yī)院管理細分為就診流程、醫(yī)院環(huán)境、診療費用等小類,醫(yī)患關系細分為溝通交流、患者權利保障等小類。投訴主體有患者本人、患者家屬、患者朋友或其他關系人。投訴對象有醫(yī)生、醫(yī)技、護士等。

為構建預防為主且標準化的投訴管理體系,無論在處理投訴件中還是事后統(tǒng)計分析,投訴件的快速準確分類都十分必要,門急診投訴的處理速度和方式直接決定患者對醫(yī)院的滿意度,面對繁多的分類元素,內容解讀耗時耗力,也不利于結構化分析。因此,基于自然語言算法的智能分析工具變得必不可少,本文利用成熟的人工智能算法實現了對投訴件的快速分類,未來還可增加對投訴件嚴重性的分析功能。

分類系統(tǒng)數據處理

投訴件屬于非結構化文字信息,在訓練模型前必須對其進行預處理,這也是文本數據分析的重點和難點。隨著醫(yī)院信息化的迅速發(fā)展,投訴件大多以電子文檔形式提交并儲存,這為數據預處理提供了便利的條件,醫(yī)患溝通部門在過去累積了大量的電子版投訴件,為模型訓練提供了充足的語料資源。

收集到充足的數據后,預處理任務分四步展開:第一步,先將投訴文本進行分詞處理,在對比jieba(結巴)、THULAC、FoolNLTK及HanLP后,本文采用較為成熟的HanLP工具,在文本分詞時,為實現速度與精度的最佳平衡,采用HMM-Bigram算法和N-最短路分詞。分詞的同時進行詞性標注,給字詞打上標簽,如形容詞、動詞、名詞等,詞性標注基于最大熵和最大概率。

第二步,語料清洗將視為噪音的內容剔除,僅保留主要內容,去除的部分包含人稱、代詞、日期、停詞、語氣詞、標點等內容,例如“綜上所述”“總的來說”和“由此可見”等。投訴件中最常見的停詞有“某某先生”“某某女士”以及電話號碼等聯系信息。清洗方式主要分為兩種,分別是人工處理和代碼腳本。人工處理方式較為靈活且準確度高,缺點是耗時且成本高。腳本代碼則根據規(guī)則自動運行,快速剔除無關內容,但缺點是靈活度不夠且準確度較低。

經過前兩步處理,投訴件A“自己母親胡某2018年12月15日在心理科住院,在走廊走動時被醫(yī)生撞倒導致右上臂骨折,當日轉入骨科治療,其認為責任完全在醫(yī)院,要求醫(yī)院給予解決住院費用”。投訴件B“王某2018年6月17日在我院看病,發(fā)現多位醫(yī)生要求病人從醫(yī)院內的醫(yī)藥連鎖店買藥,不允許使用社保卡,對此表示不滿,現要求給予自己一個合理說法”。投訴件C“因心梗2018年11月13日在心內科搶救,情況穩(wěn)定后等待搭橋手術,護士將其他患者降壓藥給予服用,身體出現食欲不振、憋氣、腹瀉、心率加快等不良反映,家屬認為醫(yī)院存在藥物錯用情況”轉換為字詞組。

投訴件A“費用問題,相關答復,心理科,住院,在走廊,走動,醫(yī)生,撞倒,導致,右上臂,骨折,骨科,治療,責任,醫(yī)院,住院,費用”。投訴件B“流程問題,相關答復,我院,看病,醫(yī)生,病人,醫(yī)院,醫(yī)藥,連鎖店,買藥,不允許,使用,社保卡,表示,不滿,要求,給予,說法”。投訴件C“醫(yī)療事故問題,相關答復,心梗,心內科,搶救,搭橋手術,護士,患者,降壓藥,服用,身體,食欲不振,憋氣,腹瀉,心率加快,不良反應,家屬,醫(yī)院,藥物,錯用”。

第三步,在分詞結果中剔除重復部分,確保每個詞語僅出現一次,生成總詞表。

第四步,遍歷所有投訴件,若總詞表中的詞出現在某一投訴文本中,則對應位置標1,沒出現則為0,構成以字詞為橫坐標以文本號為縱坐標的矩陣,每件投訴文本可看作是由1和0構成的向量。

預處理之后,特征提取是模型訓練的重要步驟,特征以文本形式表現,將具有較強語義的字詞納入為一個特征集,特征集可以保留全文大部分信息,有利于分類文章,未納入特征集的內容可導致部分語義信息的丟失,但對分類問題影響較小。投訴件字數通常在100字到500字間,屬于較短的文本,為實現相對準確的分類,本文采用詞袋模型提取文本特征,每個不同的詞都被收入詞庫,且記錄出現頻率,例如投訴件D“許先生反映:2018年6月6日下午5點半左右自己帶孩子到醫(yī)院看鼻子,掛號耳鼻喉科,醫(yī)生只是用鑷子檢查了一下,就收取前鼻鏡檢查15元,醫(yī)生稱是鑷子消毒費,對此不滿,認為醫(yī)院存在亂收費現象,要求投訴該醫(yī)院亂收費”,該件中多次出現包含“鼻”,如“鼻子”“耳鼻喉科”“前鼻鏡”,“收費”也多次出現,某一字詞超過頻率閾值都可被認定特征,詞袋特征將文本視為一個無序集合,文本分類基于特定字詞出現的頻率,上述投訴件的詞袋特征如表1所示。

表1 特征詞歸納

經過文本數據預處理步驟,文本中還存在大量的無語義助詞或字,例如,“的”在文本中出現的次數較多,但其對文本分類的貢獻價值卻很低,為了避免此類字詞的干擾,本文還使用了TF-IDF特征選擇算法進一步過濾特征,TF是詞頻Term Frequency,代表某個詞在當前文本中出現的頻率。IDF是逆文本頻率指數Inverse Document Frequency,其計算方式為文本總件數除以包括該詞條的文本件數。

經過TF-IDF處理,特征的重要性與其在當前文本中出現次數成正比,同時其重要性隨著它在所有文本中出現的頻率成反比。字詞在某種類別的文本中出現的次數越多,表示該詞條與該種文本類型的相關性越高。若該詞或字在其他文本中出現的次數越少,則表示其對于分類的重要性是真正的高,因為該字詞僅與某一類型的文本相關性強。經過TF-IDF處理,諸如“的”的問題就可被緩解,過濾后的特征文本更有利于分類投訴件,表2以收費問題為例,列舉了比較重要的特征文本。

表2 收費問題特征值列表

數據源包含2000余條投訴件,并已被人工標注10類,本文采用監(jiān)督式機器學習的模型訓練算法,為保證每種投訴類型都有充足的訓練數據,選取樣本總數前6的類型進行訓練,投訴類型分別為“收費問題”“就診流程”“設施環(huán)境”“醫(yī)療事故”“服務態(tài)度”和“紀檢”,樣本數如表3所示。

表3 樣本數量

分類算法采用多類文本分類支持向量機算法(Support Vector Machine,SVM),其在解決小樣本、非線性及高維模式識別中具有優(yōu)勢。SVM本為二分類算法,在處理多分類問題時,需要構造多類分類器。在訓練時依次把某類投訴歸為正集,其余幾類投訴歸為負集,6類源數據構造出6個SVM,分類時將未知類型的新投訴件劃分為具有最大分類函數值的那類。

“收費問題”“就診流程”“設施環(huán)境”“醫(yī)療事故”“服務態(tài)度”“紀檢”簡稱為A、B、C、D、E、F,訓練過程如下:(1)A為正集,B、C、D、E、F為負集;(2)B為正集,A、C、D、E、F為負集;(3)C為正集,A、B、D、E、F為負集;(4)D為正集,A、B、C、E、F為負集;(5)E為正集,A、B、C、D、F為負集;(6)F為正集,A、B、C、D、E為負集。使用這6個訓練集分別進行訓練,然后得到6個結果文件。在分類新投訴件時,把測試向量分別通過6個訓練結果文件進行計算,得到f1(x)、f2(x)、f3(x)、f4(x)、f5(x)、f6(x),最終以值最大的一個作為分類結果。

源數據分3個集合,分別為訓練集、驗證集和測試集。訓練集用于擬合源數據樣本。驗證集用于調整模型參數,并對模型分類的能力進行初步評估,驗證數據集可以幫助尋找最優(yōu)的網絡深度,并決定反向傳播算法的停止點。測試集用于來評估模模型的泛化能力,但不能作為調參、選擇特征等算法相關的選擇的依據。

2000余條投訴件在數據規(guī)模上不算充足,為了得到更可靠穩(wěn)定的模型,防止某類投訴件在訓練集、驗證集或測試集中扎堆出現,使得其他集合中缺乏該類投訴,本文加入交叉驗證環(huán)節(jié),采用10折交叉驗證法,將樣本數據分割成10個子集,1個子樣本作為驗證集,1個子集作為測試集,其他8個子集用來訓練。交叉驗證重復10次后,每個子樣本都被驗證且測試過1次,最后平均10次的結果,在不同集合組合中得到了相似的分類效果,分類準確度達到了78%。

未來展望

為促進醫(yī)院信息化建設,規(guī)范醫(yī)療糾紛標準化處理,結合新興技術落地,2018年4月,國家衛(wèi)生健康委印發(fā)《全國醫(yī)院信息化建設標準與規(guī)范(試行)》,同年7月國務院頒布《醫(yī)療糾紛預防和處理條例》。隨著信息化發(fā)展和人工智能技術普及,在投訴件逐年增長的壓力下,事件處理工作在自然語言處理算法和大數據技術的支撐下,不僅可實現投訴件的自動分類,還可生成匹配回復模板,提高工作效率的同時可標準化回復內容。隨著數據的積累,可形成投訴件數據庫,方便查找類似事件的歷史記錄,還可通過自然語言處理技術進行階段性服務質量分析,優(yōu)化醫(yī)務管理,改善醫(yī)療服務??傊匀徽Z言處理作為人工智能領域的重要方向,必然會為醫(yī)療糾紛的預防和處理做出重大貢獻。

猜你喜歡
分類文本醫(yī)院
分類算一算
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
我不想去醫(yī)院
兒童繪本(2018年10期)2018-07-04 16:39:12
數據分析中的分類討論
教你一招:數的分類
萌萌兔醫(yī)院
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
帶領縣醫(yī)院一路前行
主站蜘蛛池模板: 国产女人18毛片水真多1| 综合网久久| 久久99热66这里只有精品一| 久久久黄色片| 97成人在线观看| 东京热一区二区三区无码视频| 国产成人综合日韩精品无码首页 | 午夜久久影院| 亚洲无码37.| 欧美成人免费一区在线播放| 欧美性天天| 国产亚洲男人的天堂在线观看| 巨熟乳波霸若妻中文观看免费| 国产精品国产三级国产专业不| 欧美a√在线| 毛片网站在线播放| 国产自在自线午夜精品视频| 日本不卡在线播放| 天堂va亚洲va欧美va国产| 伊人AV天堂| 亚洲精品少妇熟女| 91精品亚洲| 国产永久无码观看在线| 91精选国产大片| 成人亚洲国产| 国产精品成人不卡在线观看| 亚洲欧美日韩综合二区三区| www.亚洲一区| 亚洲激情区| 在线无码av一区二区三区| 一级毛片免费不卡在线 | 久久a级片| 欧美日韩久久综合| 色成人亚洲| 91精品日韩人妻无码久久| 日本人妻一区二区三区不卡影院 | 高清无码手机在线观看| 特级毛片免费视频| 国产一区三区二区中文在线| 精品国产香蕉伊思人在线| 中文毛片无遮挡播放免费| 久久久精品国产SM调教网站| 91青青草视频| 欧美激情视频一区| 国产精品亚洲αv天堂无码| 欧美无遮挡国产欧美另类| 老司机久久精品视频| 伊人久久婷婷| 精品少妇人妻一区二区| 国产精品人莉莉成在线播放| 欧美精品1区| 亚州AV秘 一区二区三区| 国产亚洲精品91| 国产一区成人| 手机成人午夜在线视频| 亚洲美女操| 亚洲成人黄色在线观看| 亚洲欧美在线精品一区二区| 国产在线专区| 国产久草视频| 一本大道无码日韩精品影视| 国产精品yjizz视频网一二区| 国产自视频| 91综合色区亚洲熟妇p| 亚洲欧美精品日韩欧美| 国产亚洲精久久久久久无码AV| 久久精品中文字幕少妇| 欧美区一区| 久久中文字幕av不卡一区二区| 国产人成午夜免费看| 伊人久久福利中文字幕| 国产一级毛片网站| 91毛片网| 精品一区二区三区视频免费观看| 国产一级毛片网站| 国产精品女在线观看| 欧洲日本亚洲中文字幕| 亚洲乱码视频| 亚欧美国产综合| 日韩专区欧美| 亚洲日韩久久综合中文字幕| 国产精品黄色片|