李百合
(中國電子工程設計院有限公司,北京 100000)
根據2019年國民經濟和社會發展統計公報公開數據顯示,我國65歲以上老年人輕度認知功能受損和癡呆癥的患病率分別達到20.8%和5.14%,我國已成為失智癥大國[1]?;颊呒彝ゴ蠖嗖扇【蛹易o理方式,許多患者在生活上難以自理,并且常伴隨精神行為癥狀,給家庭照護者造成很大的負擔[2-4]?;颊叩闹饕彝プo理者對疾病的認知、護理知識掌握,特別是其健康素養以及信息素養成為影響護理質量的關鍵因素[5]。而隨著互聯網與手機的普及,信息量爆發式增長,在網絡環境下進行信息檢索時,通常把日常用語當作關鍵詞進行檢索,搜索引擎會返回大量的無關信息,而且由于醫學專業的特殊性,面對質量參差不齊的專業信息[6],非醫學專業人員在查找、理解及獲取方面存在諸多困難和障礙,難以滿足失智家庭照護者的需求,造成網絡信息檢索的巨大障礙,使得失智家庭護理者相關知識獲取途徑狹窄且不專業。
因此,本文嘗試梳理居家護理難點的核心問題及應對措施之間的關聯規則,構建失智護理專業領域知識庫。將失智護理知識圖譜、自然語言處理、語義分析等技術綜合,研究推薦模型構建。設計與實現面向個人用戶的失智護理自動問答系統。通過上述問題的解決,實現面向失智照護者的專業自動問答系統,解決失智照護人員的實際問題,提升失智照護人員的能力,提高老年人的生活品質。
早在上世紀六十年代人工智能的研究起步時,人們就提出了讓計算機用自然語言來回答人們的問題的設想。1961年,首個回答美國職業棒球大聯盟中有關比賽問題的智能問答系統由Green設計與實現[7]。代表系統有ELIZA[8]和ALICE[9]設計研發的基于模式匹配的問答系統,該系統基于匹配用戶問題與人工定義問題模板來獲得相應的結果。自二十一世紀以來,互聯網開始進入快速發展軌道,包含的信息量呈爆炸式的增長,簡單的信息檢索服務已經不能滿足用戶對搜索結果的要求。問答系統研究的出現正是應對信息過載問題,1994年首個面向互聯網的自然語言問答系統誕生。問答系統分為2類:開放領域的問答系統和特定領域的問答系統。開放領域的問答系統通過在互聯網上檢索到與用戶問題最為相似的問題,然后將相應的答案返回,比如微軟的Encarta3[10]和麻省理工學院研發的Start1[11]等。該系統的本質是挖掘問題的語義,將口語轉變成系統可以理解的形式。當今主流問答機器人大都是基于面向開放領域的智能問答系統實現的。這類系統的缺點是沒有專業知識庫的支撐,只能對有限類型的問題進行回答。開放領域的問答系統對專業(金融、醫護等)的問題無法返回較好的結果。目前醫護領域問答系統分為2種類型:基于傳統檢索技術的問答系統與基于語義技術的問答系統。典型的醫護領域自動問答應用見表1。其中凸顯的關鍵問題:缺乏針對非醫護專業人員知識需求研究;中文領域問答系統研究不足;缺乏基于語義技術的問答系統研究。

表1 醫護領域自動問答應用
由此,面對人工服務存在覆蓋面低、響應速度慢、需要大量的人力和物力成本等問題,基于自動問答的醫護信息搜尋模式對信息資源的利用具有重大意義。因此,特別需要面向非醫護專業人員,基于循證證據整合和知識轉化的方法,收集并重新組織失智照護領域知識,構建失智照護領域知識圖譜并持續更新,搭建國內首套基于人工智能技術的居家照護者遠程智能支持系統,解決照護者專業技能缺乏、多學科專家嚴重不足等多元化問題,達到賦能居家照護者,持續跟蹤的目標,滿足居家照護者以動態需求為導向的個性化服務,為全國失智照護者提供專業支持和案例參考。
居家失智照護輔助工具為基于J2EE平臺、B/S結構的應用系統,用戶端為微信小程序,后臺管理端為WEB。系統整體架構如圖1所示,分為來源層、加工層、存貯層、應用層與展現。系統來源層以護理書籍、科技文獻、患者案例、康復活動等資源為輸入,經過采集與轉換,收集面向核心問題的,形式包括文字、影像、視頻等多種類型形式的失智癥護理領域知識庫素材。加工層是對知識素材進行重新組織與深度加工,通過實體識別、關系抽取、實體對齊和邏輯推理建立不同特征失智老人、護理問題與對應措施的關系,構建出護理領域知識圖譜與問答推薦模型。根據系統數據類型的不同,存貯層設計為2類,其中護理問題及對應措施知識圖譜以圖數據庫形式存儲,系統中其他數據以關系型數據庫進行存儲,有利于減少系統冗余提高問答效率。在應用層通過微信小程序給用戶提供專業測評、智能問答、個性照護方案與案例活動功能,實現照護問題即時問答、通過定期專業測評給予個性照護方案,解決居家失智照護的痛點問題。

圖1 系統架構圖
首要問題是通過全面調研整理出居家護理核心問題,本文從3個方面進行整理:失智照護相關的書籍,如《失智癥照護指南》《老年期癡呆專業照護》等;科技文獻檢索,范圍包括指南庫、失智領域專業網站、CNKI、萬方,選取含失智照護相關推薦建議或干預策略的文獻;相關網站,例如百度知道和論壇以及患者家庭護理者群中聊天記錄。綜合以上3個方面確定困擾家庭失智老人照護者的核心問題及居家現存問題,整理出失智護理問題類及其層次結構,包含7個一級分類與33個二級分類,一級分類分別為:日常生活照護、精神行為照護、安全風險防范、居住環境改善、非藥物療法、照護者減壓、功能維護等7個模塊的照護問題,涵蓋了全部居家失智照護的核心問題。
針對居家失智護理核心問題對照護策略相關的結論進行整合研究,將集成后的證據轉化為針對不同核心問題的照護建議,確定出不同特征失智老人、不同類別核心問題與照護策略之間的關聯規則。然后,通過專家對照護策略及上述關聯規則進行論證。確立失智照護核心問題及照護建議之間的關聯規則,構建居家失智老人照護策略及知識庫。最后,由領域專家對知識進行檢查整理,去除抽取錯誤的知識,合并重復知識,確保構建本體的準確性。目前本體的開發工具很多,本文應用其中斯坦福大學開發的本體編輯工具Protege,是使用最廣泛的本體編輯軟件之一,此外本體的構建采用的是手工構建方法。
交互界面獲取以關鍵詞或句子為單位的自然語言問題,在問答理解模塊需要完成對句子進行預處理,問題理解是語義分析的基礎,包括分詞、去停用詞、特征詞抽取。先采用AC多模式匹配算法抽取詞典內的護理問題實體,若詞典內不包含該實體,則采用相似度計算獲取相似度最高的實體。在分析原始護理數據內容構成基礎上,對問題語料進行詞云圖分析,綜合比較得出系統要回答的問題類別。抽取出的特征詞進入信息檢索模塊,需要判斷對用戶提問意圖,即用戶的提問是查詢疾病的護理措施還是誘因。首先依據劃分的問題類別人工標注各類下少量語料數據,得出問題語料中包含的問題類別特征詞,通過AC多模式匹配算法實現用戶提問字符和問題類別詞的匹配和類別判斷。最后進行答案生成,將獲取的用戶自然語言問題中的實體和問題類別詞封裝成分類字典,將分類字典轉換為Neo4j支持的Cypher語句執行圖數據庫查詢,通過自行設置的答案框架返回用戶所需答案。自動問答模型如圖2所示。

圖2 自動問答模型
根據前期調研,本系統的使用對象年齡分布為45~60歲之間的居家照護者,因此功能與頁面邏輯設計需要遵循適老化設計,提高可用性、容錯性和用戶體驗,利于用戶對產品的接受和增加用戶黏性[18]。系統功能模塊如圖3所示,用戶通過微信授權登錄小程序,可直接選擇使用自動問答功能,支持用戶在緊急情況下快速得到照護問題的解決措施,適用于緊急問題處理場景;用戶也可選擇進行階段測評,系統根據照護對象的個性特征、精神行為問題與日常生活問題,推薦個性化的階段照護方案,適用于長期更迭的照護場景。

圖3 功能模塊圖
系統功能頁面如圖4所示。問答模塊是本系統核心功能,用戶可直接點擊最熱門的問題查看答案,也可以通過輸入文字的方式進行問答,后臺根據用戶的問題,調用后臺程序進行問題理解、信息檢索與答案抽取,給用戶展現照護問題處理措施。發現模塊作為系統的著陸頁面,首要承擔系統的導航功能,因此在視覺重點區布置測評、問答、我的3個模塊的功能入口,方便用戶通過點擊圖標直接進入。同時,系統根據用戶的使用記錄,采用瀑布流形式對用戶進行個性化的案例與專家推薦,用戶可以對感興趣的案例與專家進行收藏。其中案例庫與專家庫是本系統后臺重要的組成部分,案例庫是對多種類型知識進行集成,滿足多種類型用戶需要的數據和操作集合,包括文字、影像、視頻等多種表現形式。測評模塊是系統根據用戶填寫的階段測評,對失智患者進行階段綜合評分與階段照護方案。階段綜合評分包括7大方面的能力測算:復雜注意力、執行能力、記憶與學習、語言表達、感知動作、互動、社會認知。個性化階段照護方案包括生活環境、活動安排、日常生活、異常應對4個方面。

圖4 系統功能頁面
目前醫學領域基于知識圖譜的實踐應用有很多優秀案例,極大地促進了醫學信息化的發展。護理學領域具有大量不同于臨床醫學的專業知識與實踐范圍,構建護理知識圖譜對于提高護理服務質量、改善病人臨床結局具有重要意義。本系統貫穿失智癥的全病程護理,持續跟蹤患者日常與行為問題,提供個性化的護理建議,提高了護理工作的準確度,有效提升護理效率,顯著提升患者的生存質量。語義準確率97%以上,月交互量1 500次以上,全面覆蓋居家照護場景,解決了超過60%的失智照護類問題。針對系統中問題覆蓋度不夠高,用戶側會積累大量的無答案的搜索問題,后端設計了定期對這些無答案問題進行整理,提煉出典型的標準問題,擴充知識庫,從而提升問題覆蓋度進行系統優化。