路 薇 ,高 盼 ,翟運開
(1.鄭州大學 管理學院,鄭州 450001;2.鄭州大學第一附屬醫院,鄭州 450052;3.互聯網醫療系統與應用國家工程實驗室,鄭州 450052;4.河南省智能健康信息系統國際聯合實驗室,鄭州 450001)
遠程醫療是解決醫療資源不均衡問題的戰略途徑,因其能夠借助互聯網技術提供跨區域、跨機構的診療服務而得到了蓬勃發展[1-3]。遠程醫療在使用過程中已收集、積累了大量代表患者健康狀況的臨床數據,明顯增加了可用于面向患者決策的數字信息,使得數據驅動個性化醫療服務成為可能。但梳理業界實踐發現,現有遠程醫療服務并未充分利用和發揮其大數據價值。
患者最關心的是如何找到最專業的醫學專家來解決他們的健康問題[4],但對患者而言,為自己挑選合適的專家極具挑戰性,尤其是在沒有合適匹配機制的情況下。面對信息體量的快速增長,由于患者缺乏專業的醫療背景和知識,他們在尋找合適的專家時不知所措[5],面臨巨大的時間和搜索成本,使得問題不能得到及時有效的解決,甚至造成醫療資源的浪費,降低診療效率[6]。目前大多采用調度人員人工分配的方式為患者選擇會診專家,但隨著會診量的增加,人工分配的方式無法保證醫療服務的專業性和質量,加之醫療信息的不對稱性,易引起患者不信任,進而影響醫患關系和患者滿意度。同時,快速變化的制度環境和日益增長的患者自主權之間的障礙使醫生推薦更加復雜化。為此,探究智能化專家推薦方法,為患者推薦合適的會診專家顯得十分必要。
個性化推薦是解決信息過載[7]和知識迷向[8]問題的有效途徑,能夠幫助患者和調度人員過濾掉大量不相關的醫療專家,從專業層面快速準確地找到符合患者需求的遠程醫療專家,降低患者搜索成本,輔助醫療決策,確保醫療服務價值的有效實現,從而為患者和遠程醫療機構增益。目前,醫療保健領域的個性化推薦技術主要應用于在線健康社區,醫療資源的推薦方法主要分為兩類:一類是基于投票評分機制的醫生推薦[9-10],該方法本質上是賦予醫生一個靜態或動態的綜合權威排名,并根據排名為患者推薦醫生;另一類是基于相似性的醫療資源推薦[11-12],此類方法在協同過濾和內容推薦思想的基礎上,借助語義網技術和社交網絡技術來計算患者問題與醫生標簽之間的相似性,并以此為依據為患者推薦相關醫生。
盡管推薦系統已被運用于醫療保健領域,但已有研究也存在以下不足:
(1) 大多患者與醫生之間的交互數據較少,且出于隱私保護,患者不愿在在線平臺上透露過多個人信息,數據稀疏性問題導致患者偏好難以捕捉,從而導致推薦效果不佳[13]。
(2) 僅從患者對醫生的特征偏好以及醫患之間的特征匹配能力出發實施推薦,忽視了患者對不同推薦方式的偏好[10]以及醫生興趣和活躍度及其隨時間的變化[14],導致匹配成本增加,影響整個系統性能。
(3) 忽略反饋機制在推薦系統中的作用,未能形成推薦模型的閉環調整優化,影響推薦結果的時效性及服務質量[15]。
(4) 存在冷啟動問題,新注冊醫生由于歷史數據的不足缺乏展示機會,難以被發現[16]。
同時,以下原因使遠程醫療情境下的醫生推薦仍具有挑戰性:①區別于傳統推薦,極少患者就不同種類的醫療保健項目進行投票或評分,這給協同過濾機制帶來了困難;②健康相關數據較為敏感,在遠程醫療情境下,患者無法獲得其他類似患者的信息,其決策行為不會受到其他患者的影響,這給采用基于社交網絡的推薦系統帶來了困難。
鑒于此,本文在隱私保護前提下,患者被視為獨立個體,提出了一種融合專家活躍度和興趣度以及反饋機制的專家自適化推薦方法。
推薦系統通過推薦符合個人興趣/需求的項目來幫助用戶有效處理信息過載問題,并為用戶提供個性化服務。推薦技術已廣泛應用于電子商務、在線搜索、新聞推送和社交媒體等眾多領域[17],其在醫療領域也逐漸獲得關注,相關技術和方法已應用于醫生及其他醫療資源的推薦,以更好地支持醫療決策。一般而言,有4種類型的推薦系統:基于協同過濾的推薦、基于內容的推薦、基于深度學習的推薦以及混合推薦。
基于協同過濾的推薦是誕生最早且應用最為廣泛的推薦算法,它基于“物以類聚、人以群分”的思想,使用評級將用戶與一群志趣相投的用戶聯系起來,利用用戶-項目行為矩陣計算用戶之間或項目之間的相似性來實施推薦策略。當有足夠的評級信息時,協同過濾技術表現出良好的性能。然而,矩陣稀疏性問題一直是制約其推薦效果的主要瓶頸。當前最廣泛的解決方法是通過收集更多用戶偏好或品味信息來自動預測用戶興趣。Ren等[18]將經常與患者疾病代碼共同出現且高相關的搜索詞結合,為臨床醫生推薦特定患者的搜索詞,以便從患者大量記錄中快速找出所需信息,提高診斷效率。高山等[19]提出了一種融合多種用戶行為的協同過濾推薦算法,根據用戶多種就醫行為下的歷史偏好信息進行推薦,緩解了用戶在單一模式下評分數據稀少帶來的冷啟動問題。但此類方法需要提交大量額外的用戶行為數據,且基于用戶評分的相似性度量亦存在主觀性過強的問題[20]。
為了彌補協同過濾方法的不足,基于內容的推薦方法被提出。它依賴于項目的內容表示來定位與目標用戶喜歡的項目內容相似的項目,并為用戶推薦相似內容。一些研究使用了其他類型的用戶生成信息,如標簽、成員關系和信任關系等以提高推薦的準確性。Ju等[21]根據患者的癥狀、診斷結果、地理位置以及醫生的專業與所在科室向患者推薦科室和醫生;患者的情境信息如性別、季節、數據特征、年齡、保險等也被融入個性化藥品推薦系統中,從而支撐細粒度的診斷與處方[22]。該方法充分展示用戶偏好,但容易導致“信息繭房”效應[23],使用戶無法接觸到其他領域優質內容,不利于創新。
基于深度學習的推薦主要表現為使用神經網絡或基于關聯規則的推薦,前者通過提取并學習數據潛在特征以達到預測效果;后者通過對不同條目的關聯分析挖掘潛在規則,并將關聯項目推薦給用戶。為最大限度地利用發達醫院的先進醫療技術和醫生豐富的醫學知識,Chen等[24]對疾病癥狀進行聚類,并引入Apriori算法對疾病診療規則進行關聯分析,為患者和缺乏經驗的醫生推薦適當的診療方案。此類方法借助元數據挖掘隱含知識,進而產生用戶意想不到的結果,但其關聯規則發現需要大規模數據集且極為耗時,其規則有時難以解釋,質量或難以保證,且深度學習的“黑箱子”特性導致推薦結果可解釋性不足,進而降低用戶信任和滿意度[25]。
兼顧各類推薦方法的優缺點,有學者提出了混合推薦方法[26],用以優化推薦效果。Huang等[27]提出了一種基于協同的醫學知識推薦方法,根據臨床醫生對過去知識項的評價行為所隱含的信任因素來衡量醫生信任情況,并將其融合到協同過濾技術中,以提高推薦質量。李鵬飛等[28]對疾病的藥物治療過程進行建模,將患者歷史用藥數據進行主題聚類,形成藥物功效組合標簽,并借助XGBoost分類模型進行患者藥物推薦。
醫療推薦的核心是患者和醫療資源的內容建模,通過探知患者的信息/服務需求和醫療資源的服務能力,實現面向患者需求和興趣的個性化推送,解決信息過載和知識迷向問題。從用戶建模視角出發,醫療推薦方法可以劃分為主題建模和特征建模。
主題建模是廣泛應用于自然語言處理的強大智能技術,能夠從無序文檔或語料庫中發現主題和挖掘潛在語義[29]。例如:在問答社區中,從用戶發布問題和醫生回答中提取詞項形成用戶模型,依據用戶內容間的相似度得到推薦醫生候選集,并通過LDA 主題模型篩選具有類似專業的其他醫生以擴展候選集,最終通過相似度融合[6,12]、患者決策機理[30]、圖計算[2]等方法為患者推薦合適的醫生;Ali等[31]將患者病史、食物和處方藥物進行本體設計,基于語義Web規則語言和模糊邏輯提取風險因素以確定患者健康狀況,進而從模糊本體中檢索藥品和食物信息,為患者智能化推薦食品和藥品;Gao等[32]利用LDA 主題模型訓練用戶調用記錄來提取用戶和服務的潛在主題,并基于相似用戶形成興趣子集,最后采用服務關聯規則生成感興趣的鏈式模式。
特征建模聚焦主體或服務的細節,將信任、偏好、績效等融入推薦方法中。Yuan等[33]考慮了用戶之間的信任和不信任關系,提出了一種基于深度學習的社會化醫療服務推薦模型來預測醫療服務的可靠性。Pan等[34]提出了患者偏好學習算法,向患有不同疾病的患者提供個性化的醫生推薦;也有學者考慮了患者對不同推薦方式的偏好以及偏好指標之間的相互依賴性[10];患者基本信息、疾病特征及用戶行為也被納入推薦框架[35],構建場景化信息推薦模型,輔助患者獲得更為精準的醫療信息。推薦系統的可解釋性也逐漸被關注,成為增強患者信任的重要手段。深度學習和知識圖譜[36-37]等技術被用來生成準確、可解釋的醫生推薦,從知識圖中提取醫患的交互特征來反映醫生服務質量的個體特征,并將特征輸入深度神經網絡,基于學習得到注意力權重進而生成易于使用和可解釋的推薦結果。
綜上所述,主題建模和特征建模已成為醫生推薦中廣泛使用的方法,推薦解釋也成為增強患者信任的重要手段。然而,當前研究在對醫生特征建模時,大多依托在線醫療或在線問答社區情景,從醫生回答文本集[38]、行為網絡[39]、患者預約記錄[34]、患者評價信息[40]等歷史交互數據中提取醫生特征,單一地聚焦醫生短期內的交互信息或其衍生的評價信息而忽略了長期積累的醫學背景。單一數據并不能完全揭示事物的特征,進而缺乏對決策服務的充分、全面支持[41],而多源數據能夠從不同角度描述事物,實現數據之間的相互補充及印證[42],打破數據孤島[43]。短期知識特征體現了專家近期的關注與興趣變化,長期知識特征體現了專家持續性的特質,相對較穩定。兩者結合能夠更加全面地刻畫專家的領域知識信息,提高推薦的準確性和科學性,尤其是對于短期交互信息不足的醫生而言,長、短期知識的相互補充能夠較為完整地反映醫生特征及擅長領域,更好地支撐管理決策。因此,本文將專家的長、短期知識背景結合進行專家特征表征,不僅能夠全面刻畫專家的知識領域信息,提高推薦的準確性和科學性,也在一定程度上解決了專家推薦中的冷啟動問題。
本文借助患者病歷和專家長、短期知識背景進行特征建模,通過患者特征的相似性獲得初始專家推薦指數和推薦專家集合,并基于專家長、短期知識特征的相似性更新新注冊專家推薦指數和推薦專家集合。之后,融合專家推薦指數、活躍度和興趣度形成專業推薦模型,并將其與效用推薦及反饋機制納入同一框架來構建帶有反饋調節的自適化推薦模型,實現專家推薦的閉環調整與自適更新。這在確保推薦結果準確性和相關性的基礎上,不僅使推薦結果分布向最頻繁、最活躍的專家傾斜進而提升推薦能力,也在考慮患者偏好的同時使推薦更具時效性和自適性。
依據研究目標構建了如圖1所示的遠程醫療專家推薦框架,主要包含4個模塊:①數據集成與預處理。將多源數據進行收集、提取、聚合及預處理操作,以提高數據質量,生成可靠語料庫。②基于電子病歷的患者特征建模。引入停用詞表、自定義用戶字典等對可靠語料進行文本分詞操作,將患者病歷進行文本矢量化描述,并通過挖掘患者與專家診斷背景的契合度實現患者特征到專家特征的映射。③面向長短期知識的專家特征建模。基于專家長期積累的知識背景構建專家長期知識特征模型,基于病歷庫構建專家短期知識特征主題模型,通過挖掘專家知識特征間的相似性,在一定程度上解決冷啟動問題并實現從文檔到隱主題空間的映射。④帶有反饋調節的專家自適化推薦模型構建。在患者特征和專家長短期知識特征的基礎上,融合專家活躍度和興趣度形成專業推薦策略,并根據反饋機制調整不同推薦策略間的關系及動態更新專家屬性,實現推薦模型的動態閉環調整優化,增強推薦模型的可解釋性、自適性及時效性。

圖1 帶有反饋調節的遠程醫療專家自適化推薦框架Fig.1 Adaptive recommendation framework for telemedicine specialists with feedback adjustment
數據來自雙渠道,即遠程醫療平臺中積累的業務數據和在線醫療平臺中的醫生簡介,原始數據較為粗糙,在進行文本挖掘前需對其進行預處理:①提取、整合、存儲相關數據,并對數據進行規范化、完整性檢查,剔除異常數據、基于填補規則補充缺失值;②創建自定義用戶字典以使醫療領域專業詞匯能夠被正確識別;③創建停用詞列表過濾掉對本次研究無意義的詞、數字和符號,進而形成可靠語料,以便后文的數據分析,提高推薦準確率。
本文基于電子病歷進行患者特征建模,形成患者-信息特征模型,并通過患者特征間的交互計算映射獲得專家初始推薦指數,進而形成推薦專家候選集。文本分詞和矢量化表示利用詞的上下文信息將高維語句轉換成低維實數向量,并提取出描述患者特征的關鍵詞,形成患者特征模型。具體步驟如下:
步驟1特征詞標化。患者病歷以專業化的術語組成了患者病癥的特征描述,面對專業性強、表述方式因人而異的醫學術語,本文加載同義詞字典、特征詞字典和停用詞表進行患者病歷規范化處理、中文分詞、文本標注和特征詞提取。這一策略可增強文本的表征力,使得專業術語能夠被正確識別和劃分,壓縮特征空間維度,提高數據處理效率和預測準確性,增強決策魯棒性。
步驟2文本矢量化表示。借助word2vec模型計算文本中每個關鍵詞的向量,并對不重復的詞向量取平均,進而合成句向量表示文本的最終向量[44]。如患者pi的病歷di由f個特征詞構成,其規范化表示為:p.feature_profile=k=1,2,…,f},其中,di表示患者pi的病歷文本,wk為第k個特征詞,其對應的詞向量為:vk={vk1,vk2,…,vkp}。
步驟3特征詞權重計算。詞頻(Term Frequency,TF)是指給定單詞在文本中出現的頻率,而逆文檔頻率(Inverse Document Frequency,IDF)是衡量單詞重要性的指標[45]。據此定義dpi中關鍵詞wk的tf-idf值為:
步驟4文本相似性測度。矢量化的文本可以利用余弦相似度計算文本間的相似度,即各文本與目標文本的相似度Sim(di,dj)。余弦相似度是一種最簡單、有效的向量相似度計算方法,其公式為
步驟5生成推薦專家候選集。以專家診斷過的相似患者的最高相似值作為專家初始推薦指數ini_score,完成患者特征到專家特征的映射,即通過目標患者特征與專家診斷的患者特征之間的相似性映射醫-患背景的相似性。相似患者的診治專家組成初始推薦專家候選集。為推薦優質醫生,需返回高相似度患者的會診專家,但是由于遠程會診患者并不是常見疾病或特征,故設置相似度閾值會限制推薦結果。綜上所述,本文設置以下兩個條件:①統計所有相似專家,將其相似患者的最高相似度作為專家初始推薦指數,并按照初始推薦指數進行降序排序;②從排序結果中取Top-10納入候選集。
病歷庫反映了專家在一定時間段內診療的疾病特征,而網頁上公布的專家簡介表征了專家持續性積累的經驗及長期關注的疾病領域,因此,專家短期知識特征以病歷庫為基礎,專家長期知識特征從專家簡介中提取。
2.3.1 基于知識視圖的長期知識特征模型 基于患者病歷文本相似性確定推薦專家候選集的推薦策略只能發現診斷過與目標患者相似病情的專家,對于系統中新注冊或業務數據較少的專家(統稱為“新注冊專家”),由于業務量少、缺乏足夠的數據支撐,以至于被推薦機會不高。為解決新注冊專家的冷啟動問題,利用知識屬性快速建立專家之間的關聯,即通過計算知識屬性的視圖相似性來表征專家長期知識之間的相似度,并據此更新新注冊專家初始推薦指數,進而增加他們的被推薦機會,在一定程度上緩解冷啟動問題。具體步驟如下:
步驟1特征表示。針對知識的多樣性,根據其所屬領域、研究專長等賦予其不同的屬性,如醫生和疾病之間存在多對多關系,即一個醫生可能擅長多種疾病,一種疾病也可被多個醫生擅長,醫生專長可以用向量表示,且取值為{0,1},1表示醫生擅長該疾病,0表示不擅長該疾病。因此,本文通過計算醫生知識屬性的視圖相似性來表征醫生長期知識領域之間的相似度,構建如表1所示的專家知識屬性矩陣。

表1 專家知識-屬性矩陣Tab.1 Specialists’ knowledge-attribute matrix
步驟2知識視圖相似度測度。根據醫生擅長疾病構建其知識結構,并通過計算醫生之間的知識視圖相似性來預測醫生的能力匹配。基于知識的屬性特征,采用Jaccard系數計算知識之間的屬性相似性,其計算公式為
此外,基于不同知識的貢獻和重要程度的差異性,通過權重對不同知識加以區分,得到加權的Jaccard知識視圖相似度:
式中,ω(a)為知識屬性的權重。為充分利用屬性信息,通過信息熵的大小為屬性確權,權重是從數據中學習的,避免了專家確權的主觀性過強,即
式中:p(a)為屬性a出現的概率;n(a)為屬性a出現的次數。
步驟3新注冊專家初始推薦指數更新。為返回具有相似知識領域背景的專家,設置專家相似性閾值為0.7,若SimKnowledge≥0.7,則返回該專家索引值。同時,更新新注冊專家的初始推薦指數,即
式中:ini_scoreh為符合閾值要求的相似專家的初始推薦指數;q為新注冊專家的相似專家數量。最后,按照相似性排序更新推薦專家候選集。
2.3.2 基于LDA 的專家短期知識特征模型 僅通過尋找相似患者形成推薦專家候選集的推薦策略是片面的,系統中可能存在其他符合目標患者需求的專家。LDA 主題概率模型將專家知識特征映射至隱主題空間,在同一主題下尋找具有相似概率分布的專家,能夠從語義層面有效識別出擅長診治相似疾病的專家,大大降低尋找相似專家的規模和時間成本。因此,本文選用LDA 主題模型凝練專家診斷過的病歷文本,從中識別代表疾病類別的隱藏主題,這些主題代表專家擅長的疾病特征,每個專家屬于一個或多個隱藏主題,生成基于主題的專家短期知識特征描述框架,在語義層面擴展推薦專家候選集。
(1) LDA 主題模型。LDA 模型是一種用于語料庫建模的非監督產生式概率方法,是主題建模[46]最常用的方法,其基本思想[47]是文檔被表示為隱含主題的隨機混合物,其中主題由若干個特征詞以特定概率分布構成。LDA 根據文檔和詞匯的概率分布將高維文本-詞匯矩陣分為兩個低維的文檔-主題矩陣和主題-詞匯矩陣,從而得到文檔的主題分布。一條文本的生成過程可以形式化表述為:①從Dirichlet(α)分布中抽取文檔d下的多項式主題分布θd,即θd~Dirichlet(α);②從Dirichlet(β)分布中抽取主題t下的多項式詞分布φt,即φt~Dirichlet(β);③對于文檔d中的詞wk,從以θd為參數的多項式分布中抽取主題zn,即zn~Multi(θd);從以φzn為參數的多項式分布中抽取文檔d中的第k個單詞,即wk~ Multi(φzn)。概率模型如圖2所示。

圖2 LDA 概率模型Fig.2 LDA probabilistic model
LDA 的建模過程可以描述為每個資源尋找主題的混合,即文檔中的每個詞以特定概率選擇某個主題,并從主題中以一定概率選擇某個特征詞來得到,該過程可形式化為
(2) 專家短期知識特征主題模型。在遠程醫療情境中,一位專家可以診療多名患者,一名患者也可以通過多次申請享受同一位或多位專家的服務。本文側重于由專家診斷過的患者病歷文本組成的專家短期知識,專家與患者對應關系對本文影響不大,故后文不再對醫患對應關系進行強調。鑒于此,本文在隱私保護基礎上,在隱主題空間上構建面向短期知識特征的專家知識模型,其建模過程為:
步驟1整合專家診斷過的患者病歷文本作為專家短期知識背景,進而形成LDA 訓練語料庫,以便于專家短期知識特征模型的訓練與構建。
步驟2通過主題聚類凝練出隱藏的主題topic(t)={topic1,topic2,…,topick}及每個醫生的“文檔-主題”分布d.topic_profile={t1,t2,…,tk},k為經過LDA 主題聚類出的主題數。
步驟3LDA 主題聚類生成的“主題-詞項”概率分布可完成對專家短期知識特征的表達:d.feature_profile={
步驟4基于“文檔-主題”概率分布的相似性得到與推薦專家候選集中具有相似知識特征的專家,并以此作為面向專家短期知識特征的推薦指數short_score,這些相似專家也具有診療目標患者的能力。
在LDA 模型中,采用服從Dirichlet分布的主題概率向量來衡量,若使用余弦夾角來計算文本相似度就失去了主題模型的優勢。KL 散度作為一種衡量兩個概率分布差異性的方法,常被用來計算文檔主題分布向量的相似度[48]。則兩個分布P和Q的KL散度為
但由于KL散度的不對稱性使其不能用作距離測量,即DKL(P‖Q)≠DKL(Q‖P),故作為KL散度的變形,具有對稱性的JS散度被提出并彌補KL散度的不足。DJS∈[0,1],DJS的值越小,表示兩個分布越相似,當兩個分布相同時,DJS=0。則兩個分布P和Q的JS散度為
兩個分布越相似,DJS的值越小,因此,為了方便進行相似度計算,對JS散度值進行轉換,轉換方式為
式中:ε為調節因子;相似度取值范圍為[0,1]。
患者并不是被動地接受服務推薦,而可以提出自身需求和偏好,并在需求得到滿足后對服務質量進行評價;將患者反饋及服務結果反饋給推薦系統能夠更新專家屬性值,進而優化后續推薦結果,這就由反饋機制決定。同時,被推薦者的興趣度和活躍度會隨著時間的推移發生變化,進而影響推薦效力。鑒于此,本節將專家活躍度和興趣度及反饋機制納入推薦框架,以實現推薦系統的可解釋性及動態閉環調整,在考慮專家個體行為和患者偏好的基礎上保證推薦系統的時效性與自適性。
2.4.1 融合專家活躍度和興趣度的專業推薦 為充分考慮專家的個體行為變化,本節融合專家推薦指數與專家活躍度和興趣度,構成基于患者病歷的專業推薦方法,使推薦結果分布向最頻繁、最活躍的專家傾斜,增強推薦系統的時效性。
(1) 活躍度。活躍度已成為在線醫療和在線問答社區中識別關鍵用戶及衡量專家績效的重要指標,其受時間、回答數量、響應速度等眾多因素影響[16,49]。推移到遠程醫療情境中,可以解釋為專家在一段時間內會診病歷越多,間隔時間越短(以天為單位),專家在平臺中越活躍,其愿意開展遠程醫療服務的可能性越大。因此,在考慮相似性的基礎上,還應考慮專家在平臺中的活躍度,使推薦列表向活躍度高、具有較大熱情的專家傾斜,提高推薦效力。借鑒文獻[50]對最近活躍度的定義,本文的專家活躍度以患者最新需求發布時間及專家最近活躍時間的差值來衡量,差值越大,專家活躍度越低,即
式中:T為專家會診時間的合集;tc為目標患者申請時間;tl為該專家上次會診時間。為避免分母為0,本文將時間間隔擴大一個單位。為了降低專家最近活躍度的跳躍性,本文將專家最近活躍度做如下處理:
式中,ACmax為最活躍專家的活躍度。
(2) 興趣度。興趣反映用戶對客觀事物的選擇態度,表現為個體認識、接近、獲取客觀事物的意向和態度[51]。如何衡量并理解用戶的興趣與偏好,是推薦系統成功的關鍵[25]。會診數量可以看作專家對遠程醫療服務的顯性反饋,是專家興趣行為的表現。隨著會診頻次的增加,專家表現出對遠程醫療較高的偏好和興趣,此類專家更加信任和愿意服務于遠程醫療患者,這使得可以根據專家的會診頻次來動態衡量專家對遠程醫療的興趣。同時,相關理論研究表明,興趣會隨時間的推移而發生變化,呈非線性衰減[52-53]。因此,考慮到會診的頻率和時間,將時間信息加入推薦算法,采用指數時間衰減函數對會診專家Sj的興趣度Ij進行動態建模,即
式中:T為當前時間段;Nj(t)為專家Sj在t階段的會診次數;N(t)為t階段的總會診次數;αj為指數衰減常數,用于控制時間衰減率,由專家會診頻次擬合曲線得到。
為消除權重系數融合時量綱的影響,進一步對興趣度進行處理,得到專家的興趣度,即
式中,Imax為表現出最高興趣的專家的興趣度。
如上所述,在推薦指數的基礎上融合專家活躍度和興趣度進行推薦,使推薦結果分布向最近、最頻繁的專家傾斜,具體表達式為
式中,γ1和γ2分別為活躍度和興趣度的權重系數,且γ1+γ2=1。具體應用中,兩權重設為參數,可對線性融合方案進行靈活設置。
2.4.2 帶有反饋調節的融合推薦 服務質量關乎患者就醫體驗和滿意度,是患者就醫選擇決策的重要激勵因素[54]。僅關注相似度的專業推薦方案可能會推薦服務質量較差的專家,影響患者就醫體驗和感知質量,因此,提出兼顧專家專長相似性和服務質量的融合推薦方法至關重要,既能滿足患者的基本需求,也能向患者推薦服務質量高的專家,從而使患者獲得優質醫療服務,增強患者滿意度和依從性。這也與患者關注的醫療服務質量分類相對應,現有研究將醫療服務質量分為技術質量和功能質量兩類,前者主要指與醫療技術相關的因素,而后者與服務交付過程有關[55]。在本文中,技術要素反映為基于專長相似性的專業推薦prof_score,功能要素反映為基于服務質量的效用推薦qos_score。
反饋是需求與服務匹配中閉環控制的重要環節。融合推薦將專業推薦策略、效用推薦策略和反饋機制納入同一框架,實現推薦模型的閉環調整優化,增強其可解釋性及自適性。本文的反饋機制包括患者反饋和結果反饋,患者反饋又進一步劃分為主觀反饋和客觀反饋。主觀反饋是指患者在得到推薦結果前對不同推薦方式的偏好反饋,即根據患者主觀反饋調整患者對專業推薦策略和效用推薦策略之間的偏好關系,以優化推薦排序,使推薦結果關注權重更高的內容,形成可解釋性推薦策略。在對推薦指數進行規范化處理后,將上述推薦指數進行線性融合,具體表示為
式中:prof_score′=prof_score/prof_scoremax;ωp和ωq分別為患者對專業推薦策略和服務質量的偏好權重,滿足ωp+ωq=1。在具體應用中,可以借助簡單的問題詢問患者的推薦偏好來降低計算復雜度和時間,進而將患者偏好轉換為對應的數字。
客觀反饋是指患者在服務完成后的事后評價反饋,患者根據服務過程中的感知質量對醫療服務作出評價,即患者感知效用值,體現了患者對醫療服務和專家的滿意度,是對專家客觀QoS(Quality of Service)值的反饋調整。如qos1,j,qos2,j,…,qosm,j是m位患者對專家Sj的綜合客觀QoS評價值,患者Pi在服務完成后作出qosi,j的反饋評價,通過患者反饋進一步調整更新專家Sj的客觀QoS值為
經標準化后轉換為患者感知反饋效用指數為
式中,qosmax為所有專家的最高評價值。
最后,基于患者客觀反饋更新專家QoS值,并在服務完成后,基于結果反饋同步更新專家的活躍度和興趣度,形成帶有反饋調節的遠程醫療專家自適化推薦模型,實現推薦模型的動態閉環調整優化,在考慮患者偏好的基礎上,為患者推薦相關且活躍的會診專家。
本文的臨床試驗數據從國家遠程醫療中心獲得,其依托鄭州大學第一附屬醫院展開運營;專家簡介信息從“好大夫在線”平臺爬取,作為補充數據刻畫專家長期知識背景。醫療機構行政部門設置不同會導致科室劃分的差異,引起申請醫生對申請科室的不確定性和模糊性,且內科和外科是醫療領域兩大科室,門類多樣且交叉、數據量大。因此,本文不考慮科室的具體分支,選取內科和外科兩個部門的業務數據作為實驗數據進行分析。首先,根據鄭州大學第一附屬醫院官方網站公布的科室分布情況,將具體科室劃分為內科醫學部、外科醫學部、綜合醫學部、婦產科醫學部、老年醫學部等12大類;然后,根據研究目的,提取內科和外科醫學部兩個部門下屬醫生的會診數據。為充分保護患者隱私,本文盡可能壓縮數據空間,提取了包含會診時間、診斷結果、專家名稱和科室4類屬性的數據集,采集2021年全年數據共9 078條,其中,會診專家252人,患者8 510人,經審查證實了會診專家與患者的多對多關系。每月會診量分布情況如圖3所示。

圖3 會診量分布情況Fig.3 Distribution of teleconsultations
之后,對采集數據進行預處理操作。將同義疾病名稱用醫學領域的具體術語進行替換,例如:“呼衰”替換為“呼吸衰竭”,“HBV”替換為“乙肝”,保證數據的一致性;同時,采取2.3節提到的頻次統計方法進行缺失值填充,保證數據的完整性;使用Python中的Jieba包進行中文分詞,且在分詞處理過程中優化搜狗輸入法詞庫中的醫學詞匯大全來構建用戶詞典以識別專業醫學詞匯,如“類風濕性關節炎”“系統性紅斑狼瘡”的正確識別;在哈工大停用詞表的基礎上,根據實際情況加入對本文無用的詞匯進行停用詞剔除,過濾掉無實際意義且對本文分析無用的詞、數字和符號等,以支持文本向量化,提升推薦效力。
3.2.1 實驗設計 通過設計多個對比實驗來評估本文所提出方法的性能,這些對比實驗主要圍繞兩個方面展開:①實驗驗證。主題數量K顯著影響LDA 主題模型的聚類效果,統計不同主題數量下的模型困惑度,確定最優主題個數,使LDA 模型建模性能達到最優。②對比分析。將本文所提出的融合策略與傳統的基于內容的推薦策略進行性能對比分析,計算患者不同主觀QoS反饋和不同推薦項目數量下推薦結果的準確率(Pre@N)、召回率(Rec@N)、相似度(Relevance)、活躍度(Activity)和興趣度(Interest)。
3.2.2 評價標準 采用Top-N推薦系統中廣泛使用的準確率、召回率作為推薦策略性能的評價指標,并通過推薦結果相關性、活躍度和興趣度的對比分析來檢驗模型性能。準確率表示正確推薦項目占所有推薦項目的比率,召回率表示正確推薦項目占樣本中應檢索到項目的比率。兩個評價指標的計算方法為:
式中:TP表示正確判別項目;FP表示錯誤判別項目;FN表示假陰性,即錯誤項目被推薦。準確率和召回率越高,模型的推薦性能越好。
相關性是指推薦專家診斷的患者與目標患者間的相似性,相似程度越高表明專家越適合為目標患者提供遠程醫療服務;活躍度是指專家在遠程醫療活動中的活躍程度;興趣度是指專家對遠程醫療活動所表現出的行為興趣。這3個指標的計算方法可由章節2得到。
3.3.1 參數選擇 為獲取較優模型,實驗需先確定模型參數。對于主題模型,主題個數的取值對建模質量和主題生成十分關鍵。若直接根據經驗給定主題數量,可能導致LDA模型的性能不能達到最優,大大影響推薦效果,因而需采取科學的手段選擇主題數量。本文采用困惑度選擇主題個數,根據肘部法則選取主題數量,實驗結果如圖4所示。其中,橫坐標表示主題個數,縱坐標表示LDA 模型的困惑度。由圖4可以看出,當K=14時,LDA模型的困惑度最低。

圖4 困惑度Fig.4 Perplexity degree
對于線性融合模型,主要體現在專家活躍度和興趣度的融合以及不同推薦指數的融合。不同的權重系數通常導致不同的結果,因此,在具體實踐中可將融合系數設為參數,根據應用場景進行靈活設置。此外,由于專家活躍度和興趣度的融合不是本文重點,為公平起見,本文在實驗中遵循兩邊相等的原則[56]進行融合,即γ1=γ2=0.5。推薦指數的融合系數則通過下文對比實驗獲得。
3.3.2 對比實驗 本實驗選取2021年12 月31日的數據集作為測試數據對算法進行測試,并通過不同情境下的對比實驗來評估融合推薦模型的性能,若專家簡介中包含目標患者疾病標簽則視為正確推薦。
(1) 權重系數對融合推薦策略的有效性檢驗。推薦熱度是根據患者投票、醫生回復率、口碑和患者滿意度等多指標按照一定規則融合計算的結果,能夠綜合反映醫生的服務質量。因此,本文提取好大夫在線的醫生綜合推薦熱度作為各專家的初始服務質量評價值。不同偏好權重ωq下融合推薦模型的推薦性能結果如圖5所示。其中,N=10為專家推薦返回結果的個數,pre@10 為推薦準確率,Rec@10為召回率,橫坐標表示ωq的不同取值,縱坐標表示百分比。

圖5 不同權重偏好下的融合推薦模型性能Fig.5 Performance of the fusion recommendation model with different weight preferences
由圖5可以看出,融合方法的推薦準確率和召回率在ωq≤0.4時保持較高水平。隨著權重系數ωq的不斷增大,推薦結果的準確率和召回率呈整體下降趨勢,其中ωq增加意味著患者對服務質量更為重視,削弱了醫、患現實背景對推薦結果的影響,進而影響了推薦模型整體性能。因此,在進行專家推薦時不應過分強調患者感知效應。
(2) 推薦結果個數對推薦模型的有效性檢驗。專家推薦根據患者病歷文本的相似性來實施專家推薦,這是典型的基于協同過濾的推薦方法。因此,為檢驗融合推薦模型的性能,本文采用基于協同過濾的推薦方法作為基準方法。本實驗分別對基準方法和本文所提出的融合推薦方法進行建模,通過分析不同推薦結果個數下兩種推薦方法的準確率、召回率、相關性、活躍度和興趣度來評估模型性能。經過上節實驗驗證,當ωq=0.4時達到最佳實驗效果,故在模型對比分析過程中設定ωp=0.6,ωq=0.4。模型在準確率和召回率上的對比實驗結果如圖6 所示。其中,橫坐標表示專家推薦返回結果的個數,即Top-N中N的取值,主縱坐標表示準確率,次縱坐標表示召回率。

圖6 推薦結果的準確率和召回率對比Fig.6 Comparison of Precision and Recall of recommended results
根據準確率的定義,一般情況下,對于同一算法,N取值越大,其推薦結果的準確率越低[24],即準確率隨著N值的增加呈下降趨勢。由圖6 顯示,pre_融合>pre_基準,表明融合方法在會診專家推薦中表現出較高的準確性,能夠準確地為患者推薦合適的會診專家,提高了推薦結果的準確率。同樣地,融合推薦方法在召回率上也表現出較高的性能。綜上可知,本文所提出的融合方法提高了專家推薦結果的準確率和召回率。
圖7所示為基準模型和融合模型在推薦結果的相關性、活躍度和興趣度上的對比。其中,橫坐標表示推薦返回結果的個數,縱坐標反映推薦結果的相關性、活躍度和興趣度。由圖7顯示,融合推薦方法的推薦結果在專家的相關性、活躍度和興趣度上均優于基準模型,表明融合推薦模型能夠在保證推薦準確性的基礎上,為患者推薦相關且活躍的專家,進一步證實了本文所提出方法的有效性。

圖7 推薦結果的相關性、活躍度和興趣度對比Fig.7 Comparison of Relevance,Activity,and Interest of recommended results
3.3.3 實驗結果分析 從數據集中隨機選擇一患者P0(“上消化道出血,心力衰竭,高血壓***”)作為目標患者進行推薦,以驗證本文所提出方法的可行性。
首先,對目標患者病歷及數據集中所有患者病歷進行矢量化表示,并計算目標患者與其他患者病歷文本的相似性,結果如表2所示。據此,根據相似性排名取TOP-10納入推薦集合生成初始推薦專家候選集S={S13,S208,S23,S189,S249,S203,S178,S39,S74,S188}。

表2 目標患者相似性Tab.2 Similarity of the target patient
其次,新注冊專家歷史記錄不足導致其缺乏被推薦機會,本文引入專家長期積累知識,即專家簡介作為補充來充分刻畫專家知識特征,通過計算新注冊專家與候選專家長期知識視圖的相似性,更新專家推薦指數并擴展初始推薦專家候選集,以解決新注冊專家的冷啟動問題。假設將會診量低于10例的專家定義為新注冊專家,根據相似性閾值Simknowledge≥0.7 篩選到5 位相似專家,分別為:S40、S87、S209、S102 和S250。相應地,更新其初始推薦指數為:
進而形成新的推薦專家候選集:S′={S13,S208,S40,S87,S209,S23,S189,S249,S203,S178,S39,S102,S250,S74,S188}。
然后,LDA 主題模型使用數據集中醫生診斷過的所有病歷進行訓練。設置topic=14,迭代次數=500,每個主題下展示前10 個高頻詞。根據文檔-主題分布劃分各專家的歷史診斷記錄,根據分布相似性尋找系統中可能存在的其他符合目標患者需求的專家。部分結果如表3所示。

表3 專家間主題相似性(部分)Tab.3 Similarity of topic distribution among specialists (partial)
最后,將專家活躍度和興趣度納入推薦系數,依據會診頻次擬合專家興趣衰減系數,并根據會診時間和頻次計算專家活躍度和興趣度,同時考慮患者感知效用,進而構建遠程醫療專家推薦模型,通過計算得到最終推薦結果為:{S23,S13,S241,S2,S68,S39,S100,S141,S178,S95},其中融合系數為:ωp=0.6,ωq=0.4。
本文所提出方法成功為目標患者推薦了10位遠程醫療專家。經審查,這10 位專家在治療消化道、胃腸、心血管等領域具有豐富的臨床經驗,符合目標患者治療需求。同時,推薦結果實現了專長相似性、專家興趣度和活躍度及患者效用反饋的有機融合,共同作用于推薦結果的可接受性:例如:專家S23在相似性和積極性上略低于S13,但其推薦熱度為4,使其在患者良好反饋的助力下得到優先推薦;同時,S13和S2雖然被優先推薦,但其推薦熱度低于S68和S141,其在較高的相似性和積極性的推動下被優先展示。再者,目標患者原會診專家S39也在最終推薦列表中。此外,對比發現,最終推薦結果與前兩階段推薦專家候選集均存在一定差異,也驗證了專長相似性、專家興趣度和活躍度及患者感知效用共同作用于推薦結果的可接受性。以S102為例,新注冊專家未出現在推薦列表中,可能因其患者反饋較差,生成較低推薦指數,進而導致其在推薦列表中位次降低,而在其他策略中,如ωp=0.9,ωq=0.1,S102得到了推薦。這說明,新注冊醫生在缺乏會診歷史記錄情況下已經得到了推薦,本文所提出方法在一定程度上解決了冷啟動問題,增加了新注冊專家的被推薦機會。上述證據驗證了本文所提出方法的可行性和有效性,能為目標患者推薦滿足需求且具有較高積極性的遠程醫療專家,進而提升推薦效力。
為進一步檢驗融合推薦模型性能,本文分別采用基準模型和融合模型為目標患者推薦專家,產生兩組推薦結果。之后,根據推薦結果制作問卷進行實地調查以評估推薦結果與目標患者的適切度。問卷內容包括目標患者病歷描述及兩組推薦結果的合理性評估,并采用Likert 5級量表進行評分,1~5分別表示非常不合理~非常合理。將調查問卷發放給國家遠程醫療中心4位長期從事遠程醫療調度工作的醫療人員,其結合實際并根據自身工作經驗對兩種推薦結果進行適切度評分。評分結果如圖8所示。

圖8 兩種推薦方法的適切度評價Fig.8 The rationality evaluation of the two recommendation methods
由圖8可見,在適切度評價上融合推薦方法優于基準方法,足以證明融合推薦方法的推薦醫生列表比基準方法的推薦列表更合理,更能滿足患者的疾病及其就診需求。
多組實驗驗證了本文所提出推薦方法的有效性。①能夠為患者推薦相關且在遠程醫療服務過程中具有較高積極性的專家,滿足患者個性化需求,提供智能化的個性化服務;②通過對專家會診時間和頻次的挖掘,分析專家的興趣度和活躍度,識別其對遠程醫療的態度,以對優質醫療資源進行合理化配置;③可以緩解專家推薦中的冷啟動問題,提高新注冊專家的被推薦機會,使有能力、具有較高積極性的新注冊專家不囿于匱乏的歷史記錄,實現了患者需求和專家服務能力的有效適配。總之,本文所提出方法能夠在考慮患者個性化需求的基礎上確保推薦結果的準確性和相關性,同時也保證推薦的專家對遠程醫療具有較高的活躍度和興趣度,進而提高遠程醫療效率和服務質量,促進遠程醫療的可持續發展。
本文在隱私保護的前提下,提出了一種帶有反饋調節的遠程醫療專家自適化推薦方法,借助個性化推薦技術為患者篩選合適的專家,降低患者搜索成本,確保醫療服務價值的有效實現。本文分別面向患者電子病歷和專家長短期知識進行患者和專家的特征建模,并通過特征交互計算得到專家推薦指數,其中通過專家長短期知識的相互補充和印證相對全面地刻畫專家特征,并根據專家長期知識的相似性建立專家之間的知識關聯來更新新注冊專家初始推薦指數,緩解冷啟動問題。同時,將專家推薦指數與專家活躍度、興趣度及患者效用反饋納入同一推薦框架,實現推薦框架的反饋調節和自適更新,在考慮專家行為變化的基礎上,使推薦結果分布向最近、最頻繁的專家傾斜,并在考慮患者偏好的同時強調結果反饋,使推薦更具可解釋性和時效性,進而提升推薦能力。本文借助遠程醫療真實案例數據進行實驗分析,實驗結果驗證了所提出方法的有效性及其在數據稀疏性和隱私保護前提下的可操作性,對遠程醫療個性化推薦和醫患匹配理論及實踐具有以下管理學啟示和意義:
(1) 多源數據的相互補充能夠較為全面地刻畫背景信息,在解決推薦系統中冷啟動問題的同時支持管理決策。面向專家長、短期知識背景的特征建模,即在短期知識(歷史診斷數據)的基礎上輔以專家長期知識(個人簡介),實現了專家長、短期知識的相互補充和印證,能夠更為全面地刻畫專家知識領域,尤其是對于缺乏歷史診斷數據的新注冊專家,通過對專家間長期積累經驗的相似性挖掘,增加了新注冊專家的被推薦機會,在一定程度上緩解冷啟動問題。
(2) 推薦結果質量除受需求影響,也與被推薦者個體行為因素有關。專家活躍度及對遠程醫療的興趣會隨時間發生變化,通過動態衡量專家在遠程醫療服務中的活躍度及興趣度,使推薦結果分布向最頻繁、最活躍的專家傾斜,增強推薦模型的時效性,進而提高匹配成功率和推薦能力,提升服務效率和質量。
(3) 反饋機制實現推薦模型的閉環調整優化,提升推薦模型的自適性與可接受性。基于患者主觀反饋調節不同推薦方式的關系,基于患者客觀反饋動態調整感知效用,并通過結果反饋動態調整專家行為屬性,在滿足患者偏好的基礎上提高了推薦模型的可解釋性、時效性與自適性。同時,本文所提出方法減少了大量額外信息的提交,壓縮數據空間,解決了數據稀疏性和隱私保護問題。
(4) 該方法能夠為遠程醫療實踐提供參考,完善遠程醫療平臺建設,進而促進遠程醫療的可持續發展。該方法同樣適用于在線健康問答平臺及評審專家推薦系統,考慮專家的興趣領域及其隨時間的變化,能夠為專家推薦相關的問題或符合興趣領域的評審稿件,提升推薦的合理性,保證工作效率和效果。
本文研究存在一定的局限。本文重點關注專家服務能力與患者服務需求之間的匹配而忽略了等待成本,今后研究需結合專家排班調度展開進一步的研究。未來研究還可審查專家能力與患者選擇之間的因果關系,考慮屬性之間的相關性,以構建更精準的專家推薦模型。