醫療衛生服務作為一種多實體、多流程和多維度的復雜活動,其主要目標是滿足患者的護理需求,優化患者感知體驗。當醫療衛生機構在某些環節未滿足患者預期時,則可能導致產生意見或投訴[1]。從醫院管理的角度出發,來自患者的主觀評價往往是促進醫療服務質量改進的一個核心要素[2]。挖掘并識別這些非結構化文本中的隱含主題和熱點內容能夠有效捕捉影響患者滿意度的因素,為醫院管理者優化整體衛生服務流程提供一定參考,從而適當降低醫患糾紛發生率[3],構建和諧的就醫氛圍[4]。
當前國內外患者體驗和滿意度的調查研究不少,以醫療服務體驗相關條目構建的結構化測量問卷為主。國外醫院消費者對醫療提供者與醫療系統評價工具[5]和新Picker患者體驗量表[6]都具有廣泛適用性。在這一方面,國內醫療機構雖與國外存在較大差異,但已有學者在患者體驗醫療服務質量評價量表上進行了嘗試和大膽創新[7-9]。雖然這些測量工具較為全面地涵蓋了與患者整體就醫流程和環節相關的調查條目,但其評級評分機制往往缺乏患者參與,忽視了患者主觀性評價和建議的內在價值,在理解患者真實感受方面有所欠缺。而人工分類總結大量患者評價文本時效率不高,多使用經驗性的統計方法[10-11],缺乏機器學習方法的運用。
因此,本文對華中某三甲醫院(以下簡稱“A醫院”)線下回訪調查的患者評價文本進行了主題詞聚類和社會網絡分析,主要針對該醫院門診、入院和出院3種類型的患者,探索影響其體驗和滿意度的因素,在充分利用患者反饋的基礎上創新了醫療服務質量評價模式,為改善患者體驗和提升服務質量提供思路。
A醫院患者回訪調查得到的評價數據主要包括門診患者、入院患者和出院患者評價數據,調查形式為電話咨詢和現場調查。本文選取了2013-2019年患者反饋的關于服務體驗的負面評價文本,去空行和去除無意義條目后得到出院患者回訪評價16 697條,入院患者回訪評價3 887條,門診患者回訪評價20 362條。
1.2.1 數據清洗
本文采用了文本數據清洗的常用方法,即分詞、去停用詞、去空行的數據清洗過程。首先采取了適用于Python語言環境下的jieba分詞工具進行分詞,并采用哈爾濱工業大學的停用詞表去除語氣詞、標點符號及其他無意義詞匯。同時為了突出評價的真實主題內容,在詞表中自定義加入了“醫生”“護士”“患者”等出現頻率較高但貢獻不大的詞匯。由于某些患者回訪的評價過短,3類負面評價文本在分詞之后都出現了空行。本文以移除空行后的分詞文本作為標準語料。
1.2.2 Kmeans詞聚類
為挖掘回訪調查中的患者反饋主題內容,對負面評價文本進行數據預處理后,首先利用經過分詞處理的文本構建“詞-索引字典”以及“詞-詞向量字典”,訓練成詞向量模型后進行保存;然后運用已保存的詞向量模型依次設置5~30類,分別對3種類型的患者評價數據進行Kmeans詞匯聚類,依據聚類結果的可解釋程度確定最佳聚類數;最后,利用詞聚類結果計算每個類中詞匯的逆向文檔矩陣(Inverse Document Frequency,IDF)值,取每個類中IDF值最大的定性詞及其權值做可視化雷達圖,提取患者評價文本的主要特征。
1.2.3 社會網絡分析
社會網絡分析是為了進一步挖掘負面評價文本中出現頻次較高的主題和相互之間的關聯。在本文中包含節點中心度分析和凝聚子群分析兩個部分。首先統計分詞文本的詞頻,然后利用高頻關鍵詞構建共現矩陣,矩陣斜對角線上的數字代表該詞在相應回訪文本中的詞頻,作為社會網絡分析的數據輸入。
節點中心度分析采用Ucinet 6.186社會網絡分析軟件,首先輸入僅保留高頻定性詞的共詞矩陣,選擇內嵌工具NetDraw進行可視化,在“分析”選項中選擇“中心度測量”,節點大小反映“度”的大小,構造網絡圖譜可以更清楚地觀察網絡核心。
在凝聚子群分析中,因50個左右的詞可以看出更清晰的邊界和子群核心,所以選擇前50個左右的高頻詞構建共現矩陣。將對應矩陣輸入軟件后,在“網絡”選項中選擇“角色&位置”-“結構”-“CONCOR”,設置最大切分深度為3,集中標準為0.200,構建子群圖表,用以解釋和總結負面評價的類別和主題特征。
經過人工瀏覽,刪除了聚類中的低頻詞組合以及詞數量達到上千而無法總結的聚類,發現出院、入院和門診患者的負面評價數據均以8個聚類主題為最優。篩除低頻詞類別后的詞聚類結果如表1、表2、表3所示。

表1 出院患者負面評價詞聚類結果
從表1可以看出,出院患者的負面評價大致可分為8類。因為住院患者較門診患者經歷了更長時間和更多環節的診療流程,投入了更多的時間和經濟成本,因此對醫護人員的專業技能和服務品質提出了更高的要求,從而導致出院患者質疑住院治療過程中接觸的相關流程(如住院病房環境、接受檢查和藥物治療)的規范和標準性,如聚類中的類0,1,2,3,6。
可視化圖譜由按照IDF值最大化原則篩選出的詞構成,從8個詞聚類中抽取的詞分別是“干凈”“收取”“好轉”“提高”“留置”“等待”“咨詢”“需要”。如圖1所示,尖端越向外凸起證明該詞IDF值越大,其作為特征在出院患者負面評價文本中的地位越重要。很明顯,“收取”“等待”“留置”作為特征詞更能凸顯出院患者負面反饋的主題。

圖1 出院患者評價特征詞分布雷達圖
表2顯示了入院患者負面評價的詞聚類結果。從表2可以看出,與出院患者更注重治療進程和效果不同,正在住院的患者更加關注住院治療之前的相關手續和環節,如安排床位、辦理入院手續(如醫保等)。因此聚類主題除了部分說明醫護工作人員的專業水平和服務態度的問題之外,同時還表達了患者在入院時對診療方案和病情溝通上的不滿,如類0,2,4,7。

表2 入院患者負面評價詞聚類結果
此外,醫療服務可及性也是患者重點關注的一個問題。入院患者評價中諸如醫護人員繁忙無法及時接診、入院時床位不夠只能住走廊、做檢查時排隊時間長等主題占有很大的比重,如類1,3,6。
入院患者負面評價的聚類主題可視化圖譜如圖2所示。8個類依次選擇的詞匯是“值班”“忙”“小孩”“等待時間”“手術”“清潔”“床位”“醫保”。圖2顯示,“清潔”“忙”“等待時間”“小孩”作為入院患者負面評價的主要特征詞,更能反映核心主題。

圖2 入院患者負面評價特征詞分布雷達圖
表3顯示,門診患者對檢查檢驗、開藥繳費診療環節的負面評價較集中,圍繞這兩個環節的投訴主要是排隊等待時間和排隊秩序問題、對檢查和藥物治療的必要性和效果的質疑、藥價高于患者預期等,如類0,1,2,3。此外,患者對窗口工作人員的溝通態度不滿,以及周末和中午、夜晚時間的值班醫護人員過少也是主要投訴主題,如類4,5。值得注意的是,一定比例的門診患者是出院后回來復診的,復診時間往往是在出院15~30天后,這部分患者對住院治療方案和效果的負面評價覆蓋了門診患者的八大類主題。
門診患者負面評價的聚類主題可視化圖譜如圖3所示。8個類依次選擇的詞匯是“過長”“藥費”“藥物”“繳費”“仔細”“值班”“打掃”“錯誤”。其中“打掃”“錯誤”在門診患者評價文本中更具代表性。
出院、入院和門診患者負面評價聚類結果顯示,患者對衛生環境和護理環境都提出了意見和建議,
不僅是環境衛生的打掃不到位,還有相關設施設備的破損和更換不及時等問題,這都應該引起重視。

表3 門診患者負面評價詞聚類結果

圖3門診患者負面評價特征詞分布雷達圖
2.2.1 詞頻統計結果
3種類型患者的負面評價文本詞頻統計結果如圖4所示。圖4中由高到低顯示前46個高頻詞,從左至右分別是出院患者、門診患者和入院患者負面評論高頻詞。
圖4出院患者、門診患者和入院患者負面評價高頻詞分布
從圖4可以明顯看出3種類型患者的負面評價側重點各有不同。出院患者負面評價中出現較為頻繁的詞是“不好”“態度”“治療”“住院”“技術”“打針”等,說明醫護人員的服務態度、住院治療效果和注射、輸液等專業技術是患者不滿的重點內容。
門診患者負面評價中出現較為頻繁的詞有“時間”“看診”“長”“排隊”“久”“等待”等,說明診療服務的可及性不高是門診患者更難以接受的主觀感受。
入院患者負面評價中“態度”“不好”“入院”“接診”“管床”“及時”等詞出現得更多,與出院患者的評價相似,患者感受到的是醫護人員對其不夠重視,如接診不及時、態度差等。
2.2.2 節點中心度分析結果
按照高頻定性詞共現矩陣完成的3個可視化圖譜如圖5、圖6、圖7所示,圖中節點之間連線越粗說明聯系越緊密。
從圖5中節點的大小和分布可以看出,以“治療”“打針”“技術”“病房”“住院”“期間”“檢查”等藍色方形節點構成了出院患者評價的核心關鍵詞。由于節點眾多,連線的粗細程度和方向不夠明顯,但依然可以發現“打針”“技術”與“不好”“個別”的關聯性更強,“住院”與“期間”“檢查”“治療”等節點之間的關聯更密切。
圖6顯示,在門診患者評價數據中,“看診”“就診”“時間”“檢查”“拿藥”“排隊”“態度”“不好”等為核心關鍵詞。從連線粗細上看,“看診”“時間”“長”“等待”“等候”之間的聯系更為緊密,說明患者對等待時間明顯不滿,問題核心比較明確。

圖5 出院患者負面評價高頻詞共現圖譜

圖6 門診患者負面評價高頻詞共現圖譜
圖7顯示,在入院患者的負面評價數據中,“態度”“溝通”“入院”“詢問”“清楚”“病房”“入院”等構成了核心關鍵詞。其中“態度”“窗口”“門診”“樓”之間的聯系更密切,“入院”“接診”“及時”這3個節點同樣形成了一個小團體,除此之外其他節點較為分散。

圖7入院患者負面評價高頻詞共現圖譜
2.2.3 凝聚子群分析
評價數據的凝聚子群按照前述設置得出3個部分的圖譜。以第二深度的凝聚層次為總結依據,與之前主題詞聚類結果較為一致。從圖8可以看出,出院患者負面評價的凝聚子群進一步詮釋了聚類結果,主要評價內容包括:實習生等護理人員穿刺、打針技術不好,辦理入院時窗口溝通態度不好,治療效果不太好,病房床位太少,希望有所改善。圖9為門診患者評價的凝聚子群。排隊秩序與等待時間等服務可及性方面的不滿是主要評價內容,同樣也是主題挖掘的關鍵特征。圖10為入院患者評價的凝聚子群。患者在門診窗口辦理手續時工作人員服務態度不好、溝通困難等問題出現多次,應引起重視,但其他結果的顯示不夠明確。

圖9 門診患者負面評價的凝聚子群

圖10 入院患者負面評價的凝聚子群
本文對利用醫療機構主動調查獲得的患者評價文本,采用面向大體量文本能夠有效降維[12]的主題詞聚類法和社會網絡分析技術挖掘非結構化文本集中的隱含主題和重點特征分布,分析了A醫院住院、出院和門診3種不同類型患者的就醫體驗和滿意度相關影響因素,在結構化的測量量表之外充分利用患者主動表達的價值,為醫療機構持續改進衛生服務質量和有針對性地提升管理水平提供參考和建議。
本文的不足之處在于3個類型患者的評價數量不均衡,尤其是入院患者評價數據過少,導致主題聚類結果不夠深入,可解釋性較差;部分負面評價內容過長,詞與詞之間共現頻率高,社會網絡節點之間的聯系與分割不夠明確。今后將進一步擴大相應部分的回訪評價語料,提升聚類挖掘性能,并在現有社會網絡分析的基礎上進一步豐富實驗單元,將社會網絡中的所有節點拆解為聚類中心更明確的小團體集合,便于解釋說明。