曹佳雨 趙俊




摘要:目前,以微博為主導的網絡媒體平臺已經成為民眾信息交流的主要渠道。分析微博相關評論文本,有利于為醫療服務管理提供幫助。研究基于新浪微博,挖掘網民對醫療服務體驗的評價內容,進行意見挖掘、情感分析等實證研究,把握和理解網民就診體驗關注點演變情況,為醫療機構改進就醫流程、改善就醫體驗提供參考。
關鍵詞:微博;用戶評論;觀點發掘;情感分析
根據《2020年微博用戶發展報告》,截至2020年9月,微博月活躍用戶達5.11億,日活躍用戶達224億,廣泛覆蓋全國范圍。伴隨互聯網高速發展,微博迅速推廣,越來越多的網民可以借助網絡平臺獲知信息,發表觀點。微博是一種當下時興的互聯網社交平臺,具有發布信息便利性強、閱覽時效性高等優點,逐漸成為民眾搜集信息、溝通交流的主要工具。
網絡輿情即指網民對社會環境中的種種現象和事件表達的態度、想法、看法、情緒等觀點的總和。針對就醫體驗相關網絡文本數據進行分析,有利于把握了解網民用戶對于醫療服務的觀點體驗,有助于醫療機構獲得及時反饋,提高其服務水平。
內容情感分析是指通過分析自然語言、計算機語言來挖掘主觀文本包含具有隱藏情感色彩的信息,例如判斷文本內容是消極還是積極。文獻研究表明,目前情感分析方法已經相對成熟,利用該方法進行研究具有一定的參考價值。
研究框架
數據采集
利用網絡爬蟲收集數據,基于“就診”“就醫”等關鍵詞,收集至2021年7月31日的個人用戶原創微博內容,包括博主頭像、發布ID、文本主頁、用戶賬號是否認證、博文獨立網址、發布日期、發布媒介、轉發數量、評論數量和點贊數量等信息。
數據處理
將原創微博內容導入到Excel表格中,按照博主ID、賬號類型、博文網址分類記錄表格管理。根據研究條件,篩選過濾不符合研究需要的相關博文。篩選條件包括微博賬號類型為非個人,微博無效內容,如廣告、網頁鏈接或與研究主題無關的微博文本數據。使用Jieba分詞組件對文本數據進行處理,刪除重復和無關的文本數據,參照停用詞表刪除停用詞,基于單詞詞性對每一個被分割出來的關鍵詞的詞性依次標注記錄。結合關鍵詞詞語屬性標注記錄結果,剔除屬性為助詞、虛詞、連詞、介詞等沒有實際含義的主體詞語和所有的標點、符號,最終獲得每條帶有詞語屬性分類標注的微博內容文本主題詞數據集合。
觀點發掘
通過對微博內容文本的閱讀可以得出,網民為了表達某些觀點所使用的詞語往往都存在一類能夠涵蓋基本觀點內涵的關鍵詞。因此在本研究中,使用微博文本中出現的關鍵詞的重要程度作為指標來評價文本內容數據的主要內容。高頻詞是指微博用戶在微博內容中頻繁使用出現的詞語或者短語。本文采用文本特征加權法提取熱點,計算主題詞權重,過濾低頻詞,提取高頻詞。通過上述方法所提取的意見詞語后,再進行兩次人工鑒別、選擇、過濾提取內容觀點,進一步進行聚類分析。情感分析
網友的情緒即是網友在受到外界社會生活刺激從而產生的心理層面的感受,可以分為積極情感、消極情感以及中性情感。本文利用情感分析工具Snow NLP對文本內容進行分析,對積極情緒、消極情緒和中性情緒詞語進行分類和計數,最終統計得到網友積極情緒、消極情緒和中性情緒數量和所占比例。
研究結果
觀點發掘
研究共收集4772條微博數據,最終篩選得到27條有效數據,處理的可視化詞云圖如下。其中,按Tf—idf值排名前十的熱點詞分別是:“健康、朋友、感染、比較、那個、第一、必須、確診、中醫、病情”(見圖1)。首先可以看出網民對健康問題的關注度日漸提高,廣大群眾對健康的需求也成為了一個重要話題;其次,特征詞“朋友”的高頻率說明朋友之間的交流是用戶溝通的主要渠道;“比較、那個、第一”等詞反映出用戶對醫療機構的要求也在逐漸增加,體現人們對醫療衛生資源的多層面需求日益加大;“確診”等詞匯主要與疫情相關,顯示了民眾對當前疫情的重視,以及對疫情期間就醫行為的關注;“中醫”體現了隨著健康素養的增加,民眾對傳統中醫藥的評價與需求逐漸加大,越來越受到民眾的認可支持;“病情”直觀反映了人們對自身健康安全的關注,成為人們就醫治療的主要需求。總體來說,網民的就醫體驗與對醫療保健服務和健康的需求的日益增長相關,主要集中在治療效果、醫療資源選擇和診療方式等方面,希望獲得更好更優質的醫療服務。
情感分析
研究利用情感分析工具Snow NLP對評論文本進行情感分析,計算主題詞情感值,情感值范圍在0~1之間,取值越接近1,表達情感越正向,越接近0表達情感越負面。本文以0.5為分界值,把情感值大于0.5分的劃分為正向情感文本,小于0.5分的視為負向情感文本,其余標記為中性情感文本(見圖2)。分析可見,中性情感最多,共4825條,占48.6%,其次是正向情感,共3143條,占31.6%,負向情感最少,共1963條,僅占19.8%。數據顯示大部分網民沒有過多地表達個人情感,對就醫體驗話題的評論也較為理性。正向情感占比高于負向情感,表明網民就醫體驗的滿意度較高,結合評論內容可發現與醫療服務質量高、醫療服務效果好等原因相關,體現了改善醫療服務工作的顯著成效。負向情感文本里的關鍵詞主要包含表達自身消極情緒狀態,如“擔心、緊張、壓抑”等和對就醫體驗的負面評價,如“無語、一塌糊涂、不好”等,側面反映目前看病難、看病貴、看病煩等問題仍然存在。
討論
以健康需求為關注點,未來需要進一步完善需求保障
研究分析可得患者就醫體驗的變化,這些變化在某種程度上也反映了影響患者在就醫過程中的主要關注點。通過熱點圖譜可見患者的健康需求為主要影響因素。患者對各種醫療服務的需求是否被滿足與就醫體驗正相關,醫療衛生等部門機構未來應落實“以患者為中心”的服務精神,將服務模式從“能提供什么”轉變為“需要提供什么”,提升服務滿意度。
網民對就醫服務的情感價值存在提升空間,未來應注重情感支持與人文關懷
情緒價值對網民就醫體驗和就醫行為存在積極影響,當接受醫療服務時,患者期望獲得更好的情感體驗也演化為健康需求的一部分,即不只是基于業務關系的醫患溝通,更多的是情感上的支持和關懷。未來應更多地關注患者就醫過程中的情感體驗,予以更豐富的情感支持和人文關懷,從而提升患者的就醫體驗。
堅持落實分級診療制度,確保能最大限度利用有限的醫療資源
看病難,主要是因為難以享受優質的醫療資源,實施分級診療制度可以有效促進醫療衛生資源的合理配置、基本醫療衛生服務公平化的關鍵舉措。未來應在深化醫改的基礎上,明確各層次醫療機構的職能定位,推進不同級別機構間的協同合作,促進形成高效的分級診療模式。
搭建官方信息溝通平臺
做好官方微博等溝通渠道建設,積極接受公眾網民的評論、建議,有利于及時掌握網絡輿情狀況,及時全面了解與醫療相關的新聞、熱點動態,有針對性、高效地把握處理網絡輿情的時機,也可以為醫療機構媒體宣傳提供幫助。
做好負面言論的處理工作
積極關注網民公眾的就醫需求和情感狀態,結合微博等網絡平臺,及時對負面消極評論進行澄清回復,對疑問咨詢細心解答,針對發布不良言論的用戶,采用教育警告等懲罰措施,阻止違法信息的進一步傳播。
建立網絡輿情協調管理體系
網絡輿情的處理往往牽涉多方利益的部門系統,由于信息溝通不充分、整體
規劃不合理等問題的出現,可能會在處理過程中產生回避推卸責任,導致輿情處理不及時的后果。醫療機構應加強網絡輿情協調管理體系的建設,全方位、科學合理整合規劃資源,使不同機關部門能夠各司其職、積極處理,體現統籌協調能力。
研究借助微博平臺,搜集網民關于就醫體驗的博文內容,使用Tf—idf算法進行特征降維,Snow NLP分析模塊進行情感分析,繪制微博平臺用戶就醫體驗熱點圖譜,分析用戶就醫關注點和情感體驗,為今后提升醫療機構服務水平提供建議。研究發現,網民就醫體驗總體較好,患者的健康需求、推薦意愿、醫療服務質量和服務便利可及性是主要的關注點,看病難、看病貴、看病煩等問題仍是影響患者就醫體驗的主要因素。未來應進一步完善需求保障,注重情感支持與人文關懷,堅持推進分級診療制度,提升民眾的就醫滿意度。此外,本文在研究過程中依然存在一定不足之處:研究僅針對微博用戶數據進行分析,數據來源渠道相對簡單;并且情感分析只是基于Python的第三方庫,數據處理過程也較為簡單。在未來將會基于更多平臺,擴大數據樣本的全面性,提高研究結果的科學性、準確性。
參考文獻:
[1]微博數據中心.2020年微博用戶發展報告[EB/OL].(2021-03- 12)https://data.weibo.com/report/reportDetail?i d=456.
[2]吳鵬,劉恒旺,沈思.基于深度學習和OCC情感規則的網絡輿情情感識別研究[J].情報學報,2017,36(09):972—980.
[3]趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學報,2010.
[4]左芬.突發事件網絡輿情的負面效應及其應對研究[D].湖南師范大學.
(作者單位:1.南京醫科大學醫政學院
2.南京醫科大學第一附屬醫院)