付裕添 邱均平 張廷勇 黎遠波



關鍵詞:在線健康平臺;信息質量;DISCERN;可讀性;計量分析
據統計,截至2022年12月,我國已擁有10.67億互聯網用戶.超過76%的用戶有在各類互聯網信息發布平臺中搜索健康信息的經歷,超過68%的移動網絡終端用戶有日常在線搜索健康信息的習慣。此外,國務院辦公廳也于2018年4月25日,根據《“健康中國2030”規劃綱要》和《國務院關于積極推進“互聯網+”行動的指導意見》提出要健全“互聯網+醫療健康”服務體系,發展基于互聯網的健康服務。
得益于互聯網技術的持續進步,社會大眾在線獲取健康信息已成為一種必然趨勢,各類信息發布平臺成為了當下社會大眾獲取在線健康信息的重要渠道,“互聯網+健康信息”也將成為今后社會大眾提升個人健康信息素養的重要組合。健康信息素養作為現代社會人健康生活的必備素養之一,其定義在涉及個人構建有效搜索和理解健康信息能力的同時,還包括通過判斷和應用健康信息就健康相關問題做出正確決策的能力,當前環境中個人實現建立或提升這一素養的基礎則主要依靠相關在線健康平臺信息資源。
時下,與“互聯網+健康信息”日趨重要形成鮮明反差的是在線健康平臺信息的類型和領域范圍雖被不斷豐富,但互聯網固有的開放屬性也使許多虛假、失實、甚至邏輯混亂的劣質健康信息在各類信息發布平臺中自由流通和任意傳播,導致在線健康平臺信息質量與可讀性水平紛雜不一,在影響用戶理解、判斷、應對自身健康狀態及治療動作外,也嚴重削弱了大眾對在線健康平臺信息的信任、有效利用以及對個人健康信息素養的建立與提升。因此,從現狀出發對在線健康平臺信息質量與可讀性進行計量分析,有助于推動在線健康平臺信息的標準化和規范化,增強其效用性,這是今后大眾獲取優質在線健康平臺信息、培養和提升個人健康信息素養的重要基礎,也是國家發展互聯網健康服務、實施健康中國戰略的必然要求。本研究將分別以刊載于7類常見互聯網信息發布平臺的10種備受關注的疾病相關健康信息為代表,運用DISCERN健康信息質量評價指南,并改進現有中文健康信息可讀性計算公式來進行相關分析研究,以期揭示當前我國在線健康平臺信息總體質量與可讀性的現狀和不足。
1在線健康平臺信息相關研究綜述
1.1信息質量
在線健康平臺信息間的可靠性與準確性差異顯著,質量良莠不齊的問題一直備受社會關注,國外相關領域學者也從健康信息來源、信息發布準則、信息質量標簽等角度聚焦于健康信息質量評價問題,并基于信息內容、編寫設計等維度提出若干相關評價標準與工具。在質量相關評價標準研究方面,Eysenbach G等將在線健康平臺信息質量標準分為技術性、設計性、可讀性、準確性與完整性5類評價指標:O'Grady L將健康信息發布網站的質量標準分為假定可信度、展示可信度、聲譽可信度和參考可信度4種評價類型:錢明輝等則從權威性、歸因性、全面性、補充性等9個維度出發,構建出我國在線健康咨詢平臺信息質量評價指標體系。在質量相關評價工具研究方面,DIS-CERN、HON Code、JAMA等均是當下廣泛使用的評價工具,其中DISCERN運用最為普遍,其可面向不同學科領域或特定醫學領域進行質量評價,專業醫療人員或普通社會人群均可使用。此外,Habib M等、Afsana F等部分國外學者也嘗試利用深度學習算法開發自動化分類器以對在線健康平臺信息實現智能化評價。在評價對象方面,我國學者大多針對特定疾病的相關健康信息網站進行質量評價研究,對社交媒體、搜索引擎、健康公眾號、健康醫療應用等平臺刊載的相關健康信息質量則關注較少。
1.2信息可讀性
可讀性是衡量閱讀一段文本難易程度的指標,它被定義為“通過系統公式確定個體理解書面文本所需的閱讀理解水平”。當前,社會大眾在線搜尋并瀏覽健康信息時,由于其中包含醫學專業術語較多,往往使用戶難以閱讀和理解,相關研究也表明社會大眾對在線健康平臺信息的可讀性有所擔憂。難以閱讀理解的健康信息可能會使用戶誤解或混淆相關內容,不利于用戶根據所獲信息做出正確的個人健康判斷或指導,而易于閱讀理解的健康信息是社會大眾最為基本的需求。目前,國外學者對于在線健康平臺信息可讀性的研究主要著眼于不同可讀性計算工具的對比梳理及相關公式的應用研究,并在英語環境中發展出多種可讀性計算工具來為書面信息的可讀性分配數值,例如GunningFOG指數、Flesch-Kincaid等級分數(F-K)、SMOG公式和Flesch Reading Ease(FRE)量表等,這些基于英語字符、音節、單詞或句子數量的函數文本樣本,已被廣泛用于衡量在線健康平臺信息的可讀性。我國關于信息可讀性的研究起步較晚且相較緩慢,利用可讀性計算工具或公式的評價研究與應用分析整體較少,涉及在線健康平臺信息的相關研究更為稀缺,目前尚未發展出成熟的中文健康信息可讀性計算工具。
綜上所述,在英語環境中,針對在線健康平臺信息質量與可讀性已有廣泛研究,形成了一些成熟的評價指標體系與工具,但在中文環境中的相關研究,在內容、數量和研究角度上均尚有局限。同時,考慮到在線健康平臺信息質量與可讀性水平是影響我國社會大眾健康信息素養構建與提升的關鍵因素,因此,探究我國在線健康平臺信息質量與可讀性水平,并針對其中存在的問題提出改進對策是必要且亟需的。
2研究對象與方法
2.1研究對象選擇
為全面創建研究分析文本數據集,本文首先選取了7種社會大眾能夠普遍實現搜索獲取與閱讀在線健康信息的平臺途徑,分別是“百度搜索引擎”“微信公眾號”“微博平臺”“知乎問答平臺”“平安健康APP”“39健康網”以及“健康中國網”。這7種途徑均分別是在當前搜索領域、社交領域、移動端應用領域和健康專題網站等領域擁有大量用戶與訪問量的熱門信息發布平臺,基本可代表當前大眾在線搜索、獲取與閱讀在線健康平臺信息的各種主流途徑。同時,根據互聯網評選出的中國十大最受關注疾病,假定其作為社會大眾最有可能尋求相關在線健康平臺信息的對象,涉及癌癥、糖尿病、高血壓、痛風、艾滋病、胃病、失眠、高血脂、冠心病、肝病共10類疾病的相關健康信息。
在進行具體搜索動作前,研究人員對各平臺訪問記錄、緩存圖像和Cookies等進行了刪除或重置操作以防止影響搜索結果的準確性。隨后運用人工方式分別在7種平臺中同時檢索10類疾病的相關健康信息,以求達到完全模擬用戶的信息搜索、選擇與閱讀行為,所有搜索與下載行為均在24小時內完成,以便將平臺對信息內容可能的更改保持在最低限度。考慮到用戶對搜索結果的閱讀量一般在10個有效信息內,因此,在排除中斷鏈接、無關主題、廣告新聞、期刊文章及篇幅過低的信息后,最終共選取700份在線健康平臺信息作為評價在線健康平臺信息質量與可讀性的評價樣本,部分樣本數據如表1所示。
2.2健康信息質量評價方法
DISCERN是英國牛津大學開發用于評價書面健康信息質量的一種標準化測量方法,已廣泛用于各種健康網站信息的評價研究,以往研究也對DISCERN的可靠性進行了心理測量學上的評價,并表明其能夠較為準確地區分健康信息的質量高低。DISCERN由15個基礎問題和1個整體質量評價問題共16個題項組成,各題項均采取5分制評價方式,由“否”到“是”來依次表明信息滿足題項標準要求的程度:1分表示“完全不滿足”,2~4分表示“在某種程度上滿足”,5分表示“完全滿足”。并可將題項按問題類型分為3個部分:健康信息可靠性質量評價部分(題項1~8號)、治療方案信息質量評價部分(題項9~15號)以及整體質量匯總評價部分(題項16號),如表2所示。
對樣本的質量評價由3名主要研究人員進行,為確定評價者之間對每項評估標準的理解一致,主要利用評價工具中提供的評價事例進行試評價,并通過參考評價指南、共同評價與分歧討論后,取得對各在線健康平臺信息樣本質量進行判斷時在評判標準理解上的共識。
2.3健康信息可讀性計算方法
通過對相關樣本的檢驗查閱后發現,時下在線健康平臺信息多以圖文的形式呈現,同時相關研究也指出健康信息文本是否提供與文本內容相關的非文本圖像也是影響健康信息可讀性的一類因素。因此,為更貼近現實地計量在線健康平臺信息的可讀性,本文將以秦琴等學者構建出的中文在線健康信息可讀性計算公式為基礎進行改進,如式(1)所示,提出包含非文本圖像因素的在線健康平臺信息可讀性計算公式,如式(2)所示:
其中,S表示健康信息是否提供與內容相關的非文本圖像(S=0未提供、S=1提供);CR表示相比于純文字狀態時健康信息在含有非文本圖像狀態下非文本圖像對健康信息可讀性的提升貢獻率。研究人員通過完成非文本圖像對各樣本可讀性的貢獻評價后,得出CR的值約為21.857%,計算如表3所示,R值(可讀性值)代表在線健康平臺信息的可讀性水平,R值越小,可讀性越強,信息越容易閱讀;式(1)中TWC(總字數)為去除標點符號后的文本字數;ASL(平均句長)為總字數與完全句數的商;PMT(醫學專業術語占比)為醫學專業術語字數與總字數的比值,其中醫學專業術語確定的依據是根據LetPub網站上提供的醫學健康類專業術語詞典,囊括46個分類學科的16229個醫學專用詞匯和專業術語詞匯,具體研究則運用Python軟件實現相關元素的數值計算。由于目前國內尚未出現與可讀性值對應的中文閱讀水平分級標準,因此,本文僅對在線健康平臺信息可讀性值本身進行分析評價。
3在線健康平臺信息質量評價
3.1信息質量總體評價
運用DISCERN健康信息質量評價工具對在線健康平臺信息進行質量評價,具體描述統計如表4所示。
具體來看,在線健康平臺信息的整體質量評價得分平均值約為2.772分,整體質量近似達到中等質量水平,但信息間質量差距較大。可靠性質量評價部分的平均值約為2.544分,在該部分中1、2、3、6號題項的評價得分平均值略高于3分,5、8號題項的評價得分平均值介于2~3分之間,4、7號題項的評價得分平均值則小于2分,其中7號題項的評價得分平均值僅為1.105分,反映出在線健康平臺信息在涉及信息來源表明、提供其他信息來源方面欠缺嚴重。而治療方案信息質量評價部分總體未得到足夠的關注,其中涉及治療風險描述、未治療后果說明以及治療方案選擇討論建議等方面存在著非常嚴重的缺陷。
3.2不同平臺與提供主體間的信息質量評價對比
3.2.1不同平臺間信息質量評價對比
研究通過分別計算7種不同平臺各自刊載健康信息的整體質量評價得分平均值并結合Friedman檢驗,進一步探究不同平臺刊載的健康信息質量是否具有不同,結果如圖1、表5所示。
研究發現,不同平臺刊載的健康信息質量有所不同,其中健康中國網刊載的健康信息質量評價得分平均值最高,約為3.220分;39健康網刊載的健康信息質量評價得分平均值最低,約為2.010分:其余平臺的評價得分平均值介于2.5~3.0分之間,與前文整體質量評價得分平均值相近。
由Friedman檢驗分析結果可知,顯著性P值<0.01,統計結果顯著,表明7種不同平臺刊載的健康信息質量之間存在差異,其差異幅度Cohen's f值為0.505,差異程度較大。
3.2.2不同提供主體間信息質量評價對比
在線健康平臺信息除平臺不同外,大部分信息的提供主體也有所不同,大體可分為公立機構提供主體和私立機構提供主體,其中公立機構提供主體是指在線健康平臺信息主要由各大公立醫院、高校附屬醫院、政府資助網站等來源編寫提供,私立機構提供主體主要是指信息由私立盈利性醫療網站、私立醫院、醫療盈利APP應用、私人醫生等來源編寫提供。具體質量評價得分平均值對比如圖2、圖3所示。
公立機構主體提供的在線健康平臺信息可靠性部分質量評價得分平均值約為2.658分,雖高于私立機構的2.565分,但在統計學意義上并沒有顯著差異。具體來看,除4、5.6號題項中的私立機構主體提供的在線健康平臺信息質量平均值略有凸顯以外,其余編號題項均略低于公立機構。
在治療方案信息質量評價部分平均值對比中,公立機構主體提供的在線健康平臺信息在各題項的評價得分平均值上均稍略高于私立機構,這表明在治療方案相關信息提供方面,公立機構提供主體能夠在治療方案內容信息方面提供更多的參考和建議。
4在線健康平臺信息可讀性評價
4.1信息可讀性總體評價
運用改進型可讀性公式對700份評價樣本進行計算可知,在線健康平臺信息的平均總字數、平均句長、醫學專業術語占比及可讀性值分別約為1453.31、42.39、0.29和11.41,在信息總字數、平均句長以及可讀性方面有著明顯差異,而醫學專業術語占比方面僅存在細微差異。此外,大約有65.29%的在線健康平臺信息提供非文本圖像來輔助用戶閱讀,如表6所示。
此外,在線健康平臺信息文本的可讀性值在7~9之間分布最多,并且可讀性值不超過9的在線健康平臺信息占比約75%以上,如圖4所示。這表明對于社會大眾而言,需要具備可讀性值9及以上的健康信息閱讀能力才足以理解大部分在線健康平臺信息內容。
4.2不同平臺和提供主體間信息可讀性對比
4.2.1不同平臺間信息可讀性對比
研究同樣通過運用可讀性計算公式分別計算不同平臺刊載健康信息的文本總字數、平均句長、醫學專業術語占比和可讀性值的平均值和標準差(SD),并結合Friedman檢驗來進一步探究通過不同平臺獲取的健康信息可讀性間是否存在差異,結果如表7、表8所示。
通過表7的各項統計結果可知,由平安健康APP平臺刊載的健康信息平均可讀性值最低,說明其刊載的健康信息最易閱讀,信息間可讀性值相差最小且提供非文本圖像的信息比例高達89%:由百度搜索引擎刊載的健康信息平均可讀性值最高,說明其最難閱讀,并且各信息間的可讀性值差距也最大。其中值得注意的是,百度搜索引擎和39健康網兩者分別刊載的健康信息雖在平均總字數和句長上占據著兩個極端,但醫學術語占比的平均值均為0.34,這說明在線健康平臺信息的篇幅長短并不能導致在醫學術語占比上的差異。
Friedman檢驗分析結果可知,顯著性P值<0.01,統計結果顯著,表明7種不同平臺刊載的在線健康平臺信息可讀性間存在差異,其差異幅度Cohen's f值為0.407,差異程度較大。
4.2.2不同提供主體間信息可讀性對比
通過分別對公立機構、私立機構為主體提供的在線健康平臺信息進行可讀性值計算,可以發現公立機構主體提供的健康信息可讀性值略高于私立機構,在信息平均總字數上大幅高于私立機構,在平均句長上低于私立機構,在醫學術語占比方面二者近似,在提供非文本圖像的健康信息比例上公立機構提供主體比私立機構提供主體高出約14.22%,如表9所示。
4.3信息質量與可讀性值的關系
在上述探究中值得注意的是,39健康網和平安健康APP兩種信息來源平臺刊載的健康信息質量評價得分平均值最低,但卻有較高的可讀性。因此,本文也利用散點圖對在線健康平臺信息的質量與可讀性值間關系進行探究,可以發現在線健康平臺信息質量與可讀性值之間存在一定關聯,兩者具有一定相關關系,如圖5所示。
通過Person相關分析結果可知,在線健康平臺信息質量與可讀性值間的相關系數為0.401,顯著性P值<0.001,兩者間呈正相關關系,即健康信息質量越高,其可讀性值越高,可讀性越差,如表10所示。
5討論
5.1在線健康平臺信息質量與可讀性現狀及問題
5.1.1信息質量現狀及問題
通過運用DISCERN健康信息質量工具對在線健康平臺信息進行分析研究發現,在線健康平臺信息的總體質量平均值為2.772分,尚未達到中等健康信息質量水平,仍有提升的較大空間。從可靠性質量與治療方案信息質量兩部分的評價得分平均值來看,各部分同樣尚未達到中等水平,即便如此,后者仍比前者的評價得分平均值低出約1.08分,說明目前在線健康平臺信息中治療方案信息內容過少,重視力度不夠。從具體題項來看,在線健康平臺信息在信息來源表明、其他相關信息提供、治療方案風險描述、未治療后果描述、治療方案選擇表明等方面均未達到2分的質量水平,相關信息欠缺十分嚴重。總的來說,目前在線健康平臺信息的總體質量不高,缺乏有效的治療方案信息,用戶無法得到精準的診斷和治療建議。另外,較低的健康信息質量也會導致用戶誤解或者因誤用健康信息而對個人健康造成潛在的風險。因此,提高對在線健康平臺信息質量的重視程度,提升用戶獲取和應用在線健康平臺信息的效果是首要的。
5.1.2信息可讀性現狀及問題
通過分析計算在線健康平臺信息的相關統計量與可讀性值,發現目前在線健康平臺信息可讀性主要存在以下問題:首先,在線健康平臺信息的篇幅較長,平均字數超過1400字,平均句長超過40字,篇幅和語句的長度容易導致用戶的閱讀疲勞,同時也會使用戶在閱讀時被迫需要持續維持對前后信息內容與邏輯的記憶,進而影響用戶對有效健康信息的判斷與理解,因此,在線健康平臺信息的篇幅和語句長度切分需要得當,以兼顧信息的邏輯性與可讀性;其次,信息中的醫學詞匯占據了較大的比重,平均來看,這些詞匯約占總篇幅的29%,雖然醫學專業性強的文章往往更科學、嚴謹以及更具說服力,但對于健康信息素養和醫學知識薄弱的用戶而言可能會帶來閱讀理解上的困難,因此,平衡專業性與可讀性,以簡單易懂的方式來傳達準確、有效的健康信息應是健康信息提供者們下一步的追求目標。
5.2不同平臺與提供主體間的信息差異
分析發現,不同平臺刊載的健康信息質量與可讀性均具有一定差異,其中質量上的差異更為明顯。由于研究選取的7種信息平臺涉及搜索引擎、社交媒體、問答平臺、專業醫療等代表著完全不同的在線健康平臺信息獲取渠道,因此可以認為不同來源的在線健康平臺信息由于各平臺在提供信息的內容、方式、目的、服務、要求的不同,以及各平臺相關信息編寫者的專業背景和知識水平的差異等,導致了在線健康平臺信息在質量與可讀性上的區別。
另外,在線健康平臺信息提供主體的不同,使其在質量與可讀性上也存在一定的區別。以公立機構為主體提供的健康信息在大部分質量評價題項上的平均分均略高于私立機構,這可能是由于公立機構更加注重健康信息的公益性和專業性,對于健康信息的真實性、可靠性和準確性有更高的要求,并在信息編輯和呈現方式上也有更多規范和標準,但從整體上看,兩者差距并不十分明顯。而在可讀性方面,公立機構主體提供的在線健康平臺信息可讀性值相比較高,可讀性弱于私立機構,這或許是因為私立機構為主體提供的健康信息在編輯和制作上會因商業盈利需求而編寫出為便于吸引用戶而易于閱讀的健康信息。
5.3信息質量與可讀性間的關系
通過回歸分析發現,在線健康平臺信息質量與可讀性值的相關系數為0.401,表明在線健康平臺信息質量與可讀性值間呈正相關關系,即在線健康平臺信息文本的質量越高,其可讀性值越高,可讀性越低。高質量的在線健康平臺信息在編輯時使用了過于專業化和抽象化的醫學術語,文章雖豐富全面且涵蓋了大量具有組織結構性的內容,但代價是提高了用戶理解所需的閱讀水平,增加了健康信息的可讀性值,降低了可讀性。
6增強在線健康平臺信息效用性的對策建議
在質量提升方面,在線健康平臺信息在編寫時應注重信息的完整性,盡可能完整地包括例如病因、治療、預防和康復等方面的具體信息;在線健康平臺信息提供者還應廣泛參閱相關醫學權威著作或期刊文獻,確保編寫內容的準確性,提供符合當今前沿醫學知識和實踐標準的在線健康平臺信息。在可讀性提升方面,相關從業者在線傳播健康信息時,應確保信息易于用戶閱讀理解,在編輯過程中可盡量使用簡單明了、通俗易懂的語言,循序漸進地引導出最重要、最基本的健康信息內容,對內容中較為生澀的醫學專業概念或術語進行降維解釋,并配合相關圖表或非文本圖像進行輔助解釋。此外,提供清晰的行文結構和組織、采取多樣化的信息呈現方式、鼓勵讀者參與討論和互動,來幫助用戶更好地閱讀理解和應用健康信息也是可讀性提升的重要形式。在信息發布方面,平臺方可根據參考研究,確定一系列涵蓋信息內容、可靠性、真實性等方面的質量評價指標和標準來制定一套明確的信息發布規范,規范需要明確指出健康信息內容應該是基于科學證據的,不包含任何誤導或虛假的信息,還可以通過與醫療機構、專業協會或權威機構合作,以實現建立專業的審核機制和認證制度,確保發布的健康信息經過專業人士的審查和認證,避免出現錯誤信息誤導用戶,以及采用相關健康信息質量有效標識認證(例如HON Code等)的形式對在線信息平臺進行第三方健康信息質量認證,并向用戶宣傳相關認證標準。
7結語
社會大眾在線獲取健康信息已成為一種必然趨勢,從現實出發對在線健康平臺信息的質量與可讀性水平進行計量分析,在揭示當前在線健康平臺信息總體狀態的同時也探究其中可能的改進之處,這對今后提升我國在線健康平臺信息整體水平、幫助社會大眾有效構建和提升健康信息素養、科學地發展基于互聯網的健康服務具有重要意義。
本文運用DISCERN健康信息質量評價工具,并改進現有中文健康信息可讀性計算公式對廣受關注的疾病相關在線健康平臺信息代表樣本進行質量與可讀性計量分析研究。研究發現,目前我國在線健康平臺信息的總體可靠性質量接近中等水平,缺乏對治療作用、治療相關的風險與選擇等內容的描述,在線健康平臺信息整體的可讀性差異顯著,并且不同平臺和主體提供的健康信息質量和可讀性水平均存在差異。此外,研究還揭示了健康信息質量與可讀性值間存在的相關關系,提出了增強在線健康平臺信息效用性的對策建議,以期為今后提升我國在線健康平臺信息整體水平、提高社會大眾健康信息素養等方面提供一定的參考。