999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社會化問答網站用戶健康信息需求的演變研究

2019-06-03 03:15:33曹樹金閆欣陽
現代情報 2019年6期
關鍵詞:糖尿病

曹樹金 閆欣陽

摘 要:[目的/意義]研究的目的在于揭示社會化問答網站用戶糖尿病相關信息需求,以及隨時間的推移這些信息需求的演變。[方法/過程]以中文社會化問答網站糖尿病相關提問文本為基礎,構造共詞網絡,運用詞頻分析、社會網絡分析和社區發現的方法,確定網絡社區演變路徑,以可視化的形式呈現信息需求的特征及演變。[結果/結論]10年間用戶表達出來的信息需求趨于集中,用戶對健康管理的信息需求有較大增長,但這部分仍未成為核心關注點。建議用戶更多地對健康管理給予關注,公共衛生部門加強糖尿病預防內容的科普,并對相關并發癥加強防控和管理。

關鍵詞:健康信息需求;糖尿病;社會化問答網站;社會網絡分析

DOI:10.3969/j.issn.1008-0821.2019.06.001

〔中圖分類號〕G252.0 〔文獻標識碼〕A 〔文章編號〕1008-0821(2019)06-0003-13

Abstract:[Purpose/Significance]The research aimed to reveal the diabetes-related information needs of users in social Q&A websites and the evolution of these information needs over time.[Method/Process]Based on the diabetes-related question texts from a Chinese social Q&A website,a co-word network was constructed,then word frequency analysis,social network analysis and community detection methods were applied to determine the evolution path of the network communities,and meanwhile the characteristics and evolution of information needs were visually represented.[Result/Conclusion]The information needs expressed by users tended to be concentrated in the past decade.Information need for health management has increased greatly,but has not become a core concern yet.Users were advised to pay more attention to health management,and the public health department should do more to promote diabetes prevention,and strengthen prevention and control of complications.

Key words:health information needs;diabetes;social Q&A website;social network analysis

生命健康權是公民最基本的人格權。隨著經濟發展水平提高,人民生活水平不斷改善,健康問題越來越得到人們的重視,人們對健康信息的需求也隨之增加。隨著Web2.0時代的不斷發展和社交媒體的普及,越來越多的用戶不僅從互聯網獲取健康信息,也通過互聯網表達健康信息需求。其中糖尿病作為一種常見慢性病,患者基數大,信息需求更是豐富而廣泛。2017年發布的《第八版全球糖尿病概覽》數據顯示,全球每11位成人中就有1位患糖尿病,患病人數達4.25億,較2015年多1 000萬人。至2045年,這一數字將增至6.29億。2017年中國有1.144億名糖尿病患者,位居全球第一[1]。而Wilson V[2]在2013年就通過電子郵件調查了22~64歲之間的Ⅰ型和Ⅱ型糖尿病患者,認為互聯網是尋找一般糖尿病健康問題答案的首選。然而國內對糖尿病信息需求的研究多為問卷調查法[3-5],樣本范圍狹窄,且采用已有的分類體系而忽略了用戶信息需求的表達。中國糖尿病患者的信息需求表達需要被關注和研究。

根據貝爾金提出的知識非常態理論(Anomalous State of Knowledge,ASK),用戶之所以有信息需求產生,是因為用戶認識到自己存在關于某個主題或情境的知識非常態,而且一般也無法精確描述需要什么來解決這種非常態[6]。由于信息需求表達的是用戶所不知道的,因而貝爾金認為研究的焦點應放在用戶信息需求的問題陳述上,通過獲得問題的陳述,構建用戶知識非常態的表達。社會化問答網站是網絡用戶信息需求表達的集中地之一。作為用戶生成的內容,Anderson C提出,許多用戶構建的知識結構的長尾效應將產生不可估量的價值[7]。社會化問答網站是Web2.0用戶生成內容的典范。任何人都可以提出和回答問題,對他人提交的內容進行評分[8],并查看其他人的問題和答案。以其作為研究數據來源,最大的優勢就是可以獲取用戶相對真實完整的信息需求表達,超越了問卷調查、檢索日志等數據的局限。因此,研究試圖從社會化問答網站用戶的提問文本入手,突破先驗式分類框架,結合社會網絡分析和社區發現等研究方法對文本進行挖掘,從宏觀和微觀上客觀地揭示糖尿病患者的信息需求以及隨著時間的推移這些信息需求的演變,總結社會化問答網站用戶糖尿病相關信息需求特征和規律。研究首次從中文社會化問答網站獲取數據分析用戶健康信息需求,能夠從實證角度豐富和拓展日常信息尋求理論,推進認知觀意義下動態健康信息需求研究的深入,并為健康知識組織、知識服務研究提供理論依據。研究也力圖為社會化問答網站提供優化方向,更好地組織信息資源。同時為用戶提供提問參考和建議,幫助公共衛生部門為有效的健康教育活動修改和定制健康信息,提供更好的健康信息服務。了解用戶信息需求和信息來源的相關性如何隨時間變化還可以提高慢性病管理的質量,引領醫療保健系統向更加為患者量身定制的醫療服務轉變。

2019年6月第39卷第6期現代情報Journal of Modern InformationJune,2019Vol.39 No.6

2019年6月第39卷第6期社會化問答網站用戶健康信息需求的演變研究

June,2019Vol.39 No.6

1 相關研究現狀

1.1 用戶健康信息需求

健康信息需求是長期以來信息需求領域的研究熱點之一。由于“信息需求”本身的定義就有多種且尚未達成一致,因此健康信息需求的定義也存在爭議。Timmins F[9]認為,在健康領域,信息需求可以被簡單解釋為病人需要知道的東西。然而,從最廣泛的意義上講,它被廣泛用于代表病人/家庭的知識中可能通過信息和/或教育提供糾正的差距或不足。Ormandy P[10]認為,信息需求意味著處于特定時間點的情境中,對于知識不足以滿足目標的一種認識。我國有學者認為,健康信息需求即當個體出現自我感覺身體不適或曾有高危行為導致其對健康狀況表示懷疑或不確定時,主動尋求相關健康知識或經過醫生確診以獲取所需健康信息,以確定癥狀,排除憂慮[11]。綜合上述研究,本文將用戶健康信息需求定義為:個體主動尋求相關健康信息以獲取所需健康知識,以彌補健康知識的不足,排除憂慮的愿望和渴望。本文研究所指個體僅限于患者及家人等相關人員,不包括專業醫療衛生提供者。

關于健康信息需求的研究既有整體性的,也有針對某種或幾種疾病類型的研究。整體性研究如張洪武等[12]基于網絡用戶搜索行為,利用百度指數分析網絡用戶健康信息需求。Pieper D等[13]通過系統性綜述的方法調查2000-2012年期間以德語或英語出版的德國患者,親屬和一般人群的健康相關信息需求研究??偨Y認為研究使用的方法是高度異質的,年齡越小,病程越短,健康狀況越差,焦慮和抑郁評分越高,信息需求越高。Pian W等[14]探討了用戶健康信息需求情境的自動分類問題。他們認為用戶的健康信息需求情境(即為自己、為他人搜索或沒有健康問題的瀏覽),只要用戶點擊鼠標,就可以通過Web應用程序檢測合理準確地識別。癌癥一直是健康信息需求研究中最受關注的疾病之一。Schmidt A等[15]通過多中心方法描述乳腺癌門診患者的信息需求,劉倩雯等[16]采用信息需求自評量表探討了肝癌患者的健康信息需求。李重陽等[17]以在線問答社區中癌癥信息為例,對信息需求從時間和主題兩個角度進行綜合測度。Vetsch J等[18]通過問卷和訪談評估了癌癥幸存者和父母的信息需求及未滿足的信息需求與臨床和社會人口學特征之間的關聯。結果認為幸存者對醫療信息的需求更加不滿足,而父母在性問題和生活方式方面的需求明顯更多。作為父母,對隨訪護理不滿意,整體健康狀況降低,晚期效應感知風險較高,焦慮/抑郁程度較高與更多未滿足的需求顯著相關。其他疾病方面,Pier C等[19]采用半結構化訪談的專題分析對伴或不伴抑郁癥患者的冠心病(CHD)患者的健康和心理健康信息需求進行研究。結果認為最突出的信息需求包括識別和管理與風險有關的身體癥狀,以及心理社會信息,特別是提高患者的社會支持方面的心理社會信息?;颊哒J為這些信息對緩解健康焦慮和消極影響很重要。Cappelletti E等[20]采用問卷的方法探討受兩種慢性病——高血壓和冠狀病影響的患者的信息需求的演變。調查結果認為,隨著時間的推移,專家被認為是最值得信賴的信息來源。

關于糖尿病的健康信息需求研究也已有一些積累。研究方法方面,Jean B S[21]在對Ⅱ型糖尿病患者的信息需求和信息尋求和使用實踐進行調查時,開發了縱向研究設計,其中包括傳統的數據收集方法(問卷調查和訪談)以及一種新型的卡片分類技術,可以在不同時間點引發參與者對不同來源和類型的糖尿病相關信息的相對有用性的判斷。為滿足用戶對糖尿病相關信息的需求,Chen X等[22]提出了一個中文領域詞典,采用一些專業的糖尿病主題解釋作為領域知識,并將其納入深度學習方法,形成主題分類框架。使用真實數據集的實驗表明,與大多數最先進的基準測試方法相比,該框架在分類糖尿病相關主題方面顯著提高了效率和準確性。實驗分析還顯示,一些健康網站提供了一些不正確或誤導性的類別信息。信息需求內容方面,Lamberts E J F等[23]通過半結構化電話訪談和患者焦點小組討論了解最近開始接受口服抗糖尿病治療的患者的信息需求,并研究藥房為Ⅱ型糖尿病患者提供信息的機會,發現全科醫生無法滿足所有信息需求,而藥劑師有機會,因為患者需要信息并喜歡討論與藥物有關的問題。為了解消費者對糖尿病信息的需求,金碧漪等[24]選取雅虎問答中糖尿病相關的8 762條提問記錄作為研究對象,根據糖尿病信息的類目體系及分類策略對其進行人工編碼,再進行文本處理,并通過多維尺度分析方法,對每個需求類目下的中心詞進一步聚類發現,消費者對于糖尿病健康信息最大的關注點是日常疾病管理、疾病確診和治療,而對疾病預防缺乏應有的關注度。Crangle C等[25]通過眾包平臺,從120名門診糖尿病診所患者和100名市民中收集了164個問題,以分析患者和公眾對Ⅱ型糖尿?。═2DM)的信息需求。確定了23個一般和糖尿病特定主題和5個疾病進展階段,并確定了哪些主題是患者或公眾提出的問題的重要預測因子。Grobosch S等[26]通過混合方法確定最近診斷為Ⅰ型或Ⅱ型糖尿病的人的信息需求及與糖尿病有關的信息需求相關的因素。結果認為大多數參與者表示需要提供所有主題的信息,尤其是糖尿病研究和治療。關于這些主題,參與者希望獲得有關簡化日常生活的新療法的信息。低現時信息水平(不夠或完全不知情)和抗高血糖藥物治療與更高的信息需求顯著相關,糖尿病相關綜合癥和36項短期健康調查(SF-36)中較高的心理成分總分得分顯著相關,信息需求較低。

1.2 信息需求演變

意義建構理論認為,意義建構的能力不僅會超越時空的限制,而且也不會僅僅定位于一個點[27]。兩個面向不一致時,意義建構者在某一情境中停頓下來,由于某種認知差距使其無法趨前,而此時意義建構者就可能利用“橋梁”,即信息的搜尋、獲取和利用把其面對的鴻溝填平[28]。意義建構者填平鴻溝、評估結果(新的認知狀態)后,再繼續移動[29]。這啟示我們,用戶信息需求是一個動態的對象,了解用戶的信息需求需要了解其所處的兩個面向及其變化規律[27]。因此,在識別用戶健康信息需求時,需要運用動態的觀點進行分析。近年,也有學者開始重視對信息需求演變的動態過程的研究。

信息需求演變研究在健康方面有較多應用。Douma K F L等[30]和Matsuyama R K等[31]都調查了癌癥患者的信息需求變化情況。結果都認為盡管隨著時間的推移觀察到需求減少,但總體信息需求仍然很高。Brédart A等[32]和Sheehy E M等[33]都通過問卷調查了隨著診斷時間的推移,乳腺癌患者的信息需求是否存在差異。他們分別得出結論認為盡管有些人持續存在,但信息需求會隨著時間的推移減少;以及診斷后1年、3年和5年的中位數分數無差異,信息需求始終很高,并且疾病過程中是最高的。Halbach S M等[34]則通過前瞻性多中心隊列研究方法在乳腺癌手術后10周和40周后直接對新診斷的乳腺癌患者進行了調查。采用了線性回歸模型,分析了未滿足的信息需求隨時間的變化及其與健康素養的關系。Kassianos A P等[35]通過在線調查問卷在治療過程的各個階段回顧性地探討前列腺癌患者及其伴侶的信息需求?;貞@示越接近診斷時間,對前列腺癌相關信息的需求就越大。Hsieh L Y等[36]用改良的多倫多信息需求問卷分析肺癌患者從診斷到首次治療隨訪的信息需求。用廣義估算方程比較信息需求隨時間的變化,結果認為每個域的信息需求均隨著時間的推移而顯著下降。無論疾病階段如何,對“疾病相關信息”的需求仍然很高。Chernyak N等[37]制定了適用于評估不同醫療環境(例如初級保健或長期護理)中Ⅰ型和Ⅱ型糖尿病患者以及疾病過程中不同時間點的信息需求的問卷。Greco A等[38]通過前瞻性觀察性研究探索急性冠狀動脈綜合征后24個月內患者不同信息來源的信息需求和感知相關性。Odlum M等[39]通過縱向追蹤,在不同的流行時間點評估有關埃博拉的健康信息需求。他們對推文進行自然語言處理,并通過信息圖表進行了分析和可視化來探索公眾對埃博拉病毒的反應。結果發現隨著時間的推移,觀察到公眾對埃博拉的恐懼,沮喪和相關全球重點事項的健康信息尋求??v向內容分析顯示,由于持續的健康信息缺陷,導致恐懼和沮喪,社交媒體有時成為障礙,而不是支持健康信息需求的工具。Chen A T[40]采用K-means算法對3個在線論壇(乳腺癌,Ⅰ型糖尿病和纖維肌痛)討論內容進行聚類。結論認為聚類得到的簇強調了患者信息需求的不斷變化。提供給患者的信息應該適合他們在疾病期間的各個階段滿足他們的需求。

綜上所述,國內外對健康信息需求和信息需求演變研究都較為重視,既集中于信息需求的內容,又有涉及研究方法、應用等方面,但仍有不足之處。如雖然有些研究對網絡用戶健康信息需求有所涉及,但專門研究仍相對較少。健康信息需求的研究通常是以研究者構建好的信息需求框架為基礎,先驗性過強。而在研究方法上多以問卷調查或訪談為主,較少有從文本信息的角度對用戶健康信息需求加以挖掘,與社會網絡分析結合的則更為少見,健康信息需求演變的研究也通常按照疾病階段劃分。因此,研究參考Zhao Y等[41]的研究思路,試圖以一個中文社會化問答網站糖尿病相關提問文本為基礎,構造共詞網絡,運用社會網絡分析和社區發現的方法,突破先驗式分類框架,客觀地描述十年間用戶關于糖尿病信息需求的特點及演變。

2 研究方法

2.1 社會網絡分析

研究首先將提問進行分詞處理,進行詞頻統計,并構建共詞矩陣,繪制共詞網絡。共詞網絡是根據詞共現關系,采用不同的指數算法計算共現強度并繪制的共現網絡圖[42]。由于研究關注的是信息需求的整體特征和演變,而共詞網絡恰好符合研究需求。依據單獨的關鍵詞分析通常難以準確判斷信息需求,共詞網絡則更能代表提問的內容和思想,提供了一個更全面的視角。本文采用ROST CM6的社會網絡和語義網絡分析功能進行共現分析,并用Gephi繪制了共詞網絡圖。共詞網絡不會對詞匯數量加以限制,偏向從宏觀角度描述由關鍵詞表征的用戶提問。共詞網絡通常與社會網絡分析法結合使用以揭示主題的分布、關聯及演化[42]。

社會網絡分析方法在情報學的合著網絡、引文網絡、競爭情報、隱性知識共享等方面都有廣泛的應用,尤其是研究領域識別方面。社會網絡是社會行動者及他們之間關系的集合[43]。社會網絡分析處理的是關系數據,其分析單位是“關系”,社會網絡分析的核心價值就在于從“關系”角度出發研究社會行動者及其社會結構[44]。共詞網絡中詞便是社會行動者,由詞間關系構成的網絡便是社會結構。社會關系圖所提供的數據可視化顯示經常能讓研究者發現不如此就難以發現的模式[45]。因此研究將以可視化方式呈現共詞網絡,以圖論思想為基礎,采用社會網絡分析中典型的網絡度量方法,包括平均度、圖密度、平均聚類系數等對共詞網絡進行分析對比,揭示用戶關于糖尿病的信息需求及變化。

2.2 社區發現與演變

社區發現(Community Detection)研究是復雜網絡領域的研究熱點和重要研究方向[46]。Newman M E[47]認為,在頂點群中,連接是密集的,但它們之間的連接比較稀疏,這樣的結構就是社區結構。整個網絡可以看作是由多個社區組成,社區是社會網絡的一個重要結構特征,也是中觀尺度觀察和理解網絡拓撲的一種重要結構。相關術語還有社區、聚團或群組結構等[48]。運用社區發現方法能發現復雜網絡里潛在的、隱藏的子社區。針對社區發現已有多種技術及相應算法被提出,如以GN算法[49]為代表的層次聚類方法、以LPA算法[50]為代表的標簽傳播方法、直接進行圖劃分的SCD算法[51]、用于團滲透方法的SCP算法[52]、以抽取網絡中稠密子圖為目標的OQC算法[53]、基于模塊度優化(Modularity Optimization)的Fast Unfolding算法[53]等。

基于運算速度、運行效果、數據規模等因素考慮,本文利用Gephi內置的Fast Unfolding算法進行社區發現。Fast Unfolding算法原理分為兩個階段,首先將每個節點指定到唯一的一個社區,然后按順序將節點在這些社區間進行移動,并計算相應的模塊度變化值,哪個變化值最大就將節點移動到相應的社區中去,按照這個方法反復迭代,直到網絡中任何節點的移動都不能再改善總的模塊度值為止。第二個階段是將第一個階段得到的社區視為新的“節點”(一個社區對應一個),重新構造子圖,兩個新“節點”之間邊的權值為相應兩個社區之間各邊的權值的總和[55]。

公式中,kisi代表在模塊s中節點i的度數,si代表節點i所屬的模塊,〈…〉j∈s表示平均數。根據經驗,在一個社區中,Z-value值大于2.5的節點為核心節點,被用來代表社區[56]。研究對聚類得到的每個社區中每個節點的Z-value進行計算和排序,以找到能表征整個社區的核心節點。

在共詞網絡中,網絡社區不是一成不變的。網絡社區的屬性可能會隨時間發生變化,網絡社區的演化既包括社區自身內部節點、關系和結構的變化,也包括社區間關系和位置的變化[58]。共詞網絡的演變研究在各學科研究進展的分析中有著比較多的應用[59-62]。網絡社區演變問題可以簡單理解為為t時段的所有網絡社區尋找前驅和后繼。尋找一個網絡社區前驅后繼的常用方法有3種,分別為分類方法、語言模型方法、相似度模型方法[58],本研究采用相似度模型方法,引入包含指數(inclusion index)計算相似度。包含指數的基本思想如下:設Tt為子周期t的主題集合,U∈Tt表示子周期中每個檢測到的主題(社區)。令V∈Tt+1為下一個子時段t+1中的每個檢測到的主題。如果在兩個相關的社區中都存在相同的關鍵詞,則說社區U到社區V存在演變[63]。包含指數表示如下:

與Jaccard或余弦指數相比,包含指數在衡量相似集合方面更有優勢,因為它不受數量影響[63]。研究通過這種方法確定網絡社區演變路徑,并以可視化的方式進行分析和呈現。

3 數據獲取與預處理

3.1 數據源的選擇

研究選取尋醫問藥網作為數據來源,原因在于:其一,作為專業健康社會化問答網站,用戶信息需求不會過于分散,噪音較少。其二,尋醫問藥網成立于2004年,是中國較早探索和實踐互聯網醫療服務的平臺之一。截至2016年,尋醫問藥網注冊用戶超過1.2億,日獨立訪客超過2 200萬,月獨立訪客超過3.2億,位居醫療健康服務行業第一[64]。其提供的問答服務“有問必答”中,問答模式是以醫生回答提問為主,也有普通用戶回答的情況。一般社會化問答網站是用戶提問用戶回答,其缺陷是回答問題的人往往不具有嚴格的專業性。因為誰都可以成為回答者,對回答的內容判別要交給提問者,當面對醫學健康這種嚴謹的問題時就面臨著難以得到專業回答的尷尬境地??梢哉f,“有問必答”屬于已經進行了專家發現的社會化問答社區,積累了比較豐富的用戶提問,是比較成熟的、適合進行研究的健康類社會化問答網站。

尋醫問藥網“有問必答”(http://club.xywy.com/)下的所有問題以日期為單位呈現,每天被提出的所有問題作為一個集合形成一個鏈接歸檔(如圖1)。因此,數據獲取以時間為單位,保證完整性。采集工具為八爪魚采集器,以“糖尿病”為關鍵詞對提問進行篩選。對于每條提問采集3個字段:標題、問題描述和時間。如果某一項或幾項用戶沒有填寫則置空。采集的提問時間段為2007年12月至2008年12月以及2017年12月至2018年12月。

3.2 文本預處理

對采集到的問題文本進行清洗,處理內容包括以下情況:

1)問題描述中的引導語。網站提問框中提供了如下引導語:病情描述(發病時間、主要癥狀、癥狀變化等)。一些用戶直接將這部分寫入了自己的問題描述。由于可能對關鍵詞提取產生影響,因此將這部分文字去除。

2)文本內容去重。針對文本內部的無意義內容進行去重,如“糖尿病怎么辦糖尿病怎么辦”,使用最大公共子序列算法,將公共序列中重復部分去除,只保留1個。

3)圖片。對于問題描述中帶有圖片的,將圖片網址去除。

4)對疑似水軍的灌水提問進行清理。

完成以上處理后,將文檔進行編碼和格式轉換,并采用ICTCLAS分詞模塊對得到的提問數據進行分詞處理。最終用于研究的有效數據分別為2007年12月至2008年12月(下簡稱“2007-2008年”)7 555條,以及2017年12月至2018年12月(下簡稱“2017-2018年”)13 328條,問題描述的平均字數分別為58.4和64.5。

4 結果與討論

4.1 高頻詞分析

對所有文本進行分詞后,采用ICTCLAS語言統計模塊對已分詞的提問文本進行單篇——批量詞頻統計,不統計虛詞,得到2007-2008年實義詞7 436個,2017-2018年8 928個??梢钥闯?,雖然10年間提問數將近翻了1倍,但所用詞數增長得并沒有那么多。而其中有共現關系、參與構成共詞矩陣的詞則分別為395個和301個,這個比例與劉知遠等[65]的實驗結果大體一致。核心語詞減少這一點則與Zhao Y等[41]得出的結論一致。Zhao Y等對2005-2006年及2013-2014年雅虎問答網站用戶關于糖尿病的問答日志進行了分析,認為在提問數增加的情況下,核心詞數量有所減少并趨于集中。這也反映了用戶信息需求的集中趨勢。

如表1和表2所示,從具體的高頻詞及其變化可以初步對用戶糖尿病相關信息需求有一個直觀的認識。通用詞變化較小,關于“治療”、“醫院”、“醫生”等信息需求一直處于較高的水平?!把恰薄ⅰ耙葝u素”等基本專有詞排名一直靠前,“高血壓”是被提問最多的并發癥。10年間用戶對健康管理(飲食、運動)的信息需求有較大增長,“運動”的增長最為顯著。相對于關于“藥”的排名有所下降,“中藥”和“中醫”的信息需求則有所上升。此外,并發癥腎病以及妊娠糖尿病相關信息需求都有增長,同時也更注重糖尿病及其并發癥的預防。提問者表現出更多的焦慮情緒(“擔心”),更多關注是否能治愈及遺傳因素。由于代謝病外科手術技術的不斷成熟,對這種治療方法的信息需求也隨之增加。

4.2 共詞網絡整體屬性分析

兩個時間段的共詞網絡整體屬性對比如表3所示。頂點的度是指與頂點相關聯的邊數,從圖2和圖3中可以看出,度序列散點呈明顯的冪律分布,部分節點具有極高的連接度(110以上),而大量節點的連接度很低,體現出了非均勻性。也就是說,網絡中存在大量度值相對較小的邊緣詞,也存在少量度值相對非常大的核心詞[66],這與齊夫定律的結論相符。核心詞的存在使得很多不相關的關鍵詞產生了間接聯系,進而產生社區。2007-2008年平均度為4.66,而2017-2018年增長到6.759,圖密度則從0.022增長為0.029。這兩個指標的同步增長表明隨著時間的變化,網絡的相關性和連通性都在提高。也就是說,核心詞數量減少的情況下,其聯系是有所增加的。網絡的平均路徑長度是指所有可達節點對最短路徑的加權平均值[67],平均聚類系數是指所有節點聚類系數的平均值[68],根據圖論,聚集系數是表示1個圖形中節點聚集程度的系數。網絡的平均路徑保持在2左右,變化較小,網絡邊緣概念離核心概念的關聯步長較短,網絡平均聚類系數遠高于同等規模的隨機網絡(0.01左右)。小平均路徑長度和大聚類系數即是小世界效應的兩個顯著特點[69],因此可以認為網絡具有小世界效應。平均聚類系數在10年間有顯著提高,進一步表明核心詞集中趨勢的加強。

4.3 社區發現與演變

經上一節分析可知,2007-2008年和2017-2018年網絡度分布、聚類系數、平均路徑長度的特點均符合社區劃分結構。運用Fast Unfolding算法對構建的共詞網絡進行社區發現,分別劃分出7個和5個社區,模塊度分別為0.355和0.311。社區數量減少,也反映了核心詞的集中趨勢。社區內語詞數分布如圖4和圖5所示。

按照Z-value的計算公式,對所劃分的每個社區中的節點的Z-value進行計算,并進行排序,將Z-value大于等于2.5的節點提取出來作為每個社區的核心節點(剔除意義不大的中心節點“糖尿病”)。圖6和圖7為通過Gephi可視化呈現的結果,社區以不同顏色進行了區分,核心節點放大標出。可以看到,有些社區Z-value大于等于2.5的節點有兩個,而社區本身詞數小于等于3的也都用兩個詞作為核心節點。通過分析核心節點及社區內的關聯關系,可以發現2007-2008年用戶關于糖尿病的提問包括癥狀(“疼痛”)、降糖(“血糖”)、治療、并發癥(糖尿病眼?。?、病史幾個方面,而2017-2018年用戶提問則包括就診、治療、并發癥(高血壓)、檢查、癥狀(“無力”)幾個方面。對比之下,可以看到用戶對高血壓這種并發癥的信息需求增加,而眼病則相對下降。此外,用戶對身體檢查更加重視,也體現了用戶健康素養和生活水平的不斷提高。

為從一個更微觀的角度研究用戶信息需求的演變,將2017-2018年的數據劃分為4段,大體與季節對應,記做t1、t2、t3和t4。對4部分數據進行上述同樣的共詞網絡構建和社區發現操作,基于相似度找出社區的前驅后繼關系,用?;鶊D的形式呈現演變結果如圖8所示??梢钥吹剑?個時間段社區發現的結果與全年結果基本一致,治療、癥狀信息需求表現穩定,反映了最近一段時間用戶糖尿病相關的主要信息需求。時段t1的“并發癥”在t2時段分化為“血壓”和其他,而在t3時段“血壓”社區消失,由其他3個社區演化出了1個新的社區“眼病”。與t1時段“血糖”社區結合分析,可以看出糖尿病及并發癥具有一定的季節性規律。冬季是糖尿病病情最易加重和高血壓多發的季節,因此時段1和時段2用戶關于“血糖”和“血壓”的信息需求明顯集中。t3時段社區“檢查”出現,結合全年社區發現結果,可以認為用戶從t3時段開始對檢查的信息需求增加,且增長顯著。

5 結論與展望

研究通過詞頻分析、共詞社會網絡分析以及社區發現和演變的方法,以社會化問答網站“尋醫問藥網”為例,總結了中文用戶糖尿病相關信息需求的特點:1)10年間用戶表達出來的信息需求趨于集中是最突出的特點,這一點在采用的各種研究方法得出的結論中都有體現。與PubMed等醫學權威機構或組織所使用的分類體系相比,用戶實際信息需求集中于特定的幾個方面,治療和癥狀一直屬于用戶的核心信息需求,這與Zhao Y等[41]以及金碧漪等[24]的研究結果基本一致。2)10年間用戶對健康管理(飲食、運動)的相關關鍵詞數有較大增長,但在社區發現與演變研究中則表現不顯著。這一結果則與上述兩組學者的研究結果不一致,分析認為是由于數據源不同導致的。Zhao Y等[41]以及金碧漪等[24]所采用的都是來自雅虎問答的英文數據,各方面的差異使得健康管理仍未成為中文用戶的核心關注點。3)10年間“中藥”和“中醫”的信息需求有所上升,體現了用戶的求醫問藥轉向。而的確有研究證明中藥在調理糖尿病方面的潛力,尤其是中西藥物聯用與單用西藥比較有較顯著的優勢[70]。4)“高血壓”是被提問最多,增長也最明顯的并發癥,并遵循一定的季節性規律。盡管研究方法和數據都不同,但研究結論與Grobosch S等[26]對德國糖尿病患者的研究大體一致。

結合上述結論,建議用戶更多地對健康管理給予關注。雖然10年間相關信息需求有所增長,對比之下仍有差距。世界衛生組織認為,定期進行中等強度的身體活動可幫助預防并治療糖尿病。Ⅱ型糖尿病占總病例數的90%,主要是由于體重超重和缺乏身體活動造成[71]。因此,用戶有必要對相關問題給予更多關注,以從本質上調節自己或親人的病癥。研究的詞頻分析及共詞網絡揭示了糖尿病消費者在表達具體健康信息需求時的用詞習慣、詞匯間的語義關聯等[24],社會化問答網站、搜索引擎等可以據此優化信息組織、信息推薦、查詢補全等功能,使之更貼近用戶需求和使用習慣。對公共衛生部門來說,則應該加強糖尿病及其并發癥預防內容的科普。整體來看,提問用戶雖然對如何預防關注度有所提高,但通常仍是患病或疑似患病才求助各信息源,說明用戶還需要提高對疾病預防的重視程度。作為一個糖尿病大國,糖尿病又是通過日常生活方式的改變就容易預防的慢性病,公共衛生部門有責任和義務進行糖尿病預防內容的科普。同時應根據用戶信息需求將預防策略細化,如怎樣健康飲食、如何預防各種并發癥等。針對提問較多的眼病、高血壓等并發癥,還可以建立并發癥防控篩查制度和平臺,加強防控和管理,定期檢查并獲取相關數據,形成檔案,建立一個中長期、多維度的健康管理體系,為干預方法多樣性和有效性提供大數據支持[72]。

研究還有一些不足之處。首先,研究只選擇一特定社會化問答網站為例,可能存在數據偏見。其次,進行社區發現和演變分析時沒有考慮重疊社區。實際上在演變可視化結果中可以看到,核心節點相同的社區存在相互分化的現象,也就是說各社區有重疊部分存在。

鑒于以上局限和不足,后續研究還可以從以下方面進行改進和突破:1)考察更多其他不同疾病、不同社會化問答網站的用戶提問,與本文得出的結論進行比較,以驗證其普遍性;2)考慮騎墻節點因素,發現重疊社區并進行研究;3)力圖補齊10年間數據,更為細致地分析用戶糖尿病相關信息需求的演變。

參考文獻

[1]IDF.Diabetes Atlas:Eighth Edition[R/OL].https://www.idf.org/e-library/epidemiology-research/diabetes-atlas/134-idf-diabetes-atlas-8th-edition.html,2018-10-21.

[2]Wilson V.Patient Use of the Internet for Diabetes Information[J].Nursing Times,2013,109(23):18.

[3]曲振瑞,丁麗.糖尿病患者健康信息需求調查[J].中國誤診學雜志,2007,(3):660.

[4]高改云,王霞.糖尿病患者健康信息需求分析與對策[J].醫學信息,2007,(1):149-150.

[5]郭光霞.糖尿病患者健康信息需求調查分析及護理對策[J].基層醫學論壇,2008,(21):628-629.

[6]Belkin N J,Oddy R N,Brooks H M.ASK for Information Retrieval.Part I:Background and Theory[J].Journal of Documentation,1982,38(2):61-71.

[7]Anderson C.The Long Tail:Why the Future of Business Is Selling Less of More[M].NY,US:Hachette Books,2006.

[8]Gazan R.Social Q&A[J].Journal of the Association for Information Science & Technology,2014,62(12):2301-2312.

[9]Timmins F.Exploring the Concept of‘Information Need[J].International Journal of Nursing Practice,2006,12(6):375-381.

[10]Ormandy P.Defining Information Need in Health-assimilating Complex Theories Derived from Information Science[J].Health Expectations,2011,14(1):92-104.

[11]張馨遙.健康信息需求研究的內容與意義[J].醫學與社會,2010,23(1):51-53.

[12]張洪武,馮思佳,趙文龍,等.基于網絡用戶搜索行為的健康信息需求分析[J].醫學信息學雜志,2011,32(5):13-18.

[13]Pieper D,Fabian Jülich,Antoine S L,et al.Studies Analysing the Need for Health-related Information in Germany-A Systematic Review[J].BMC Health Services Research,2015,15(1):407.

[14]Pian W,Khoo C S,Chi J.Automatic Classification of Users Health Information Need Context:Logistic Regression Analysis of Mouse-Click and Eye-Tracker Data[J].Journal of Medical Internet Research,2017,19(12):e424.

[15]Schmidt A,Ernstmann N,Wesselmann S,et al.After Initial Treatment for Primary Breast Cancer:Information Needs,Health Literacy,and the Role of Health Care Workers.[J].Supportive Care in Cancer,2016,24(2):563-571.

[16]劉倩雯,張美芬,陳梅先.肝癌患者栓塞化療術前疾病不確定感與信息需求水平及相關性[J].護理學報,2013,20(22):73-76.

[17]李重陽,翟姍姍,鄭路.網絡健康社區信息需求特征測度——基于時間和主題視角的實證分析[J].數字圖書館論壇,2016,(9):34-42.

[18]Vetsch J,Fardell J E,Wakefield C E,et al.“Forewarned and Forearmed”:Long-term Childhood Cancer Survivors and Parents Information Needs and Implications for Survivorship Models of Care[J].Patient Education & Counseling,2017,100(2):355-363.

[19]Pier C,Shandley K A,Fisher J L,et al.Identifying the Health and Mental Health Information Needs of People with Coronary Heart Disease,with and Without Depression[J].Medical Journal of Australia,2008,188(12):142-4.

[20]Cappelletti E,DAddario M,Steca P,et al.Evolution of Information Needs in Patients Affected By Coronaropathy and Hypertension[C]//Conference of the European Health Psychology Society.“Well-being,Quality of Life and Caregiving”.Bordeaux,France:European Health Psychology Society,2013.

[21]Jean B S.Devising and Implementing a Card-sorting Technique for a Longitudinal Investigation of the Information Behavior of People with Type 2 Diabetes[J].Library & Information Science Research,2014,36(1):16-26.

[22]Chen X,Zhang Y,Zhao K,et al.Domain Supervised Deep Learning Framework for Detecting Chinese Diabetes-Related Topics[C]//International Conference on Database Systems for Advanced Applications.Berlin,German:Springer,Cham,2018:53-71.

[23]Lamberts E J F,Bouvy M L,Hulten R P V.The Role of the Community Pharmacist in Fulfilling Information Needs of Patients Starting Oral Antidiabetics[J].Research in Social and Administrative Pharmacy,2010,6(4):354-364.

[24]金碧漪,許鑫.社會化問答社區中糖尿病健康信息的需求分析[J].中華醫學圖書情報雜志,2014,23(12):37-42.

[25]Crangle C,Bradley C P,Carlin P,et al.Exploring Patient Information Needs in Type 2 Diabetes:A Cross Sectional Study of Questions[J].PLOS ONE,2018,13(11):e0203429.

[26]Grobosch S,Kuske S,Linnenkamp U,et al.What Information Needs Do People with Recently Diagnosed Diabetes Mellitus Have and what Are the Associated Factors?A Cross-sectional Study in Germany[J].BMJ open,2018,8(10):e017895.

[27]馬費成,宋恩梅編著.信息管理學基礎(第2版)[M].武漢:武漢大學出版社,2011

[28]顏端武.信息獲取與用戶服務[M].北京:科學出版社,2010:61.

[29]Dervin B.Sense-making Theory and Practice:An Overview of User Interests in Knowledge Seeking and Use[J].Journal of Knowledge Management,1998,2(2):36-46.

[30]Douma K F L,Koning C C E,Zandbelt L C,et al.Do Patients Information Needs Decrease Over the Course of Radiotherapy?[J].Supportive Care in Cancer,2012,20(9):2167-2176.

[31]Matsuyama R K,Kuhn L A,Molisani A,et al.Cancer Patients Information Needs the First Nine Months After Diagnosis[J].Patient Education & Counseling,2013,90(1):96-102.

[32]Brédart A,Kop J L,Fiszer C,et al.Breast Cancer Survivors Perceived Medical Communication Competence and Satisfaction with Care at the End of Treatment[J].Psycho-Oncology,2015,24(12):1670-1678.

[33]Sheehy E M,Lehane E A,Quinn E M,et al.The Information Needs of Patients with Breast Cancer at Years One,Three and Five Post Diagnosis[J].Clinical Breast Cancer,2018,92:S26.

[34]Halbach S M,Ernstmann N,Kowalski C,et al.Unmet Information Needs and Limited Health Literacy in Newly Diagnosed Breast Cancer Patients Over the Course of Cancer Treatment[J].Patient Education and Counseling,2016:S0738399116302932.

[35]Kassianos A P,Raats M M,Gage H.An Exploratory Study on the Information Needs of Prostate Cancer Patients and Their Partners[J].Health Psychology Research,2016,4(1):4786.

[36]Hsieh L Y,Chou F J,Guo S E.Information Needs of Patients with Lung Cancer from Diagnosis Until first Treatment Follow-up[J].PloS One,2018,13(6):e0199515.

[37]Chernyak N,Stephan A,Bchle C,et al.Assessment of Information Needs in Diabetes:Development and Evaluation of a Questionnaire[J].Primary Care Diabetes,2016,10(4):287-292.

[38]Greco A,Cappelletti E R,Monzani D,et al.A Longitudinal Study on the Information Needs and Preferences of Patients After an Acute Coronary Syndrome[J].BMC Family Practice,2016,17(1):136.

[39]Odlum M,Yoon S.Health Information Needs and Health Seeking Behavior During the 2014-2016 Ebola Outbreak:A Twitter Content Analysis[J].PLoS Currents,2018,10.

[40]Chen A T.Exploring Online Support Spaces:Using Cluster Analysis to Examine Breast Cancer,Diabetes and Fibromyalgia Support Groups[J].Patient Education & Counseling,2012,87(2):250-257.

[41]Zhao Y,Chen B,Zhang J,et al.An Investigation on the Evolution of Diabetes Data in Social Q&A Logs[J].Data and Information Management,2018,1(ahead-of-print).

[42]隗玲,許海云,劉春江,等.技術領域主題發現研究——以基因工程疫苗領域為例[J].數字圖書館論壇,2017,(1):37-45.

[43]葉春蕾,冷伏海.基于社會網絡分析的技術主題演化方法研究[J].情報理論與實踐,2014,37(1):126-130,140.

[44]劉軍.整體網分析:UCINET軟件實用指南[M].上海:格致出版社,2014.

[45]斯坦利·沃瑟曼,凱瑟琳·福斯特.社會網絡分析:方法與應用[M].陳禹,孫彩虹,譯.北京:中國人民大學出版社,2012.

[46]陽廣元,曹霞,甯佐斌,等.國內社區發現研究進展[J].情報資料工作,2014,(2):29-33.

[47]Newman M E.Detecting Community Structure in Networks[J].European Physical Journal B,2004,38(2):321-330.

[48]王莉,程學旗.在線社會網絡的動態社區發現及演化[J].計算機學報,2015,38(2):219-237.

[49]Newman M E,Girvan M.Finding and Evaluating Community Structure in Networks[J].Physical Review E,2004,69(2):026113.

[50]Raghavan U N,Albert R,Kumara S.Near Linear Time Algorithm to Detect Community Structures in Large-scale Networks[J].Physical Review E,2007,76(3):036106.

[51]Prat-Pérez A,Dominguez-Sal D,Larriba-Pey J L.High Quality,Scalable and Parallel Community Detection for Large Real Graphs[C]//Proceedings of the 23rd International Conference on World Wide Web.New York:ACM,2014:225-236.

[52]Kumpula J M,Kivel M,Kaski K,et al.Sequential Algorithm for Fast Clique Percolation[J].Physical Review E,2008,78(2):026109.

[53]Tsourakakis C,Bonchi F,Gionis A,et al.Denser Than the Densest Subgraph:Extracting Optimal Quasi-cliques with Quality Guarantees[C]//Proceedings of the 19th International Conference on Knowledge Discovery and Data mining.New York:ACM,2013:104-112.

[54]Blondel V D,Guillaume J,Lambiotte R,et al.Fast Unfolding of Communities in Large Networks[J].Journal of Statistical Mechanics:Theory and Experiment,2008,2008(10):P10008.

[55]劉自強,王效岳,白如江.語義分類的學科主題演化分析方法研究——以我國圖書情報領域大數據研究為例[J].圖書情報工作,2016,60(15):76-85,93.

[56]朱夢嫻,程齊凱,陸偉.基于社會網絡的學科主題聚類研究[J].情報雜志,2012,31(11):40-44,39.

[57]Guimera R,Sales-Pardo M,Amaral L A N.Classes of Complex Networks Defined By Role-to-role Connectivity Profiles[J].Nature Physics,2006,3(1):63.

[58]程齊凱,王曉光.一種基于共詞網絡社區的科研主題演化分析框架[J].圖書情報工作,2013,57(8):91-96.

[59]Cui P,Zhang W.Co-word Analysis of Domestic Network Virtual Society Research Hotspots and Evolution[C]//International Conference on Management of E-commerce & E-government.Piscataway,NJ:IEEE,2012.

[60]王宇燦,李一飛,袁勤儉.國際大數據研究熱點及前沿演化可視化分析[J].工程研究-跨學科視野中的工程,2014,6(3):282-293.

[61]Li W,Liu Y,Xiao S,et al.An Investigation of the Underlying Evolution of Shale Gas Researchs Domain Based on the Co-Word Network[J].Sustainability,2018,10(1).

[62]Sohn E,Noh K,Lee B,et al.Bibliometric Network Analysis and Visualization of Research and Development Trends in Precision Medicine[C]//2018 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining(ASONAM).Piscataway,NJ:IEEE,2018:727-730.

[63]Cobo M J,López-Herrera A G,Herrera-Viedma E,et al.An Approach for Detecting,Quantifying,and Visualizing the Evolution of a Research Field:A Practical Application to the Fuzzy Sets Theory Field[J].Journal of Informetrics,2011,5(1):146-166.

[64]尋醫問藥網.關于我們[EB/OL].http://www.xywy.com/about/index.html,2018-10-21.

[65]劉知遠,孫茂松.漢語詞同現網絡的小世界效應和無標度特性[J].中文信息學報,2007,(6):52-58.

[66]張斌.共詞網絡的結構與演化:概念與理論進展[J].情報雜志,2014,33(7):103-109.

[67]Albert R,Barabási A L.Statistical Mechanics of Complex Networks[J].Reviews of Modern Physics,2002,74(1):47-97.

[68]Watts D J,Strogatz S H.Collective Dynamics of‘SmallworldNetworks[J].Nature,1998,393(6684):440-442.

[69]周云龍.復雜網絡平均路徑長度的研究[D].合肥:合肥工業大學,2013.

[70]胡佳卉.基于信息處理的中醫藥治療Ⅱ型糖尿病方藥數據挖掘與分析研究[D].北京:北京中醫藥大學,2017.

[71]世界衛生組織.2016年世界衛生日宣傳活動[EB/OL].https://www.who.int/campaigns/world-health-day/2016/zh/,2018-11-23.

[72]新華網.貴州省首個基層糖尿病眼底篩查防控平臺揭牌[EB/OL].http://www.gz.xinhuanet.com/2019-03/16/c_1124241961.htm,2019-03-19.

(責任編輯:孫國雷)

猜你喜歡
糖尿病
糖尿病知識問答
中老年保健(2022年5期)2022-08-24 02:35:42
糖尿病知識問答
中老年保健(2022年1期)2022-08-17 06:14:56
糖尿病知識問答
中老年保健(2021年5期)2021-08-24 07:07:20
糖尿病知識問答
中老年保健(2021年9期)2021-08-24 03:51:04
糖尿病知識問答
中老年保健(2021年7期)2021-08-22 07:42:16
糖尿病知識問答
中老年保健(2021年3期)2021-08-22 06:49:56
糖尿病知識問答
糖尿病離你真的很遙遠嗎
糖尿病離你真的很遠嗎
得了糖尿病,應該怎么吃
基層中醫藥(2018年2期)2018-05-31 08:45:04
主站蜘蛛池模板: 在线a视频免费观看| 波多野结衣一二三| 国产素人在线| 九九九精品成人免费视频7| 亚洲综合亚洲国产尤物| 77777亚洲午夜久久多人| 国产成人综合久久精品尤物| 2020精品极品国产色在线观看| 久久国语对白| 久久精品日日躁夜夜躁欧美| 特级做a爰片毛片免费69| 人妖无码第一页| 午夜福利视频一区| 国产精品福利在线观看无码卡| 亚洲国产亚综合在线区| 91九色视频网| 亚洲人成色在线观看| 精品黑人一区二区三区| 国产性猛交XXXX免费看| 99久久精品免费观看国产| 成人免费网站久久久| 成人亚洲国产| 国产一区在线观看无码| 国产网站一区二区三区| 欧美色99| 九色在线观看视频| 欧美v在线| 日韩无码视频播放| 久久五月天综合| 亚洲av片在线免费观看| 国产二级毛片| 久久精品视频亚洲| 亚洲精品在线观看91| 在线免费看片a| 国产成人高清精品免费5388| 欧美另类精品一区二区三区| 中字无码av在线电影| 精品无码国产一区二区三区AV| 亚洲国产AV无码综合原创| 久久久精品久久久久三级| 中文国产成人精品久久一| 亚洲精品手机在线| 情侣午夜国产在线一区无码| 91久久国产成人免费观看| www中文字幕在线观看| 色一情一乱一伦一区二区三区小说| 亚洲综合极品香蕉久久网| 亚洲最大在线观看| 亚洲综合极品香蕉久久网| 全部免费毛片免费播放| 伊人91在线| 伊人网址在线| 亚洲Av综合日韩精品久久久| 中文字幕丝袜一区二区| 天天婬欲婬香婬色婬视频播放| 97视频免费在线观看| 国产精品永久不卡免费视频| 丝袜国产一区| 久久精品一品道久久精品| 国产91熟女高潮一区二区| 欧美不卡二区| 精品无码人妻一区二区| 欧美日韩亚洲综合在线观看| 国产主播在线一区| 亚洲全网成人资源在线观看| 国产三级毛片| 精品国产99久久| 日韩精品资源| 欧美综合成人| www精品久久| 亚洲日韩高清在线亚洲专区| 亚洲国产综合自在线另类| 四虎成人精品| 亚洲电影天堂在线国语对白| 欧美一级特黄aaaaaa在线看片| a天堂视频在线| 国产精品永久久久久| 精品91视频| 国产精品吹潮在线观看中文| 国产精品亚洲天堂| 99久久人妻精品免费二区| 国产v精品成人免费视频71pao|