999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于膠囊網(wǎng)絡模型的抑郁癥預測研究

2021-11-22 08:53:36王汝傳
計算機技術(shù)與發(fā)展 2021年11期
關(guān)鍵詞:情緒特征文本

査 猛,葉 寧*,王汝傳,徐 康

(1.南京郵電大學 計算機學院、軟件學院、網(wǎng)絡空間安全學院,江蘇 南京 210003;2.江蘇省無線傳感網(wǎng)高技術(shù)研究重點實驗室,江蘇 南京 210093)

0 引 言

隨著現(xiàn)代生活的快速發(fā)展,心理健康問題引起社會各界越來越多的關(guān)注。抑郁癥也稱抑郁障礙,是一類以顯著而持久的心境低落為主要特征的情緒障礙疾病,具有慢性、反復發(fā)作、遷延不愈、自殺率高的特點[1]。因此,對抑郁癥患者進行早期識別診斷,并及時給予治療十分重要。但是,目前抑郁癥的診斷主要以問卷調(diào)查為主,并以醫(yī)生的判斷為輔。其準確程度主要依賴于醫(yī)生的專業(yè)水平和經(jīng)驗以及患者的配合程度,并且患者的早期診斷和評估具有非常大的限制,如患者沒有意識到自己得病、患者不愿意就醫(yī)等[2]。針對抑郁癥的診斷困難問題,由于近年來微博、推特等社交工具的廣泛使用,產(chǎn)生大量的可分析數(shù)據(jù),為采用機器學習方法來識別輕度抑郁癥患者提供了數(shù)據(jù)基礎,因此利用機器學習來預測網(wǎng)絡用戶的抑郁癥傾向得到了越來越多研究人員的關(guān)注,并成為自然語言處理領(lǐng)域的研究熱點之一[3]。

國內(nèi)外許多研究人員針對情緒分析已經(jīng)做了大量研究,但在社交網(wǎng)絡中利用微博或推特評論并基于深度學習框架關(guān)于抑郁癥的研究很少[4]。近年來,不斷有學者提出用圖像領(lǐng)域的卷積神經(jīng)網(wǎng)絡來解決自然語言處理的任務。受此啟發(fā),文中使用卷積神經(jīng)網(wǎng)絡來處理微博文本的抑郁癥預測任務,但是卷積神經(jīng)網(wǎng)絡存在池化層丟失信息以及無法學習文本內(nèi)在的關(guān)聯(lián)信息等問題,并且抑郁癥的預測不是情緒的正負極判斷,僅僅通過神經(jīng)網(wǎng)絡模型訓練得出的預測結(jié)果較為不準確。為了解決難以充分利用文本情緒特征和抑郁癥預測不準確的問題,文中設計了融合局部與整體特征的膠囊網(wǎng)絡模型。該模型使用膠囊網(wǎng)絡來彌補卷積神經(jīng)網(wǎng)絡的缺點,可以充分地學習文本整體與局部的內(nèi)在空間關(guān)系,并且使用情緒詞典準確地找出微博數(shù)據(jù)中與抑郁癥相關(guān)的文本,提高抑郁癥預測的準確率。模型中情緒詞典用于選取文本中的局部特征,膠囊網(wǎng)絡用于學習文本的整體特征,在模型的輸出層使用兩種方法將局部特征和整體特征進行融合得到微博用戶抑郁癥預測的最終結(jié)果。通過與幾種典型的機器學習算法對比表明,提出的基于局部與整體特征的膠囊網(wǎng)絡模型在抑郁癥的預測中具有更好的效果。

1 研究現(xiàn)狀

抑郁癥是一種與情緒密切相關(guān)的嚴重疾病,對人的健康有著非常大的危害。情緒分析相對于抑郁癥已經(jīng)被廣泛的研究了很長時間。情緒可以分為基本情緒和復雜情緒,但不同的精神病學家對情緒的詳細分類不同,導致了結(jié)果也存在一定的差異。根據(jù)Ekman[5]提出的被廣泛使用的模型,有六種基本情緒:驚訝、恐懼、厭惡、憤怒、快樂和悲傷。通過結(jié)合這六個情緒,可以得到各種復雜的情緒描述,如抑郁、緊張、焦慮等。目前,在社交媒體網(wǎng)站中用戶產(chǎn)生了豐富的多媒體信息,這種信息不僅包含了用戶的不同觀點和思想,而且包含了用戶的情緒信息,正是這些情緒信息可以用來做心理健康的研究。因此,基于社交媒體的情緒分析現(xiàn)在已經(jīng)成為了研究熱點,并且隨著深度學習在自然語言處理領(lǐng)域的發(fā)展,使用深度學習來解決情緒分類的研究越來越多,如Kim等人[6]用卷積神經(jīng)網(wǎng)絡對電影評論進行情緒分類;Kalchbrenner等人[7]用卷積神經(jīng)網(wǎng)絡處理Twitter文本;Wang等人[8]用長短期記憶網(wǎng)絡對文本情緒極性進行分析。這類基于深度學習的方法都取得了比傳統(tǒng)分類器更好的效果,還有一些研究者針對短文本來構(gòu)建分類模型,如Vo等人[9]提出了使用多樣化特征對Twitter文本進行情緒分類;Tang等人[10]通過情緒種子擴充特定領(lǐng)域情緒詞對用戶評論進行情緒分類。除此以外,還有一批過國內(nèi)學者利用微博文本進行情緒分析,如馮等人[11]首先將卷積神經(jīng)網(wǎng)絡應用于微博的情緒分類中,取得了不錯的效果;陳等人[12]提出了多通道卷積神經(jīng)網(wǎng)絡模型,利用情緒特征信息以及將多方面特征信息進行結(jié)合來對微博情緒進行分析;周等人[13]使用基于注意力機制的LSTM模型進行情緒分析,以更好地學習文本中的情緒信息,提升情緒分類的成功率;張等人[14]運用多尺度卷積核改善微博評論中上下文信息有限的條件制約,來提高卷積神經(jīng)網(wǎng)絡對于微博評論情緒分類的效果。但這些都是情緒分類方面的研究,國內(nèi)對于利用互聯(lián)網(wǎng)數(shù)據(jù)進行抑郁癥方面的研究還具有很廣闊的前景,現(xiàn)有的關(guān)于微博情緒分類的研究主要在于識別文本的基本情緒上,這是因為復雜的情緒分析在不同的領(lǐng)域具有不同的策略,并且對人的情緒進行進一步的研究時會有非常多的限制,如抑郁這一情緒的研究。抑郁癥是一種病因非常復雜的精神疾病,精神病學、心理學、醫(yī)學、社會學等方面的專家進行了大量的相關(guān)研究。心理學家使用不同的抑郁測量量表,如SDS(自我評價抑郁量表)和CES-D(流行病學研究中心抑郁量表)來確定人們的抑郁程度。醫(yī)學研究人員還研究了許多行為信號來檢測人們的心理狀態(tài),比如大腦信號、心率、血壓、聲音韻律和面部表情來獲得心理生理學信息[15]。

隨著移動網(wǎng)絡技術(shù)的飛速發(fā)展和智能手機的廣泛使用,社交網(wǎng)絡也得到了迅速的發(fā)展,許多人使用了一種或多種社交網(wǎng)絡服務表達他們的觀點和情緒,如Facebook、Twitter、微博、微信、QQ等。因為抑郁個體的發(fā)帖內(nèi)容往往含有許多負面情緒詞匯,所以這些文本數(shù)據(jù)為研究者在社交媒體網(wǎng)站上找到潛在的抑郁癥患者提供了一種可能的途徑。一些研究人員在網(wǎng)上社區(qū)或者論壇的基礎上對抑郁問題進行了情緒分析,如Nguyen等人[16]研究了網(wǎng)絡抑郁社區(qū)的特征,并與其他社區(qū)的特征進行了比較,利用情緒信息、興趣話題和語言風格進行抑郁分析。更多的研究人員使用在線社交網(wǎng)站來預測抑郁癥,如Park等人[17]努力研究在社交網(wǎng)絡中對抑郁癥起決定性的因素;王等人[18]建立了預測抑郁癥的關(guān)聯(lián)模型,該模型建立在情緒分析算法的基礎上,將患者行為特征與影響抑郁癥預測的原理癥狀進行了比較。上述的研究都是通過情緒分析來進行抑郁分析,可見對于抑郁癥的預測分析網(wǎng)絡中帖子的內(nèi)容是一個非常有效的方法。

在機器學習領(lǐng)域的發(fā)展中,卷積神經(jīng)網(wǎng)絡原本是用來處理二維圖像的網(wǎng)絡,常用來提取圖像的特征,在圖像處理領(lǐng)域有非常好的效果。在2014年Kim[6]將CNN網(wǎng)絡用在了文本分類任務中,并且取得了目前最好的效果。盡管卷積神經(jīng)網(wǎng)絡在許多領(lǐng)域取得了非常好的效果,但是卷積神經(jīng)網(wǎng)絡有兩個無法彌補的缺陷,一個是卷積神經(jīng)網(wǎng)絡無法學習圖像內(nèi)部之間的相對位置關(guān)系,另一個是訓練一個卷積神經(jīng)網(wǎng)絡需要大量的數(shù)據(jù)。在2017年Hinton等人[19]提出了改進的卷積神經(jīng)網(wǎng)絡——膠囊網(wǎng)絡,膠囊網(wǎng)絡在卷積神經(jīng)網(wǎng)絡的基礎上增加了膠囊層,并且在膠囊層之間使用動態(tài)路由算法來更新參數(shù),這一網(wǎng)絡完美地彌補了卷積神經(jīng)網(wǎng)絡的缺點,在MNIST手寫數(shù)據(jù)集上取得了令人滿意的效果。但是膠囊網(wǎng)絡是使用在圖像處理領(lǐng)域的模型,文中受到卷積神經(jīng)網(wǎng)絡用于文本分類任務的啟發(fā),將膠囊網(wǎng)絡進行細微修改,用于學習微博文本中的情緒特征,通過用戶的帖子來辨別該用戶是否存在抑郁傾向,使用了適用于抑郁癥的情緒詞典來提高預測準確率。實驗結(jié)果表明,與傳統(tǒng)的機器學習模型相比取得了不錯的預測效果。一旦通過社交媒體的數(shù)據(jù)發(fā)現(xiàn)了潛在的抑郁癥患者,就為精神病學家提供了有用的線索,從而可以立即進行干預和治療。

2 CapsNet抑郁癥預測模型

2.1 CapsNet模型

近幾年,卷積神經(jīng)網(wǎng)絡因為可以充分利用多層感知機的結(jié)構(gòu),具備很好的學習復雜、高維和非線性映射關(guān)系的能力,在圖像識別任務和語音識別任務中得到了廣泛的應用。隨著研究的不斷深入,卷積神經(jīng)網(wǎng)絡也逐漸被應用于自然語言處理領(lǐng)域,并取得了很好的效果,但是卷積神經(jīng)網(wǎng)絡有著不可彌補的缺點,如需要大量的數(shù)據(jù)來訓練網(wǎng)絡中的參數(shù),以及無法學習事物內(nèi)部結(jié)構(gòu)之間的相關(guān)關(guān)系特征等問題。在2017年CapsNet應運而生——Hinton等人針對CNN的不足提出了膠囊網(wǎng)絡模型。模型的結(jié)構(gòu)如圖1所示。

圖1 CapsNet模型結(jié)構(gòu)

CapsNet的核心結(jié)構(gòu)由3層構(gòu)成,模型的第一層與CNN中的卷積層相同,通過第一個卷積層粗略映射事物的局部特征,在卷積層后接一個RELU激活函數(shù)將線性映射變?yōu)榉蔷€性映射。結(jié)構(gòu)中的第二層即為膠囊層,其實這是一個特殊的卷積層,由8×32個大小為9×9的卷積核卷積得到,膠囊層可以將卷積層提取的特征圖轉(zhuǎn)化為向量膠囊,它的維度比正常的卷積層要高一維,由32個長度為8大小為6×6的膠囊組成。第三層為數(shù)字膠囊層,是一個維度為16×10的矢量,16是一個向量的維度,10代表類別數(shù),其中向量的長度可以表征實體存在的概率,向量的方向可以表示實例化參數(shù)(即實體的某些圖形屬性)。

2.2 動態(tài)路由算法

主膠囊層和數(shù)字膠囊層之間采用動態(tài)路由算法進行更新,這一過程解決了卷積神經(jīng)網(wǎng)絡在池化操作中丟失局部特征的問題,增強了網(wǎng)絡魯棒性,動態(tài)路由算法的結(jié)構(gòu)圖如圖2所示。

在主膠囊層和數(shù)字膠囊層之間,一個預測向量首先通過主膠囊層的膠囊向量ui乘以一個權(quán)重矩陣Wij計算得到,表達式為:

(1)

然后,在數(shù)字膠囊層中,通過對權(quán)重Cij和向量uj|i進行線性組合生成膠囊Sj,表達式為:

(2)

其中,cij是動態(tài)路由過程中產(chǎn)生的耦合系數(shù),通過對bij進行softmax運算得到cij的值,這一運算保證了膠囊uj的所有系數(shù)之和為1,并且bij初始化為0保證了在第一次路由中,每一條路徑的耦合系數(shù)是一樣的。cij的表達式為:

(3)

膠囊的長度表示輸入樣本具有所描述的對象膠囊的概率,即膠囊的激活。因此,膠囊的長度在[0,1]范圍內(nèi),使用一個非線性壓縮函數(shù)進行膠囊的壓縮,表達式為:

(4)

圖2 動態(tài)路由算法結(jié)構(gòu)

通過該函數(shù),短向量就被壓縮到接近0,而長向量就被壓縮到接近1。

最后,膠囊網(wǎng)絡的更新其實就是在計算耦合系數(shù),而耦合系數(shù)的計算通過在每次迭代中更新bij的值,表達式如下:

(5)

相對于卷積神經(jīng)網(wǎng)絡的池化操作,使用動態(tài)路由算法不僅縮短了模型訓練時間,而且保留了數(shù)據(jù)之間的相對位置關(guān)系。

2.3 CapsNet抑郁癥預測模型

文中提出的CapsNet抑郁癥預測模型如圖3所示。

圖3 CapsNet抑郁癥預測模型

模型中輸入數(shù)據(jù)為已經(jīng)處理好的一條微博文本,是一個N*50的二維張量,N表示輸入文本詞向量的數(shù)量,50是詞向量的維度。

模型分為了整體特征提取和局部特征選擇,其中整體特征提取使用CapsNet模型,在模型中第一層是卷積層,使用256個9×9卷積核,這樣的卷積核可以彌補模型層數(shù)較低,充分學習輸入文本數(shù)據(jù)的特征。卷積核的步幅為1,且卷積層中使用RELU激活函數(shù)。之后,主膠囊層使用第一層卷積層得到的張量,將卷積層數(shù)據(jù)作為輸入,使用相同的卷積核進行8次卷積操作,從而產(chǎn)生8個張量組成一組膠囊神經(jīng)元。第三層為類膠囊層,在第二層輸出向量的基礎上進行傳播和動態(tài)路由更新,得到最后的預測向量,通過預測向量的模長得出類別概率。每一條微博數(shù)據(jù)都可以通過模型獲得情緒預測概率,將一個用戶的所有微博數(shù)據(jù)作為一個整體,最后取所有預測概率的平均就可以得到一個用戶數(shù)據(jù)的整體特征。

在局部特征選擇中,局部特征的選擇是通過使用情緒詞典統(tǒng)計微博文本的情緒詞來進行抑郁識別。但是,在不同語言中有不同的情緒詞典,例如,作為一種英語情緒詞典,LIWC詞典[20]已經(jīng)得到了很好的驗證,并被廣泛應用于情緒分析中;作為中文情緒詞典,可供文中使用的有HowNet[21]、NTUSD[22]和Chinese Affective Lexicon Ontology (CALO)[23]情緒詞典等。HowNet和NTUSD主要用于粗粒度情緒分析,如積極情緒或消極情緒,而CALO主要用于細粒度情緒分析。所有這些情緒詞典都不適合用于特殊的情緒識別,比如文中的抑郁情緒識別。文中參考了Zhichao Peng[24]等人的研究,制作了自己的情緒詞典來進行局部特征提取,該情緒詞典綜合了基礎情緒詞典和網(wǎng)絡用語情緒詞典,如表1所示。

表1 情緒詞典

文中使用情緒詞典對處理好的微博文本數(shù)據(jù)進行情緒詞數(shù)計算,得出每條微博文本數(shù)據(jù)中的情緒詞數(shù),將一個用戶的所有微博以情緒詞數(shù)進行排序,找出并標記情緒詞數(shù)多的微博,之后將其對應的序號輸入到輸出層,由模型得到對應微博的情緒預測概率,作為整個微博數(shù)據(jù)的局部特征。

由于整體特征和局部特征都是由CapsNet模型產(chǎn)生的二維預測結(jié)果,文中將兩個特征融合到最終預測中,考慮兩個策略,分別是max pooling和sum pooling。

在max pooling中,整體特征和概率大的局部特征被保留,忽略了概率小的局部特征,最終的預測概率Y的表達式為:

(6)

其中,YGlobal表示整體的預測概率,YPartj表示第j個局部的預測概率。文中根據(jù)情緒詞典選取了排在前K個的局部特征。Y,YGlobal,YPartj都具有一致的向量結(jié)構(gòu)(ypos,yneg),二維向量中的ypos和yneg分別表示積極情緒預測概率以及消極情緒預測概率。

在sum pooling中,所有的局部特征都被使用,文中添加參數(shù)β來權(quán)衡整體預測概率和局部預測概率,表達式如下:

(7)

3 實 驗

3.1 數(shù)據(jù)集獲取

文中的數(shù)據(jù)來自新浪微博,分為兩部分數(shù)據(jù),一部分是抑郁癥用戶的微博數(shù)據(jù),另一部分是非抑郁癥用戶的微博數(shù)據(jù)。其中,抑郁癥用戶的數(shù)據(jù)來自于一家專門做抑郁癥監(jiān)測的公司,帖子的抑郁特征較為明顯,例如,“也不是真的崩潰,也不太想活,也不敢去死”、“壓死駱駝的不是最后一根稻草,而是所有稻草”、“真不知道自己接下來的人生要怎么辦了,很迷茫很迷?!钡?。對于非抑郁癥用戶的微博數(shù)據(jù),為了使該部分數(shù)據(jù)對于模型的訓練有明顯效果,由筆者團隊對網(wǎng)上獲取的微博帖子進行嚴格的篩選,剔除了所有具有負面情緒的數(shù)據(jù),保留情感趨向積極的用戶數(shù)據(jù),內(nèi)容包括用戶基本信息和用戶發(fā)布的所有微博數(shù)據(jù),根據(jù)實驗需求,選取了自2019年1月到2019年12月的用戶微博數(shù)據(jù)。

繪本的形象也就是繪本的主人公,他既是整個故事的主體,也是情感傳達的載體,同時也表現(xiàn)了作者內(nèi)心索要表達的一些思想。通常治愈系繪本的形象可以分為三大類:第一類是作者的思想載體,作者通過自己塑造的人物形象或者是動物形象來表達作者的內(nèi)心世界。第二類是對著這本人進行夸張?zhí)幚?,這種繪本的形象通常是作者本身,作者通過自己的日常生活,或者是自己的一些經(jīng)歷通過繪本的形式呈現(xiàn)給讀者。第三類是人物形象并不是故事的主角,而是作為一個情節(jié)的需要,也會隨著故事的改變而改變,這類繪本讀者容易跟著作者的節(jié)奏一步一步慢慢進入正題,這樣也更容易是讀者有探索性。

3.2 數(shù)據(jù)集預處理

從獲得的數(shù)據(jù)中,實驗只使用到用戶的帖子數(shù)據(jù),所以除去了個人簡介以及轉(zhuǎn)發(fā)數(shù)評論數(shù)等信息。微博設置的帖子限制符號數(shù)為150,由于微博的帖子長短不一,加上含有許多表情符號,為了與文中框架模型的輸入數(shù)據(jù)格式一致,避免高維稀疏向量影響實驗的準確率,經(jīng)過剔除標點符號、表情符號、數(shù)字和字母等,從剩下的帖子中選取字數(shù)在15以上的帖子。對每個用戶的微博數(shù)據(jù)進行處理后,選取了剩余帖子在150條以上的用戶。

如表2所示,根據(jù)實驗需求,選取了120個抑郁用戶和200個非抑郁用戶。其中抑郁用戶總共發(fā)布了24 785條帖子,非抑郁用戶發(fā)布了62 456條帖子。

表2 實驗數(shù)據(jù)的組成及數(shù)量

3.3 詞向量的生成

神經(jīng)網(wǎng)絡模型通過接收文本的向量化輸入來學習輸入句子的特征信息,在文本分類任務中,句子中詞語的內(nèi)容隱含著句子最重要的特征信息。文中以詞為單位來表示句子,通過jieba分詞工具將上文中處理得到的單一文本數(shù)據(jù)(不含有標點符號、表情符號、數(shù)字和字母等)劃分為詞,之后將每一個詞映射為一個多維的連續(xù)值向量,將詞向量逐行排列為矩陣,用補齊的方式統(tǒng)一矩陣大小,最終每段文本被表示為長為最大句長、寬為詞向量維度的稠密矩陣,可以得到整個數(shù)據(jù)集詞集合的詞向量矩陣E∈Rm×|V|,其中m為每個詞的向量維度,|V|為數(shù)據(jù)集的詞條集合大小。對于長度為n的句子,句子中每一個詞語wi都可以映射為一個m維向量,一個文本的詞向量形式如圖4所示。

實驗中,對句子的輸入設定一個最大長度maxlen,對于長度小于maxlen的句子用0向量補全,為了有效降低高維稀疏向量對實驗的影響,在數(shù)據(jù)預處理階段就已經(jīng)刪去了大量的不合適文本。對詞向量的生成,使用的是Word2Vec工具的CBOW模型,未登錄詞使用均勻分布U(-0.01,0.01)來進行隨機初始化,為了降低模型的學習時間,實驗中訓練的詞向量維度為50維。

圖4 輸入詞向量形式

3.4 實驗過程和評價指標

通常,較大部分的數(shù)據(jù)用于訓練,較小部分的數(shù)據(jù)用于測試,文中采用5折交叉驗證來進行實驗。因此,以用戶為單位將實驗數(shù)據(jù)分成5份相同大小的互斥子集,使用4份數(shù)據(jù)進行訓練,1份數(shù)據(jù)用于測試,最后選擇損失函數(shù)評估最優(yōu)的模型參數(shù)。

將提出的模型和傳統(tǒng)的機器學習模型進行實驗對比,驗證文中提出的基于局部和整體的膠囊網(wǎng)絡模型的有效性。對比的機器學習模型有KNN、DNN、TextCNN和BiRNN等模型。其中,輸入數(shù)據(jù)使用的詞向量維度均為50,KNN模型中K取10;DNN模型使用3個隱藏層,維度分別為100、50、25,第一個和第三個隱藏層均使用RELU激活函數(shù);TextCNN模型中含有一個卷積層、一個池化層和一個全連接層,卷積核大小為9×9;BiRNN模型為含有兩個隱藏層的雙向循環(huán)神經(jīng)網(wǎng)絡;以上模型的學習速率均為0.01。

(8)

(9)

(10)

(11)

其中,TP表示正確分類到該類的文本數(shù),F(xiàn)P表示錯誤分類到該類的文本數(shù),F(xiàn)N表示屬于該類但未被分類到該類的文本數(shù)。

3.5 實驗結(jié)果與分析

在該模型中,輸出最后預測時使用max pooling和sum pooling兩種融合策略,其中含有兩個超參數(shù)K和β。首先對于sum pooling策略使用不同的β進行對比,如圖5所示,在測試集中,設置β=0.4達到抑郁癥預測的最佳總體精度。

圖5 模型準確率-β參數(shù)

之后再對兩個策略都要使用的局部特征K進行不同值的對比,如圖6所示,可以發(fā)現(xiàn)在K=7時max pooling策略達到最佳精度,K=8時sum pooling策略達到最佳精度。還可以發(fā)現(xiàn)sum pooling策略在效果上要明顯好于max pooling策略,因此在之后的對比實驗中,均采用sum pooling策略進行對比。

圖6 模型準確率-K值

在處理好的數(shù)據(jù)集上,運行了不同的模型,將實驗結(jié)果的精確率、召回率、綜合評價指標和準確率進行對比,實驗結(jié)果如表3所示。

表3 實驗結(jié)果

實驗結(jié)果中,PGCapsNet模型得到了比其他模型更好的精確率、召回率和綜合評價指標,除此以外,PGCapsNet模型獲得了73.79%的準確率,而傳統(tǒng)的文本分類模型KNN和DNN的準確率分別為61.07%和65.54%,此外TextCNN和BiRNN模型的準確率要高一點,分別為70.66%和70.39%。實驗結(jié)果證明,提出的PGCapsNet模型對于抑郁情緒分類的性能要優(yōu)于其他模型。

4 結(jié)束語

隨著互聯(lián)網(wǎng)的發(fā)展,社交媒體提供了新的方法去識別潛在的抑郁癥患者,由此提出了面向微博文本的抑郁癥預測模型。模型中,首先將文本特征劃分為局部特征和整體特征,之后使用情緒詞典選取局部特征,以及CapsNet模型學習整體特征,最后在輸出層將兩部分特征進行融合得到用戶的抑郁癥預測概率。實驗證明,提出的模型在基于微博文本的抑郁癥預測方面具有不錯的效果。

在今后的研究中,將嘗試使用BERT(bidirectional encoder representation from transformers)模型與膠囊網(wǎng)絡模型相結(jié)合,進一步提高模型對于抑郁情緒預測的準確率。此外,文中實驗數(shù)據(jù)集并不豐富,未來的研究中將使用樣本量足夠大的數(shù)據(jù)來訓練復雜的模型,使得模型可以取得更好的性能。

猜你喜歡
情緒特征文本
如何表達“特征”
在808DA上文本顯示的改善
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
小情緒
小情緒
小情緒
抓住特征巧觀察
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
情緒認同
主站蜘蛛池模板: 国产va在线观看免费| 欧美福利在线| 国产草草影院18成年视频| 亚洲精品动漫在线观看| 中国成人在线视频| 人妻出轨无码中文一区二区| 国产精欧美一区二区三区| 99一级毛片| 四虎永久在线精品国产免费| 六月婷婷激情综合| 无码'专区第一页| 婷婷午夜影院| 91麻豆久久久| 亚洲综合天堂网| 天堂中文在线资源| 欧美在线一二区| 日本午夜三级| 国产日韩av在线播放| 在线色国产| 色婷婷成人| 岛国精品一区免费视频在线观看| 亚洲大尺度在线| 国产视频资源在线观看| 国产h视频免费观看| 日韩乱码免费一区二区三区| 人妻一区二区三区无码精品一区| 色综合五月| 日韩二区三区| 青青草久久伊人| 国产精品美女在线| 制服无码网站| 国产人人干| 国产91视频观看| 9966国产精品视频| 欧美日韩在线亚洲国产人| 四虎影视无码永久免费观看| 亚洲啪啪网| 欧美精品在线观看视频| 国产精品久久自在自线观看| 成人福利在线视频免费观看| 国产白丝av| 亚洲精品无码在线播放网站| 国产成在线观看免费视频| 中文字幕欧美日韩高清| 精品视频一区二区观看| 无码网站免费观看| 五月婷婷导航| 国产精品香蕉| 91国内在线视频| 欧美影院久久| 成人在线天堂| 免费全部高H视频无码无遮掩| 精品人妻系列无码专区久久| 99久久精品国产自免费| 亚洲成人播放| 日本国产精品| 婷婷色中文| 亚洲天堂久久久| 青青草国产免费国产| 久久成人免费| 九色综合视频网| 国产真实自在自线免费精品| 国产精品第| 成人在线亚洲| 亚洲嫩模喷白浆| 99这里只有精品在线| 国产女人水多毛片18| 成人年鲁鲁在线观看视频| 久久综合色天堂av| 国产XXXX做受性欧美88| 中文字幕2区| 日韩欧美国产成人| 国产日本视频91| 制服丝袜亚洲| 国产麻豆91网在线看| 国产成人精品在线| 久久99热66这里只有精品一| 欧美在线网| 成人免费视频一区| 2019年国产精品自拍不卡| 久久综合色播五月男人的天堂| 香蕉eeww99国产在线观看|