999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ERNIE-BiLSTM與EEMD-GRU-XGB的網絡輿情分析與預測

2025-09-15 00:00:00陳松柏
荊楚理工學院學報 2025年4期

中圖分類號:G206;TP391 文獻標志碼:A 文章編號:1008-4657(2025)04-0008-1

0 引言

近些年來,微博等社交媒體為公眾發聲提供了良好平臺,在輿論監督方面也有著廣泛的影響力。網絡具有及時性和便利性等優勢,社會民眾可以在社交媒體上合法闡述自己的意見,表達自己的感受和展現自己的情感化傾向。因此,社交媒體中廣泛的文本評論數據是掌握公眾未來情感走向的重要資料,而文本數據挖掘可以通過對原始文本提取有價值信息,明確情感走向,窺見公眾心中所想,預測信息熱度,成為解析資料的一種重要信息處理方法。本文在廣泛搜集前人關于情感傾向分析和熱度預測的方法基礎上,基于自然語言處理、深度學習和情感分析方法原理,提出兩種新模型(ERNIE-BiLSTM模型和EEMD-GRU-XGB模型),采用多個模型優化組合,彌補原先單個模型的不足,并將組合模型用于輿情的公眾情感化傾向判斷,并預測輿情熱度。不僅可以推動文本挖掘技術的發展,還可以為公共政策實施效果評估提供技術支持。

1相關研究現狀

1.1情感傾向化研究現狀

文字是記錄和表達情感的重要方式,在現代社會中,文字成為互聯網中各大社交平臺中提出觀點和傳遞信息的重要載體。大數據時代擁有海量的文本數據,人們借助計算機對其進行分析能夠挖掘重要信息和有用知識,促進社會發展。自然語言處理這一領域應運而生,情感分析屬于自然語言處理的一類常見應用場景。NasukawaT等[1]在2003年提出了情感分析的概念,指出情感分析是指從文本中挖掘寫作者的內心情感,包括情感抽取、情感傾向性分析和主客觀分析等子任務。其中,情感傾向性分析是一個重要應用方向,主要工作是根據文本表達識別出寫作者的情感傾向,一般的情感傾向有積極或消極兩類,也有實驗將其劃分為更細的類別。經過學界較長時間的探索,情感傾向化分析方法形成了三大類別,分別是基于情感詞典的方法、基于機器學習的方法和基于深度學習的方法。

1.1.1基于情感詞典的分析方法

基于情感詞典[2的分析方法依賴情感詞典,情感詞典中包含每一類情感詞及對應分值。建立情感詞典中情感詞和分析文本對應詞的匹配關系,依靠加權計算的方式得出文本的情感分數,根據情感分數進行情感傾向分類。整個流程中情感詞典至關重要。英文情感詞典在1998年就已經投入使用,之后Cynthia Whissel[3]在2009 年對情感詞典作了進一步的補充。鐘佳娃等[4]提出 SentiWordNet、General In-quirer、OpinionLexicon 和 MPQA(Multiple Perspectives Questions And Answers)等都是使用頻率較高的情感詞典。中文情感詞典包括中文HowNet(知網)[5]、中文NTUSD(臺灣大學)[6]和中文情感本體庫(大連理工大學)[7等。隨著研究的不斷深人,為了提高分析的精準性,研究者針對各自領域形成了專門的情感詞典。例如,Yang Aimin等[8]構建了情感詞典專門應用于酒店評價領域,經實驗后分類效果良好;葉霞等[9]綜合多個情感詞典,根據標準挑選少量基礎詞,利用 SO-PMI(Semantic Orientation Pointwise MutualInfor-mation)對待選定詞進行判斷,從而構建所研究領域的正負情感詞典;林振宇等[10]也是基于現有詞典通過抽取主題詞并擴展情感詞的方法構建了專屬旅游領域的多主體情感詞典。

1.1.2基于機器學習的分析方法

基于機器學習的分析方法主要是從大量的語料庫中篩選特征,整個文本就可以由其具有的特征表示,經過這一預處理之后再使用機器學習方法對特征進行分類,進而達到對文本分類的目的。目前的機器學習方法主要分成監督學習、半監督學習和無監督學習三類。監督學習的方法要求事先構建包含大量已標注語料的訓練集,訓練集作為模型識別依據,模型經過訓練之后就可以對文本進行分類處理。例如,Pang B 等[\"]使用 ME(Maximum Entropy)、SVM(Support Vector Machine)和 NB(Naive Bayes)等三種分類模型對電影評論數據進行分類并取得了良好的分類效果。半監督學習運用到情感分析中一般是圖算法。例如,ZhuXJ等人[12]通過建立已標注和未標注兩種樣本間的關系完全圖模型,提出了LP(Linear Pro-gram)算法。無監督的方法放棄了監督學習中對語料進行提前標注的步驟,直接根據少數的情感詞極性和數量劃分文本。例如,孫艷等人[13]使用無監督主題情感混合模型先得到少數的文本主題情感詞,再根據情感詞進行劃分文本。對于文檔級別的長文本的劃分方法有PLSA(Probabilistic Latent Semantic Anal-ysis)[14]和 LDA(Linear Discriminant Analysis)[15]等模型。此外,Yan Xiaohui等[16]針對短文本提出了 BTM(Biterm Topic Model)模型進行主題建模,彌補了PLSA 和LDA 模型的缺陷。由于中文的特殊性,詞語常與上下文關聯且有一詞多義的情況,李壽山等[17]基于堆疊法(Stacking),使用NB、SVM和 SGD(Stochas-ticGradientDescent)等方法進行分類。

1.1.3基于深度學習的分析方法

基于深度學習的分析方法沒有了人工標注和提取特征等先驗工作,直接使用神經網絡自動提取情感特征并加以組合,利用組合特征對文本進行自動分類。經常使用的方法包括:CNN(ConvolutionalNeural Network)、RNN(Recurrent Neural Network)、LSTM(Long Short-Term Memory)、Transformer、BiLSTM(Bi-directional Long Short-Term Memory)和 Attention以及這些模型的組合模型。例如,劉龍飛等[18]通過訓練詞向量,以詞向量為輸入,運行卷積神經網絡提取文本特征并判斷情感傾向,取得了良好的效果。值得說明的是,近些年出現的模型當中表現驚人的是 BERT(Bidirectional Encoder Representations fromTransformers)等預訓練模型,在各種情感化傾向的經典任務中刷新了多項紀錄。預訓練模型包含預訓練(Pre-Training)和微調(Fine-Tuning)兩個步驟,具體是指先在一個任務的訓練集上訓練出初始模型,在這個任務中學會各種網絡參數并保存,當出現新任務時,調出先前訓練好的初始模型,采取相同的網絡結構,根據新任務的特征對模型進行微調,進而達到任務目的[19]。預訓練模型因其便捷性和精準性被廣泛使用,并不斷發展,許多性能較高的預訓練模型都是基于BERT改進而來。

綜上所述,每種方法各有優劣,以預訓練模型為代表的深度學習方法取得了較多研究者的青睞,該方法以其優良的性能對情感傾向分析提供了較大的幫助。

1.2熱度預測研究現狀

熱度,通俗地說是公眾對于某一事件的關心程度,直接反映在文本的點贊數、轉發數、瀏覽量等特征上。微博的群眾基礎廣泛,話題熱度影響巨大,信息能瞬時裂變傳播,其深度和廣度足以干擾社會輿情動向。因此,掌控熱度動向能夠做到對話題的實時掌控,在微博日益發展壯大的時代,及時把控輿論事件的走向,及時止損,避免往糟糕的方向繼續發展,將對社會發展具有關鍵性作用。微博熱度預測作為了解輿情未來趨勢的首要問題,成為了學界和政府廣泛關注的重點問題。目前,針對熱度的預測模型主要分成兩類:第一類是基于統計學,第二類是基于機器學習。

1.2.1基于統計學模型的分析方法

基于統計學的方法主要包括自回歸模型(Autoregressive model)、移動平均自回歸模型(Autoregres-sive Integrated Moving Average model)、指數平滑法、移動平均法和回歸模型等傳統時序模型。由于傳統時間序列方法偏重數理統計,不具備自適應學習的能力,尤其是對非線性、多維度的海量數據不能有效擬合。隨著大數據技術興起,機器學習方法的出現,與傳統統計方法相結合,彌補了不足,為傳統統計方法帶來一波生機。例如,林育曼等[20]先使用ARIMA 模型(Autoregressive Integrated Moving Averagemodel)進行突變值的調控,再利用BP(Back Propagation)神經網絡進行預測,取得了不錯的預測精度;陳羽中等[21]利用差分自回歸移動平均模型和小波變換相結合的模型進行話題預測,發現能夠減少話題預測的誤差;向小東等[22]將百度指數作為熱度指標,使用集合經驗模態分解后,構建時間序列模型,最終得到預測結果;ChenNY等[23]使用微博的轉發量這一單指標作為熱度代理值,利用BP神經網絡建立網絡輿情監測系統。

1.2.2基于機器學習的分析方法

基于機器學習或深度學習的方法是目前熱度預測研究趨勢,基于各種神經網絡、SVM及RF(Ran-domForest)等模型的多種機器學習算法的時間序列預測模型日益發揮重要作用,他們不僅能夠很好地彌補傳統統計方法的不足,還能夠提高模型的精準性,帶來諸多便利。例如,裴可鋒等[24]通過搭建LDA和EEMD(Ensemble Empirical Mode Decomposition)之間的聯系,綜合分析流程組成 DTPM(DiscretizedTopic Predict)預測模型,提高了模型預測熱度的精準性;靳春妍[25]認為熱度預測搭配情感分析更能表現輿情監測的主題,因此先使用Doc2vec和SVM進行情感分析,再利用LSTM模型進行分析預測,完善了整個分析流程;曾輝等[26]在BP神經網絡中加入了用戶關系網絡和相關主題等信息,達到了不錯的預測效果。

綜上所述,熱度預測方法也在逐步探索之中,更多傾向于深度學習方法或者多種模型組合的方法,取長補短,一切以提高模型預測精準度為目的。但多數研究集中于方法上的使用,較少將情感分析和熱度研究兩者用于同一問題的研究。

2 模型設計

2.1 ERNE-BiLSTM模型設計

ERNIE 模型以其獨特的掩碼方式和海量的中文訓練語料在一眾預訓練模型中脫穎而出,處理中文自然語言處理任務時取得了出色的表現。再加上BiLSTM模型能夠獲取前后兩個方向的信息,極大提高了文本數據中信息搜集能力。因此,本文將 ERNIE模型和BiLSTM模型結合在一起得到ERNIE-BiL-STM模型。其基本工作流程為:第一步,文本數據通過ERNIE 層加工成動態詞向量。采用ERNIE 模型對預處理過的文本數據進行詞嵌人及編碼訓練,形成動態詞向量。第二步,通過BiLSTM層獲取文本語義信息。將生成的動態詞向量作為BiLSTM層的輸入,從前后兩個方向進行信息搜集,提高語義表示能力。第三步,通過Softmax分類器解碼,實現情感傾向分析。整個模型的總體結構如圖1所示。

圖1ERNIE-BiLSTM模型總體結構圖

2.1.1 ERNIE層

ERNIE層的主要功能是將預處理后的文本數據轉換成機器可以識別的動態詞向量矩陣。記文本數據集為 X={x1,x2,?xn} ,其中 xi 是指文本數據中的第i條文本,通過ERNIE層訓練后的動態向量集為(204號 E={e1,e2$\\cdots _ e _ { n } \\}$ ,其中 ei 是指向量集中的第 i 條向量。之所以選擇ERNIE 模型進行訓練,正是因為ERNIE模型擁有著不同級別的掩碼方式和海量的中文訓練語料,具有著強大的文本特征提取能力,能夠提升情感傾向化分析的效果。

2.1.2 BiLSTM層

BiLSTM層的主要功能是進一步挖掘文本數據中存在的信息。ERNIE層的輸出向量作為BiLSTM層的輸入向量,通過正反兩個LSTM進行深度提取。例如,“作為教育政策之一,雙減’能夠減輕學生負擔。\"在這個文本語句中,如果只是進行單向的從左往右的信息傳遞,那么就不會知道“教育政策\"指代的是什么,但增加了反向的從右往左的信息傳遞,就可以實現“教育政策”和“雙減”之間的聯系,實現詞語下文和詞語之間的聯系。BiLSTM層的加入能夠極大保留語境,完整解讀文本信息,從而增強文本分析能力。

2.1.3 輸出層

輸出層的主要功能就是解碼 BiLSTM的輸出向量,再通過 Softmax分類器進行情感傾向分類。由于本文是正向和負向情感的二分類任務,所以輸出的結果最終表示了情感是積極的還是消極的概率。計算公式如下:

式(1)中, Ψx 是評論文本中的一條文本 Δ,j 是分類的類別數, pi 是 x 屬于第 i 類的概率。

2.2 EEMD-GRU-XGB模型設計

單個模型對時間序列進行預測都具有局限性。本文提出的EEMD-GRU-XGB模型將結合三個模型對一個序列進行擬合,在EEMD模型對原序列擬合的基礎上,依次使用GRU模型和 XGB 模型對殘差進行擬合,以期提高模型整體擬合精度。EEMD-GRU-XGB模型的基本工作流程如下:第一步,利用EEMD方法對序列值進行分解,分解得到若干個IMF分量;第二步,對每個分量使用GRU時間序列預測得到預測值;第三步,對GRU預測值和真實值之間的誤差進行XGB擬合;第四步,GRU預測值和XGB預測值的和為各IMF分量預測值,各IMF分量預測值合成最終序列預測值。整個模型的總體結構如圖2所示。

圖2EEMD-GRU-XGB模型基本結構圖

3模型測試

3.1測試數據

3.1.1 數據獲取

以“雙減\"和“‘雙減'政策\"為關鍵詞,綜合考慮爬取數據的可獲得性與時效性,通過python語言在微博平臺爬取時間段在2021年8月1日至2021年10月31日的文本評論及相關數據,共獲取數量26302條,經刪除無關數據(如“雙11減價\"等與本文研究主題無明顯關系的數據)及重復數據,最終得到數據15422條,部分具體數據見表1。本文后續研究將基于此數據進行分析。其中,文本評論部分作為情感傾向分析的主要數據;“評論數”\"轉發數\"和“點贊數\"作為熱度預測的主要數據。

表1爬蟲最終分析數據表

3.1.2 數據預處理

在原始數據中選取“文本評論\"部分作為后續情感傾向分析的數據。由于15422條原始評論數據未帶有傾向性的標注,為保證評論文本標注準確有效,本文使用EasyData軟件對原始數據進行人工標注,將原始文本數據標注成正向情感和負向情感兩類。在標注的過程中,對文本評論進一步清洗,刪除文本中夾雜的網址、多余的空格和符號組成的表情等干擾模型學習效果的噪聲。經過人工標注,共獲得正向評論6059條和負向評論9363條。在帶有標注的評論數據集中選擇 80% 作為模型訓練集, 10% 作為模型驗證集, 10% 作為模型測試集。

在原始數據中選取“評論數”“轉發數”和“點贊數\"部分作為后續熱度預測的基礎數據。考慮到微博信息傳播速度快、信息傳遞量大的特點,使用微博每小時的發布數、評論數、轉發數和點贊數作為熱度特征,利用熵權法對這些特征進行賦權處理,得出熱度。由此方法定義第 i 天的熱度計算方式為:

Hoti=w1Numberi+w2Reposti+w3Commenti+w4Likei

式(2)中, w1,w2,w3 和 w4 表示熵權法確定的各特征對應權數, .Numberi 表示第 i 小時發布數, Reposti 表示第 i 小時轉發數,Commenti表示第 i 小時評論數, Likei 表示第 i 小時點贊數。具體計算方式為:

式(3)中, numi,j,repi,j,comi,j,likei,j 分別表示發布者 j 在第 i 小時發布的微博數、轉發數、評論數和點贊數。

得到 Xi∈{Numberi,Reposti,Commenti,Likei} ,采用熵權法進行賦權處理,權重計算流程如下:首先,對指標 Xi∈{Numberi,Reposti,Commenti,Likei}. 進行歸一化處理,得到標準化后的值為:

其次,信息熵的定義為:

最后,計算第 j 個指標的權重 wj ,即

式(6)中, 0?wj?1 且

經過熵權法加權后的微博熱度數據共2208條,代表2021年8月1日至2021年10月31日共92天,2208個小時的熱度值。

3.2 ERNIE-BiLSTM模型測試

3.2.1 超參數設置

超參數是深度學習中神經網絡模型應用于具體任務之前必須要設置的變量。超參數的確立要使神經網絡模型在實際任務中對數據既不會擬合失敗,也不會過度擬合,并且能夠盡可能快地學習到數據特征。但超參數的最佳數值不是固定的,它需要具體任務和具體數據的要求調整。超參數優劣對于最終模型運行效果的好壞起著至關重要的作用。因此,在運行模型之前必須要花費大量精力嘗試并慎重選擇超參數的數值,一次次實驗后取得最佳結果。

本文的ERNIE-BiLSTM模型需要調整有學習率、批量大小和迭代次數等超參數。學習率是控制每次迭代中的步長使得損失函數收斂到最小值的超參數,如果學習率過低則花費更長的時間達到理想狀態;如果學習率過高,模型可能不會收斂到最小值。本文采用的學習率為0.00005。批量大小是模型每次訓練用到的樣本數,該數值的高低會影響到模型訓練過程的資源需求和運行效率,值得說明的是,批量大小會影響GPU內存使用情況,當批量大小的值過高會使得GPU內存溢出,程序運行將會終止,影響模型運行,本文采用的批量大小為32。迭代次數是指神經網絡對實際任務中訓練集全部數據的訓練次數,考慮到訓練的時間成本,本文使用早停的方法,設置模型提前停止的條件防止模型的過度迭代。本文采用的迭代次數為20,若模型訓練超過10000的批量,模型的性能未得到優化,則模型停止訓練。

3.2.2訓練方法

本文使用的ERNIE-BiLSTM模型在提前設置超參數初始值后,利用訓練集訓練模型,再通過驗證集驗證,得到相關指標評價結果后繼續動態調整超參數,在找到超參數的最佳數值之后構建最終模型,對最終模型輸入測試集進行測試,驗證模型的泛化能力。對于“雙減\"政策在微博平臺上的文本評論數據,為確立效果最佳模型,本文選用若干適合情感傾向分析的主流深度學習模型進行對比。

3.2.3測試結果

為了說明ERNIE-BiLSTM模型性能,本文選擇主流的深度學習文本分類模型進行對比試驗,并主要采用準確率、召回率和F1值等指標進行評價,模型評價結果如表2所示。

表2各模型性能評價對比表

從以上的情感傾向化分析模型的比較,可以發現ERNIE-BiLSTM模型性能是最優的,在各個評價指標上都取得了不錯的效果。這是因為ERNIE預訓練模型強大的預訓練能力,不僅能夠根據上下文意形成動態詞向量,還加人了海量的中文預訓練語料,使得其中文文本分析能力遠超同類預訓練模型,再加上BiLSTM能夠進一步捕捉文意,對ERNIE忽略的“漏網之魚\"進行掃除,起到了“錦上添花\"的作用。事實證明,本文提出ERNIE-BiLSTM模型確實能夠提高“雙減\"政策評論文本的情感傾向化分析的效果。

3.3EEMD-GRU-XGB模型測試

3.3.1測試準備

同樣的,EEMD-GRU-XGB模型也面臨著超參數設置的問題,之前已經詳細說明了超參數,在本節中就直接介紹最終選擇的超參數值。在GRU模型中,設置窗口lookback_window為24,即在本文時間序列的預測中使用前24小時的熱度預測下一小時的熱度;采用包含兩層隱含層的網絡,其中前一層為門控循環單元神經網絡,包含32個節點,后一層是全連接層,包含128個節點。此外,損失函數選取MSE,優化器optimizer選取Adam,迭代次數為100,每次訓練的樣本數目為16。在XGBoost模型中,針對本文的實驗數據,將設置樹的最大深度為5、最大迭代次數為100、最小葉子節點樣本權重為4、學習率為0.1。同時,需要被最小化的損失函數objective采用linear,預測效果最佳。總體流程就是利用EEMD-GRU-XGB模型預測2021年8月1日至2021年10月31日每小時的熱度,并與真實熱度值進行對比。

3.3.2測試結果

首先利用EEMD模型將熱度分解為8個IMF分量,EEMD分解后IMF分量較為平穩,且未出現明顯的模態混疊現象。當分解出8個IMF之后,使用GRU模型對每一個IMF進行時間序列預測,再利用XGB模型對真實值和GRU預測值之間誤差進行擬合,兩次預測值加總得出每一個IMF分量的預測值,組合IMF預測值之后就可以得到熱度預測值。具體預測效果如圖3所示。其中,實線表示真實值,虛線表示預測值。

圖3各模型擬合效果對比圖

由圖3可以看出,在2021年8月1日至2021年10月31日每小時的熱度預測值和真實值的誤差很小,EEMD-GRU-XGB模型的 R2 為 89.31% ,說明模型能夠解釋真實值大多數的波動情況,擬合效果較為優秀。為說明模型性能,本文選用相關GRU、EEMD-GRU和EEMD-LSTM-XGB三個常見模型進行對比實驗,使用相關指標進行預測效果評價,具體預測見表3。

表3各模型性能評價對比表

由表3可知,EEMD-GRU-XGB模型在各個評價指標上都取得了不錯的效果,說明該模型在熱度預測問題上確實有不俗的表現。這是因為EEMD-GRU-XGB模型綜合三個模型的預測功能,對熱度值進行層層擬合,提高預測準確性。事實證明,本文提出EEMD-GRU-XGB模型確實能夠提高“雙減\"政策評論文本的熱度預測的效果。

4小結

本文提出 ERNIE-BiLSTM模型和EEMD-GRU-XGB模型,并使用“雙減\"政策評論數據進行模型測試,發現:ERNIE-BiLSTM模型可以從前后兩個方向捕捉文本語義,極大地提高語義表征能力,搜集盡可能多的信息,最后輸出情感傾向化結果。經過與其它常用模型對比實驗,發現本文提出的ERNIE-BiL-STM模型擁有較強的情感傾向化分析能力。EEMD-GRU-XGB模型是綜合利用了EEMD、GRU和 XG-Boost三個模型進行層層擬合,先使用EEMD模型進行分解,對分解后的分量進行擬合,再對擬合誤差進行再一次擬合。三個模型發揮預測功能并相互補充,極大提升了整體模型的預測水平。與其他常用模型相比,本文提出的EEMD-GRU-XGB模型預測水平更高。

參考文獻:

[1]NasukawaT,YiJ.Sentimentanalysis:capturingfavorabilityusing naturallanguageprocessingC].Procofthe2ndInteetna-tional Conference on Knowledge Capture,20o3:70-77.

[2]LinL,LiJ,Zhang R,etal.Opinionminingandsentiment analysisinsocial networks:aretweting structure-awareapproach[C]. Proc of 2014 IEEE/ACM 7th International Conference on Utility and Cloud Computing,2014:890-895.

[3]Cynthia Whisell.Usingthreviseddictionaryofafectinlanguagetoquantifheemotioalndertonesofsamplesofnaturallanguage[J].Psychological Reports,2009,105(2):509-521.

[4]鐘佳娃,劉巍,王思麗,等.文本情感分析方法及應用綜述[J].數據分析與知識發現,2021,5(6):1-13.

[5]Dong Z D,Dong Q.HowNet-Ahybrid language and knowledge resourceC].Procof Internetional ConferenceonNaturalLan-guage Processing and Knowledge Engineering,20o3:82O-824.

[6]Ku LW,LoYS,Chen HH. Using polarityscoresofwordsforsentence-levelopinionextractionC].ProcofNTCIR-6 Work-shop Meeting,2007:316-322.

[7]XuLinhong,LinHongfei,PanYu,etal.ConstructingtheectivelexiconontologyJ].JoualoftheChinaSocietyfoSintific and Technical Information,2008,27(2):180-185.

[8]Yang Aimin,Lin Jianghao,Zhou Yongmei,etal. Research on building a Chinese sentimentlexicon basedonSO-PMI[C]. Ap-plied Mechanics and Materials.Trans Tech PublicationLtd,2013,263:1688-1693.

[9]葉霞,曹軍博,許飛翔,等.中文領域情感詞典自適應學習方法[J].計算機工程與設計,2020,41(8):2231-2237.

[10]林振宇,解吉波,楊騰飛,等.旅游多主題情感詞典的構建方法[J].地理與地理信息科學,2021,37(4):22-27.

[11]Pang B,LeeL,VaithyanthanS.Thumbs up?Sentimentclassificationusing machinelearning techniques[C].Procof heCon-ference on Empirical Methods in Natural Language Processing,2OO2:79-86.

[12]Zhu XJ,ZouG.Leaming from labelsandunlabeled datawithlabel propagation[J].TechReport,2002,3175(2004):37244.

[13]孫艷,周學廣,付偉.基于主題情感混合模型的無監督文本情感分析[J].北京大學學報(自然科學版),2013,49(1):102-108.

[14]Hofmann T.Probabilisticlatentsemanticanalysis[C].Procofthe15thConferenceon UncertaintyinArtificialItellgenc,1999:289-296.

[15]BleiDMNgAY,JodanM1.LatentdirichletalocationJ].JournalofMachine Learing Research,2O3,3:992.

[16]YanXiaohuiGuoJiengLanYanyan,etal.AitetopicmodelfoshorttextsC].Procofthe22ndInteratioalCoferenceonWorldWideWeb,2013:1445-1456.

[17]李壽山,黃居仁.基于Stacking組合分離方法的中文情感分類研究[J].中文信息學報,2010,24(5):56-61.

[18]劉龍飛,楊亮,張紹武,等.基于卷積神經網絡的微博情感傾向性分析[J].中文信息學報,2015,29(6):159-165.

[19]趙月華,朱思成,蘇新寧.面向網絡虛假醫療信息的識別模型構建研究——一種基于預訓練的BERT模型[J].情報科學,2021,39(12):165-173.

[20]林育曼,文海寧,饒浩.基于ARIMA-BP神經網絡模型的微信輿情熱度預測[J].統計與決策,2019,35(14):71-74.

[21]陳羽中,方明月,郭文忠,等.基于小波變換與差分自回歸移動平均模型的微博話題熱度預測[J].模式識別與人工智能,2015,28(7):586-594.

[22]向小東,黃飄.基于EEMD-NAR的突發傳染病輿情熱度預測研究[J].武漢理工大學學報(信息與管理工程版),2019,41(4):352-358.

[23]ChenNY,LiuY,Zhang ZJ.AforecastingsystemofmicroblogpublicopinionbasedonartificialneuralnetworkJ].Journal of Internet Technology,2015,16(6) :999-1004.

[24]裴可鋒,陳永洲,馬靜.基于DTPM模型的話題熱度預測方法[J].情報雜志,2016,35(12):52-57.

[25]靳春妍.基于情感分析的突發公共衛生事件網絡輿情熱度預測研究[D].長春:吉林大學,2021:13-21.

[26]曾輝,彭俊,胡蓉,等.基于主題與用戶關系信息的微博熱度預測算法[J].現代電子技術,2021,44(13):140-143.

Network Public Opinion Analysis and Prediction Based on ERNIE-BiLSTMand EEMD-GRU-XGB

CHEN Songbai

(School of Education,SoochowUniversity,Suzhou 215ooo,China)

Abstract:Public atitudes andopinions toward public events willform socialpublicopinion.This paper aims tocapture the publicsentimentorientationofpublicopinionand predictthepopularitythroughalgorithmic modeling.Anemotionclassification method basedon ERNIE-BiLSTM model andthe popularityprediction method based on EEMD-GRU-XGBost model areproposed.These modelsareapliedtoanalysis thetextdataofmicroblogcomments,andtestedusing\"DoubleReduction\"policycomments data.Teanalysisprocessandexperimentalresultsarepresented,withperformancecomparison experimentsusingmultiple mainstreammodelstoevaluateteeffctsofiferentmodelsspaatelyFinallitisfoundtattheERNE-BiSTodeldte EEMD-GRU-XGBoost model are superior to other models, achieving good analysis results.

Key Words:ERNIE-BiLSTM; EEMD-GRU-XGB; emotional tendency; popularity prediction; model testing

[責任編輯:許立群]

主站蜘蛛池模板: 久久综合九色综合97婷婷| 国产在线观看99| 久久精品波多野结衣| 国产91av在线| 欧美亚洲国产视频| 色男人的天堂久久综合| 欧美全免费aaaaaa特黄在线| 无码内射中文字幕岛国片| 国产精品成人免费视频99| 亚洲一区波多野结衣二区三区| 自拍偷拍一区| 国产精品视频系列专区| 麻豆精品在线| 成人欧美日韩| 国产免费久久精品99re不卡| 色婷婷在线影院| 麻豆精品视频在线原创| 午夜免费视频网站| 色亚洲激情综合精品无码视频| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 91系列在线观看| 2022精品国偷自产免费观看| 亚洲精品无码AⅤ片青青在线观看| 亚洲大尺码专区影院| 老司机久久99久久精品播放 | 特级aaaaaaaaa毛片免费视频| 五月天久久婷婷| 中文字幕无码中文字幕有码在线| 91精品国产自产91精品资源| 国产成人欧美| 色偷偷av男人的天堂不卡| 亚洲欧洲美色一区二区三区| 毛片久久网站小视频| 欧美怡红院视频一区二区三区| 久久精品亚洲专区| 在线观看国产精品第一区免费 | 天天爽免费视频| 一级毛片在线免费看| 国产精品久久久久久影院| 久久综合伊人 六十路| 国产麻豆福利av在线播放| 99热6这里只有精品| 国产毛片久久国产| 亚洲日本中文字幕天堂网| 在线观看无码av免费不卡网站| 青青久视频| 亚洲无码视频图片| 国产成人亚洲欧美激情| 精品人妻无码区在线视频| 国产日本欧美亚洲精品视| 久久semm亚洲国产| 久久精品aⅴ无码中文字幕| 在线精品欧美日韩| 九色91在线视频| 国产性爱网站| 日韩av手机在线| 91福利片| 国产精品综合色区在线观看| 全裸无码专区| 国产区人妖精品人妖精品视频| 亚洲欧美国产高清va在线播放| 久久香蕉国产线| 日韩大片免费观看视频播放| 一级香蕉人体视频| 2021国产精品自产拍在线| 国产女主播一区| 国产精品九九视频| 亚洲人成人无码www| www欧美在线观看| 天天做天天爱天天爽综合区| 永久免费精品视频| 日韩精品久久久久久久电影蜜臀| 91精品专区国产盗摄| 色综合天天操| 精品小视频在线观看| 欧美综合区自拍亚洲综合绿色| 日韩专区第一页| 日本午夜影院| 国产jizz| 成年人免费国产视频| 久久一日本道色综合久久| 尤物成AV人片在线观看|