聶黎生



摘 ?要: 隨著互聯(lián)網(wǎng)時(shí)代社交媒體的飛速發(fā)展,熱點(diǎn)事件不斷進(jìn)入公眾視野,輿情分析成為公共管理部門面臨的新挑戰(zhàn)。針對(duì)該問(wèn)題提出基于KPCA?粒子群隨機(jī)森林算法用于輿情趨勢(shì)預(yù)測(cè)研究。實(shí)驗(yàn)結(jié)果表明,該算法在預(yù)測(cè)精度上較BP神經(jīng)網(wǎng)絡(luò)算法有顯著提高,可以為政府部門及時(shí)掌握、引導(dǎo)和控制網(wǎng)絡(luò)輿情提供決策支持。
關(guān)鍵詞: KPCA; 輿情; 趨勢(shì)預(yù)測(cè); 粒子群隨機(jī)森林; 預(yù)測(cè)精度; BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào): TN911.1?34; TP391 ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)15?0079?04
Research on trend prediction of public opinion based on KPCA
and particle swarm random forest algorithm
NIE Lisheng
(College of Computer Science and Technology, Jiangsu Normal University, Xuzhou 221116, China)
Abstract: With the rapid development of social media in the Internet era, the hot issues come into the public view constantly, and the public opinion analysis becomes a new challenge to public administration departments. In order to solve this problem, the trend prediction study on public opinion is proposed on the basis of KPCA and particle swarm random forest algorithm. The experimental results show that the prediction accuracy of this algorithm is significantly higher than that of BP neural network algorithm, and it can provide the decision support for government departments to master, guide and control the network public opinion in time.
Keywords: KPCA; public opinion; trend prediction; particle swarm random forest; prediction accuracy; BP neural network
0 ?引 ?言
隨著網(wǎng)絡(luò)社交媒體的蓬勃發(fā)展,信息傳播的速度和廣度以指數(shù)級(jí)規(guī)模快速擴(kuò)散,社會(huì)個(gè)體在進(jìn)行便利信息傳播的同時(shí)也給輿情監(jiān)控和公共安全增加了復(fù)雜性[1]。及早發(fā)現(xiàn)社會(huì)高度關(guān)切的輿情熱點(diǎn),及時(shí)為公共管理部門提供輿情后續(xù)傳播趨勢(shì),從而使管理部門能夠準(zhǔn)確、高效地進(jìn)行危機(jī)處理,有利于社會(huì)的和諧與穩(wěn)定。
近年來(lái),輿情趨勢(shì)預(yù)測(cè)研究已經(jīng)引起眾多學(xué)者的關(guān)注。文獻(xiàn)[2]探討了離散粒子群優(yōu)化算法發(fā)現(xiàn)微博熱點(diǎn)話題的應(yīng)用;文獻(xiàn)[3?4]分別從數(shù)據(jù)挖掘和詞項(xiàng)角度研究了微博熱點(diǎn)話題預(yù)測(cè)及發(fā)現(xiàn);文獻(xiàn)[5]基于微博事件的情感常識(shí)層面研究了公眾情感的變化趨勢(shì);文獻(xiàn)[6]分析了輿情大數(shù)據(jù)背景下網(wǎng)民情緒變化機(jī)理及趨勢(shì)預(yù)測(cè);文獻(xiàn)[7]給出了基于社交網(wǎng)絡(luò)的輿論傳播模型,并對(duì)輿論傳播的動(dòng)力學(xué)進(jìn)行了研究。
本文運(yùn)用基于核主成分分析(KPCA)與粒子群隨機(jī)森林算法對(duì)輿情趨勢(shì)進(jìn)行預(yù)測(cè)。該算法首先提取原始輿情數(shù)據(jù)特征向量,通過(guò)KPCA線性降維并選取其中核主成分特征向量,輸出非線性時(shí)間序列數(shù)據(jù);然后利用粒子群隨機(jī)森林算法輸入上述序列數(shù)據(jù),從而實(shí)現(xiàn)對(duì)輿情趨勢(shì)進(jìn)行預(yù)測(cè)。
1 ?特征提取與KPCA降維處理
在輿情趨勢(shì)預(yù)測(cè)中,原始數(shù)據(jù)混入的噪聲信號(hào)對(duì)預(yù)測(cè)結(jié)果存在冗余和不確定性,如若直接提取時(shí)間序列物理量的特征,就會(huì)導(dǎo)致最終的預(yù)測(cè)結(jié)果存在明顯誤差。從趨勢(shì)預(yù)測(cè)的角度看,輿情反映在時(shí)序波形中有可能并非輿情爆發(fā)的開始時(shí)間,而是具有一定的時(shí)間延遲。對(duì)獲取的輿情數(shù)據(jù)進(jìn)行時(shí)域和頻域特征提取,不同特征向量對(duì)于趨勢(shì)預(yù)測(cè)的貢獻(xiàn)率和關(guān)聯(lián)度差異較大,最終預(yù)測(cè)結(jié)果存在誤差。所以,如果物理含義不充分,或者是不存在先驗(yàn)知識(shí)時(shí),必須完成特征向量降維這一環(huán)節(jié)[8]。
1.1 ?核主成分分析
模式識(shí)別中線性特征提取和數(shù)據(jù)表示通常采用主成分分析(PCA)的方式。當(dāng)訓(xùn)練數(shù)據(jù)集樣本數(shù)量相對(duì)較少時(shí),很難得到精確的估計(jì)協(xié)方差矩陣,并且在非線性數(shù)據(jù)處理時(shí)往往得不到較好的期望效果。作為一種非線性特征降維算法,KPCA利用核化思想把樣本空間通過(guò)非線性的方式映射到高維特征空間[F],然后對(duì)[F]執(zhí)行PCA算法進(jìn)行線性降維。KPCA在解決非線性特征提取問(wèn)題上較PCA具有特征更多和質(zhì)量更高的優(yōu)點(diǎn),利用核函數(shù)可以有效地保留原始數(shù)據(jù)的特征,并最大限度地抽取數(shù)據(jù)中蘊(yùn)含的非線性信息。KPCA具有以下特點(diǎn):將原空間中數(shù)據(jù)通過(guò)引入隱性非線性映射函數(shù)映射到高維空間;該空間中的所有樣本均可線性表示空間中的任一向量。
1.2 ?基于核函數(shù)的主成分分析的實(shí)現(xiàn)
1) 構(gòu)建[m×n]維數(shù)據(jù)矩陣:
2) 選擇核函數(shù),確定參數(shù),通過(guò)計(jì)算得到矩陣[S]。
3) 對(duì)核矩陣予以優(yōu)化,得到[SL]。
4) 通過(guò)雅克比(Jacobi)迭代法進(jìn)行計(jì)算以確定[SL]的特征值[λ1,λ2,…,λn],并計(jì)算其對(duì)應(yīng)的特征向量[V1,V2,…,Vn]。
5) 將特征值通過(guò)降序排列,得到[λ′1≥λ′2≥…≥λ′n],并相應(yīng)地調(diào)整特征向量為[V′1,V′2,…,V′n]。
6) 利用施密特正交化方法,對(duì)特征向量予以正交化處理,確定[α1,α2,…,αn]的值。
7) 通過(guò)計(jì)算確定降序后特征值的累積貢獻(xiàn)率[β1,β2,…,βn],按照之前設(shè)定的特征提取效率[g],若有[βk≥g],通過(guò)提取得到[k]個(gè)主成分[α1,α2,…,αk]。
8) 確定經(jīng)過(guò)標(biāo)準(zhǔn)化處理的樣本數(shù)據(jù)[X]在特征向量上的投影[F=X?α],其中,[α=(α1,α2,…,αk)]。
降維后的數(shù)據(jù),就是數(shù)據(jù)協(xié)方差矩陣[K]個(gè)最大特征值對(duì)應(yīng)的特征向量。所有包含特征向量的矩陣[F]形成一組正交基,同時(shí)在數(shù)據(jù)中保留了最佳信息。
2 ?粒子群隨機(jī)森林算法
2.1 ?隨機(jī)森林
隨機(jī)森林是Leo Breiman和Adele Cutler在2001年首次提出的一種使用多棵樹來(lái)訓(xùn)練和預(yù)測(cè)樣本的分類器。在此之后,Deitterich將隨機(jī)節(jié)點(diǎn)優(yōu)化思想嵌入到模型中進(jìn)而有效地優(yōu)化隨機(jī)森林。隨機(jī)森林算法以若干CART為元分類器,基于“套袋”思想控制方差創(chuàng)建不同的決策樹集合。雖然單一決策樹不能提供很強(qiáng)的性能分離器,但是通過(guò)組合起來(lái)可以有效提高決策性能[9]。作為一種多功能的機(jī)器學(xué)習(xí)算法,隨機(jī)森林可以實(shí)現(xiàn)回歸和分類任務(wù),亦可用于缺失值、異常值及重復(fù)值的降維處理[10]。一般而言,該方法的執(zhí)行程序?yàn)椋?/p>
1) 設(shè)定包含[K]個(gè)樣本的集合為[A],變量的數(shù)量為[J]。
2) 每個(gè)節(jié)點(diǎn)通過(guò)隨機(jī)方法選擇[m(m 3) 從[A]中以可放回采樣的方式,重復(fù)采樣[N]次,形成一組決策樹的訓(xùn)練集[Z]。根據(jù)訓(xùn)練集[Z]預(yù)測(cè)剩余類別,并對(duì)誤差進(jìn)行分析。 4) 隨機(jī)選取[m]個(gè)基于每一個(gè)節(jié)點(diǎn)上的變量,根據(jù)這[m]個(gè)變量,計(jì)算確定其最優(yōu)分裂點(diǎn)。 5) 每棵決策樹在不剪枝的情況下最大限度地進(jìn)行生長(zhǎng),并通過(guò)將所有決策樹相加預(yù)測(cè)新數(shù)據(jù)。 2.2 ?粒子群優(yōu)化算法 粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是基于魚群和鳥群等動(dòng)物在自然界中以相互合作的方式尋找食物的行為模擬技術(shù)。該算法把粒子群當(dāng)作鳥群,種群里面各個(gè)粒子代表可行域里面的可行解,通過(guò)粒子間的相互作用尋求復(fù)雜空間最優(yōu)解。在進(jìn)行迭代操作時(shí),能夠利用學(xué)習(xí)機(jī)制掌握歷史經(jīng)驗(yàn),據(jù)此優(yōu)化自身速度以及位置矢量,從而實(shí)現(xiàn)全局尋優(yōu)的效果。 式中:[W]為慣性權(quán)重,用于調(diào)節(jié)對(duì)空間的搜索范圍,它在種群全局搜索和局部細(xì)化能力中起著關(guān)鍵作用,通常在 0.4~1.2范圍內(nèi);[C1]和[C2]代表將每個(gè)粒子推向Pbest和Sbest位置的加速常數(shù),用來(lái)調(diào)整最大學(xué)習(xí)步長(zhǎng);[rand()]為隨機(jī)函數(shù),在[0,1)范圍內(nèi)產(chǎn)生隨機(jī)數(shù),從而確保搜索的隨機(jī)性。 粒子速度更新公式由三部分構(gòu)成:粒子自身運(yùn)動(dòng)習(xí)慣的“動(dòng)量”部分,表示粒子保持之前的速度;粒子對(duì)歷史經(jīng)驗(yàn)記憶的“認(rèn)知”部分[11],表示粒子的實(shí)時(shí)位置和自身最佳位置的距離;不同粒子彼此協(xié)作和共享的“社會(huì)”部分,表示粒子的實(shí)時(shí)位置和群體最佳位置的距離。 3 ?基于粒子群隨機(jī)森林的輿情趨勢(shì)預(yù)測(cè) 媒體傳播方式、網(wǎng)民關(guān)注程度及信源敏感性質(zhì)等均會(huì)影響到輿情的發(fā)展趨勢(shì)。本研究選擇網(wǎng)民關(guān)注度較高的微博話題作為實(shí)驗(yàn)數(shù)據(jù),采用基于KPCA?粒子群隨機(jī)森林算法預(yù)測(cè)輿情的趨勢(shì)變化。 3.1 ?實(shí)驗(yàn)數(shù)據(jù)獲取 實(shí)驗(yàn)數(shù)據(jù)通過(guò)網(wǎng)絡(luò)爬蟲系統(tǒng)自動(dòng)提取2018年8月1日—12日新浪微博熱點(diǎn)話題所形成的時(shí)間序列作為實(shí)驗(yàn)數(shù)據(jù),采樣間隔為24 h,采樣點(diǎn)的數(shù)量為1 580個(gè)數(shù)據(jù)點(diǎn),實(shí)驗(yàn)記錄了該時(shí)間內(nèi)總共6 245條微博。根據(jù)實(shí)際問(wèn)題的需要,獲取的微博數(shù)據(jù)主要包含博主ID、博主類型、發(fā)布時(shí)間、主題特征、閱讀數(shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)及點(diǎn)贊數(shù)等,這些數(shù)據(jù)可用來(lái)分析輿情動(dòng)態(tài)趨勢(shì)特征。將收集的前5天數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),后1天數(shù)據(jù)作為測(cè)試數(shù)據(jù),分成兩組,通過(guò)采用單步滾動(dòng)的方式進(jìn)行預(yù)測(cè)以驗(yàn)證本文算法的預(yù)測(cè)精度。 3.2 ?特征向量提取與KPCA降維 由于提取數(shù)據(jù)的特征向量很多,致使原始特征空間的維數(shù)非常大,勢(shì)必影響到?jīng)Q策的建模并降低建模精度,因此需要對(duì)原始特征集空間進(jìn)行降維處理,刪除那些對(duì)預(yù)測(cè)結(jié)果貢獻(xiàn)率和關(guān)聯(lián)度較小的特征向量,進(jìn)而得到最優(yōu)化意義下的最簡(jiǎn)約特征向量集合,以提高算法的預(yù)測(cè)效率和精度。對(duì)于特征向量的選取以及權(quán)值計(jì)算,采用時(shí)域與頻域分析,從每一節(jié)數(shù)據(jù)里面提取16個(gè)特征向量(頻域、時(shí)域特征量分別有6個(gè)和10個(gè))展開核主成分分析。 為了揭示出各個(gè)微博特征對(duì)輿情發(fā)展變化的作用,通過(guò)計(jì)算確定各個(gè)特征對(duì)輿情趨勢(shì)的信息增益值,留下作用較為明顯的特征;這樣分類學(xué)習(xí)算法就能夠僅關(guān)注攜帶最多預(yù)測(cè)信息的那部分特征,使模型在有效性方面具有更好的表現(xiàn)。本實(shí)驗(yàn)數(shù)據(jù)的16個(gè)特征值里,保留了反映輿情趨勢(shì)和富含預(yù)測(cè)價(jià)值的12個(gè)主要特征展開KPCA主成分分析,從而實(shí)現(xiàn)特征向量的降維處理。根據(jù)核主成分分析結(jié)果,如表1所示確定了貢獻(xiàn)率排名前四的分量。這里面,分量1的貢獻(xiàn)率高于90%,達(dá)到了94.49%,基于貢獻(xiàn)率超過(guò)85%為合適的原則,選擇貢獻(xiàn)率排名第一的分量為預(yù)測(cè)實(shí)驗(yàn)依據(jù)。表1 ?部分特征向量貢獻(xiàn)率

3.3 ?實(shí)驗(yàn)與分析
3.3.1 ?粒子群隨機(jī)森林預(yù)測(cè)模型構(gòu)建
基于通過(guò)實(shí)驗(yàn)獲取的數(shù)據(jù),以及粒子群隨機(jī)森林的輸入輸出和結(jié)構(gòu),確定訓(xùn)練集以及預(yù)測(cè)數(shù)據(jù),對(duì)數(shù)據(jù)分析結(jié)果進(jìn)行KPCA降維處理,獲取876個(gè)能夠正確反映輿情趨勢(shì)變化數(shù)據(jù)點(diǎn),從中選取601~800數(shù)據(jù)點(diǎn)為訓(xùn)練集,801~820數(shù)據(jù)點(diǎn)為預(yù)測(cè)數(shù)據(jù),創(chuàng)建訓(xùn)練集的訓(xùn)練樣本特征空間[s=α,β],其中訓(xùn)練集樣本空間[α]為:
預(yù)測(cè)步長(zhǎng)擁有25列。在步長(zhǎng)為15,20,25,30的情況下進(jìn)行實(shí)驗(yàn),結(jié)果表明在步長(zhǎng)為25的情況下,模型的預(yù)測(cè)準(zhǔn)確性達(dá)到最佳。粒子群隨機(jī)森林以100~900為樹的數(shù)量,以50為步長(zhǎng)步進(jìn),實(shí)驗(yàn)結(jié)果表明在樹的數(shù)量等于500的情況下,預(yù)測(cè)誤差是最小的。每個(gè)樹節(jié)點(diǎn)隨機(jī)采樣數(shù)目設(shè)置為25,其他參數(shù)設(shè)為缺省值。
3.3.2 ?實(shí)驗(yàn)結(jié)果及有效性分析
為了驗(yàn)證基于KPCA?粒子群隨機(jī)森林算法的預(yù)測(cè)效果,選取BP神經(jīng)網(wǎng)絡(luò)算法比較兩者的預(yù)測(cè)精度。圖1為BP神經(jīng)網(wǎng)絡(luò)、粒子群隨機(jī)森林預(yù)測(cè)點(diǎn)擊數(shù)和微博實(shí)際點(diǎn)擊數(shù)對(duì)比圖,并采用[R]方值、RMSE值以及MSE值作為衡量預(yù)測(cè)值和實(shí)際值擬合優(yōu)度的評(píng)價(jià)指標(biāo)。
微博的點(diǎn)擊數(shù)量是輿情趨勢(shì)變化晴雨表的直接反映。從圖1總體上看到,輿情熱度的演變具有爆發(fā)迅速、回落緩慢的特征,大致經(jīng)歷萌動(dòng)、加速、成熟和衰退4個(gè)階段,基本符合網(wǎng)絡(luò)輿情的生命周期[12]。具體來(lái)看,BP神經(jīng)網(wǎng)絡(luò)在輿情萌動(dòng)階段預(yù)測(cè)結(jié)果不精確且延遲較為嚴(yán)重,尤其在輿情爆發(fā)時(shí)其預(yù)測(cè)值偏離真實(shí)值較大;對(duì)于粒子群隨機(jī)森林算法,不僅在相對(duì)平緩的地方預(yù)測(cè)趨勢(shì)和真實(shí)情況比較相符,而且能夠準(zhǔn)確揭示出真實(shí)值在波峰較大情況下的趨勢(shì)。這表明基于KPCA?粒子群隨機(jī)森林算法,可以從日益增長(zhǎng)的媒體數(shù)據(jù)中挖掘輿情傳播的內(nèi)在規(guī)律,準(zhǔn)確預(yù)測(cè)輿情的發(fā)展趨勢(shì),預(yù)測(cè)結(jié)果較實(shí)際數(shù)值誤差較小。粒子群隨機(jī)森林算法、BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)結(jié)果[R]方值、RMSE值、MSE值詳見表2。對(duì)表中的數(shù)據(jù)進(jìn)行對(duì)比分析可知,本文算法各指標(biāo)明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型,其[R]方值為0.934 9,比BP神經(jīng)網(wǎng)絡(luò)模型的0.832 5高出12.30%;RMSE值與BP神經(jīng)網(wǎng)絡(luò)相比,降低了50.18%;MSE值相對(duì)于BP神經(jīng)網(wǎng)絡(luò)大大降低,結(jié)果表明本文算法具有更高的預(yù)測(cè)精度,是一種有效的輿情趨勢(shì)預(yù)測(cè)方法。


4 ?結(jié) ?語(yǔ)
本文以復(fù)雜網(wǎng)絡(luò)輿情的預(yù)測(cè)模型為研究對(duì)象,提出一種基于KPCA?粒子群隨機(jī)森林算法,并通過(guò)實(shí)驗(yàn)對(duì)比了本文算法與BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)效果。從實(shí)驗(yàn)結(jié)果可以看出,在[R]方值、RMSE及MSE評(píng)價(jià)指標(biāo)上粒子群隨機(jī)森林算法整體均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)算法,表明本文算法能夠準(zhǔn)確反映輿情傳播進(jìn)程中潛在驅(qū)動(dòng)機(jī)制和動(dòng)態(tài)規(guī)律,可以為政府部門引導(dǎo)和控制網(wǎng)絡(luò)輿情提供決策支持。
參考文獻(xiàn)
[1] CERON A, NEGRI F. The social side of public policy: monitoring online public opinion and its mobilization during the policy cycle [J]. Policy & Internet, 2016, 8(2): 131?147.
[2] 馬慧芳,吉余崗.基于離散粒子群優(yōu)化的微博熱點(diǎn)話題發(fā)現(xiàn)算法[J].計(jì)算機(jī)工程,2016,42(3):208?213.
MA Huifang, JI Yugang. Discrete particle swarm optimization?based topic discovery algorithm for microblogs [J]. Computer engineering, 2016, 42(3): 208?213.
[3] 張貴紅,李中華.基于數(shù)據(jù)挖掘技術(shù)的微博熱點(diǎn)話題預(yù)測(cè)[J].現(xiàn)代電子技術(shù),2017,40(15):52?55.
ZHANG Guihong, LI Zhonghua. Micro?blog hot topic forecasting based on data mining technology [J]. Modern electronics technique, 2017,40(15): 52?55.
[4] 李惠,王麗婷.基于詞項(xiàng)熱度的微博熱點(diǎn)話題發(fā)現(xiàn)研究[J].情報(bào)科學(xué),2018,38(4):45?50.
LI Hui, WANG Liting. Research on topic discovery in microblogs based on term hot [J]. Information science, 2018, 38(4): 45?50.
[5] 任巨偉,楊亮,吳曉芳,等.基于情感常識(shí)的微博事件公眾情感趨勢(shì)預(yù)測(cè)[J].中文信息學(xué)報(bào),2017,31(2):169?178.
REN Juwei, YANG Liang, WU Xiaofang, et al. Public sentiment trend prediction of microblog events based on affective commonsense knowledge [J]. Journal of Chinese information processing, 2017, 31(2): 169?178.
[6] 蘭月新,夏一雪,劉冰月,等.面向輿情大數(shù)據(jù)的網(wǎng)民情緒演化機(jī)理及趨勢(shì)預(yù)測(cè)研究[J].情報(bào)雜志,2017,36(11):134?140.
LAN Yuexin, XIA Yixue, Liu Bingyue, et al. Research on the evolution mechanism and trend prediction of netizens for public opinion big data [J]. Journal of intelligence, 2017,36(11): 134?140.
[7] XIONG Xi, HU Yong. Research on the dynamics of opinion spread based on social network services [J]. Acta physica sinica, 2012, 61(15):150?156.
[8] 王梓杰,周新志.基于PCA和隨機(jī)森林的故障趨勢(shì)預(yù)測(cè)方法研究[J].計(jì)算機(jī)測(cè)量與控制,2018,26(2):21?26.
WANG Zijie, ZHOU Xinzhi. Research on fault trend prediction methods based on PCA and random forest [J]. Computer measurement and control, 2018, 26(2): 21?26.
[9] 李強(qiáng),鄭宇杰.基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測(cè)[J].現(xiàn)代電子技術(shù),2015,38(8):50?53.
LI Qiang, ZHENG Yujie. Protein crystallization prediction based on fusion of multi?view features and random forest [J]. Modern electronics technique, 2015, 38(8): 50?53.
[10] SURHONE L M, TENNOE M T, HENSSONOW S F, et al. Random forest [J]. Machine learning, 2010, 45(1): 5?32.
[11] 程慕鑫.基于小波變異的改進(jìn)粒子群算法[J].華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,39(1):236?240.
CHENG Muxin. Improved particle swarm optimization based on wavelet mutation [J]. Journal of East China University of Science and Technology (Natural science edition), 2013, 39(1): 236?240.
[12] 曾子明,黃城鶯.BP神網(wǎng)絡(luò)的突發(fā)傳染病輿情熱度趨勢(shì)預(yù)測(cè)模型研究[J].現(xiàn)代情報(bào),2018,38(5):37?52.
ZENG Ziming, HUANG Chengying. BP neural network for predicting the trend of public opinion on sudden infectious diseases [J]. Modern intelligence, 2018, 38(5): 37?52.