王 東, 孫 彬
(1. 新疆財經大學 計算機科學與工程學院, 烏魯木齊 830012; 2. 新疆教育學院 計算機職業教育分院, 烏魯木齊 830033)
?
情緒波動方程下微信息推介演變模型*
王東1,2, 孫彬1
(1. 新疆財經大學 計算機科學與工程學院, 烏魯木齊 830012; 2. 新疆教育學院 計算機職業教育分院, 烏魯木齊 830033)
為有效地捕捉微信息用戶情緒,準確把握用戶的興趣傾向,使用最大信息熵估計法建立情緒波動方程,確定刺激力和內趨力參數方案.在衡量微信息情緒狀態的前提下,描述出微信息用戶情緒演變系統,建立及時激勵推薦型的情緒導引模型,實現了情緒預測和情緒信息準確推薦的目的.結果證明,信息熵估計可以介入準確的情緒符號,提高微信息導引策略的適用性,達到穩定用戶情緒、導引網絡正能量的效能,對建立公信力和平抑小眾情緒起到積極的作用.
信息熵; 情緒識別; 推薦; 導引模型; 激勵法; 監測; 微信息; 正能量
微信息(微博、貼吧和微信等)的用戶行為和文字記錄具有強烈的情緒特征,反映了用戶對社會現象的興趣偏好和傾向特征.通過對微信息數據進行情緒導引,能改變人們被動接受網絡負信息、管理部門主動引導低效的不利局面.從微信息用戶的角度來分析,需要一種能貼近用戶情緒、能有效導引用戶訪問興趣和行為的方法.
微信息情緒識別要求針對每個用戶的具體個性特征進行情緒歸類和傾向評價活動.微文本應用涉及社會生活的各個方面,其具備如下特點:從百姓日常生活到社會時事評論,所有信息內容都附帶著用戶個人的情緒色彩[1];用戶所提交的交互信息和交互行為都是基于興趣的[2];用戶與興趣之間往往是多對多的關系[3];微文用戶的興趣愛好符合艾賓浩斯遺忘曲線,隨著時間的推移,用戶興趣逐漸衰落[4].微信息的情緒識別工作被多領域的工作者廣泛關注,同時微信息的情緒識別工作也面臨著許多技術難題,例如,大數據特征使得信息管理部門與用戶都力不從心,無暇顧及輿情的情緒特征,很難把握正確的情趣導引舉措[5-6];微博微信的對抗性批評降低了,激烈的輿情有所減少,輿情的隱性化使監測成為難題[7].
微文內容分析包括概率圖模型提取[8]、情緒詞節點映射[9]、語義特征向量最相似選取[10]、聚類特征主題識別[11]、改進LDA(latent dirichlet allocatlon)模型模糊識別興趣主題[12-14]等方法,而在用戶興趣發現的諸多方法中,從識別效率和降維技術的方面來看,模糊識別具有獨特的優勢.
本文結合信息熵技術,建立情緒波動方程獲得適用的微信息情緒特征,突破了情緒識別技術瓶頸,實現微信息用戶的情緒推介服務.
情緒計算為試圖創建一種能感知、識別和理解用戶情緒的過程,實現情緒特征值的捕捉.情緒計算存在著兩個層次的問題和挑戰,即規范層與實現層.規范層為合成情緒推介服務提供良好的演化模型;實現層通過對用戶情緒結構及交互規則的描述,為用戶的情趣和級性特征測量提供語法分析上的支持.如果缺乏對情緒信息的有效控制分析,微信系統應用就無法在情緒約束條件下實現復雜服務的有效推廣.
2.1情緒指標設計
關于用戶情緒特征的測量指標,可先推薦一組主題傾向特征,并對每一主題傾向特征定義強度指標,使得每個情緒主題指標都相當于一種情緒空間的分量.把情緒描述預定為三類問題:
1) 主被動分類,即區分出情緒內容是主動性刺激還是被動性情緒對抗;
2) 維度分類(又稱為主題傾向性分類),即判別信息內容的情緒方向,例如:快樂、悲傷和猶豫等;
3) 強度分類,即判定情緒的強弱程度,如無、微、中、強、極強等級別.
采集用戶數據集,通過隨機訓練,根據評價結果估計主被動參數,再改變情緒特征的時序,重新估計主被動參數,如此循環直到獲得適用的情緒期望指標及主被動參數.情緒指標及各種參數越是接近用戶的期望特征,則用戶的滿足度越高.
2.2最大情緒熵計算
本文利用信息熵方法來直觀地度量情緒,反映了用戶興趣演變過程.假設情緒空間(π)有多個情緒狀態,并且某一時刻處于第t個時序狀態,那么,情緒空間的演變概率就構成了一個情緒狀態的動態隨機過程.考慮到情緒的連續性,情緒恢復到平靜的過程不是一個大的階越過程,而應該是一個緩慢發展的過程[13].
采用最大信息熵來描述這一演變過程:假設某用戶有m種情緒(維度分類),并且每種情緒強度劃分為n個級別,那么就具有nm個情緒狀態.將此情緒空間(π)中的某個情緒狀態分布定義為Pij,即第i種情緒維度下第j種強度的狀態分布,則情緒熵表示為

(1)
式中,C為與對數單位有關的調節常數.如果情緒空間中,每一個情緒狀態的分布函數均出現相同的概率,則最大情緒熵值[15]為
H(P)max=-mClogPij=mClogn
(2)
H(P)max代表了情緒空間內情緒復雜程度的最大值,即H(P)max是情緒熵上界,越接近此數值,就越具有情緒平穩的特征.實際中,分布平均出現是不可能的,所以情緒熵上界是不能達到的.當復合情緒與各基本情緒概率相近時,則認為心情為平靜狀態.在情緒熵達到較大值時,即認為情緒處在較大穩定狀態,但并不意味著Pij分布能達到均值.
2.3情緒波動方程
借鑒艾賓浩斯遺忘曲線,一個用戶的興趣如果沒有持續的激勵,興趣強度的波動必然隨著時間的延續不斷地衰減.假定在大多數時間內,微信息用戶處于平靜心態,當看到一個微文消息時,便產生了情緒波動.隨著微信息人機交互的不斷持續進行,用戶的情緒一直處于變化狀態中,依照情緒反應規律,情緒將逐漸積累和疊加.用戶情緒狀態的概率分布隨著時間發生連續變化,表示為P(t).外界刺激對P(t)直接發生作用,用A表示刺激力參數,相應情緒強度的變化量為AP(t),即A與興趣強度變化率有一定的正比例關系;用B表示惰性的內驅力參數,表現出用戶本能的情緒對抗力,由于情緒強度隨時間的延續,最終會趨于極低的強度水平(平靜狀態),借鑒遺忘曲線原理設計對抗項為BP2(t).綜合以上分析得到情緒波動方程為

(3)
當B≥0,A≥0,且有初值條件P0限制時,該方程解為

(4)
當t→∞時,P(t)→A/B,情緒最終將衰落,趨于穩定.B值越大,則A/B的值越小,則可認定情緒惰性大,不易情緒激動;反之,B值很小時,A/B值就大,可認定為情緒易激動,容易發生激烈活動.假定有m種基本主題類型,則至少可確定m個情緒波動方程(k=1,2,…,m),即

(5)
2.4刺激力參數
通常可以設計8種刺激,且每種刺激有5種情緒強度.由此設計評價規則,評價的指標集可劃分如下:
1) 8種刺激主題:{快樂、崇拜、好奇、嫉妒、厭惡、懼怕、悲傷、憤怒};
2) 5種情緒強度等級:{無、微、中、強、極強},對應數值:{1,2,3,4,5}.
選定一種交互型微信息系統,并隨機抽取一批交互數據,按照上述8種刺激和5種情緒強度進行歸類訓練.例如:對于“快樂”這一情緒指標,10%的微文樣本等級是“無”,40%的微文樣本是“微”,20%的微文樣本是“中”,20%的微文樣本是“強”,10%的微文樣本是“極強”,于是確定A1(快樂)的值為
E(A1)=0.1×1+0.4×2+0.2×3+
0.2×4+0.1×5=2.8
(6)
按照同樣的方法可得獲得其他基因維度的期望值E(A2),E(A3),…,E(Am).
2.5內驅力參數
內驅力參數B本質上是用來表征人的情緒惰性,也是一個多維的向量調控因素,與當事群體連續遭受的刺激力有關.內驅力參數的取定需要通過大量有外界刺激的數據集訓練來估定.一般情況下,外界刺激A在哪一個分量上數值大,內驅力B在該分量上的值也會相應要大一些,B表現出慣性衰落的特征.A與B的對應分量不是正比的關系,B分量夾雜著自然性衰落的惰性對抗性.
內驅力參數B的隸屬函數可根據多種形態曲線來確定,本文采用情緒衰落函數來得到內驅力參數B的適用值.以特征曲線標記各個情緒刺激信號,反復訓練情緒數據集便可得到與衰落性近似吻合度更好的衰落函數.
2.6情緒演化模型
情緒推介服務要求能自動推斷和捕獲用戶的情緒需求變化,推薦出一個滿足當前需求的情緒特征項,并參與到用戶交互活動中去.掌握用戶偏好,分類進行情緒激勵是在線互動和個性推薦系統中的一種重要目標.在社會網絡的信息傳播過程中,通過對用戶微信短信和行為日志的分析,可以預測用戶偏好對不同主題的情緒強度和變化率,這對自媒體網絡輿情傳播的控制管理有重要的導引作用.
假設:借鑒生物體細胞核中染色體的組成原理,將情緒演變結構表示為基因序列,即一個長度為L的染色體:π={ξ1,ξ2,…,ξL},第i個基因(ξi)上存在一系列等位強度基因,表示為ξi={ai1,ai2,…,aiki},那么所有情緒狀態(等位強度基因)的組合就構成了情緒空間的整體結構,即

(7)
對于現實存在的任意情緒(染色體)實例S必然為π的一個真子集,即S∈π,當S演變到t階段時,標識為S(t).關于情緒實例S(t)對環境F(t)的適應性描述,采用正實數序列來表示,假設刺激力參數A和內驅力參數B相等,設t時段環境F(t)所提供的信息為I(t),那么在適當調節因子τt的作用下,S(t)演化成新的情緒實例S(t+1)描述為
F(t)∶S(t)I(t)→S(t+1)
(8)
情緒演化過程中,不可能隔斷歷史性的慣性衰落作用.F(t)與其歷史過程有著直接的遺傳關系,所以在新的情緒實例S(t+1)生成時,不僅要考慮即時發生的環境信息I(t),還必須考慮到環境的歷史慣性MF(t).歷史環境提供的動態信息列表為MF(t)={I(1),I(2),…,I(t)},可以看作是在環境F(t)下,情緒實例S(t)發生情緒變化時必須遭受的慣性衰落性內驅阻力.
綜合考慮環境F(t)、情緒實例S(t)、動態信息I(t)、歷史信息列表MF(t)和智能調整適應性激勵參數A等因素,流程可以看作是情緒實例S(t)在現實環境F(t)下的理性選擇或推介過程,反映了t階段情緒變量的可調控性能.隨著情緒實例S(t)的情緒結構和環境F(t)的演化,情緒狀態分布μt的內容隨著t進行適應性調整,所以情緒激勵的邏輯τt描述為
τt∶μt-1[S(t-1)I(t)]→μt
(9)
式中,μt、μt-1為情緒整體空間π中的一個情緒基因的分布狀態(μt、μt-1都為正數).將μt對應于情緒概率分布P(t),可形成式(3)波動方程.
在整個情緒適應過程中,情緒波動過程與歷史慣性序列MF(t)緊密相關.在候選情緒調節指令集中挑選優良方案,投入到微信息圈,增加刺激力,那么整個情緒過程的適應性可以表示為

(10)
考慮到情緒適應隨機的性質,t時刻波動過程的情緒適應度表示為

(11)
環境變化歷程表示為
J(S)=Max(H(μt))≥mClogn-ε
(12)
式中,ε為閾值.
將上述描述加以匯總,可以得到情緒演化過程的數學模型為
(13)
上述情緒演化模型中,對環境刺激力與歷史慣性(內驅力)發生作用進行了規范描述.在缺乏假設問題先驗信息的情況下,系統在不同階段所處的環境F(t)只是一種理論性的假設,其與情緒實例S(t)和適應計劃τt相關.
情緒推薦方案不僅與問題的即時動態情緒信息有關,也和整體環境的歷史慣性有關,環境刺激力與慣性內驅力的設計與選擇策略是實施該情緒波動與演化激勵模型的關鍵.
2.7情緒調整過程
計算過程中,首先通過先驗文本訓練確定用戶特征值(測算時段次數、刺激力參數、內驅力參數和閾值等),然后設計情緒調整的對話策略.情緒參數的訓練算法如下:
1) 確定微信息圈及若干用戶對象,并定義情緒主題和情緒強度等級,將其情緒文字詞歸類采集,形成訓練數據集X0.
2) 變量初始化.根據第t0時段的數據集確定適應性參數值,包括刺激力參數、內驅力參數和閾值等.
3) 時段循環測試.將新發生的動態信息I(t)以主題傾向(同類歸并)的形式加入到訓練數據集Xt;基于當前用戶的信息變動,調整情緒刺激力參數;基于用戶的歷史信息列表,調整閾值和內驅力;由情緒熵極值條件獲取可行參數,如果達到最后時段則結束循環.
4) 遍歷各個時段,挑選具有最大熵的時段ti,對應的輿情數據集為Xi.
5) 從Xi數據集中挑選活躍情緒元素,然后按照輿情正能量調節需要組成情緒調整候選指令項.
6) 計算Γ(t)和J(X),若情緒調整計劃參數未達到預定的期望值,轉步驟3);否則轉步驟7).
7) 總結該用戶情緒特征,生成最優情趣推薦列表,并翻轉為對應的情緒文字,虛擬執行相關微信息行為.
本實例根據用戶興趣樣本,篩選和過濾相關信息項,把相同或相近興趣特征用戶所瀏覽的感興趣信息進行同類歸并,然后合成進化推薦數據列表,引導用戶活動.用戶瀏覽活動的不確定性被降低,正能量導引目的性被加強.總結用戶情緒推介序列的關鍵環節如下:
1) 收集用戶己瀏覽的信息,根據其情緒偏好類型生成用戶習慣情緒特征;
2) 核對同類微信息數據集;
3) 找出具有關聯關系的情緒調節候選項,構造當前的情緒推薦列表;
4) 捕獲當前用戶的習慣性情緒特征,修正情緒適應度.
針對最流行的幾種微信息交互服務系統,在用戶情緒許可采集的條件下,將用戶訪問過的情趣主題、關注行為、訪問次數和情緒詞類等動作捕捉,對應到預定的用戶興趣指標,并直接換算為情緒強度,合成用戶興趣趨向概率分布.鎖定一組經常上網的用戶進行情緒樣本采集,采集到12 300多條情緒微文本,去除情緒信息無效的部分,有效微文本數據9 803條,情緒特征分布結果如表1所示.經過波動方程迭代計算,與該類用戶最合拍的情緒推薦特征是:(快樂、崇拜、驚奇、懼怕、悲傷、厭惡、興趣、憤怒)=(0.21,0.22,0.45,0.20,0.35,0.23,0.23,0.13).

表1 情緒特征分布Tab.1 Distribution of emotional characteristics
在實驗中,將情緒候選子集的規模從10逐步調整到60.情緒推介活動顯示:客戶情緒熵與種類子集規模的關系密切,如圖1所示.可觀察到通過250次時段的情緒演變,隨著子集規模的增加,情緒推介活動使得情緒熵先是逐漸增加,然后又逐漸衰落.騰訊微信用戶的熵值最低,微博用戶的熵值居中,百度貼吧的熵值較高,顯然,微信系統在網絡上的情緒波動性最強列,同時情緒調整子集數要達到20~25個才能完成情緒推介的需要.

圖1 情緒熵與子集規模的關系Fig.1 Relationship between emotional entropy and subset size
將情緒候選子集個數定位在22個,情緒信息I(t)不斷疊加,時段序列t由1時段逐步演變到500時段,采集實驗數據結果如圖2所示.由圖2同樣可以看出,微信在網絡上的情緒波動性最大.
根據用戶情緒波動特點,對預測微信息用戶的情緒喜好進行定性輔導,將有助于微信息網絡的深層次應用,對輿論導控具有較大的潛在價值.

圖2 情緒熵與情緒調整序列關系Fig.2 Relationship between emotional entropy and emotional adjustment sequence
情緒波動方程下的微信息推介演變模型能面對微信息交互系統,獲得用戶交互情緒特征,保持信息圈興趣的適應度,可提高面向客戶的主動性,用戶不再僵化于被動性瀏覽.情緒識別與及時推介是一個復雜的信息波動檢測過程,通過信息熵及適應度最優的迭代挑選進程能夠獲得一個真實的、合適的情緒文字態度,以更好的角色融入到目標信息圈中,能亦步亦趨地傳遞正能量情緒信息,可使信息管理者越來越接近客戶情緒需求,最終自動進行適用的情緒微信息推介工作.
[1]張劍峰,夏云慶,姚建民.微博文本處理研究綜述 [J].中文信息學報,2012,26(4):21-27.
(ZHANG Jian-feng,XIA Yun-qing,YAO Jian-min.A review towards microtext processing [J].Journal of Chinese Information Processing,2012,26(4):21-27.)
[2]索勃,李戰懷,陳群,等.基于信息流動分析的動態社區發現方法 [J].軟件學報,2014,25(3):547-559.
(SUO Bo,LI Zhan-huai,CHEN Qun,et al.Dynamic community detection based on information flow analysis [J].Journal of Software,2014,25(3):547-559.)
[3]張輝,劉奕群,馬少平.文本情緒分類中生成式情緒模型的發展 [J].計算機應用研究,2014,31(12):3521-3526.
(ZHANG Hui,LIU Yi-qun,MA Shao-ping.Development of generative model in text sentiment classification [J].Application Research of Computers,2014,31(12):3521-3526.)
[4]蔣逸,張偉,趙海燕.互聯網環境中基于環境激發效應的協同式概念建模 [J].計算機科學,2015,42(11):228-233.
(JIANG Yi,ZHANG Wei,ZHAO Hai-yan.Stigmergy-based collaborative conceptual modeling in web environment [J].Computer Science,2015,42(11):228-233.)
[5]王東.大數據技術在精準化營銷中的應用 [J].中國流通經濟,2014(7):90-93.
(WANG Dong.The application of big data technology to precision marketing [J].China Business and Market,2014(7):90-93.)
[6]吳純青,任沛閣,王小峰.基于語義的網絡大數據組織與搜索 [J].計算機學報,2015,38(1):1-17.
(WU Chun-qing,REN Pei-ge,WANG Xiao-feng.Survey on semantic-based organization and search technologies for network bid data [J].Chinese Journal of Computers,2015,38(1):1-17.)
[7]張玉亮.突發事件網絡輿情信息流風險模糊綜合評價研究 [J].情報科學,2015,33(11):100-106.
(ZHANG Yu-liang.Research on fuzzy comprehensive evaluation model construction of information flow on network public opinion of sudden events [J].Information Science,2015,33(11):100-106.)
[8]張宏毅,王立威,陳瑜希.概率圖模型研究進展綜述 [J].軟件學報,2013,24(11):2476-2497.
(ZHANG Hong-yi,WANG Li-wei,CHEN Yu-xi.Research progress of probabilistic graphical models [J].Journal of Software,2013,24(11):2476-2497.)
[9]劉德喜,萬常選.社會化短文本自動摘要研究綜述 [J].小型微型計算機系統,2013,34(12):2764-2771.
(LIU De-xi,WAN Chang-xuan.Survey on automatic summarization of socialized short text [J].Journal of Chinese Computer Systems,2013,34(12):2764-2771.)
[10]蘇雪陽,左萬利,王俊華.基于本體與模式的網絡用戶興趣挖掘 [J].電子學報,2014,42(8):1556-1563.
(SU Xue-yang,ZUO Wan-li,WANG Jun-hua.Web user interest mining based on ontology and patterns [J].Acta Electronica Sinica,2014,42(8):1556-1563.)
[11]徐恪,張賽,陳昊,等.在線社會網絡的測量與分析 [J].計算機學報,2014,37(1):165-183.
(XU Ke,ZHANG Sai,CHEN Hao,et al.Measurement and analysis of online social networks [J].Chinese Journal of Computers,2014,37(1):165-183.)
[12]李小林,張力娜.基于直覺模糊理論的混合多屬性Web服務選擇 [J].沈陽工業大學學報,2014,36(6):676-680.
(LI Xiao-lin,ZHANG Li-na.Hybrid multi-attribute Web service selection based on intuitionistic fuzzy theo-ry [J].Journal of Shenyang University of Technology,2014,36(6):676-680.)
[13]徐軍,鐘元生,鄭也夫.一種多維集成直覺模糊信息的信任評價方法 [J].計算機工程與科學,2015,37(9):1768-1775.
(XU Jun,ZHONG Yuan-sheng,ZHENG Ye-fu.A trust evaluation approach of multi-dimensional integrated intuitionistic fuzzy information [J].Computer Engineering & Science,2015,37(9):1768-1775.)
[14]張福勇,趙鐵柱.采用路徑IRP的Windows惡意進程檢測方法 [J].沈陽工業大學學報,2015,37(4):434-439.
(ZHANG Fu-yong,ZHAO Tie-zhu.Windows malicious process detection method with path IRP [J].Journal of Shenyang University of Technology,2015,37(4):434-439.)
[15]陳小輝,張功萱.基于信息熵的符號屬性精確賦權聚類方法 [J].重慶郵電大學學報(自然科學版),2014,26(6):850-855.
(CHEN Xiao-hui,ZHANG Gong-xuan.Symbol pro-perty accurate weight clustering method based on information entropy [J].Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition),2014,26(6):850-855.)
(責任編輯:景勇英文審校:尹淑英)
Model for promotion and evolution of micro-message based on emotional fluctuation equation
WANG Dong1, 2, SUN Bin1
(1. College of Computer Science and Engineering, Xinjiang University of Finance and Economics, Urumchi 830012, China; 2. Computer Vocational Education Branch, Xinjiang Education Institute, Urumchi 830033, China)
In order to effectively capture the emotion of micro-message user and accurately grasp the interest tendency of user, the emotional fluctuation equation was established with the maximum information entropy estimation method, and the parameter scheme for both stimulation and internal forces was determined. Under the premise of measuring the emotional states of micro-message, the emotional evolution system of micro-message user was described, the emotional guidance model for timely incentive recommendation type was established, and both emotional prediction and accurate emotional information recommendation were achieved. The results show that the information entropy estimation can get involved in the accurate emotional symbols, and the applicability of micro-message guidance strategy can be improved. Therefore, the efficiencies in stabilizing the user emotion and guiding the network positive energy can be achieved. The information entropy estimation can play a positive role in establishing the popular credibility and stabilizing the clique emotion.
information entropy; emotion recognition; recommendation; guidance model; incentive method; monitoring; micro-message; positive energy
2015-12-25.
國家自然科學基金資助項目(61562080; 61363082); 教育部人文社會科學研究規劃基金項目(14YJA860017).
王東(1966-),男,新疆烏魯木齊人,副教授,主要從事計算機信息安全等方面的研究.
10.7688/j.issn.1000-1646.2016.04.13
TP 292.1
A
1000-1646(2016)04-0434-06
*本文已于2016-05-12 13∶56在中國知網優先數字出版. 網絡出版地址: http:∥www.cnki.net/kcms/detail/21.1189.T.20160512.1356.004.html