王振乾




摘 要:IT服務臺BP神經網絡模型智能服務機器人是一種基礎的信息處理技術,可以推理帶有情感的主觀文本,同時可以分析、處理和匯總問題。近年來該技術在國內諸多領域得到應用。介紹了IT服務臺BP(Back Propagation)神經網絡模型智能服務機器人性化情感分析的基本結構與內容;分析了IT服務臺智能情感分析模型的構建方案;深入闡釋了IT服務臺BP神經網絡模型智能服務機器人個性化情感模型建立的實驗方案。
關鍵詞:BP神經網絡模型;智能客服;個性化;社交媒體;情感分析
中圖分類號:TQ430.5 文獻標識碼:A ? ? 文章編號:1001-5922(2021)12-0079-04
Research on Personalized Emotion of IT Service Desk BP Neural Network Model Intelligent Service Robot
Wang Zhenqian
(Information and Communication Branch, China Southern Power Grid Peak Frequency Modulation Power Generation Co., Ltd., Guangzhou 510000, China)
Abstract:IT service desk BP neural network model intelligent service robot is a basic information processing technology. It can deduce subjective text with emotion. At the same time, it can analyze, process and summarize problems. In recent years, this technology has been applied in many domestic fields. This paper introduces the basic structure and content of humanized emotion analysis of IT service desk BP neural network model intelligent service machine. The construction scheme of IT service desk intelligent emotion analysis model is analyzed. In addition, the experiment scheme of building personalized emotion model of IT service desk BP neural network model intelligent service robot is further explained.
Key words:BP neural network model; Intelligent customer service; Personalized; Social media; Emotion analysis
0 引言
分析、處理和推理主觀表達的過程就是情感分析。在21世紀初期情感分析開始受到關注和發展,將其與計算機的融合發展成為近年來文本信息挖掘領域的熱門研究對象。當前的人工智能情感分析已經完成了簡單指標的情感分析,情感分析在智能服務領域擁有很強的實用性和必要性的一新興課題,有必要進行進一步的研究[1]。
1 IT服務臺BP神經網絡模型智能服務機器人性
化情感分析的基本結構與內容
IT服務臺BP(Back Propagation)神經網絡模型智能服務機器人性化情感分析,首先介紹了BP神經網絡方法(由魯梅爾哈特和麥克勒蘭德首次提出的),目前已經廣泛應用到許多領域。如圖1所示BP神經網絡是一種神經網絡模型,是現在使用最為普遍的一種[2]。BP神經網絡是可以通過學習和存儲就可以分析出相應的input和output的映射關系,該模型符合預期的過程就是通過不停的誤差反向傳播來進行的(待錯誤率降低到可以接受的水平為止)。
2 IT服務臺智能情感分析模型的構建方案
2.1 基于TF-IDF模型的架構
TF-IDF(term frequency–inverse document frequency)是一種用于信息檢索與數據挖掘的常用加權技術。文本單詞級語義表示由三維向量空間表示,3個單詞屬性的權重均表示每段文字,然后在擴展到n維空間。Ti=(E1,i,E2,i,E3,i)表示文檔,如圖2所示表示TF-IDF方法計算單詞的權重:單詞的權重=TF×lg(Ndoc/IDF),式中:IDF表示詞語出現的次數;TF為輸入的頻率;Ndoc為文本集中的總數[3]。
2.2 Word vector(詞向量)模型架構與表示
獲取向量的表示形式一般為使用谷歌的開源預訓練Word2vec單詞訓練方法來實現。先在句子中選擇一個輸入單詞,將其定義為跳過窗口的參數(表示從當前輸入的單詞的左側或者右側選擇的單詞數量);還有一個參數是跳過數字,其表示輸入詞需要選擇多少個。網絡的最終輸出形式是一種概率分布(表示字典中每個單詞都是Output word的概率),如果在段落中兩個單詞非常相似,就需要通過分析兩個單詞的嵌入矢量,即Word2Vec模型訓練[4]。如圖3所示,在向量模型中基于文本的情感分類,單詞與單詞間需要建立獨立的關系,可以更好地獲得單詞級別的語義表示。
2.3 基于IT服務臺語義整合的個性化文本情感分析模型
基于IT服務臺語義整合的個性化文本情感分析模型當前還存在許多不足:用戶間的個體差異被忽略了;用戶間的個性化差異被忽略了(語言習慣、觀點偏見等);文本與用戶之間的依存關系掌握的不夠精準[5]。在以上問題的基礎上,出現了一種基于用戶情感的神經網絡模型UBPNN:
式(1)中,c表示句子b的長度;mxi表示單詞xi的單詞嵌入。將激活函數 f (.)進行非線性變換投影,如公式(2)、(3)、(4)所示:
p= f(Epb+tp)
r= f(Er p+tp)
n= softmax(En R+tn)
公式(2)、(3)、(4)中,Wp、tp、Wr、tr、Wn、tn表示可訓練參數。
p= f(Ep[b,v]+tp)
r= f(Er p+tr)
n= softmax(En [r,v]+tn)
公式(5)、(6)、(7)中,表示訓練參數的為Wp、tp、Wr、tr、Wn、tn;表示用戶嵌入的為v。如圖4所示為BP神經網絡的情感訓練模型圖。
2.4 IT服務臺智能模型訓練過程
輸入層、隱藏層、輸出層等部分(Input layer、Hidden layer、Output layer)都屬于BP神經網絡模型,其具體內容如下:
(1)Input layer:句子的語意表示用輸入句子的單詞,再將用戶根據相應的句子進行初始化,轉化為為一定維數的向量[6]。
(2)Hidden layer:表示輸入的語意,一般獲取Hidden layer的語意需要使用非線性激活函數和矩陣乘法的線性運算來獲取。
(3)Output layer:表示隱藏層的語意,獲取句子的語意表示一般使用降維操作,在分類層中輸入句子的聯合用戶,并在句子級別上合并用戶信息。
(4)Final classification:在二維情感空間中映射獲取的向量,將情感進行分類時需要運用softmax方法進行。
3 IT服務臺BP神經網絡模型智能服務機器人個性
化情感模型建立的實驗方案
3.1 數據集的選取與采集
基于IT服務臺BP神經網絡模型智能服務機器人個性化情感研究的相關數據比較缺乏,本研究選取了2個公共產品評論數據集:點評2016和點評2017。如表1所示為2016和2017的點評數據,并將他們分為Training set、verification set、test set(訓練集、驗證集、測試集)[7]。
3.2 對比模型的選取與構建
本研究的對比算法選用Decision tree、K-NN、SVM模型和Naive Bayes等。
(1)Decision tree:是代表對象屬性和對象值之間的映射,屬于一種預測模型。樹種每個葉節點對應根節點到葉節點的路徑對象,而每個節點都代表一個對象。
(2)K-NN是一種分類模型,是數據挖掘與機器學習分類中最常用的方法之一,表示集合中的每個個體都能通過其最近的K個近鄰的個體進行表示。在其認知的某個空間中,絕大多數或者某個臨近的k的鄰居個體屬于同類屬性,可根據其確定該個體所應具有的屬性及分類結果[8-10]。
(3)SVM模型:是利用相關支持的vector從訓練集中找到可以構建最佳分類超平面,其核心思想是將規模的危險原理最小化,再將其應用到屬性劃分的領域中。
(4)Naive Bayes:是著重在基于模型間屬性的獨立性,屬于一種基于Naive Bayes函數概率的分類模型。
3.3 實驗結果
通過以上實驗歸結出2016點評、2017點評數據集上的實驗結果,分別如表2和表3所示。
由表2可知,本文提出的UPBNN方法在這兩個數據集上的實驗表現優于其他的對比方法。
由表3可知,UPBNN方法在這兩個數據集上的實驗表現優于其他的對比方法。
4 結語
在IT服務臺神經網絡BPNN方法的基礎上,本研究提出了一種UBPNN的改進方法。通過實驗得出,該方法在很多方面都優于其他比較方法。在兩個公共數據集上的實驗結果表明,該方法具有一定的優勢,適合于多元分類的情況。
參考文獻
[1]吳偉國,李虹漫. PAD情感空間內人工情感建模及人機交互實驗[J]. 哈爾濱工業大學學報,2019,51(01):29-37.
[2]張素芹. 機器人BP神經網絡避障控制模型構建及仿真[J]. 西安工業大學學報,2015,35(08):678-682.
[3]張林賀.機器人寫作新樣態中記者的應對策略探析[J].新聞愛好者,2019(03):29-33.
[4]肖舒琪. 人工智能在情緒識別領域的應用研究[J]. 信息與電腦(理論版),2019(07):138-140.
[5]王 桉. 人工智能讓政務服務更有“溫度”[J]. 上海信息化,2019(06):56-58.
[6]盧 宇,陳鵬鶴. 人工智能賦能教育:教育機器人[J]. 人工智能,2019(03):103-109.
[7]朱 敏. “AI機器人新聞”觀照與采編人員的工作重塑[J]. 新媒體研究,2019,5(13):114-116.
[8]張 堯,王運武. 機器人賦能未來教育的創新與變革——國際機器人教師研究綜述[J]. 開放教育研究,2019,25(06):83-92.
[9]柳晨晨,宛 平,王佑鎂,等. 智能機器人及其教學應用:創新意蘊與現實挑戰[J]. 遠程教育雜志,2020,38(02):27-36.
[10]王 軍. 人工智能語音在親子閱讀領域的創新應用研究——以智伴教育機器人為例[J]. 出版廣角,2020,(05):74-76.