999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的網絡心理咨詢問題智能多分類模型

2018-11-07 09:18:14程會林曾偉楊琳琳岑蕭萍蔣琳琳
卷宗 2018年27期

程會林 曾偉 楊琳琳 岑蕭萍 蔣琳琳

摘 要:為了簡化網絡心理咨詢分診流程和降低咨詢助理的勞動強度,提出一種基于深度學習的網絡心理咨詢問題智能多分類模型。采用Word2vec對來訪者的自述情況進行文本特征提取,設計卷積神經網絡的深度學習分類器,實現對來訪者咨詢問題的智能分類。與傳統機器學習分類方法相比,所提方法的準確率提升約20%。本研究為網絡心理咨詢問題的智能分診提供了一種新方法。

關鍵詞:網絡心理咨詢;自述分類,Word2vec;卷積神經網絡

1 引言

隨著互聯網技術的不斷發展,網絡心理咨詢逐漸發展起來,僅“525心理網”便已解決近857萬個心理問題。心理咨詢網站一般配備有一名咨詢助理,根據來訪者的自述情況進行分類,匹配到合適的心理咨詢師。然而,這種分診的準確性與效率依賴于咨詢助理的經驗知識。為減輕咨詢助理的負擔,本文提出一種對咨詢問題進行智能分診的方法。傳統的分類方法需要進行復雜的處理來進行特征提取,再根據提取的特征來訓練分類器。卷積神經網絡通過結構重組和減少權值將特征提取和分類功能進行融合,這種結構比以往多種算法性能更為高效[7]。因此,本文擬利用文本挖掘技術,設計卷積神經網絡多分類模型,對來訪者的自述情況進行智能分類,簡化分診流程。

2 實驗步驟與分析

2.1 流程圖

2.2 數據預處理

為獲得數據,訓練分類模型以供使用,本文利用八爪魚采集器從“咨詢中國網”中爬取“公益心理問答模塊”數據,共得到6個類別,分別為“婚戀情感”“親子關系”“人際關系”“認識自我”“壓力疏導”及“子女成長”。但每一類數據的數量不同,為使訓練時類別均衡,本文將“親子關系”“人際關系”及“子女成長”合并為“關系成長”類。最終共有4個類別,其中婚戀情感自述情況條數310條,關系成長自述情況條數284條,認識自我自述情況條數310條,壓力疏導自述情況條數310條。

利用結巴分詞(jieba)將爬取的數據分詞,因文本并不長,所以未加載停用詞,例如“我覺得我活得很累”被分為了“我覺得我活得很累”。

將分詞后結果轉為txt文本,代入Word2vec模型[1],得到256維的詞向量,即一個中文詞(t)由256個數字表示,表示為R(t)。為訓練出更好的詞匯模型,本文使用約43萬條,涉及影視、小說、心理、司法內容的文本進行訓練,得到新的Word2vec結果。

R(t)=Word2vec(t)

接著利用訓練得到的Word2vec模型,計算每條自述情況的向量R(dj),即句子dj中n個詞匯的Word2vec向量的均值,表示為:

2.3 模型構建

以256維的文本向量作為特征,分類標簽作為label,分別使用決策樹[2]、隨機森林[3]、SVM[4]及卷積神經網絡[5]進行建模。

將一條文本所得的256維向量看作16×16的二維矩陣。將32個5×5的小型矩陣,作為第一層的卷積核,對于大矩陣中的每個值,計算其周圍的值與卷積核對應位置的乘積,將結果相加最終得到的終值則為新矩陣該位置的值。

一層卷積的操作可概括為:

(1)文本向量通過多個不同的卷積核的濾波,并加偏置,提取出局部特征,每一個卷積核映射出一個新的2D文本。

(2)將前面卷積核的濾波輸出結果,進行非線性的激活函數ReLU處理。

(3)對激活函數的結果進行最大池化,保留最顯著的特征,實現數據壓縮,并提升模型的畸變容忍能力。

在第一層卷積層中,共有32個5×5的卷積核,第二層為64個5×5的卷積核,利用relu作為激活函數,全連接得到自述情況的分類。并利用AdamOptimizer不斷優化得到結果,經過20000次迭代后,得到準確率最高的的模型。

2.4 實驗結果

從實驗結果可以看出,相較于傳統分類方法,卷積神經網絡在短文本的分類中更具優勢。準確率得到大大提升。卷積神經網絡通過卷積核的權值共享,減少了參數個數,亦提取了顯要特征,通過梯度下降算法的參數更迭,使得模型的準確率得以大大提升。

2.5 實驗進階

在得到關于自述情況的分類后,可得知其咨詢的問題所屬大類為何,即可推薦擅長此大類的心理咨詢師。而實際情況中,推薦時若能夠更加細致,則心理咨詢師的推薦將能夠更加個性化。根據自述情況中來訪者的期望,自動篩選出重要信息,例如希望心理咨詢師性別為男,年齡為30歲以上等等。

本文簡單化處理,對于心理咨詢師的要求,統一在文本的最后,表述為:“心理咨詢師要……”,便可使用正則表達式,獲取其對咨詢師的要求,接著由“性別……”“……歲”等模式的正則,繼續細化出要求得到的結果,由機器直接獲取信息,按照心理咨詢師的標簽,進行推薦。

3 結語

與傳統方法對比,卷積神經網絡在短文本分類上訓練效果更好,但準確率仍有提升的空間。若能考慮到關鍵詞在分類過程中的顯著作用,相信能夠得到更好的結果。例如通過“老公”,“男朋友”兩詞,即可判定此文本屬于婚戀情感類。但可以肯定的是,卷積神經網絡在心理咨詢自述情況上的分類是有應用價值的。當配合以正則表達式,便可更個性化推薦心理咨詢師。

參考文獻

[1]王奕森,夏樹濤.集成學習之隨機森林算法綜述[J].信息通信技術,2018,12(01):49-55.

[2]郭東亮,劉小明,鄭秋生.基于卷積神經網絡的互聯網短文本分類方法[J].計算機與現代化,2017(04):78-81.

[3]唐明,朱磊,鄒顯春.基于Word2Vec的一種文檔向量表示[J].計算機科學,2016,43(06):214-217+269.

[4]張棪,曹健.面向大數據分析的決策樹算法[J].計算機科學,2016,43(S1):374-379+383.

[5]崔建明,劉建明,廖周宇.基于SVM算法的文本分類技術研究[J].計算機仿真,2013,30(02):299-302+368.

[6]許闖.網絡心理咨詢五步法[J].政工導刊,2017(07):40-41.

[7]夏從零,錢濤,姬東鴻.基于事件卷積特征的新聞文本分類[J].計算機應用研究,2017,34(04):991-994.

主站蜘蛛池模板: 精品国产网| 国产裸舞福利在线视频合集| 亚洲中文字幕久久无码精品A| 最新无码专区超级碰碰碰| 91久久青青草原精品国产| 91丝袜乱伦| 亚洲第一中文字幕| 亚洲av无码专区久久蜜芽| 日韩一区精品视频一区二区| 国产一级妓女av网站| 大学生久久香蕉国产线观看| av一区二区无码在线| 久久久久国产精品免费免费不卡| 毛片久久久| 国产尤物jk自慰制服喷水| 国产AV无码专区亚洲精品网站| 中文无码精品a∨在线观看| 亚洲区一区| 午夜丁香婷婷| 日本在线免费网站| 欧美 国产 人人视频| 女同国产精品一区二区| 色视频久久| 免费精品一区二区h| 国产精品亚欧美一区二区| 亚洲天堂成人| 91探花在线观看国产最新| 久久不卡精品| 国产成人高清精品免费| 国产亚洲欧美日韩在线观看一区二区| 亚洲三级视频在线观看| 久久精品人人做人人爽电影蜜月| 又黄又爽视频好爽视频| 成人在线不卡| 国产欧美自拍视频| 亚洲成A人V欧美综合| 制服丝袜在线视频香蕉| 欧美福利在线观看| 国产凹凸视频在线观看| 久久网欧美| 国产成人亚洲欧美激情| 婷婷开心中文字幕| 欧美福利在线| 国产毛片不卡| 欧美一级黄色影院| 午夜毛片免费看| 亚洲AV无码久久天堂| www成人国产在线观看网站| 亚洲综合色在线| 手机成人午夜在线视频| a欧美在线| 欧美日韩高清| 久久情精品国产品免费| 亚洲成人精品在线| 国产人成在线观看| 久无码久无码av无码| 亚洲伊人久久精品影院| 欧美成人二区| 一区二区自拍| 国产在线98福利播放视频免费| 国产凹凸一区在线观看视频| 激情五月婷婷综合网| 男女男精品视频| 国产激情无码一区二区三区免费| 丝袜久久剧情精品国产| 中国国产A一级毛片| 亚洲 欧美 日韩综合一区| 伊人久久福利中文字幕| 日本一区二区不卡视频| 精品国产香蕉伊思人在线| 久久免费观看视频| 国产欧美中文字幕| 国产成人高清精品免费软件| 台湾AV国片精品女同性| 5388国产亚洲欧美在线观看| 幺女国产一级毛片| 福利在线不卡| 亚洲一区二区成人| 欧美一道本| 黄色网在线免费观看| 国语少妇高潮| 国产手机在线ΑⅤ片无码观看|