楊利 丁嬌 胡天寒 劉影 王婷婷


摘要:人工智能技術被廣泛應用于心理學的各個領域,研究方法和工具能夠促進心理學的發展,對于心理學而言具有重要意義。文章梳理社交網絡、語音、面部表情、其他心理數據及多元心理數據融合的應用現狀,比較分析決策樹、人工神經網絡、支持向量機和深度學習等心理數據分析算法,深度學習能抽取更高級別的特征數據,更具優勢。對人工智能應用于心理學領域的研究進行了總結和展望。
關鍵詞:人工智能;心理學;深度學習
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)11-0001-03
心理學主要研究人的心理、精神和行為及其之間的相互關系,研究對象為個體或群體的情緒、認知、思維、人格、人際關系、行為等,常見的研究方法有:實驗法、訪談法、調查法、比較法等[1-2]。心理學的研究方法和工具對心理學的研究具有重要意義,例如,1879年馮特首創了心理研究實驗室,將特定的心理現象置于某種受控條件下進行研究,直接促使了心理學從哲學的分離,成為一門獨立的科學[1]。近年來,統計學中的t檢驗、方差分析、回歸分析等工具廣泛應用于心理學的研究,并取得了一定的成果[3]。但這些傳統的統計學方法存在兩個方面的問題:一是傳統的統計學方法需設置前提條件才能對數據進行分析;二是影響人類心理現象的因素眾多,且這些因素之間存在錯綜復雜的關系,數據量巨大,傳統的統計學方法難以進行分析。
人工智能是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學[4]。人工智能的工作原理是使用機器學習算法對大量數據進行訓練學習,從而構造模式識別模型,并使用該模型對未知數據做出類似于人的決策。人工智能技術相對于傳統的統計學方法在大數據處理和數據分析方面有著顯著的優勢。
1 人工智能在心理測量領域的應用
目前,使用各種心理測量量表獲取人們的心理特征是心理學測量領域的普遍方法,這種方法可以快速獲得受試者不同視角下的心理特征,但是受試者在評測過程中,存在記憶偏差、主觀隨意性強、審答題不仔細等因素,造成所獲取的心理特征數據不能客觀地反映受試者的心理狀態。
人工智能在獲取數據方面有著天然優勢,除使用心理量表采集數據外,還可從受試對象的社交網絡、語音、面部表情、生理信號等方面獲取相關數據,社交網絡內容往往是內心情感的真實寫照,語音和面部表情也是傳達情感狀態的自然、普遍方式,相對于從心理量表所得數據而言更具客觀性,各種生理指標數據也被應用于心理分析。心理數據應用的一般過程為:采集某種或幾種心理數據,生成有結構的心理特征數據,使用機器學習算法提取出重要特征,再使用分類算法進行分類或預測,如圖1所示。
1.1 社交網絡心理數據
隨著社交網絡的興起,人們將部分社會行為轉移至網絡上,常見的表現形式有:撰寫博文、發表評論、互動留言、關注他人社交網絡主頁、閱讀博文等,這些網絡行為可以是匿名的,因此往往是人們真實心理活動的對照,具有較強的自發性和真實性,同時這些行為數據可被記錄下來,將其有效地組織起來可構成不同情境下的用戶行為數據。
社交網絡心理數據應用于心理領域的任務十分廣泛,如抑郁、自殺傾向、壓力、輿情等。Nadeem M構建了250萬條的語料庫,每條語料庫對應一篇Twitter博文,然后用幾個統計分類器估計抑郁癥的風險,其準確率達到86%[5]。Yates A等人提出了一個識別社區用戶抑郁的神經框架,從Twitter和Facebook上獲取社區用戶發帖,使用框架分析處理后能有效識別用戶的抑郁程度,結果與自我報告的抑郁癥診斷結果基本相符[6]。朱廷劭等人提出一種基于網絡行為時頻的抑郁檢測方法,通過抑郁自評量表和網絡行為采集獲取了728名受試者心理特征數據,使用時頻分析構建了時頻特征,該方法能有效地捕捉抑郁狀況變化[7]。劉德喜等人對QQ空間、微信朋友圈等準私密社交網絡上的數據進行采集和分析,論證了基于準私密社交網絡檢測用戶抑郁的可行性[8]。林靖怡等利用網絡爬蟲技術獲取微博內容,并從中提取心理健康數據,構建基于社交網絡數據挖掘的心理健康預警模型,分類準確率高到91%[9]。王海起等也從社交網絡中爬取情感信息,并以此分析地理情感特征[10]。
1.2 語音心理數據
語言是人們之間最普遍的交流方式,語音則是語言表達的重要形式,富含表達者豐富的情感、態度等心理特征。近年來,研究者主要聚焦于語音的情感識別的研究,研究重點為語音特征和語音數據庫的構建。在語音特征方面,李田港等設計了一種基于集成學習的語音情感算法,在生氣、悲傷、高興、驚慌及中性情感上都有著較好的識別效果[11];IBM (International Business Machines Corporation,國際商業機器公司)研發了一種臨床高危人群精神障礙發作預測系統,該系統能自動采集患者的說話聲音并進行分析處理,預測準確率達到了79%[12]。Ben Alex S等提出一種基于深度學習的語的Emo-DB情感識別系統,對語音中的韻律特征進行提取和分割,具有較好的情感識別效果[13]。陳穎等構建一個包含7種情感共計5376條語音樣本的漢語情感語音數據庫,分別并從差異性、一致性、集中性和及情感識別率分析樣本數據庫的質量,結果表明樣本數據庫的情感一致性較高且具有明顯的可區分性[14]。
1.3 面部表情心理數據
面部表情是人們內心活動的真實寫照,面部表情同語音相同,也蘊含著大量的心理特征信息。目前,基于面部表情的情感識別主要分為兩大類:靜態圖像和視頻圖像。在靜態圖像方面:楊金朋等對在線學習平臺學習者的人臉表情進行采集和分析,計算其情感值,為個性化學習方式提供支持[15];張海峰針對人臉識別的身份認證、特征提取和特征提取方式等應用場景分別設計了相應算法,對人臉識別的全過程進行了優化,提高了識別精度[16]。在視頻圖像方面,LI Q等在提取面部表情的基礎上,提取了微表情的光流特征,再對這些光流特征進行細化,最后利用SVM(Support Vector Machine,支持向量機) 進行了分類[17]。
1.4 其他心理數據
生理信號、醫學影像圖片等也包含著許多心理特征數據。Kim等開發了一種基于生理信號數據的短期情緒監控系統,識別準確率為75%[18];Sarraf S等使用機器學習算法分析MRI(Magnetic Resonance Imaging,磁共振成像) 結構成像數據,對阿爾茨海默病患者和健康老年人進行分類,分類準確度高達95%左右[19]。Bahado-Singh RO等提出了一種基于外周血表觀遺傳基因的識別系統,該系統能有效預測新生兒時期的孤獨癥譜系障礙(Autism Spectrum Disorders,ASD) [20]。
1.5 多元心理數據融合
單一心理數據來源不夠全面,將語音、面部表情、生理信息等特征融合起來進行分析已成為行業共識。具體實現路徑有兩種,一是先提取單種心理特征數據再融合,二是先融合再進行心理特征數據提取。范習健等利用多種機器學習模型對語音和面部表情兩種特征數據進行融合分析,對比實驗表明,融合后的數據模型識別效果優于單一數據模型[21]。陳敏提出了一種融合文本和短視頻的情感分析方法,在中性、積極和消極三種情感類別識別上表現較好[22]。袁鵬提出了基于注意力機制Dempster-Shafer(D-S) 證據理論的融合策略,先通過深度學習算法直接提取心理特征數據,再用融合策略進行特征篩選,其有效識別率達到了85.73%[23]。
2 人工智能應用于心理分析的常見算法
人工智能的核心技術是通過構建機器學習算法模型對數據進行分析。機器學習是研究計算機模擬或實現人類的學習行為,重組已有的知識結構并使之不斷改善[24]。余凱等將機器學習算法分為兩大類:淺層學習和深度學習。淺層學習算法如決策樹、人工神經網絡和支持向量機等,目前已廣泛應用于心理學領域,但其模型的評估效果與經驗相關,難以取得較好的評估結果。深度學習是目前性能表現最優的機器學習算法,主要包括卷積神經網絡、循環神經網絡和深度信念網絡等[25]。主要的機器學習算法的發展歷程如圖2所示。
2.1 決策樹
決策樹算法通過把數據樣本分配到某個葉子節點確定數據集中樣本所屬的分類,利用樹形模型不斷遞歸樣本空間,樹形模型由決策節點、分支和葉子節點組成[26]。樹中的每個決策節點表示一個樣本空間,每個決策節點到葉子節點的連接都是一條路徑規則,每個葉子節點代表一個判斷類別,主要用于解決分類問題。
李夢然使用決策樹模型找出影響大學生亞健康的重要因素有:學習時長、經濟困難、熬夜、身體鍛煉等,對樣本的分類準確率達到83.9%[27]。侯繼文收集了青島大學附院住院部及體檢中心的330例MCI(Mild Cognitive Impairment,輕度認知障礙) 患者數據,使用決策樹模型篩選出影響MCI指標的重要因素有教育程度、社會交往、業余愛好、高脂飲食、高脂血癥等,模型的AUC(Area Under Curve) 值達到0.81[28]。
2.2 人工神經網絡
人工神經網絡是一種模仿生物學中神經元的計算模型[29],其網絡結構由大量的類似于神經元的節點構成,每個節點都有輸入值、輸出值,輸入值進行線性組合后,再經過某種激勵函數即為輸出值,神經元節點按其功能可分為輸入層、隱藏層和輸出層。人工神經網絡不同于傳統的邏輯推理,僅通過計算輸入值的權值,便能獲得類似于人的簡單決策能力。奚曉嵐等構建了基于神經網絡的大學生心理健康評估模型,對150名大學生的SCL-90量表數據進行分析,實驗結果顯示模型的收斂性和準確性較好[30]。王麗使用優化后的神經網絡對研究生群體的SCL-90心理數據進行分析,結果顯示預測值接近實際值[31]。
2.3 支持向量機
支持向量機將樣本數據表示為空間的點,利用核函數轉換將低維樣本空間轉換為高維樣本空間,在高維空間中,取間隔空間最大的線性分類表面作為決策邊界,各類樣本點距離決策邊界越大,其分類誤差越小,主要用于解決分類問題[32]。
王琳虹等提出了一種基于粒子群與支持向量機的駕駛疲勞等級判別模型,對駕駛員的生理特征:心電RR間期標準差、腦電的α波和β波和心率均值等進行分析,其判別準確率超過85%[33]。莊媛通設計了一種基于支持向量機和隨機森林的情緒分類模型,對60名學生的情緒數據進行分析。情緒的最高識別率達到75.13%[34]。
2.4 深度學習
深度學習源自人工神經網絡,通過建立基于反向傳播的深層次神經網絡,模仿人腦的機制分析處理各類數據。以深度神經網絡為代表的深度學習包含了更多的隱含層,能夠抽取更高級別的抽象特征,是人工神經網絡的進化和提升,因此深度學習比淺層學習更具優勢[25]。Zhou J等通過構建基于深度學習模型,揭示了非編碼突變對ASD(Autism Spectrum Disorder,自閉癥譜系障礙) 的影響[35]。徐其華等提出了一種基于深度自編碼網絡和自注意力的表情識別模型,可自動提取人臉表情特征,該模型表情識別的準確率達到90%以上[36]。劉小灃分別用自適應深度度量學習和對抗訓練兩種方法解構面部表情信息,并在IJB-A/B/C系列數據集、Celebrity-1000視頻數據集上驗證了該算法的有效性[37]。
3 結束語
綜上所述,人智能技術已經成功應用于心理學諸多領域,文本、語音、面部表情等多元心理數據融合更具有全面性,深度學習算法比傳統的支向量機、決策樹等淺層學習算法具有更好的評估性能。針對不同的任務,導致各種技術的預測結果準確率相差很大,有的能達到90%,有的卻只有70%,原因在于應用場景各異,數據集大小、參數設置、標注質量都不相同。心理數據的主體為人,相較于自然科學下的數據而言,主觀性更強,因此如何構建高質量、可復用的心理數據庫是這一領域的重大挑戰。
參考文獻:
[1] 高學德.心理學研究方法的回顧和思考[J].甘肅聯合大學學報(社會科學版),2005,21(2):90-92.
[2] 李宇,王沛.心理學研究方法的前沿創新之作——評《心理學研究方法》[J].教育研究,2013,34(6):158-159.
[3] 焦璨,黃澤娟,張敏強,等.心理研究中統計方法應用的元分析——以《心理學報》《心理科學》(1998—2008)統計方法應用為例[J].心理科學,2010,33(1):48-54.
[4] 鐘義信.人工智能的突破與科學方法的創新[J].模式識別與人工智能,2012,25(3):456-461.
[5] Nadeem M.Identifying depression on twitter[J]. arXivpreprintarXiv:1607.07384,2016.
[6] Yates A,Cohan A,Goharian N.Depression and self-harm risk assessment in online forums[C]//Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing.Copenhagen,Denmark.Stroudsburg,PA,USA:Association for Computational Linguistics,2017.
[7] Zhu C Y,Li B B,Li A,et al.Predicting depression from Internet behaviors by time-frequency features[C]//2016 IEEE/WIC/ACM International Conference on Web Intelligence (WI).October 13-16,2016,Omaha,NE,USA.IEEE,2016:383-390.
[8] 劉德喜,邱家洪,萬常選,等.利用準私密社交網絡文本數據檢測抑郁用戶的可行性分析[J].中文信息學報,2018,32(9):93-102.
[9] 林靖怡,黎大坤,吳平鑫,等.基于社交數據挖掘的心理健康預警建模與分析[J].電子技術與軟件工程,2020(8):172-173.
[10] 王海起,陳冉,魏世清,等.利用中文微博數據的地理情感特征挖掘[J].武漢大學學報·信息科學版,2020,45(5):699-708.
[11] 李田港,葉碩,葉光明,等.基于集成學習的語音情感識別算法研究[J].計算機技術與發展,2020,30(6):82-86.
[12] Corcoran C M,Carrillo F,Fernández-Slezak D,et al.Prediction of psychosis across protocols and risk cohorts using automated language analysis[J].World Psychiatry,2018,17(1):67-75.
[13] Alex S B,Babu B P,Mary L.Utterance and syllable level prosodic features for automatic emotion recognition[C]//2018 IEEE Recent Advances in Intelligent Computational Systems.December 6-8,2018,Thiruvananthapuram,India.IEEE,2018:31-35.
[14] 陳穎,肖仲喆.離散標簽與維度空間結合的語音數據庫設計[J].聲學技術,2018,37(4):380-387.
[15] 楊金朋,薛耀鋒,李佳璇,等.基于人臉表情識別的在線學習情感計算研究[J].中國教育技術裝備,2017(18):35-36,43.
[16] 張海峰.基于多特征融合的人臉表情識別研究[D].合肥:中國科學技術大學,2020.
[17] Li Q Y,Zhan S,Xu L F,et al.Facial micro-expression recognition based on the fusion of deep learning and enhanced optical flow[J].Multimedia Tools and Applications,2019,78(20):29307-29322.
[18] Kim K H,Bang S W,Kim S R.Emotion recognition system using short-term monitoring of physiological signals[J].Medical and Biological Engineering and Computing,2004,42(3):419-427.
[19] Sarraf S,Tofighi G.Deep learning-based pipeline to recognize Alzheimer's disease using fMRI data[C]//2016 Future Technologies Conference (FTC).December 6-7,2016,San Francisco,CA,USA.IEEE,2016:816-820.
[20] Bahado-Singh R O,Vishweswaraiah S,Aydas B,et al.Artificial intelligence analysis of newborn leucocyte epigenomic markers for the prediction of autism[J].Brain Research,2019,1724:146457.
[21] 范習健,楊緒兵,張禮,等.一種融合視覺和聽覺信息的雙模態情感識別算法[J].南京大學學報(自然科學),2021,57(2):309-317.
[22] 陳敏.融合文本和短視頻的雙模態情感分析[D].南京:南京郵電大學,2020.
[23] 袁鵬.基于深度學習的情感識別算法研究[D].南京:東南大學,2019.
[24] 陳凱,朱鈺.機器學習及其相關算法綜述[J].統計與信息論壇,2007,22(5):105-112.
[25] 余凱,賈磊,陳雨強,等.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,50(9):1799-1804.
[26] 楊靜,張楠男,李建,等.決策樹算法的研究與應用[J].計算機技術與發展,2010,20(2):114-116,120.
[27] 李夢然.基于Logistic和決策樹模型的大學生亞健康狀況及影響因素分析[D].北京:北京交通大學,2015.
[28] 侯繼文.輕度認知障礙影響因素分析及決策樹模型研究[D].青島:青島大學,2020.
[29] 毛健,趙紅東,姚婧婧.人工神經網絡的發展及應用[J].電子設計工程,2011,19(24):62-65.
[30] 奚曉嵐,程灶火.基于神經網絡的大學生心理健康評估模型[J].中國臨床心理學雜志,2011,19(6):746-747,733.
[31] 王麗.基于神經網絡的研究生心理健康狀況預測分析[D].西安:西安科技大學,2016.
[32] 丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011,40(1):2-10.
[33] 王琳虹,李世武,高振海,等.基于粒子群優化與支持向量機的駕駛員疲勞等級判別[J].哈爾濱工業大學學報,2014,46(12):102-107.
[34] 莊媛.基于符號動力學的心率變異性情緒識別研究[D].濟南:山東大學,2019.
[35] Zhou J,Park C Y,Theesfeld C L,et al.Whole-genome deep-learning analysis identifies contribution of noncoding mutations to autism risk[J].Nature Genetics,2019,51(6):973-980.
[36] 徐其華,孫波.基于深度學習和證據理論的表情識別模型[J].計算機工程與科學,2021,43(4):704-711.
[37] 劉小灃.基于深度學習的人臉圖像識別技術的研究[D].北京:中國科學院大學(中國科學院長春光學精密機械與物理研究所),2019.
收稿日期:2021-09-01
基金項目:安徽高校人文社會科學研究重點項目(SK2020A0380,SK2021A0468,SK2021A0466);大學生心理健康教育研究中心安徽省人文社會科學重點研究基地校級課題(SJD202001);安徽高校自然科學研究重點項目(KJ2020A0822);高校優秀青年人才支持項目(gxyq2020106);皖南醫學院中青年科研基金自然科學項目(WK202115)
作者簡介:楊利(1984—),男,安徽池州人,講師,碩士,主要從事信息技術教學研究和機器學習研究。