

摘要:本文通過大數據文本處理技術,采用知識圖譜技術實時監控所覆蓋學生群體網絡自媒體(如微博)等文本信息,實時形成三級危機預警報告,輔助人工評估進行危機預防及干預,并通過大數據輔助建構“實時評估—智能風控—危機干預”心理危機預警的智能服務體系,為高校心理健康工作提供智能保障。
關鍵詞:大數據;智能服務;心理危機預警;心理健康
中圖分類號:G642 ?文獻標識碼:B ?論文編號:1674-2117(2021)07-0105-04
十九大報告指出,推動互聯網、大數據、人工智能與實體經濟深度融合。[1]說明大數據時代的數據儲備、技術理念,正以前所未有的方式預測事物發展趨勢,改變大學生的知識體系、生活方式及心理健康水平。大學生作為接觸最活躍思想、最先進技術、最密集知識的排頭兵群體,其心理健康標準體系在大數據時代產生了革命性的變化,導致認知、情感與行為方式的改變,給高校危機干預提供了海量化、實時化、個性化、可量化數據資源。[2]在互聯網高速發展的今天,網絡社交媒體成為大學生傾訴想法、宣泄情緒的重要平臺,這些信息中包含了很多心理危機信息,為危機干預提供了豐富而寶貴的數據。[3]
高校心理危機干預的研究現狀
目前,抑郁癥、焦慮癥等心理問題已經成為高校大學生心理危機干預中的高發問題,然而目前高校心理危機干預面臨很多因互聯網技術的發展而帶來的挑戰[4]:第一,微信、微博、QQ等社交媒體蘊含著大學生心理危機評估診斷重要線索,但無法實時提取分析;第二,傳統心理危機評估多依靠經驗或直覺,反饋模糊延遲,難以量化評估與風險控制[5];第三,危機干預機制延遲僵化,效率低下,事故頻發[6];第四,危機干預的跟蹤評估機制缺乏可持續性。
知識圖譜技術
本研究利用互聯網大數據提供海量數據,挖掘微博大數據文本信息,采用知識圖譜技術,對特定群體的學生“實時監控”其微博、知乎等特定網站,從學生信息中篩選高風險的自殺人群,并實時監控心理危機的風險程度,根據監控報告結合人工評估結果,采取心理危機干預行動。[7]對清洗出來的準確可靠的信息進行結構化描述、關聯、組織,將其轉化為知識圖譜的知識。[8]2018年1月至2019年1月,本研究已經對770余人進行心理危機預警及干預行動,對58人獲得有效干預,及時發現自殺情緒,阻止自殺行為。
危機預警分級標準
為了更加精準地篩選、甄別危機個體,本研究提出危機預警分級系統。根據自殺方式的確定性、時間緊迫性等因素確定危機風險級別,級別越高代表危機越大、自殺風險越大。[9]具體的危機預警分級如下頁表所示。
本研究通過Python爬蟲八爪魚等工具抓取大數據,獲得心理危機監測智能系統所需的信息知識支撐,構建常見高危心理病癥的知識圖譜,提供心理危機相關的各種基本信息,如抑郁癥表征、焦慮癥表征,用于篩選、抓取社交媒體(如微博等)信息進行分析與判斷。本研究對心理危機進行心理畫像描述,如抑郁癥的知識圖譜對自殺方式、自殺計劃、自殺行動、自殺時間、自殺地點、自殺體驗、負性情緒、痛苦表達等描述,由不同心理危機的知識圖譜組合構成。本研究的文本處理知識圖譜由自殺圖譜、時間圖譜、空間圖譜、意愿圖譜等作為主要構成集合。
(1)自殺圖譜。本研究利用大數據文本處理技術監控高、中、底三級自殺危機學生群體。根據自殺方式(采用何種行為方式實施自殺計劃,如跳樓、投河、服藥、上吊等)、自殺計劃(根據自殺計劃的詳細具體程度判定,計劃越詳細、實施的可能性越大)、自殺行動(根據采取自殺行動,如相約自殺、遺言自殺等)描述進行記分評估。
(2)時間圖譜。時間圖譜是對危機事件中嵌入時間的描述,包括絕對時間(如日歷、節假日等)和相對時間(如過去、現在、將來等)的描述。
(3)空間圖譜。空間圖譜或稱為地點圖譜,是對危機事件中嵌入空間地理位置的描述,包括定位地點(自媒體軟件定位)和描述地點(空間地理位置的文本描述)。
(4)意愿圖譜。意愿圖譜是對危機事件的主體的主觀愿望或相近情緒的描述,主要用于判定分析危機主體是否有自殺意愿及自殺意愿強烈程度(分為不想自殺、比較想自殺、非常想自殺三級)。
根據以上危機預警分級標準,進行語義數據處理,對抓取的數據進行數據挖掘、分析,生成對應的危機預警報告,針對高危、中危、低危三級不同危機程度,采取相應的危機干預行動方案。
危機預防智能系統
本研究根據心理危機預警分級標準,建立語義大數據處理流程,能夠每天固定時間段從系統抓取數據,進行數據清洗、數據分析、結果報告、危機判斷、生成報告等步驟,并根據危機報告結合人工評估復核,最后制訂危機干預方案,進行危機干預行動。
本研究對心理危機預警的文本處理過程如下頁圖所示,大數據分析通過以下幾個步驟完成。
(1)數據抓取:利用八爪魚工具在微博抓取當天數據,生成HTML格式數據。數據抓取模塊需要根據各個知識圖譜設定操作化指標判斷需要抓取的數據,且避免重復抓取造成數據冗余。
(2)數據清洗:把抓取的數據對其每一條信息提取關鍵詞信息,關鍵詞需要10個屬性——時間、發文地址、微博賬號、微博名稱、文案內容、情緒關鍵詞、回復對象微博名稱、回復對象微博地址、回復內容、回復情緒關鍵詞,將關鍵詞信息生成一個文件,將其他無關信息刪除。
(3)數據分析:將數據清洗后匯總文件進行分析處理。采用自然語言處理工具進行分詞與句法分析。采用知識圖譜進行推理分析,分級提取信息:0~3級為低危,3~6級為中危,7~10級為高危。這一過程需要使用知識圖譜及其風險判斷的規則算法。這些規則采用了基于邏輯程序語言Prolog中的定義子句文法(Definite Clause Grammars,DCG)知識轉換規則。對于DCG規則加上面向知識圖譜推理能力的擴展描述,從知識圖譜中獲得領域知識的理解來解讀每一條信息,以判斷此信息的風險級別,如定義8級危機風險為:自殺計劃已定,自殺日期基本確定。描述這種邏輯程序規則的算法為:
Statement(crisis risk(7),[plan,time)),-->
Uninterested Text(_M1),rdfs Subclass of (Time, future, timeOntology),
Uninterested Text(_M2),rdfs Subclass of (Plan, crisisplan, crisisOntology),
Uninterested Text(_M3).
Statement(crisis risk(7),[plan,time)),-->
Uninterested Text(_M1),
rdfs Subclass of (Plan, crsisPlan, crsisOntology),
Uninterested Text(_M2),
rdfs Subclass of (Time future,timeOntology),
Uninterested Text(_M3).
這一算法邏輯為:如果一條信息談到自殺計劃和自殺時間,且沒有關于這個自殺計劃的否定表達,這條信息將被判斷為危機風險7級,即高危風險。
(4)危機判斷:上述算法規則中,“rdfs Subclass of”用于判斷是否包含自殺圖譜中描述的某種自殺計劃及時間圖譜中關于將來的時間描述。“uninterestedText”進一步判斷這個語句不包含否定愿望圖譜。根據算法篩選評估信息危機評分:7~10分為高危信息,4~6分為中危信息,0~3分為低危信息。
(5)生成報告:根據算法評估結果,生成大數據危機預警報告。高危信息為立刻上報人工復核處理,中危信息為每天固定時間上報,待人工復核,低危信息為過濾信息,不做處理。
(6)人工復核:高校心理健康中心組織心理學專家團隊進行人工復核,專家根據平臺預警信息追溯信息來源,對文本進行專業評估,如復核結果為高危自殺信息,會立刻通知學校危機干預工作團隊,如復核結果為中危自殺信息,會定期通知學校危機干預工作團隊。
(7)危機方案制訂:學校危機干預工作團隊根據大數據報告和人工復核結果,迅速做出反應,制訂對應的危機干預方案。
(8)危機干預行動:學校由學生處、保衛處、校醫院等多個危機干預核心部門協同展開危機干預行動,及時聯系校外醫院、公安等部門聯動,力求在最短時間內化解危機。
結果分析
本研究通過對選定的某高校大學生學生微博數據進行實時監控,從2018年1月至2019年1月,每日發布危機報告。為了評估該系統的危機干預大數據分析的信度與效度,隨機抽取了30天的監控數據進行人工數據分析檢驗。數據共有42702條危機信息,平均每天1423.4條有效信息,其中發現了58條高危信息(7級以上),125條中危信息(4~6級),587條低危信息(3級以下)。通過對中危、高危信息進行大數據結果和人工復核結果的風險級別和正確率進行分析發現,本研究心理危機預警的大數據評估結果高危信息檢出正確率為84.98%,中危信息檢出正確率為78.74%,低危信息檢出正確率為72.36%,總體平均正確率為78.69%。本研究從42702條信息中抓取770條危機信息,抓取1.80%危機數據,剔除98.20%無效信息,大大減輕了人工復核的工作量,從而提高人工復核的工作效率和復核準確率。
盡管本研究的風險信息報告的平均正確率為78.69%,但是大數據報告生成后,仍然立刻對危機信息進行人工復核,即讓心理學專業人員進行文本評估后,再制訂危機干預方案,從而保證了危機干預行動沒有出現誤判或失誤。
本研究對心理危機預警的危機評估和危機干預中體現了大數據分析的優勢,尤其是知識圖譜的技術特點。雖然本系統不能做到100%的危機檢出率,但本研究將從這些遺漏信息中再次分析,以改進現有的危機判斷規則,提高大數據技術支撐的決策準確率。
結論
本研究采用文本處理技術建立高校心理智能干預平臺,對特定群體的大學生社交媒體信息進行實時監控,發現心理危機信息并生成危機報告進行預警,進而為高校心理中心提供危機干預方案和行動的數據支撐。通過一年的數據監測,監測結果充分證明了大數據技術在心理危機預警與危機干預領域中的巨大應用價值和發展空間。大數據技術作為心理危機干預的支撐,拓展了大數據的技術價值,提高了危機檢出率,減少了自殺發生率,突出了大數據技術的社會價值。今后的研究將進一步改進危機判斷規則與算法,以提高大數據技術的正確檢出率。
參考文獻:
[1]習近平.決勝全面建成小康社會奪取新時代中國特色社會主義偉大勝利——在中國共產黨第十九次全國代表大會上的報告[N].人民日報,2017-10-28(01).
[2]高雯,董成文,竇廣波,等.心理危機干預的任務模型[J].中國心理衛生雜志, 2017,31(01):89-93.
[3]高勁松,黃梅,付家煒.基于年度高頻關鍵詞的研究熱點提取與可視化研究[J].現代情報,2020,40(12):130-139.
[4]李飛,葛魯嘉.大數據之于心理健康教育:功能邊界與實施取向[J].思想理論教育,2016(07):87-91.
[5]張麗,周建松,李凌江.精神創傷急性期危機干預方法評價[J].中國心理衛生雜志, ?2016,30(08):561-567.
[6]陳真真,楊雪梅.中小學生心理援助熱線來電者的特征及咨詢內容[J].中國心理衛生雜志,2016,30(12):933-935.
[7]馬海群,張濤,李鐘雋.新時代文獻信息的價值重構:人工智能技術和智慧服務[J/OL].情報理論與實踐,2020.
[8]陳婉珍,何雪松.大數據驅動的社會工作:前景與挑戰[J].社會科學,2017(07):74-81.
[9]張倩,鄭涌.創傷后成長:5·12地震創傷的新視角[J].心理科學進展,2009,17(03):623-630.
作者簡介:王會麗(1985—),河北雄安人,重慶大學副教授,研究方向為心理健康教育。
本文為2019年度教育部人文社會科學研究項目“基于大數據的高校心理危機‘實時評估—智能風控—危機干預—發展可塑智能機制”2018年重慶市教委人文社會科學研究項目(18SKSZ001)“大數據時代增強青年文化自信的引領力與凝聚力研究”的階段性成果,2018年重慶市“十三五”教育科學規劃重點項目(2018-GX-083)“基于大數據的高校心理健康服務智能化服務體系研究”、重慶大學“心理育人”名師工作室(2020SZK-19)等階段性成果。