吳志淵,黃戌霞,陳新元,楊漫鑫
(1.福州墨爾本理工職業學院 學生工作部,福建 福州 350108;2.寧德職業技術學院 信息技術與工程系,福建 寧德 355000;3.福州墨爾本理工職業學院 信息工程系,福建 福州 350108)
近年來,經歷抑郁或焦慮等心理健康問題的大學生比例不斷上升[1]。世界范圍內,大約有31%的大學生在過去的一年中篩查出某種精神紊亂或疾病[2]。人們也逐漸認識到為存在這些常見精神健康問題的大學生提供治療具有一定的難度。
首先,許多學生的心理健康素養較低,沒有認識到治療的必要性,而且認為這些抑郁和焦慮癥狀是大學時期的典型壓力,沒有尋求專業醫療幫助的必要;雖然有些學生認識到自己需要心理健康服務,但是在尋求幫助時卻常常遇到障礙,或對干預方案的療效存在疑慮[3]。其次,大多數高校都有心理咨詢室,但可能存在專業人員/相關資源不足的問題,難以滿足學生的需求;而且部分學生對現實生活中的心理健康干預存在排斥心理,擔心隱私泄露[4]。可喜的是,目前已有較多的在線心理健康干預方案(通過Web頁面和APP等方式)提供心理咨詢和治療服務,不受時間/空間的限制,同時能跨越上述傳統心理健康服務的障礙[5]。
許多研究關注成年人的在線心理健康干預[6];關于高校學生心理干預方案的研究也在快速增加。2014年Davies等[7]對在線方式提供的大學生心理健康干預措施進行了系統性回顧,發現在線治療可以有效緩解學生的抑郁、焦慮和壓力。2018年Harrer等[8]經評估認為,互聯網心理健康干預對一系列精神紊亂狀況可能具有輕到中度影響。
盡管上述研究一定程度上可以評估在線心理健康干預措施的治療成效,但存在局限性:只專注隨機對照試驗(RCT)的研究。將其他類型的相關研究(如非隨機試驗、單臂試驗和全局試驗等),即現實場景中的不同實施方案及成效分析納入評估范疇,有助于充分評估相關方案并改善未來的干預實施,充分發掘其臨床公共衛生潛力。
進一步來說,在線醫療工具的實施和將其集成到常規護理環境中是近年的研究熱點。有研究呼吁從實用主義的角度出發,在現實場景中測試在線醫療方案,可盡快和最大程度地提高知識從科研實驗到現實應用的遷移[9],而在線心理干預無疑是在線醫療的重要組成部分。
此外,有研究發現在線心理健康工具普遍存在參與度和完成率較低的問題[10]。有研究將重心放在評估在線工具的用戶體驗方面(包括易用性和可接受性),希望能發現用戶對相關治療方案的不滿意/不理解之處,分析并進行改進,使用戶更愿意,也更能順利接受在線心理健康服務[11]。
本研究的目的是設計綜合性的評估框架,以包括但不限于RCT類型的大學生在線心理健康干預方案研究為評估對象,設計收錄標準和檢索策略,確定主流數據庫和數據源,設計數據抓取、處理和存儲方案,并對評估體系進行初步設計,包括治療效果、易用性、可接受性和推廣程度等內容,以發現相關研究的強項和不足,用于其未來的改進參照,最終加強抑郁癥、焦慮癥等心理問題的治療效果,進一步提高大學生的心理健康水平。
團隊成員包括多位心理學領域的具有3年以上提供心理咨詢服務經驗的專家,信息技術領域的從業人員,以及心理學專業的本科生等。
本文將框架分析對象的收錄標準定為:
⑴ 該研究的核心是旨在改善心理健康,解決心理問題的干預/治療措施。
⑵ 以在線方式提供干預(包括手機,PC、平板等多種終端媒介,通過APP、小程序、在線網站等方式提供服務均可);可以是面對面治療方案的補充/輔助手段。
⑶ 治療和研究的對象為高等教育學生群體,包括全日制本科及以上學歷的學生,全日制高等職業教育的學生,成人非全日制學歷教育的學生,等等。
⑷ 研究的心理問題包括壓力、抑郁和焦慮等癥狀,應有干預治療實施和成效分析的內容。
本框架使用了基于關鍵字匹配的搜索策略,根據PMI共現頻率整理并手動校對關鍵字字典,收錄“大學生”“抑郁”“焦慮”“心理健康”和“心理治療”等詞語,以及其同、近義詞和所有相應的英文術語。
將關鍵字檢索應用于以下數據庫:知網、萬方、維普、MEDLINE(Ovid)、EMBASE(Elsevier)、PsycINFO(EbscoHost)、Cochrane(Wiley)和Web of Science(Thomson Reuters)。由于部分期刊(如JMIR Mental Health和Digital Health未在上述數據庫中收錄),因此另行訪問該類出版物的官方網站獲取文獻;框架還擴展到從檢索結果的參考文獻中發現新的未被上述數據庫收錄的期刊/文獻并進行手動核查。不對日期、語種、文獻類型(除簡訊/快訊外)和研究方案類型進行限制。
使用分布式爬蟲結合Redis進行數據處理,持久化使用MongoDB(實驗中發現該方案效率高于通過StrictRedis讀寫Redis數據庫實現持久化存儲)。
本研究使用多認證賬號(>100)、多授權APP_KEY組合(>20)、多代理(可用IP庫>400)的組合進行輪詢;同時設定單線程的請求頻率,350 ms/400 ms,具體過程如下:
⑴ 首先構建指向prelogin頁面的URL,從事先構造且驗證可行的Header庫中隨機選擇,通過urllib.request.Request進行配置,使用urllib.request.ProxyHandler設置代理;
⑵ 根據頁面加密方式,對賬號進行base64轉換,使用utf-8編碼,密碼構造過程中,聯合從prelogin頁面取到的servertime時間戳、nonce和pubkey字段值后,進行RSA加密和16進制轉換;
⑶ 在使用servertime、rsakv等參數進行登錄的同時,根據is_openlock參數判斷驗證碼是否存在,若發現則下載,使用weibo_verify_code等三方庫進行識別(主流Python引擎如Tesseract的OCR識別率不高,故驗證碼量較小時直接調用三方平臺是主流選擇,準確率高且成本較低),登陸后根據響應的location字段定位,使用ticket等字段構造請求,獲取會話session信息,之后可從uniqueid中提取分配的用戶登錄編號,其他信息類似,有效期內使用MozillaCookieJar()進行Cookies的切換;
⑷ 服務器響應的URL中有部分進行了字符編碼,使用urllib庫的unquote_plus函數進行還原;具體信息根據<div class = “content clearfix” node-type =“like”>標簽定位,先使用Selenium+PhantomJS框架的get_attribute等方法進行重定向定位,再實現直接請求以提升抓取效率,過程中涉及到mini_original.js等請求參數的識別和使用;
⑸ 使用RedisSpider分布式框架將url爬取和數據提取分離,使用redisMixin為爬蟲分配key,同時引入concurrent包構建進程池和線程池,根據keyword選擇內容,按時間升序生成隊列,并行提取、過濾和輸出各個字段的信息。在數據抓取過程中,時有發現因為內容過長,沒有完整抓取的情況,故針對“展開全文”的Ajax請求使用Beautiful Soup模塊進行爬取;
⑹ 盡管數據收集機制較為完善,也提供了網站認可的Header信息,使用了切換app_key、ip等機制,但實際獲取數據時還是會出現無法控制的異常,這類異常大約占總請求的2%~6%,使用re庫編寫的精確正則表達式往往無法識別,對數據過濾造成影響,因而大量使用了BeautifulSoup模塊提供的預處理方法,效率低些,但識別率高;這類異常往往隔一段時間后重發請求即可解決,但為了保證效率,使用了上述方案。此外考慮到網絡延時等因素導致數據抓取失敗的可能,設置了異常處理,對抓取到的數據進行驗證,若抓取失敗,如提取到500失敗碼,則執行except語句循環抓取,同時使用Time庫的計時器判斷超時;
⑺ 最終提取的數據結構包括項目名,時間及跨度,地域,主要干預/治療目標,學生人數,治療方案設計,比較類型,預防/治療類型,技術類型,支持資源,參數設置,樣本組規模,易用性和可接受性,治療的完成度,干預治療結果,結果分析,等等。
⑻ 檢索得到的文獻經框架自動初篩(使用機器學習技術進行迭代,直到驗證集上的準確率在最后10個epoch內提升小于1%為止)和本科生根據標題和摘要進行初步校對外,每篇通過篩選的文獻都由不少于2位專家根據方案標準進行獨立評估;存在分歧時則引入第3位專家作為仲裁[12]。
⑼ 數據的持久化存儲通過pyMongo模塊調用MongoDB數據庫,通過創建Mongoclient()讀寫數據;本文借鑒了Scrapy框架的get_media_requests和item_completed方法,將對url的請求發送到管道,實現異步下載和字典格式的存儲以提升效率。
⑽ 使用釘釘平臺,以便研究成員間可進行在線協作。
本文方案用到或參考的相關模塊版本如下:
Urllib_kerberos-0.2.0;Pymongo 3.7.0;BeautifulSoup 4.6.0;lxml 3.3.1;Scrapy 0.24.4;Selenium 3.11.0;PhantomJS 2.1.1;Numpy 1.14.3;Pandas 0.23.0;Chardet 3.0.4。
本研究旨在設計綜合性、自動化的數據收集和評估框架,用于對大學生線上心理健康干預/治療相關研究進行分析,根據Preferred Reporting Items for Systematic Reviews and Meta-Analyses guidelines[13]設計系統性的評估方案,評估體系包括治療效果、易用性、可接受性和推廣程度等內容。具體如下:
⑴ 治療結果的度量指標包括Beck Depression Inventory-II[14]和Patient Health Questionnaire[15](抑郁),Beck Anxiety Inventory[16]和Anxiety Sensitivity Inventory[17](焦慮),Perceived Stress Scale[18]和Scales of Psychological Well-being[19](心理壓力和幸福感/健康指數)。
⑵ 易用性定義為與終端媒介和網站/程序交互時用戶體驗質量,包括剛開始治療時適應方案的難易程度,網站/程序的操作效率和用戶友好性,可記憶性以及對相關方案的印象描述。易用性結果包括標準可用性度量System Usability Scale[20]和定性描述報告。
⑶ 可接受性是用戶關于治療/干預方案各方面的滿意度,主要通過用戶自行編寫的定性描述 報告進行評估。
⑷ 推廣程度的主要指標是在線干預/治療服務的下載和使用量、穩定用戶數量和變化情況(以潛在用戶總數為基數),若有條件可補充該服務的高校知名度。但是,鑒于很少有研究提供該細節,因此未來計劃在爬取的數據范圍和識別錨標上進行擴展設計。
⑸ 偏倚風險評估:由于本框架的研究對象包括隨機試驗和非隨機試驗,因此同時使用Cochrane Collaboration的評估隨機試驗偏倚風險和評估非隨機研究風險的工具[21]。對于隨機試驗,使用“高”“低”和“不明”的等級評估選擇偏倚、實驗偏倚、檢測偏倚、損耗偏倚和分析偏倚等。對于非隨機試驗,評估因混雜而造成的偏倚風險,因選擇參與者而導致的偏倚,干預分類的偏倚,缺失數據而造成的偏倚,結果分析中的偏倚,等等。
近年來出現了許多在線大學生心理健康干預/治療方案,如何改善這些項目的用戶體驗和實際治療效果,對于在高校中提供在線心理健康咨詢服務并持續改善至關重要。本文設計了大學生在線心理健康干預相關研究的評估框架,包括團隊成員、方案收錄標準、檢索策略、數據源、數據抓取、處理和存儲方案,以及評估標準等,可對相關研究進行匯總和分析。未來計劃開展該框架的驗證實驗,通過對相關方案的匯總評估,為在線心理干預方案和相關研究提供持續改進參照,同時迭代細化、優化干預措施的有效評估指標,最終實現不斷提高大學生心理健康水平的目標。