趙乾坤 趙少勇 王立君
[摘 要] 隨著互聯網及移動終端設備的普及,其作為新興平臺被更多地應用于心理測評。各種測評網站及APP的開發,使這種測評更具有廣泛性和生態性,然而,相對于紙筆測評,互聯網及移動終端測評在擁有自身優勢的同時也存在眾多問題。數字化時代控制并解決這些問題成為互聯網及移動終端下心理測評的當務之急。
[關 鍵 詞] 互聯網;移動終端;心理測評
[中圖分類號] B841 [文獻標志碼] A [文章編號] 2096-0603(2017)34-0040-02
一、引言
網絡心理測評不是新興事物,20世紀80年代就已出現[1],這種通過網絡收集心理學數據的方式被稱為網絡研究方法[2]。就目前來看,基于網絡的心理學研究多為在線調查和心理測評[3]。根據目標的不同可分為三大類:發展成長性測評、心理診斷測評及認知能力測評。發展成長性測評主要針對大眾群體,這類測試用來定義特殊品質,如追求成功的動機;心理診斷測評是一種傳統的診斷方式,是典型的診斷和決定測評;認知能力測評多為篩選測評,以便對人員有效篩選。相對于傳統紙筆心理測評,網絡心理測評具有耗費少、樣本易獲取、測評情景性弱等優點,但也有研究者對網絡心理測評被試作答的可靠性及有效性持保留態度。因此,對網絡心理測評的統籌性進行探索勢在必行。
二、移動互聯網心理測評的優勢
(一)移動互聯網測評的經濟性
與傳統紙筆測評相比,移動互聯網測評更為節省、經濟,效能更高。傳統紙筆大規模團體測評,往往需要先對測評進行印制,然后發放給被試群體,待被試群體作答結束后收回,最后進行數據的篩選錄入及分析,被試群體也是在幾個月之后才能夠拿到測評報告。國外的紙筆測評中,被試者需要把答題卡郵寄回測評發布者,然后由測評發布者進行統計和整理,最后再把測試結果郵寄給被試者。而在網絡測評中,被試群體只需要在電腦或移動終端上回答每個項目,在完成之后,終端會迅速自動地進行分數計算和報告評估,參與者也能通過網絡短時間內獲得測評結果。這樣不僅節省了大量的時間、精力,還能在一定程度上避免因數據錄入不當而產生不真實的結果。同樣,網絡測評相比紙筆測評有更好的可擴容性,能夠在較短時間內發現測試存在的問題并且進行修訂。
(二)移動互聯網測評的被試廣泛性
任何一種測評,被試的選擇都十分重要。傳統紙筆測評由于方法及地域的局限,所選取的被試不具有全面的代表性,這使心理測評曾一度被戲稱為“大學生的心理測評”,但是,此類針對特定群體的調查結果可推廣性受到質疑,而且難以發現其差異特征與行為的關系。移動互聯網測評的被試選取則較為廣泛,網絡樣本盡管不能代表全體人口,但是他們比在有選擇性的高層心理學雜志上發表研究的樣本要豐富,尤其在性別、社會地位、地理位置和年齡等方面,網絡樣本比傳統樣本更具有代表性。在種族方面,網絡樣本與傳統樣本具有同樣的代表性。此外,移動互聯網測試還能對潛在農村人群進行測試,尤其對那些交通不便利和身體有恙的群體,移動互聯網測評是非常有必要的。
(三)移動互聯網測評的效度優勢
許多研究已經證明,在心理學的多種領域里網絡測評與紙筆測評在額外因素的控制、所得整體結果上相等價[4]。網絡測評相比紙筆測評除了能夠獲得更準確的分數外,還杜絕了紙筆測評中答案凌亂、擦除不干凈、筆跡不清晰、計分錯誤等問題。我們假設在一個題目上參與者選擇了B,計算機會將B選項調為黑色,也會允許參與者更改所選選項,如果參與者繼續下一道題目,電腦程序會立即將上一道題目的選項記錄并計分,這樣,由于統計所導致的錯誤就能夠被避免。
在測評作答方面,紙筆測評的情境性,尤其是臨床測試、人格測試、企業人才選拔、健康風險行為測試等情境容易引發被試的高自我評價,進而影響測評有效性。移動互聯網測評受情境性影響較小,被試在自我環境中作答,自我隱匿就會減少。還有研究表明:紙筆和網絡版本的信度、其他心理學建構的要素結構是相似的[5]。基于網絡心理學研究的外部效度比使用傳統手段的心理學研究要高,而且這正是網絡心理學研究方法的最大優點之一[6]。
網絡測試和評估更適用于項目反映理論(IRT)[7]。例如,計算機自適應測評能夠通過這種媒介有效地對參與者的能力和水平進行區分進而調整測評難度,項目反映理論技術則被用于選擇匹配難度合適的題目給被試。網絡測評也能夠評估出一些參與者的潛在能力,這是紙筆測評無法實現的。
三、移動互聯網測試的局限
(一)網絡測評的獨立與保密
移動互聯網測評中,由于被試是在遠程平臺上作答,缺少監控與監督,在某些測評中,被試很可能是由他人代為作答,甚至是在網絡搜索后進行作答,這類作答模式很難獲得真實數據,雖然一些測評在設計時就力求保證測評的獨立性,但目前針對網絡測評的獨立性仍存在較大問題。此外,測評的安全性與參與者信息的安全性均受到威脅,有些團體或個體非法復制、粘貼、抄錄、傳播測試信息,導致測試題泄露,更為重要的是,被試在網絡上所留存的信息無法得到嚴格的保密。一旦測試者個人信息遭到截取和破壞,傳播出去,這樣將極大地損害測試者的個人隱私。
(二)移動互聯網測評的科學性
測評的科學性主要存在兩個方面的問題,測評理解與測評解釋。由于移動互聯網測評面臨的群體較為廣泛,遇到的被試群體可能是偏遠地區或互聯網測評了解較少的地區,這類人群在參與測評過程中難免會遇到指導語不明白、測試要求不清楚的問題,這種情形下,測評所達到的結果的科學性將受到質疑。在測評結果的解釋性方面,由于不清楚測評時參與者所處的環境與狀態,測評方僅根據所得數據給出的解釋有限,有效性不夠全面。
(三)移動互聯網測評的非標準化
當今形勢下,移動互聯網的非標準化測評已經到了濫用的地步,許多測評隨處可見于各種網站鏈接,這些測評大都是一些非標準化測評,沒有經過專業人員的審定與修改,存在一定問題,而網絡化心理測評平臺由于其成本低廉、操作簡單被大量使用,以至于出現了一些自編自造的網絡心理測評,給人們帶來諸多不良影響。
互聯網非標準化心理測評的廣泛傳播,甚至近乎泛濫,恰好反映了我國心理測量工作的標準化和法制化工作任重而道遠[8]。
四、小結
隨著移動設備和網絡的介入,心理學研究有了很大的便利性,但在使用網絡心理測評時,道德性和專業性問題也日益突顯出來。網絡作為一把雙刃劍,它既可使心理學加速向前發展,也可使心理學更快地陷入困境。在實際運用中,工作者應該科學合理地使用網絡化心理測評平臺,在實踐基礎上給予創新。
參考文獻:
[1]Byers, A. P.Psychological evaluation by means of an online computer[J]. Behavior Research Methods & Instrumentation, 1981(13):585-587.
[2]Gosling.S D.,Vazire.S.Should we trust Web—based Studies[J].American Psychologist,2004,59(2):93-104.
[3]趙向陽,朱瀅.互聯網:心理學研究的新工具[J].心理科學進展,2002,10(3):30-3l.
[4]Coles,M., Cook, L.,Blake, T.Assessing obsessive compulsive symptoms and cognitions on the internet: Evidence for the compatibility of paper and internet administration[J].Behavior Research and Therapy,2007,
49(9):2232-2240.
[5]Buchanan,T.,Smith.J.L.Using the Intemet for psychological research:Personality testing on the World Wide Web[J].British Joumal of Psychology,1999(90):125-144.
[6]Bimbaum ,M .H.,et a1.Psychology experimental on the Intem et[M]. Academic Press,2000.
[7]Hulin,C. L.Drasgow, F.Parsons, C. K.Item response theory:Application to psychological measurement[J].British Journal of Surgery,1983,96(8).
[8]樂國安,王恩界.當前心理測評的應用問題與倫理規范[J].心理科學,2005,28(6):1294-1296.