朱昭紅 孫令令
(1 西安體育學院運動與健康科學學院,西安 710068) (2 河南省淮陽中學,周口 466700)
體育運動有助于預防疾病(Rhodes et al., 2017),并促進身心健康(Warburton et al., 2006)。然而,以WHO(2010)所推薦的運動方案為標準,全世界超過27%的成年人缺乏足夠的運動。現有的健康干預措施主要通過改變認知進行運動干預,例如,普及關于鍛煉對健康的益處,這些干預方案背后的假設認為人類的行為決策從根本上是理性的(Brand & Cheval, 2019; Ekkekakis et al., 2018),但這一假設一直以來都備受爭議。近年來,運動心理學中關于自動評價(automatic evaluations)對健康行為改變和維持的作用研究越來越受到關注(Ekkekakis & Brand, 2019)。據此,出現了一系列與這一新的研究方向相關的雙加工理論模型(朱昭紅, 孫令令, 2019)。
上述理論模型認為鍛煉行為形成中自動加工(系統1)和熟慮加工(系統2)是兩個相互作用但又截然不同的信息處理系統。其中自動評價由系統1 產生,所謂自動評價指一個人在概念(例如,鍛煉)和愉快或不愉快感覺之間自動聯系的強度(Rebar et al., 2016)。具體表現為與運動相關的刺激觸發系統1,并激活運動記憶自發的心理聯想,例如,不舒服、出汗、疲憊等,產生自動情感評價,進而促進個體對這些線索采取趨近或回避行為,如參加或不參加鍛煉(Schinkoeth & Brand,2020)。
近年來有研究采用內隱測量任務考察了不同人群的自動評價特點,結果顯示鍛煉人群比久坐人群對鍛煉刺激具有更強的積極自動評價(Cheval et al., 2018; Schinkoeth & Antoniewicz, 2017);自動評價越消極,參與者報告的未來鍛煉行為就越少(Eves et al., 2007)。但這一結果能否作為區分鍛煉人群和久坐人群的自動評價特點受到了質疑(Antoniewicz & Brand, 2016b; Conroy & Berry, 2017;Schinkoeth & Antoniewicz, 2017),原因之一是現有研究所采用的測量工具可能并未有效地反映出對鍛煉的自動評價特點。
到目前為止,研究者已經使用了五種不同的內隱測量任務來評估自動評價,其中IAT(內隱聯想測驗)的使用頻率相對較高,占比4 0%(Schinkoeth & Antoniewicz, 2017)。盡管每種測量方法都有其自身的特點,但研究者仍然認為可能只有其中一種是自動評價的最佳測量方法。Brand和Schweizer(2015)針對上述質疑建議使用評價啟動任務范式(evaluative priming task, EP),認為該任務的機制更接近自動評價的概念。在這個任務中,一個啟動刺激(例如,鍛煉詞或控制詞)被快速地呈現出來,然后是一個積極或消極的評價屬性詞作為目標刺激(例如,“愉快的”或“厭惡的”),要求被試分別對積極目標詞和消極目標詞進行反應,假設鍛煉啟動刺激的出現激活了相關的評價屬性,對于鍛煉自動評價為積極的人來說,鍛煉啟動詞對積極目標詞的反應被易化,從而導致反應加快。但目前僅有少數研究(Antoniewicz & Brand, 2016a; Bluemke et al., 2010;Brand & Schweizer, 2015; Eves et al., 2007)采用EP 任務,據此,本研究的目的是為采用EP 任務測量自動評價提供一定的實證依據,和上述研究一致的是,本研究的假設也是鍛煉者對鍛煉詞具有積極自動評價,不鍛煉者對鍛煉詞具有消極自動評價。同時,以上的研究都使用閾上刺激來評估自動評價特點,因此不能排除來自熟慮加工過程對研究結果污染的可能性,本研究和上述研究的區別是,進一步采用閾下啟動刺激來驗證上述假設。
實驗1 采用短語評價啟動范式考察鍛煉人群和不鍛煉人群自動評價的差異。研究假設:在鍛煉詞啟動下,鍛煉組對積極目標詞的反應更快。本研究采用2(組別:不鍛煉組、鍛煉組)×2(啟動刺激:鍛煉啟動詞、控制啟動詞)×2(目標刺激:積極目標詞、消極目標詞)的三因素混合實驗設計,組別是被試間變量,啟動刺激與目標刺激是被試內變量;因變量是反應時。
2.1.1 被試
招募某大學在校生,通過體育活動等級量表(PARS-3)進行被試的篩選與分組,其中運動量小的被試為不鍛煉組,運動量大的被試為鍛煉組,t(60)=16.09,p<0.001,不鍛煉組與鍛煉組各31 名,其中不鍛煉組男性10 名,女性21 名;鍛煉組男性19 名,女性12 名;平均年齡為22.81 歲(SD=2.33 歲),所有被試視力或矯正視力正常,均為自愿參與實驗,完成實驗后予以一定報酬。
2.1.2 實驗材料
啟動刺激材料:按照體育鍛煉與久坐行為的定義,本研究選取描述體育鍛煉與久坐行為的動詞短語共40 個,隨機選取89 名在校大學生對這些短語與鍛煉的相關性進行評定。根據毛偉賓等(2013)的方法,采用5 點量表,1~5 代表“完全不相關”到“極為相關”;同時要求被試對這些短語的愉快程度進行等級評定,同樣分為5 個等級,1~5 代表“非常不愉快”到“非常愉快”。根據被試的評定結果選出與鍛煉相關性最高和最低的動詞短語各8 個,其中高相關性短語如去跑步、去健身、打排球、去騎行、去游泳、練瑜伽、打籃球、打網球作為鍛煉啟動詞,低相關性短語如看電視、玩手機、去上網、聽廣播、打游戲、去下棋、去讀書、去睡覺作為控制啟動詞,兩類短語在與鍛煉的相關性上存在顯著差異,t(88)=7.57,p<0.001;兩類短語在情感效價上不存在顯著差異,t(88)=0.94,p>0.05;控制單詞長度統一。
目標刺激材料:本研究將目標詞界定為與鍛煉有關的形容詞。根據以往研究選取60 個形容詞,隨機選取30 名在校大學生對這些詞進行初步篩選,根據篩選結果與被試反饋,最終確定40 個與鍛煉相關的形容詞。之后隨機抽取82 名在校大學生對這40 個形容詞的愉快程度進行5 級評定,1~5 代表“非常不愉快”到“非常愉快”;同時要求被試對這些詞與鍛煉的相關性進行5 級評定,1~5 代表“完全不相關”到“極為相關”。根據等級評定結果選出8 個讓被試感到非常愉快的鍛煉相關形容詞作為積極目標詞(欣喜的、振作的、鼓舞的、舒暢的、美好的、柔韌的、輕松的、活躍的),8 個感到最不愉快的鍛煉相關詞作為消極目標詞(乏力的、勞累的、疲憊的、吃力的、痛苦的、受傷的、倦怠的、腫脹的),兩類詞語與鍛煉的相關性都達到了中等以上,兩者相關性評分差異顯著,t(81)=4.09,p<0.001,積極目標詞相關性評分較高;兩類詞語在情感效價上存在顯著差異,t(81)=13.72,p<0.001;控制單詞長度統一。
2.1.3 研究工具
本研究采用體育活動等級量表對被試的運動量進行測量并分組,該量表由梁德清(1994)修訂,從鍛煉的強度、時間及頻率三個方面來測量,每個方面分為5 個等級,其中強度與頻率各等級分別計1~5 分,時間從1~5 等級分別計0~4分,運動量的大小等于三者的乘積,即,運動量=強度×時間×頻率,其評定標準為:得分小于等于19 分為小運動量,得分介于20~42 分之間為中等運動量,得分大于等于43 分為大運動量。
2.1.4 實驗程序
實驗開始時,屏幕中央呈現書面指導語,實驗者再以口頭解釋指導語,確保被試明白任務后開始實驗,如圖1 所示,中央注視點呈現1000 ms后出現啟動刺激100 ms,要求被試盡量忽視這一刺激,之后屏幕會出現200 ms 的空白;隨后呈現目標刺激,要求被試盡可能又準又快地對目標刺激進行按鍵反應,其中一半被試被要求對積極目標詞按“G”鍵,消極目標詞按“H”鍵,另一半被試則與此相反,目標刺激呈現1000 ms 或者被試做出按鍵反應后目標刺激消失;最后電腦屏幕呈現空白1000 ms,標志著這一試次的結束,隨后開始下一試次。

圖 1 閾上啟動任務流程圖
實驗共有110 個試次,其中有10 個練習試次,若被試沒有熟悉規則可重新進入練習。正式實驗將16 個啟動刺激放入一個list,16 個目標刺激放入另一個list,采用隨機抽取的方式,共抽取100 次。正式實驗共分為兩個組塊,每個組塊包括50 個試次,被試每完成一個組塊可進行休息,休息時間由被試決定,休息結束之后進入下一個組塊。
2.1.5 數據分析
采用SPSS16.0 對數據進行統計分析。首先對被試的數據進行初步篩選,所有被試的反應正確率均高于95%,刪除反應錯誤的試次以及反應時在三個標準差之外的數據,采用trail-by-trail 的分析方法,以目標刺激鍛煉相關性作為協變量,對每一個被試的有效反應時進行單變量方差分析。之后,將回歸掉目標刺激鍛煉相關性帶來影響后的兩組被試的數據進行獨立樣本t 檢驗和重復測量方差分析。
兩組被試在不同實驗條件下反應時的均值和標準差見表1。結果見圖2。

圖 2 閾上啟動實驗條件下兩組被試的反應時比較

表 1 閾上啟動條件下兩組被試的反應時(M±SD)(ms)
對于積極目標詞而言,鍛煉組在鍛煉詞啟動下反應速度顯著快于不鍛煉組,t(60)=3.45,p=0.001,在控制詞啟動下的兩組差異不顯著,t(60)=1.86,p=0.067。說明鍛煉人群對鍛煉詞具有積極自動評價。
對消極目標詞而言,兩組被試在鍛煉詞啟動下[t(60)=0.52, p=0.603]和控制詞啟動下[t(60)=1.20,p=0.236]差異均不顯著。說明不鍛煉人群對鍛練詞不具有消極自動評價。
重復測量方差分析顯示,目標詞主效應顯著,F(1, 60)=10.71,p=0.002,η2p=0.151,所有被試對積極目標詞的反應顯著快于對消極目標詞的反應;組別、啟動刺激和目標刺激交互作用顯著,F(1, 60)=4.28,p=0.043,η2p=0.067。簡單效應分析發現,在鍛煉詞啟動條件下,鍛煉組對積極目標詞反應快于消極目標詞,F(1, 60)=10.13,p=0.002;在控制詞啟動條件下,鍛煉組[F(1, 60)=5.45,p=0.023]和不鍛煉組[F(1, 60)=6.88, p=0.011]均表現為對積極目標詞反應快于消極目標詞。其他自變量的主效應和彼此之間的交互作用均不顯著。
實驗1 采用短語評價啟動任務,考察了閾上呈現啟動刺激條件下鍛煉組和不鍛煉組的自動評價特點,研究結果僅證實了鍛煉組對于鍛煉詞具有積極的自動評價。由于實驗1 中啟動刺激呈現的時間為100 ms 的閾上刺激,刺激物在屏幕上是可見的,盡管實驗中要求被試盡量忽略啟動詞,但依然無法排除意識成分對測量結果的影響(Gawronski & Bodenhausen, 2007)。據此,實驗2采用了閾下呈現啟動刺激的評價啟動范式來證實自動評價的存在。本研究預測,鍛煉組對鍛煉詞具有積極自動評價,不鍛煉組對鍛煉詞具有消極自動評價。
隨機選取30 名在校大學生進行預實驗以確定閾下啟動刺激的呈現時間。預實驗程序和正式實驗相似,只是不呈現目標刺激(張美晨 等,2015)。結合以往研究(柳恒超 等, 2010; 張煥煥,2017; 張家甄 等, 2016),本研究中啟動刺激有兩個水平,分別是鍛煉啟動詞與控制啟動詞,因變量為反應正確率。啟動刺激呈現時間分別為15 ms、20 ms、25 ms、30 ms、35 ms,分為 5 個組塊并進行偽隨機,啟動刺激被掩蔽刺激“####”覆蓋,掩蔽刺激呈現60 ms,接著出現寫有“請判斷”的圖片,要求被試對之前出現的啟動刺激是否屬于鍛煉詞進行判斷,被試做出按鍵反應后圖片消失,如果沒有看清該詞語,則要求被試進行迫選。預實驗結果表明:在啟動刺激呈現時間為15 ms 時,被試反應的正確率與隨機水平50%沒有顯著差異[t(29)=0.53, p>0.05],且在每個組塊結束之后詢問被試是否看清了前面閃過的詞語,所有被試均報告無法看清詞語的內容或無法看到詞語的存在。
3.2.1 被試
招募某大學在校大學生,鍛煉組32 名與不鍛煉組28 名,其中鍛煉組男女各16 名;不鍛煉組男女各14 名;平均年齡為21.65 歲(SD=2.21 歲),視力或矯正視力正常。
3.2.2 實驗材料與研究工具
同實驗1。
3.2.3 實驗程序
實驗開始時,屏幕中央呈現書面指導語,實驗者口頭解釋指導語,確保被試明白任務后開始實驗。如圖3 所示,實驗程序和實驗1 基本相同,唯一的區別是實驗2 中注視點消失的位置會呈現啟動刺激15 ms,啟動刺激很快會被掩蔽刺激覆蓋,掩蔽刺激呈現60 ms;接著再呈現目標刺激。

圖 3 閾下啟動任務流程圖
3.2.4 數據分析
同實驗1。
兩組被試不同實驗條件下反應時的均值和標準差見表2。結果見圖4。

表 2 閾下啟動條件下兩組被試的反應時(M±SD)(ms)

圖 4 閾下啟動實驗條件下兩組被試的反應時比較
對積極目標詞而言,鍛煉組和不鍛煉組在鍛煉詞啟動上差異邊緣顯著,t(1, 58)=1.73,p=0.087。鍛煉組和不鍛煉組在控制詞啟動上差異不顯著,t(1, 58)=0.24,p=0.811。說明鍛煉人群對鍛煉詞具有積極自動評價。
對消極目標詞而言,鍛煉組和不鍛煉組在鍛煉詞啟動上差異不顯著,t(1, 58)=-0.67,p=0.503。鍛煉組和不鍛煉組在控制詞啟動上差異不顯著,t(1, 58)=0.55,p=0.581。說明不鍛煉人群對鍛練詞不具有消極自動評價。
重復測量方差分析顯示,組別與啟動詞交互作用顯著,F(1, 58)=4.94,p=0.030,η2p=0.079,簡單效應分析發現,鍛煉組在鍛煉詞啟動和控制詞啟動上的反應差異邊緣顯著,F(1, 58)=2.83,p=0.094。啟動刺激和目標刺激的交互作用顯著,F(1, 58)=5.40,p=0.024,η2p=0.085,簡單效應分析發現,在鍛煉詞啟動條件下兩組被試均對積極目標詞反應顯著快于消極目標詞,F(1, 58)=12.21,p=0.001。其他自變量的主效應和彼此之間的交互作用效應均不顯著。
本研究的目的之一是為鍛煉行為中自動評價的特點提供證據。研究結果發現閾上閾下啟動條件下鍛煉人群對鍛練詞均具有積極自動評價。以往研究結果表明鍛煉的積極自動評價可以用來區分鍛煉人群和久坐人群(Antoniewicz & Brand,2014, 2016a; Bluemke et al., 2010; Calitri et al., 2009;Conroy et al., 2010)。本研究的結果進一步證實了上述結論。和這類研究相同的是,本研究也選用了主觀報告的運動量作為衡量運動類型的指標,因而所采集鍛煉量的數據可能并不能完全代表實際所實施的鍛煉行為。盡管這一不足之處所導致的系統性的誤差并不一定影響研究結果得出自動評價和鍛煉行為之間的關系,但研究結果的外部效度可能會受到限制。因此,未來研究需要采用運動量的客觀評價指標,如加速度計進一步來證實(Antoniewicz & Brand, 2016b)。
按照雙加工理論中的聯想-命題評價模型(the associative-propositional evaluation model, APE)的解釋,外在的信息或者刺激首先自動激活存儲在記憶中與外在信息相聯系的情感狀態,如鍛煉這個詞自動激活了一種愉快的感受,這是聯想加工過程(系統1),這一過程是自動產生的,即自動評價過程,之后這種感受可能會轉變為一個命題,即鍛煉有趣,因此個體會表現為愿意并積極參加鍛煉,這是命題加工過程(系統2)。該模型認為系統1 中的自動評價為系統2 中態度的認知細化提供了基礎(Gawronski & Bodenhausen, 2007),進而影響之后的行為決策(Brand & Schweizer,2015)。目前已有研究中僅有3 項采用了縱向研究的方法(Schinkoeth & Antoniewicz, 2017),證實了自動評價對之后鍛煉行為具有預測性,但對于自動評價在何種條件下以及為什么會影響鍛煉行為還需要更多的研究證實。
本研究中閾上閾下啟動實驗均未證實不鍛煉人群對鍛煉詞具有消極自動評價。在一項干預性研究中也得到類似結果。Antoniewicz 和Brand(2016a)采用評價性條件作用技術(evaluative conditioning, EC)對被試的自動評價進行干預,研究中將鍛煉(或不鍛煉)的圖片與引發積極或消極情感的圖片進行配對,結果顯示獲得積極自動評價組的個體自動評價發生了顯著變化,但未發現消極自動評價組的顯著變化。Chevance 等(2017)采用IAT 變式研究肥胖人群久坐行為,結果顯示對久坐行為的自動評價并不能預測未來行為。Schinkoeth 和Antoniewicz(2017)認為這一結果可能表明鍛煉行為和久坐行為分別受到兩種不同動機因素的影響。Brand 和Ekkekakis(2018)進一步提出具有消極自動評價個體可能需要更強的動機才能達到具有積極自動評價個體相同的運動行為(例如,每周的運動量)。同時,本研究和上述研究僅僅檢測了即時性的自動評價,這一結果是否對實際鍛煉行為具有預測作用無法確定。Hyde 等(2012)提出對鍛煉的自動評價可能由穩定和不穩定兩部分組成,對最初經驗的反復評價反應可能先影響不穩定的成分,然后再影響穩定的成分。使用評價性條件作用技術來激勵人們開始做某項特定的運動,可能僅影響了不穩定成分。未來研究應該明確一種行為的反復啟動和積極的即時自動評價是否會導致更積極的自動評價的穩定成分(Marteau et al., 2012),進而影響鍛煉行為的長期維持。
本研究的第二目的是為尋找更加有效的自動評價測量指標提供證據。按照Brand 和Schweizer(2015)的建議,本研究選用評價啟動任務作為自動評價的測量工具,并分別采用閾上和閾下呈現啟動刺激的方式,結果均證實了鍛煉人群對鍛煉詞具有積極自動評價的特點。
在已有的與鍛煉相關的自動評價研究中,絕大多數研究采用IAT 及其變式作為自動評價的測量方法。IAT 通過對靶概念和屬性詞之間自動化聯結強度的評估來對個體無意識、自動化的內隱社會認知進行間接的測量(董妍, 俞國良, 2004)。這一研究范式可能使得內隱測量和所要研究的問題無法最大化重疊(Rebar et al., 2015)。而評價啟動任務要求被試僅對目標詞進行按鍵反應,假設啟動刺激的出現激活了相關的評價屬性,對于積極自動評價者而言,運動啟動詞對積極目標詞的反應被易化,從而導致反應加快,研究結果通過比較情感啟動效應測量個體對事物自動評價的能力,這一方法更加接近所要研究的問題。
另外,本研究在閾上啟動條件下發現在非鍛煉啟動詞上,兩組被試均表現為對積極目標詞反應速度更快。Eves 等(2007)和史偉鋒(2012)的研究也出現了類似的結果,這一現象被稱之為啟動反轉效應,即啟動刺激與目標刺激情感效價不一致時被試反應速度更快。根據情緒轉換模型理論,啟動反轉效應與目標詞的高易接近性有關,高易接近性的詞語材料引發的反應更強烈,當啟動詞和目標詞效價不同時被試能快速知覺,對目標詞產生快速反應;當效價相同時,被試需要時間判斷是對啟動詞抑或是對目標詞反應,反應變慢(李芳 等, 2007)。本研究的實驗材料評定顯示積極目標詞和鍛煉相關性評分顯著高于消極目標詞,實驗1 和實驗2 對目標詞鍛煉相關性這一無關變量進行了控制,實驗1 中依然表現為啟動反轉效應,實驗2 采用閾下呈現啟動刺激規避了意識成分的干擾未出現啟動反轉效應,該結果表明閾下呈現啟動刺激可能是更加有效的自動評價測量工具。未來研究需進一步證實該測量工具在自動評價中的有效性。
鍛煉行為不僅僅是深思熟慮的認知結果,同時也受無意識自動評價的影響。根據本研究的結果,鍛煉者與不鍛煉者對鍛煉的自動評價存在差異,與不鍛煉者相比,鍛煉者對鍛煉具有更加積極的自動評價反應。