石玉生, 黃偉芬, 江 源, 吳 昊, 張 相, 秦海波
(中國航天員科研訓練中心, 北京 100094)
隨著中國載人航天進入空間站時代,航天員將執行3~6 個月的長期在軌任務,完成包括在軌空間實驗、設備維護更換、出艙活動巡檢、機械臂遙操作等復雜任務,這對航天員的在軌認知能力水平提出了更高要求。 但在軌失重、噪聲、光照、密閉隔離環境等多種因素下可能影響航天員的基本認知能力,航天員在軌認知能力監測是評估航天員在軌狀態、安排航天員執行復雜動態任務的重要依據。
為了全面、有效地監測評估航天員在軌認知能力,蘇聯及國際空間站任務在不同階段使用了多種方法進行認知能力測試,并獲得了寶貴的在軌監測數據。 中國自神舟九號飛行任務以來進行了包括警覺性測試、眼手協調測試等在內的多項在軌認知能力及操作能力研究,積累了短期飛行航天員眼手協調等多項操作能力變化數據。 隨著計算機技術和測試范式的不斷進步,在軌認知能力監測的方法不斷改進,同時,隨著在軌數據的積累,對航天員認知能力影響的認識也在不斷加深。本文總結梳理在軌認知能力監測的研究方法和主要成果,為空間站時代研究長期在軌認知能力監測工具及對認知能力的影響提供借鑒。
不同時期研究者使用的在軌認知能力測試方法總體上遵循了測試時間較短、測試限制較少、測試無練習效應等原則。 這些方法以計算機軟件測試為主,選取經典認知能力測試范式作為測試任務,同時又根據相關研究風險偏好、情緒測試等領域的不斷進步而進行更新。以標志性軟件的不同,可將在軌認知能力測試的發展分為3 個階段。
在和平號空間站時代及國際空間站任務早期,不同研究者使用的在軌認知測試方法并不相同。 例如Ratino 等較早進行在軌反應時測試和時間知覺測試,使用簡單反應時、選擇反應時以及時間知覺測試范式,并未測試其他認知能力。隨后,Benke 等在1991 年的飛行中使用了多項計算機測試任務:簡單反應時、選擇反應時、Stroop型干擾測試、空間記憶能力測試以及空間知覺能力測試等。 而Manzey 等則發展了環境壓力研究標準測試工具(Standardized Tests for Research with Environmental Stressors,STRES),該軟件包括了語義推理測試、記憶搜索測試、不穩定追蹤測試以及雙任務測試,并在多個研究中進行了應用。 相比于Benke 等的測試項目,Manzey 等的軟件中增加了推理、眼手協調(不穩定追蹤)以及注意分配(雙任務)等認知能力測試。
NASA 研究者Eddy 等根據前人的研究成果, 提出了操作測試評估站( Performance Assessment Workstation,PAWS)軟件包。 該軟件包由6 個認知測試任務以及2 個量表測試組成,可在20 min 內完成,測試短時記憶、空間記憶、注意、眼手協調以及注意分配等能力。 PAWS 包含的認知測試項目如表1 所示,包含量表為情緒詞評估量表和疲勞量表。 該軟件包在NASA 相關研究中得到了廣泛應用。

表1 PAWS 認知測試項目[12]Table 1 Cognitive tests of PAWS[12]
Windows 系統飛行乘組認知能力測評工具(Spaceflight Cognitive Assessment Tool for Windows,WinSCAT)由NASA 在2005 年公布。 軟件包括符號替換測試、符號替換再認測試、延遲匹配測試、加減法測試以及連續工作記憶測試,滿足了在軌認知測試敏感性、簡便性、可重復性、有效性等要求,如表2 所示。 相比于過去的PAWS 測試,WinSCAT 刪除了追蹤測試和雙任務測試,增加了2 種符號替換測試,修改了心理旋轉測試內容,保留了加減法測試。 整體上降低了測試難度,也減少了航天員在軌測評的時間,便于航天員短時間內完成自評。

表2 WinSCAT 認知測試項目[16]Table 2 Cognitive tests in WinSCAT[16]
該系統發布后一直在國際空間站的各次任務中使用,一般每個月會對乘員評估一次,在乘員執行重大任務之前還會進行再評估;在Mars 500大型地面模擬實驗中也對志愿者進行了該項測試。 WinSCAT 發布后成為NASA 的標準認知測驗工具。
在WinSCAT 使用了近10 年之后,2015 年Basner 等公布了新的認知能力測試工具—乘組認知能力測試工具(Cognition Test Battery for Spaceflight,簡稱Cognition)。 WinSCAT 主要關注的是反應時、工作記憶等內容,對抽象推理、情緒判別、注意力的持久度以及風險決策等內容都沒有涉及;此外之前的評估方法得到的結果顯示航天員在軌認知測試成績未出現顯著變化,這和部分航天員在軌自述失眠、疲勞甚至衰弱等情況不一致,可能是由于在軌測試不夠全面導致。 因此開發出了含有10 項測試的Cognition 測試工具,測試項目見表3,測試項目示意圖見圖1。

圖1 NASA Cognition 測試項目圖示[19]Fig.1 Example of tests in NASA Cognition[19]

表3 Cognition 測試項目[19]Table 3 Cognition test items[19]
對比WinSCAT,Cognition 工具包重新引入了眼手協調測試和反應時(警覺性)測試,還加入了抽象推理測試、線段朝向測試、情緒識別測試、邏輯推理測試和氣球模擬測試;此外對心理旋轉和工作記憶測試進行了修改,保留了字符匹配測試。這些說明NASA 開始關注航天員的邏輯推理、情緒識別和風險偏好能力,之前在軌測試中并未涉及這些部分;重視了空間認知能力評估,引入了二維和三維測試2 種手段;保留了前人重點關注的眼手協調、字符匹配、工作記憶以及警覺性測試。
該工具發布后即在NASA 的多項研究中應用。在NASA 的天地雙生子研究中,研究者利用Cognition 測試集對比了雙胞胎的天地認知表現;2018 年發表的二氧化碳濃度對模擬乘組認知能力影響的研究中,也使用了Cognition 測試。目前來看,該測試取代了WinSCAT 的地位,成為NASA 新一代的標準認知測試集。
中國自神舟九號載人飛行任務以來,在軌完成了多項面向工效學評價和認知能力研究的在軌測試項目,主要包括在軌眼手協調測試、簡單反應時測試、選擇反應時測試、時間知覺測試、工作記憶測試和雙任務測試等。 與國際空間站相比,中國短期在軌飛行中選用的認知測試項目更加偏向警覺性、注意、記憶、精細操作能力等基本認知能力和影響航天員在軌操作績效的因素。
綜上,載人航天飛行中研究者選擇的認知測試具有以下特點:
1)覆蓋了知覺、注意、工作記憶、眼手協調、邏輯推理、空間認知等多項基本認知能力;
2)測試任務較為簡單,盡量避免練習效應的干擾;
3)單項測試任務時間不長,避免給航天員造成過大的腦力壓力。
值得注意的是,盡管都是為了更好地監測航天員在軌認知能力變化,但是不同時期研究者選用的測試種類和數量均不相同。 從早期階段到WinSCAT 時期減少了測試種類(例如刪除了追蹤任務)、降低了測試數量(由6 個降為5 個);但是Cognition 階段又增加了測試種類和測試數量,并且引入了諸如邏輯推理測試等高級認知功能的測試。 3 種測試集認知能力測試對比如表4 所示。

表4 不同測試集測試能力對比Table 4 Comparison of different test batteries
相比過去的測試集,最新的Cognition 測試集測試的能力最多,測試范式也更加復雜,加入了包括邏輯推理測試、情緒識別測試以及風險認知測試等高級認知功能的測試。 隨著更多高級認知功能測試范式不斷成熟,在軌測試將會更加豐富,也有助于更加全面地評估長期在軌對航天員認知能力的影響。
目前航天飛行對航天員認知能力影響研究大多集中在和平號空間站和國際空間站早期任務中,以中短期飛行(小于20 天)研究結果為主;Manzey 等和Bakelman 等發表的NASA 雙胞胎研究是極少的長期飛行對基本認知能力影響的研究;中國自神舟九號任務以來也積累了短期在軌測試數據,可為后續長期在軌的研究提供借鑒。
從現有的研究結果來看,中短期飛行并未對航天員的認知能力造成顯著影響。 Benke 等針對一名到訪和平號空間站6 天的澳大利亞航天員進行測試,發現其在軌測試反應時和準確率并沒有顯著變化;Manzey 等對1 名德國航天員在軌飛行8 天進行了測試,發現短時記憶和邏輯推理任務的測試成績都未下降,但追蹤任務在入軌早期和任務末期變差,這被認為是入軌早期不適應微重力環境、任務末期長時間高負荷工作導致疲勞和睡眠質量下降的影響;Eddy 等針對3 名航天員進行了為期13 天的在軌認知能力研究,包括短時記憶、注意、追蹤等多方面的測試,發現一名航天員的工作記憶測試、注意測試表現變好,一名航天員的注意測試、追蹤測試及雙任務中的追蹤測試表現下降,這種認知測試下降發生在入軌早期和任務后期,與前人的研究結果一致;Manzey等在4 名航天員18 天在軌飛行中,進行了包括工作記憶、注意、空間認知、追蹤任務、雙任務等測試,發現一名航天員的空間認知測試和注意測試成績下降,另一名航天員的注意測試成績下降,但是追蹤能力測試成績提高,其他2 名航天員無顯著性差異;Kelly 等對4 名航天員在軌飛行10天的研究結果發現,認知能力測試在軌沒有顯著變化,航天員主觀評價中的疲勞感和情緒喚醒度在軌升高,著陸后降低。
中國神舟九號、神舟十號和神舟十一號載人飛行任務航天員在軌測試數據表明,入軌早期有航天員的部分測試表現出現一定程度的下降(如警覺性測試),但同組航天員之間存在顯著個體差異,隨后會恢復到地面水平;相比于簡單認知任務(例如簡單反應時等),復雜認知任務(例如雙任務追蹤測試)的績效在入軌早期受到的影響更大,適應在軌環境后恢復,返回后績效水平可快速完全恢復;時間知覺在軌受到了較為明顯的影響。 這些結果說明航天員入軌早期主要存在適應過程,度過適應期后認知表現與地面差異不大,這與前人的研究成果基本一致。
總體而言,中短期飛行航天員的基本認知能力并沒有受到顯著損害,部分測試在入軌早期和任務末期的下降是入軌適應和疲勞積累導致的;此外,同組航天員的測試結果存在較大差異,部分航天員全程認知能力測試成績均保持穩定,個體化差異是后續需要重點關注的方向。
公開發表的長期飛行的相關研究非常少見。Manzey 等針對1 名俄羅斯航天員進行了為期4個月的在軌認知能力測試,發現在發射前2 天該航天員認知表現下降,但是入軌后這種下降消失,在入軌早期僅有視覺運動能力測試成績出現下降,隨后的13 周測試中航天員的認知績效保持穩定,與地面測試沒有顯著性差異。
Manzey 等針對1 名俄羅斯航天員進行了在軌438 天長期飛行研究,包括語義推理、記憶測試、追蹤測試以及雙任務測試等認知能力測試。飛行前測試4 次,飛行中測試29 次,著陸后測試8 次。 結果發現除了在軌第一周出現了追蹤任務測試績效下降之外(與前人研究結果相同),其他測試在軌期間均比較穩定,但是著陸后記憶測試有顯著下降。
Bakelman 等發表的NASA 雙胞胎研究對比了天地2 個同卵雙胞胎航天員的認知測試成績,發現在軌的航天員比地面航天員表現出了更強的冒險傾向,在軌測試中情緒識別測試和字符匹配測試的反應時、抽象推理測試的準確率均出現了下降,其他的反應時和準確率均沒有顯著變化。 值得注意的是,著陸后航天員認知能力測試成績出現了普遍下降,并且這種下降持續至少6個月。 目前尚未確定這種認知能力下降的原因,可能是航天員的重力再適應、返回后參加多項研究、多種媒體活動等所致。 考慮到返回后航天員需要在重新適應的同時參加多種活動或測試,加之認知測試的敏感性,認知測試成績的下降可能反映了航天員返回后處于疲勞或較為放松的狀態。
除了真實飛行之外,地面長期模擬實驗的研究結果也為長期飛行對航天員認知能力的影響提供有益借鑒。 Barger 等探究了24 h 輪班和睡眠不足對認知績效的影響,利用Mars 500 實驗前的105 天隔離實驗。 研究發現在24 h 輪班期間,由于睡眠不足,受試者以及任務中心的指揮人員均出現了典型的認知績效下降,在24 h 輪班結束后認知績效恢復到正常水平。 Torre 等利用NASA WinSCAT 工具對Mars 500 的受試者前8 個月的認知表現每月測試1 次,發現部分測試成績出現了顯著下降,但是并未說明具體哪些測試在何階段出現了下降,也未說明后續的測試成績。中國2016 年開展的4 人180 天大型密閉實驗中,4 名志愿者的部分決策能力在第107 天測試點出現了較為明顯的下降。
上述長期航天飛行任務的結果表明,航天員的基本認知能力長期在軌期間基本不會受到顯著影響,尤其是經歷過適應階段之后;但返回后認知測試成績往往出現了顯著下降。 此外,雖然地面模擬實驗證明了睡眠剝奪和密閉隔離環境等因素會對認知績效表現造成顯著影響,但是這種績效下降并沒有出現在真實飛行任務中,這可能是因為在軌執行任務時航天員會受到各種支持,同時他們會付出更多的努力或者找到更好的策略完成任務。
總的來看,載人航天飛行航天員在軌期間認知能力總體保持正常水平。 從中短期飛行的研究結果看,入軌早期適應重力、在軌末期高強度工作的疲勞積累可能導致追蹤測試、注意測試等績效下降,但是不同航天員之間存在較大差異,并沒有一致性數據證明中短期在軌飛行對航天員認知能力造成持續影響;在軌期間度過適應期后航天員的認知能力測試成績保持穩定,但是返回后有顯著的下降。 這種長期在軌飛行返回后的認知能力測試水平下降還需進一步研究分析原因。
值得注意的是,當前的研究成果,尤其是長期飛行的研究成果僅基于3 名航天員的飛行數據,樣本量較小,相關研究結論還需要進一步數據積累。
隨著認知領域研究的深入,在軌認知測試的種類從注意、記憶、視覺搜索等基本認知能力測試向著更加豐富的測試種類發展,如情緒識別、風險決策等。 我國短期飛行任務中重點關注了航天員警覺性、眼手協調、工作記憶、雙任務等認知能力變化,為工效學設計等研究提供了在軌數據。
目前已有的研究結果表明在軌飛行,尤其是長期在軌飛行,除了早期可能由于空間適應等因素的影響外,航天員的認知功能特別是復雜認知功能能夠保持在較高水平。 但該結論仍需要空間站長期飛行任務進一步的檢驗。 同時,目前研究中不同航天員測試結果之間存在較大差異,這可能和航天員參與測試時段、狀態和投入程度等多種因素有關,需要在后續的在軌研究中加強變量控制和多項指標綜合分析,發展個性化的監測方法和監測安排。
隨著中國空間站任務逐步開展,航天員在軌認知監測是獲取航天員在軌工作狀態、適時安排重大操作任務的重要基礎,探究在軌環境對認知能力影響,需要發展全面、有效地認知能力評價測試集,加入高級認知功能(比如邏輯推理、風險決策等)。 此外,隨著人工智能、大數據、虛擬現實等技術的發展,心理學研究領域會涌現出更多敏感、有效、綜合的測試方法和分析方法,助力在軌認知監測的進步。
從發展趨勢看,在保留警覺性、工作記憶等基本認知能力測試的基礎上,借鑒心理學領域已有的成熟范式,同時結合負荷狀態、情緒狀態等多種指標,發展適用于空間站長期飛行任務的綜合認知能力測試評價工具是后續研究的重要方向。