歐美國家幼兒運動技能測評工具的組織與管理研究進展

2020-06-14 06:41:36

文體用品與科技 2020年10期

（貴州理工學院體育學院貴州貴陽 550003）

現有不同的工具來評估幼兒期的運動表現，這些評估工具大多針對特定的幼兒群體，因此具有特定的評估測試內容。運動評估作為常模參照測試或標準參考。一種是標準參照測試將孩子的表現與預定的標準進行比較，標準參照測試考慮了執行動作技能項目所需動作的定性方面。另一種形式運動技能評估主要是教師通過對學生使用監測儀器進行的。前期研究文獻中多集中在測試內容和標準上，幾乎很少涉獵測試中組織與管理，本文主要是對七測試評估工具 MOT4-6、M-ABC、PDMS、KTK、TGMD、MMT、BOTMP 測試中組織與管理進行梳理。

1、測試內容的選擇

標準化工具標準包括：測試手冊轉換表清晰、測試儀器、測試項目和評分操作指南，計分表和大量自由選擇空間以獲得補充的定性信息。此外，評估儀器設備應易于安裝，測試項目應易于指導、演示和管理。

按照測試使用者標準進行評估(物理療法測評估工作小組，簡稱TESMPT，1991年)，例如，報告測試選擇(例如描述實際使用、實物背景、測試選擇的總體和理由，包括不選擇工具的原因），測試選擇必須基于什么內容是最好，并應遵循道德準則（如經評估的學齡前兒童和其父母的知情同意、安全措施等）。經過審查工具的行政管理，可用于指導為特定的教育研究目標或臨床選擇適合的測評工具（見表 1）。

表1 標準數據

2、測試環境和評分員

在開始評估之前，應采取預防措施，防止出現危險情況。大多數測試都是“當場”進行的環境。測試手冊明確環境需求，如測試室是6m×4m，包括障礙物的墻和堅硬的地面。測試室應明亮、安靜、通風良好。避免測試孩子間干擾和測試時間最短。

考官或測試人員的選擇和培訓是非常重要的組成部分。測試者的專業背景應符合物理治療中的測試和測量標準（TFSMPT，1991）。合格的測試員應閱讀和研究測試內容和預編手冊。然后，他們應該遵守具體的規則和程序。當報告結果時，它們應該描述在測試過程中可能發生的任何事情。

3、動作評估工具的標準數據和來源

規范性數據往往是基于小樣本、較舊或針對運動能力不足而不是運動能力。表1顯示了規范性數據，作者和工具的來源、年齡、抽樣中的兒童人數和抽樣方法。本綜述多數數據來源僅代表美國人口，因族裔、種族、性別等不同而有所區別。只有Movement-ABC測試歐洲兒童有相對較新的規范數據。KTK和MOT4-6以及MMT代表歐洲兒童數據。這些數據中有一些是作為負值點，有些過時了。它們在本國使用，受到限制(見表1)。

4、動作評估工具的關鍵考慮

對動作評估工具批判性是沒有像心理測量中認知發展一樣。造成這一特殊缺陷的主要原因有五個方面：（1）認為最重要的發展目標是認知發展，由于有限的證據關于運動技能發展的信息有助于理解認知發展，因此對運動技能發展的興趣是有限；（2）體育往往沒有其他學科那么重要；（3）沒有證據證明存在不分割的運動能力，使用簡單的任務來解決一種測量大項目方案，但太耗時；（4）關于性別差異結果的可能產生相互矛盾，不能激勵研究性別中立、可靠和有效的評估工具。并非所有作者都同意根據性別差異出現在11歲或以后。如粗細運動技能性別差異的研究。這重要缺點是沒有提供男女兒童標準；（5）同齡兒童之間存在很大差異。

測試總分，測試者應該意識到不同運動任務之間的相關性可能很低。運動技能評估的復雜性反映了運動系統的多因素特性、可能存在的性別或文化以及同齡兒童之間的巨大差異。因此建議使用多個評估工具。用于學齡前的兒童，不同評估工具的優缺點（詳見表 2）。

運動評估工具的選擇考慮影響因素。應考慮以下標準：

測試目的、運動障礙、測試的年齡、測試的易操作、考評員的水平、測試項目時間等。

表2 用于學齡前兒童教育研究的評估工具的優缺點

強調了評估工具中使用的單一美國樣本，以及跨文化有效性不足。現有數據的日期或以小年齡組樣本為基礎，增加歐洲學齡前兒童的樣本，這為跨文化使用提供了數據樣本。美國和歐洲兒童的運動技能發展之間存在著明確的差異，如歐洲缺乏關于運動技能發展和表現的最新信息。使用PDMS-2分別獲得精細和粗大動作性能的分數，允許1-6歲兒童的粗大和精細運動表現之間存在相對差異。

5、測評工具的發展特點

5.1、測評工具標準化

經典測量理論（Classical Test Theory，CTT）認為測評體系的構建需要經過信效度檢驗、項目分析、常模、標準化等基本建造程序。標準化測評對實施程序、對象范圍、施測環境、測試方式、測驗時限、分數解釋（常模）作了統一的規定，這樣測評能夠在異時、異地，不同的主試等條件下進行，并能得到同等有效的測評結果。標準化的思想主要來自于自然科學中對實驗條件進行嚴格控制以降低測量誤差，其方法主要源自實驗科學中對無關變量和干擾變量控制的方法。本研究選取的測評工具在現實操作中均已經具有了完整的操作手冊，并對操作情景、工具規格以及測試人員品質等提出要求，較高的標準化程度保證了測試的信效度，同時保證了常模解釋的準確性，這也是它們得以廣泛應用的重要原因。

5.2、常模在評估中的應用

常模參照評價是一種以經典測評理論為基礎的測量，主要目的在于把施測對象同常模比較，從而判斷施測對象在所屬團體中的相對位置。FMS的發展是一個復雜的過程，對于運動技能模式發展的認識，一般是通過辨別運動技能發展的序列和階段的方法，這也是判斷FMS是否形成的常用方法。因此通常FMS的測評是對不同年齡段的兒童使用相同的測評工具，預期隨著年齡的增長，FMS表現會隨之發展，這樣可以將不同年齡段的兒童進行直接比較，或將單個的兒童與常模進行比較，這凸顯了常模參照評價的優點。但運用常模參照評價評估的最大短板是由于地區差異導致的測評工具推廣難的問題，這也是各國紛紛建立自己獨立的FMS測評體系的原因之一。

6、測評工具研究展望與啟示

6.1、借鑒國外先進測評工具方法

FMS的測評是實施運動技能干預和教學的前提，盡管對于FMS的操作概念還存在爭議，但發達國家多數已經建立了基于本國操作情景的FMS測評工具。回溯我國體育教育中關于動作發展研究的歷史，可以看出上世紀80年代以前，國內并沒有學者對運動技能發展進行研究。從對外國測評工具的綜述可以看出，對于運動技能測量的研究在我國還處于初步的探索階段，應更好的借鑒發達國家在FMS測量研究的先進理念和方法，同時緊密結合我國體育教育的現狀，取長補短，批判吸收。

6.2、設計適合中國版幼兒的測量評估工具，建立常模數據庫

（1）當前主流的兒童運動技能發展評價的方法都是由美德等國的學者基于本國兒童青少年運動技能數據研發，注重常模參照評價在評估中的運用，但多數測評工具存在因為跨文化測評，效度減弱的缺點，其數據常模不能精確地適用于他國兒童；

（2）“體育素養”已經被我國學界所認同，建立我國兒童青少年體育素養的測評體系是目前體育素養研究中的熱點，而FMS測評是體育素養測評的一個維度，基于我國大陸兒童數據常模的FMS的測評是研發是當前我國兒童青少年體育素養測評的關鍵環節；

（3）FMS的推廣已經成為體育教育和競技運動后備人才培養的重點，并已成為發達國家體育教育效果實施的評估標準，大量的文獻也證實，教師和研究人員可以通過改變和控制任務及環境因素來影響兒童青少年的FMS的發展，而我國在FMS相關研究上的力度依舊薄弱。

在研究教育環境中，建議測試工具取決于研究的目的。當評估學齡前兒童的一般運動能力時，建議使用MOT4-6；測評運動功能障礙時使用PDMS-2；而KTK測試將更合適平衡力。使用MMT運動測試能力潛力較大。然而，當目的是評估學齡前兒童運動障礙的發生率時，Movement-ABC將適合使用，其敏感性和特異性有待進一步研究，如BOT-2和PDMS-2需有復雜的測試儀器，更適合評估較小的兒童群體，測試也相當耗時。