摘要:以511名3~10歲兒童為測試對象,探討了大肌肉動作發展測試(TGMD-2)的信度和效度,結果表明測試者信度系數為0.436~0.876;內部一致性信度系數為0.607~0.925;重測信度系數為0.608~0.876;內容效度、結構效度、效標效度也都令人滿意。TGMD-2可作為3~10歲兒童大肌肉動作發展狀況的測評工具。
關鍵詞:大肌肉動作發展;信度;效度;兒童
中圖分類號:G80-32 文獻標識碼:A 文章編號:1006-7116(2007)03-0037-04
在個體發育的早期,動作發展是評價、診斷、監測個體身心發展狀況的重要指標。兒童發展的早期成就主要體現在動作的發展上,從20世紀初開始,對早期發展的評估就多以動作為主要指標。動作的良好發展可以為個體認知、情緒和社會性等多方面的發展提供有利條件,反之,動作發展出現障礙,個體的發展也會受到阻礙。大肌肉動作發展是動作發展的重要內容。大肌肉動作技能就是“由軀干、四肢等大肌肉群發力而產生的動作技能”。大肌肉動作發展包括在空間內移動身體的技能(位移技能)和控制物體的技能。這些動作技能是兒童在學前期和小學早期重點發展的動作,也是為以后運動技能發展提供基礎作用的大肌肉動作。在學前期和小學期間,孩子的運動能力開始發展并漸趨成熟起來。身體的發育狀況和孩子的活動經歷在影響運動模式方面起到根本作用,如果大肌肉動作發展方面的缺陷得不到識別和補救,孩子就有可能終身都存在運動能力方面的問題。大肌肉動作發展測試(test ofgross motordevelopment,TGMD)由美國密歇根州立大學Dale A.Ulrich博士編制的,專門用于評估3~10歲兒童大肌肉動作發展狀況的測評工具。該測試始編于1985年,經過幾年的實踐后并結合有關專家們的建議,UIrich博士于2000年又進行了修訂(稱TGMD-2)(TGMD-2內容詳見中國體育科技2005年第2期41卷)。修訂后的測試在美國體育教學和研究中廣泛應用,并在多種文化環境下都證實有良好的信度和效度。TGMD-2是一項標準嚴格、具有高度有效性和可靠性的測驗項目。該測驗由兩部分構成,分別測驗了兒童身體移動的能力和控制物體的能力。每個測驗由不同的測試動作組成,每個測試動作測量的是兒童大肌肉動作發展的不同方面。它的測驗樣本是由美國10個州的1028名兒童組成,并根據性別、年齡、種族、居住地區進行了分類,經研究證明具有很高的信度和效度。

TGMD-2的測試內容包括位移運動部分和物體控制部分。位移運動部分包括跑步(Run)、立定跳遠(HorizontalJump)、單腳跳(Hop)、跨跳(Leap)、前滑步(Gallop)、側滑步(slide)6個動作;物體控制部分包括原地拍球(stationary Dribble)、接球(cateh)、踢球(Kiek)、擊固定球(striking a Stationary Ball)、上手投球(0verhand Throw)、地滾球(Underhand Roll)6個動作,總共12個測試動作。在我國臺灣地區的兒童中應用,也得到了較好的信度和效度。但在大陸兒童中應用還沒有相應的報告。為此,本文將大肌肉動作發展測試(TGMD-2)在大陸兒童中試測,研究其信度和效度,以探討將其推廣使用的可行性。
1 研究對象與方法
1.1 研究對象
由濟南勝利大街小學、濟南銀座雙語幼兒園、德州市光明街小學、德州市直屬機關幼兒園3~10歲兒童組成,共511名。其中3歲61名(男32名,女29名);4歲65名(男31名,女34名);5歲67名(男35名,女32名);6歲有57名(男30名,女27名);7歲69名(男35名,女34名);8歲64名(男34名,女30名);9歲68名(男35名,女33名);10歲60名(男28名,女32名)。男生共260名,女生共251名。
1.2 研究方法
(1)測試工具:大肌肉動作發展測試(TGMD-2)由兩部分構成,分別測試兒童身體移動的能力和控制物體的能力。每個部分的測試由不同的測試動作組成,每個測試動作測量了兒童大肌肉動作發展的不同方面。位移測試包括跑步、立定跳遠、單腳跳、跨跳、前滑步、側滑步6個動作;物體控制測試包括原地拍球、接球、踢球、擊固定球、上手投球、地滾球6個動作,共12個動作。每個測試動作有3~5項不同的、具體的動作標準。這些動作標準可以界定兒童在完成某個動作時軀干和四肢配合是否協調、基礎大肌肉動作技能的形成是否精確,是否達到自然、順暢的動作技能模式。測試人員根據兒童完成動作的情況也就是符合動作標準的情況記錄得分,符合一項動作標準得1分,不符合動作標準不得分,記為0分。
(2)測試過程:正式測試之前,隨機抽取30人進行預測試,統一測試人員的操作方法和評分標準,解決測試過程中可能出現的問題。測試開始后,有兩名測試人員進行記錄評分,每個兒童進行兩次測驗動作的測試,以減少隨機誤差的出現。將兩次動作的得分之和作為最后成績。在測試過程中,要鼓勵學生做最大效能的動作表現,并且盡量讓每一個學生都有先測的機會。兩周后,從已測對象中抽取80名(每個年齡段10名)進行重測,重測率為15.65%。所有數據都在SPSSfor Windows 12.0軟件中進行處理和分析。
2 結果與分析
2.1 信度
測試的信度(reliability)又稱可靠性,是指在相同測試條件下,對同一批受試者使用相同的測試手段,重復測試結果的一致程度。一個好的測試必須是穩定可靠的,只有具有充分可信度的測試才能測試到“真實”。常見用來評價信度的方法有評分者信度、內部一致性信度和重測信度。

(1)評分者信度:評分者信度(raters reliability)是指兩個或數個評價者(裁判、教師、測試者等)對同一受試者進行同一測試時,所得測量結果的一致程度。在本次測試中,兩名測試人員經過統一培訓后,對511名被測對象的動作表現進行了獨立的記錄評分。將兩名測試人員的評分運用皮爾遜(Person)相關系數進行比較,結果見表1。由表1中的數據可以看出,不同測試者對12個測試動作的評分情況在a=0.01的水平上,有顯著性的相關關系,也就是兩個評分者的評分情況是基本一致的,說明TGMD-2的評分者信度值很高,可為測試評分人員提供有力的可信證據。
(2)內部一致性信度:內部一致性信度(internal-consisteney reliability)是指在一天內受試者重復參加相同的測試所獲得成績(結果)的一致程度。為了檢驗TGMD-2的內部一致性信度,在本次測試中,每個測試動作都完成了兩次,采用Cronbach'a系數來表示量表的內部一致性。
表2列出了TGMD-2中12個測試動作的內部一致性系數,單腳跳的系數為0.925,踢球和擊固定球的信度系數較低,分別為0.709和0.748,其他動作的信度系數在0.766~0.892。根據信度系數的參考標準,當0.5≤a<0.7很可信(最常見);當0.7≤a<0.9,很可信(次常見);當a≥0.9,十分可信。可見,這些信度系數值有很高的接受性,可以放心使用。

(3)重測信度:重測信度(test-retest reliability)又稱為穩定性系數,是指數天后,對受試者重復進行同樣的測試時,測試結果的一致程度。重測信度高,說明測試的結果一致、可靠,測試成績穩定;反之,說明該測試不穩定,需要進行修訂。
測試結束兩周后,又從測試對象中隨機抽取了80名孩子(每個年齡段10名)進行重測,重測率為15.65%。將80名孩子的兩次測試結果用皮爾遜(Peason)積差相關系數進行相關分析,相關系數見表3。表中的數據表明每個測試動作前后兩次的測試成績在a=0.01水平上有顯著性意義,這些數值對統計測試分數樹立了穩定的信心。
2.2 效度分析
測試的效度(validity)就是測試的有效性,指一個測試或測量工具能真實地測量出所要測量事物的程度。一次測試是否有效,主要看其是否準確測量了它所要測量的東西。效度越高,表示測量結果越能顯示出所要測量對象的真正特征。常用來評價效度的標準有內容效度、結構效度和效標效度。
(1)內容效度。測試的內容效度(content validity)指測量的內容或項目對總體內容的代表性程度,也就是測試能否充分代表所要測量的內容范圍。內容效度的高低,取決于測試題目的代表性,要看選出的題目能否包含所測內容范圍的主要方面,并使各方面題目比例適當。
1)測試項目的辨別力。項目的辨別力(dscimination)有時也稱區分度,就是測試項目對于不同水平的被試者加以區分的能力。具有良好辨別力的測試,實際水平高的被試者應得高分,水平低的被試者應得低分。它是評價測試是否有效的“指示器”。通常用辨別力指數來評價。根據上下各27%的標準將被試者分為高分組和低分組,得出各測試動作的辨別力指數見表4。在一般測試中,D>0.30項目就可以接受了。可見TGMD-2各測試動作的辨別力指數是可以接受的。
2)測試項目的難度。項目的難度(difficuhy)就是測驗的難易程度,可以反映出測試動作對學生的適宜程度。一個測試的難度是由組成測驗的各項目難度決定的。通常采用某個測試動作的平均分與該動作滿分之比來計算難度。P值越大,說明難度越小,P值越小,說明難度越大。Anastasi和Urbina認為平均難度大約占50%并占有相當大分散性,分配在15%~85%的項目一般被認為是可以接受的。
從表5測試動作的難度值看出,擊固定球和上手投球的難度最大,分別為49%和53%,踢球、跑、跨跳的難度相對較低,分別為86%、83%和83%。總的來說,12個測試動作的難度值都在可以接受的范圍內。
(2)結構效度。結構效度(construct validity)3L稱構想效度,是指測驗能夠測量到理論上的結構或特質的程度。確定結構效度的方法可以通過分析測試內容與測試總分的相關關系來進行。表6列出了各個測試動作得分與測試總分的相關關系,其相關系數為0.421~0.719,差異均有顯著性。說明各個測試動作與測試總分之間有密切的相互關系,測試量表的結構合理。
(3)效標效度。效標效度是指測試分數能否有效的預測或估計某種行為表現。也就是一種測量的結果,與某種已證明有效的效標測量結果的相關程度。當有效性系數接近l時,說明該測量手段有效程度高;如果有效性系數接近0,則說明該測量手段有效程度低。

由于目前我國還沒有一套評價兒童大肌肉動作發展情況的量表,本文對于測定效標效度的“效標”就采用學生體育課的運動成績及體育教師日常的評價。抽取德州市光明小學三年級一班40名學生12項測試動作的總分與他們學期末的體育運動成績進行比較。兩個成績經過標準分的轉換后進行相關分析,效標間的相關系數為0.825,P<0.01,可以認為TGMD-2的效標效度很高,可以接受。同時在測試過程中,通過與體育教師的交流了解到,測試結果與學生平日的體育成績,以及有經驗教師的經驗評定是非常接近的,這也說明TGMD-2的測試結果經受了體育教育工作者的實踐檢驗。
3 結論
(1)大肌肉動作發展是兒童最早發展起來的運動技能,它對兒童的心理發展和社會交往能力發展都有重要的作用。UIrich博士編訂的大肌肉動作發展測驗是專門用來評估3到10歲兒童大肌肉動作發展能力的量表,在多種文化環境下都證實有良好的信度和效度,并廣泛應用于西方國家。因此,在我國研究大肌肉動作發展測驗的可行性是非常必要的。
(2)對我國511名兒童的測驗發現:位移分測驗測試動作的得分情況比物體控制分測驗測試動作要好,其中跑、側滑步、踢球動作的掌握情況較好,擊固定球和上手投球動作掌握情況相對較差。
(3)兒童大肌肉動作的發展能力隨年齡的增長不斷提高,不同的測試動作在不同年齡段表現出各自的特點。在位移分測驗中不存在性別差異,在物體控制分測驗中的踢球、擊固定球等動作上存在非常顯著的性別差異,男生比女生的動作得分要高,但從總體情況來看不存在性別差異。
(4)TGMD-2有良好的信度:不同測試人員之間的信度系數為0.860~0.922;不同測試動作之間的內部一致性信度系數為0.709~0.925,不同性別的內部一致性信度系數為0.920~0.962,不同年齡的內部一致性信度系數為0.755~0.930;重測信度系數為0.871~0.948。不論是測試者信度、內部一致性信度還是重測信度都符合測量學的要求。
(5)TGMD-2有良好的效度:專家評價以及對測試動作的區分度和難度的分析說明內容效度良好;測試動作之間以及測試動作與總分之間的相關關系和因素分析證明結構效度良好;以學生的運動成績和教師的經驗評價為效標也證明效標效度良好。
(6)TGMD-2的測試內容豐富,量表長度適中,操作簡單,易于掌握,是可靠有效方便可行的測試工具,可以在我國進行推廣應用。
本文只是對TGMD-2的信度和效度進行了檢驗。TGMD-2在中國廣泛應用尚需要一段時間,因為還有大量的研究需要繼續完成,比如擴大測試的樣本,最好能加入農村和不同民族的樣本;修訂測驗中的個別動作和動作標準,以適應中國兒童的實際情況;建立中國地區的常模,用來評價我國兒童的大肌肉動作發展狀況;利用此量表致力于對智障兒童的研究。總之,TGMD-2簡單易行,信度和效度較好,是評價3~10歲兒童大肌肉動作發展狀況的有效工具,值得推廣應用。
[編輯 鄭植友]