陳思同 劉陽 唐炎 蔡玉軍 陳佩杰
摘 要:系統梳理體育素養測評領域的關鍵問題并提出對策,為完善該領域的方法學理論和實踐應用提供借鑒。研究認為,當前體育素養的測評存在以下主要問題:(1)概念不清晰,導致無法確定測評的維度和內容;(2)指標的科學性存在爭議,無法提供可靠和準確的測評結果;(3)體系構建存在方法學的不規范;(4)體系應用僅停留在個人層面,無法有效推廣到大規模人群層面。研究建議,進一步對體育素養概念進行辨析,確定測評的維度和內容;根據確定的測評維度和內容優先考慮成熟的測評工具構建測評體系;采用主觀和客觀的方式全面選取專家,評估測評模型;對于體系的應用要進行大規模的人群試驗,以驗證體系的可適性;放棄傳統的測評方式,采用定量和定性測評相結合的方式,研制以動態測評為主要方式的個性化測評體系。
關 鍵 詞:學校體育;體育素養;測量與評價;指標體系
中圖分類號:G807 文獻標志碼:A 文章編號:1006-7116(2019)05-0110-08
Abstract: The authors systematically collated key problems in the physical literacy measurement and evaluation area and put forward suggestions and countermeasures, so as to provide reference for perfecting methodological theories and practical application in this area, and concluded that current physical literacy measurement and evaluation had the following main problems: (1) unclear concepts, resulted the failure to determine measurement and evaluation dimensions and contents; (2) there was controversy about index scientificness, the indexes were unable to provide reliable and accurate measurement and evaluation results; (3) system construction was not standardized in terms of methodology; (4) system application stayed at the individual level, could not be effectively generalized to a large-scale population level. The authors put forward the following suggestions: further clarify the concept of physical literacy, determine measurement and evaluation dimensions and contents; preferably consider using a mature measurement and evaluation tool to build a measurement and evaluation system according to the determined measurement and evaluation dimensions and contents; in a subjective and objective fashion, comprehensively select experts to assess the measurement and evaluation model; large-scale population test should be done for system application, so as to verify the feasibility of system application. The authors also suggested giving up the traditional way of measurement and evaluation, and adopting the quantitative and qualitative measurement and evaluation combined way to develop an individualized measurement and evaluation system that uses dynamic measurement and evaluation as the main way.
Key words: school physical education;physical literacy;measurement and evaluation;index system
體育教育作為教育活動的重要形式之一,對全人發展的價值已經得到廣泛認可[1]。近年來,體育教育理論得到重要發展。其中,最為重要的就是體育素養概念(Physical Literacy,PL)的提出(注:有關PL的翻譯,有學者認為應當譯為“身體素養”,但是學界尚無統一表述,因此本研究暫將PL譯為體育素養),這一概念極有可能對未來體育教育帶來變革[2]。國外體育素養概念創始人Whitehead將體育素養定義為“個體在一生中維持適當水平身體活動所需的動機、信心、身體能力、知識和理解”[3]。隨后,Whitehead更新體育素養定義,即個體在一生中參加身體活動的動機、信心、身體能力、需要重視的知識和理解、責任。20世紀初,我國素質教育熱潮也引發體育學者“本土”體育素養概念的提出和思辯,以賴天德教授為代表的學者提出了不同理解。隨后,陳思同等[4]對國外體育素養概念進行了分析,結合我國已有研究提出了新的解釋——人類在生命過程中獲得的利于全人生存發展的運動要素的綜合能力。盡管存在研究邏輯、語言和文化的差異,但是國內外學者都從多維度視角將體育素養理解為維持身體活動或運動的一種綜合能力。圍繞體育素養這一概念,國內外學者在概念辨析[4-5]、測評工具研制[6-7]和實踐推廣[8-9]等方面進一步展開大量研究。以這些成果為基礎,美國、加拿大(部分地區)進行了新一輪的體育教育改革,將“培養具備體育素養的人”(Being Physically Literate)設為體育教育的總目標。與此同時,我國國務院辦公廳也于2016年下發《強化學校體育 促進學生身心健康全面發展的意見》(以下簡稱27號文件),將“全面提高學生體育素養”作為強化學校體育的基本原則,這標志著體育素養這一概念已經逐步從學術研究領域拓展到社會教育實踐層面。
在實際教育情境下,作為體育教育的目標和學校體育的重要原則,體育素養測量與評價的重要性不言而喻。國內外學者對于體育素養的測評研究已經有近20年的歷史并取得一定成果,推動了該領域的發展。以加拿大學者為代表,Tremblay[10]和Longmuir[11]帶領的科研團隊歷經近10年的時間開發出加拿大體育素養測評工具(Canadian assessment of Physical Literacy,CAPL),并于2018年完成改良。此外,Lodewyk[12]和Cairney等[13]也相繼開發適合不同年齡兒童青少年的體育素養測評工具。美國和英國一些教育組織或協會也開發了針對兒童青少年的體育素養測評工具,并在實際中得到應用[14]。我國學者對體育素養的測評也有多年研究歷史。2002年,陳琦[15]對學生體育素養的測評進行了初步探索,并構建了7個指標的體系。隨后,于秀等[7]帶領的科研團隊對學生體育素養的測評工具進行研究,開發了相對完整的測評工具并對我國部分城市的中小學生進行了調查。近年來,一些國內研究者對國外研究進行介紹,主要集中于對加拿大研究者開發的測評工具的介紹和分析。比如,陳思同和劉陽[6]介紹并分析了CAPL的特點,趙雅萍等[16-17]先后報道加拿大青少年體育素養測評體系(Passport for Life,P4L)和加拿大體育素養測評體系(Physical Literacy Assessment for Youth,PLAY)。上述3種已在國內公開報道的測評工具為今后研究提供了研制思路和方法范式,但這些測評體系仍存在一些問題,并引發學者的探討[6]。比如,測評體系的測量可靠程度、反映概念內涵的全面性以及實際應用的可適性。然而,有關當前體育素養測評的問題和不足國內研究鮮有報道,且大多數研究局限于兒童青少年人群,未拓展到其他年齡段人群,甚至是特殊人群。
盡管體育素養測評面臨一些問題和挑戰,但從教育需要和政策執行的角度來說,體育素養的測評至關重要。首先,測評體育素養是全面評價體育教育成效的重要方式,這不僅反映了體育教育工作的效果,也反映了學生體育學習的效果及質量。其次,體育素養的測評更是調整和改進未來體育教育工作的實證基礎。此外,體育素養作為一個綜合性概念,評價方式突破了過去體育教育采用單一評價方式(如單以體質健康測試為評價方式)的弊端,為教師、學生、家長和政策制定者提供了全面的體育教育評估措施。在當前我國教育綜合改革的背景下,研究體育素養的測評有利于高考綜合改革的實施和推進,為建立綜合素質評價制度提供可靠的評估工具。最后,從長遠角度來看體育素養作為制定公共健康政策的依據勢在必行,因為其測評結果為政策的“有效制定”和“精準落實”提供了重要的決策依據。因此研究有必要解決當前體育素養測評中的問題,開發出科學的測評工具。綜上,體育素養測評研究領域尚處于“萌芽階段”[18],仍有許多問題需要回答。有鑒于此,本研究旨在系統梳理國內外體育素養測評研究的基本現狀和關鍵問題,并提出建議和對策,以進一步完善體育素養測評的方法學基礎,指導體育素養測評的實踐和應用,以期為未來研究提供啟示。
1 體育素養測評的現狀
到目前為止,世界上關于體育素養測評研究仍處于起步階段[14,18],但存在很多爭議問題。在可考證的學術文獻和公開資料(測評手冊、操作協議等)中,加拿大研究人員是該領域的先鋒。我國部分學者已經對加拿大開發的3種體育素養測評工具進行了介紹,分別為CAPL[6]、P4L[16]和PLAY[17]。CAPL由加拿大學者Tremblay和Longmuir及其團隊開發,針對8~12歲兒童青少年。基于常模參照和標準參照評價標準,CAPL能夠給每位測試者提供全面評價。盡管如此,關于CAPL的質疑仍然值得關注,如其測評時間成本較高以及測量準確性較低。P4L是針對幼兒至12年級青少年的測評工具,每個年齡段的測評指標和方式存在不同。作為一個過程性評價工具,P4L為體育素養的發展提供了很好的參考標準。但是,關于P4L的爭議,比如非綜合性測評、可靠性不足也需要引起研究者重視。PLAY系統是一套針對青少年的體育素養測評工具,可以從不同視角對受測對象進行評估。其測評結構由PLAY-fun、PLAY-basic、PLAY-self、PLAY-parent、PLAY-coach和PLAY-inventory構成,具有關注變化趨勢、形成“立體環繞式”評估的優勢。但是,針對PLAY系統不足的爭論也一直存在,比如測量的可信度、項目過于繁瑣、分數不易理解。
目前美國沒有公開的體育素養測評工具,但是美國學者正積極推廣體育素養理念。雖然暫無專門體育素養測評工具,但是一些研究學者利用現有測評工具作為“代替辦法”測評兒童青少年的體育素養。比如,PE Metrics(一種體育教育評價綜合性工具)就被采用[19],作為評估兒童青少年體育素養的工具。但是,這種測評無法反映兒童青少年的體育素養水平。與美國類似,英國也未開發綜合的體育素養測評工具。部分體育和教育協會,比如英格蘭青少年體育基金會(Youth Sport Trust)、體育威爾士(Sport Wales)、北愛爾蘭年輕人體育(Young People & Sport)和體育蘇格蘭(Sports Scotland)的計劃——運動吧!智者(Better Movers and Thinkers)都在Whitehead的學術理念影響下開展了一系列測評研究,但效果并不理想。這些計劃中,有些側重于運動技能,但忽視了心理和動機維度;有些側重于運動能力,但無法體現體育素養概念的全面性。
近年來,澳大利亞學者對體育素養的相關研究也得到了學界關注。澳大利亞體育教育專家Keegan領銜的團隊圍繞體育素養的概念辨析、測評工具、教育標準和政策制定開展了深入研究[20]。但是,澳大利亞學者也未能開發出一個相對合適的體育素養測評工具。他們認為當前體育素養測評研究總體處于無法反映概念本質的模糊狀態,這可能與概念本身還未辯析清楚有關。
陳琦[15]是較早涉及該領域的中國學者,他于2002年就學生體育素養測評進行初步探索,并提出7個指標的體系。但是,該測評指標體系是否具有可行性尚需論證。于秀等[7]對學生體育素養測評工具進行一些研究,并開發相對完整的測評工具,對我國部分城市的中小學生進行了調查。然而,在這一測評體系中部分指標的測量難度較大,如體育道德,因為至今仍未有公認的行為學或心理學測量工具;該測評工具并未研制出體育素養水平的總評指標得分,無法反映學生體育素養的總體水平。此外,個別研究就大學生體育素養測評進行了分析,但過于簡單,類似于“拼湊”測評工具。隨著研究的深入發展,一些學者開始介紹國外研究[6,16-17],這也一定程度推動了我國相關研究的進步。但是,針對中國人群較為認可的體育素養測評工具仍然處于“空白”狀態。
盡管過去我國的研究存在局限,但目前少數關于體育素養測評工具的研究已經取得了一定突破。比如,上海體育學院牽頭進行的學生體育素養測評體系研究在國內外相關專家的支持下已經初步完成了體系構建,該測評體系在綜合國內外相關研究的基礎上對研制方法進行了改進,一定程度能夠減少過去國內相關研究的局限。
2 體育素養測評的挑戰
雖然一些國家的學者對體育素養測評進行了較為深入的探討[14,18,21],但是當前體育素養測評研究的局限性和爭議性仍是學界面臨的挑戰。受制于過去研究的視角,我國并無系統分析這些挑戰的相關研究,以下從概念的差異、指標的科學性、體系的構建、體系的應用以及其他問題5個關鍵方面進行詳細分析。
2.1 概念的差異
現代實證科學的邏輯起點就是明確概念,提出清晰的理論定義,進而對理論定義進行操作化,形成操作定義,最后發展測評工具。因此,測量體育素養的首要前提則是明確概念的理論和操作定義。操作化是科學研究中必不可缺的一個環節。基于經驗觀察,通過操作化過程,將抽象概念轉化成一套可以觀察或者測量的指標體系或工具(如具體的測量問卷、量表)。事實上,形成合適的觀察或者測量指標體系或工具是開發體育素養測評工具的最終目標。因此,有關體育素養理論定義和操作定義的關鍵問題,就是最終形成的測評體系中應該包含哪些內容。
首先,在概念的理解上國內外學者都提出了多種且不同的辨析[4-5],這導致了體育素養的概念定義存在定義不清晰和構成元素不同的情況,進而導致不同的測評維度和內容。舉例來說,如采用Higgs[22]的“在不同身體活動、律動運動和競技運動情況下,兒童自信、可控制地參與活動的基本運動能力和運動技能”的定義,按照此思路體育素養概念的構成元素就是環境(對應不同情況)、心理情感(對應自信)、身體能力和運動技能(對應基本運動能力和運動技能)。因此,上述內容應該作為測評的具體內容。事實上,盡管不同學者對體育素養概念的理解存在差異,但是大部分學者都認同體育素養是一個綜合性概念[3-5],包含行為、情感、認知和效果等多個維度,而并非一個僅僅涉及身體的概念。因此,Higgs[22]的概念缺少認知這一構成元素。再如,采用Whitehead[3]的概念,就應該包括日常行為、身體能力、知識理解和情感動機,這在CAPL中得到體現。又如,在P4L中生存技能作為一個重要方面被納入測評。關于“生存技能”這一部分是否是體育素養的維度,理論層面上一直沒有得到很好解答。因為從概念上分析,生存技能是比體育素養更為廣泛的上位概念。因此,概念不清晰和差異造成了當前研究無法明確概念的構成元素,導致研究者無法明確哪些元素需要測評,進而對未來的概念操作化造成困難。由此可見,不同概念定義對于測評維度和內容造成了差異。那么,哪些構成元素是體育素養概念的構成,進而被納入測評體系進行操作化呢?當前研究似乎沒有一致認同。
其次,關于體育素養概念的定義都存在不同程度的抽象性[5]。盡管一些定性測量遵從體育素養概念的理論基礎——身心一統的一元論[23],但是在具體測量時如何反映這個概念的整體性仍存在問題。以Whitehead的定義為分析樣本(國外大部分學者都參照Whitehead的定義),國外體育素養概念本身就是根據一元論、存在主義和現象學等抽象的哲學理論構建的,這使得體育素養概念的特性和內涵存在不同程度的抽象性。在Whitehead[3]的概念中提及了“個體閱讀環境”和“與外界環境進行交互式互動”類似的特性,試問如何理解“閱讀環境”和“與外界環境交互”,這些構成元素如何被定義、如何被操作化等需要進一步闡明。賴天德[24]提出的“體育的文化水平”,馮古首等[25]提出的“人的各種體育精神要素及其品質的綜合”,余智[26]提出的“綜合體育素質與修養”,楊獻南等[27]提出“對身體和精神文化內在追求的綜合性文化塑造”,這些包含“文化”“精神”“修養”和“內在追求”字眼的體育素養概念內涵特性,抽象甚至“形而上學”,那么這些概念構成可以被定義么?進而被操作化進行測評么?再如,我國一項關于城市學生體育素養研究提出了包含“體育道德”這一指標在內的測評體系[7]。然而,到目前為止有關兒童青少年體育道德的測量與評價,由于概念不明確、工具不完善等問題仍有很多爭議[28]。因此,在測評個體的體育素養過程中,測量個體的體育道德是否合理或者能夠被測評仍需要探討。
美國著名體育學研究者Corbin[29]提出,應該就體育素養的各個構成元素開發特定具體的測評工具。然而,Whitehead提出的概念指出體育素養概念的構成元素是彼此交互的,且隨著環境和文化背景而改變。也就是說,在明確概念構成元素基礎上構成元素之間的關系也需要測評。如果采用Corbin的理念,“拼湊”一套測評體系無法體現構成元素之間的關系,似乎有“1+1 < 2”之嫌,更無法體現概念的整體哲學思想。因此,當前測評工具能否完全反映體育素養概念的整體抽象性及其構成元素的交互關系,學界存在很大爭議。
2.2 指標的科學性
即便已經確定體育素養的測評維度和內容,其測評指標都有具體操作化條件,而體育素養的測評指標仍有一些問題需要考慮。按照評估理論,測評指標需要從可行性、信度、效度和敏感度4個方面進行評估。Longmuir[18]指出當前研究中,體育素養概念的部分維度和內容還未有較好的測量方式,比如信心、動機和知識在目前測量領域內還無法被直接測量。再如,測量個體身體活動參與的責任和價值判斷也無可行工具。也就是說,目前這些維度和內容的測評似乎并沒有一套可行的方式。此外,Whitehead指出體育素養測評應該貫穿個體一生并反映“體育素養的歷程”,同時放棄傳統的常模參照和標準參照,但是目前的研究未能在這方面有所突破,也未能開發出可行的測評工具。
在測評工具的信度和效度上,一些問題仍需要研究者重視。關于體育素養的體質水平維度,我國一些學者采用《國家學生體質健康標準》(或者該標準的2014修訂版,以下統一簡稱《體質測試標準》)作為測評工具。《體質測試標準》作為國家推廣的測評體系,能夠保證測量工具的統一性,具有高度的可行性,但是這一標準也存在爭議。以心肺耐力測評為例,《體質測試標準》采用男生1 000 m和女生800 m作為具體測評方法。心肺耐力是指在鍛煉過程中向肌肉運用氧氣并利用氧氣產生能量以支持肌肉活動的能力,所體現的重要特性就是個體在長時間過程中肌肉繼續工作的能力,而男生1 000 m和女生800 m的測評不符合上述概念。因為,個體1 000 m和800 m的測評以時間作為評價基準,無法體現個體的長時間做功能力,導致測評效度存在爭議。在信度方面,Edwards等[21]指出定性測量的效果受到測評人員經驗的制約,倘若是經驗不足的測試人員,那么測量結果的可信度更難以保證。因此,采用定性工具測量對體育素養進行評估仍需持謹慎態度。
在測評的敏感度上大部分研究還未涉及,僅有CAPL-2(CAPL第二版)對這些問題進行了研究[30]。測評敏感度可以分為測評模型理論和實際敏感度。早先,CAPL-1分為日常行為、身體能力、動機和信心以及知識和理解4個維度,共計25個指標。但是,后續研究發現部分指標對體育素養測評的理論模型并無太大貢獻,進一步導致部分指標在反映其所在維度時存在敏感度較低的問題。因此,研究人員對CAPL進行了新一輪的因子分析,形成了新的CAPL-2[31]。此外,測評工具敏感度在實際應用中具體表現為測評能否有效區分個體在某方面的差異。比如,在體育素養的知識測評中測評工具能否反映個體間在知識水平上的細微差異。倘若測評工具無法反映個體在某方面存在的明顯差異,那么這樣的工具在測評敏感度上便存在明顯缺陷,無法進行準確測評。因此,當前關于體育素養測評的研究在這些方面需要改進,以進一步檢視測評工具的科學性。
2.3 體系的構建
在當前體育學研究中,德爾菲法是常用的構建完善測評體系的科學方法。比如,CAPL就采用德爾菲法構建其測評的理論模型[11]。CAPL研究團隊選取來自6個領域(兒童青少年身體活動、健康體適能、身體活動和體適能測評、運動技能發展、認知和殘疾人適應身體活動)專家作為征詢對象,對體育素養測評體系的構建進行評判。從整體上來看,6個領域專家基本能夠涵蓋體育素養概念的內涵,保證測量工具的完整性。但是CAPL研究并未報告測評理論模型的穩定性[11],所以無法得知專家對理論模型的貢獻大小以及模型質量。我國也有學者采用德爾菲法選擇專家構建學生體育素養的測評體系,但是一些問題依舊需要商榷。比如,一項研究選擇教育學、心理學和體育學領域的專家構建測評體系[7]。選擇這3個方面的專家固然正確,但是在當今科學研究精細化的背景下,有可能出現上述3個領域的專家顯得過于寬泛,因此對體育素養概念會出現不了解的情況。比如,研究運動生物力學的專家很有可能不太了解體育素養概念,即便了解也不能保證其達到研究需要的水平。不可否認,構建測評工具的研究者也會認可上述假設并實施了相應的問題規避。倘若研究者能更加精細化地區分專家的研究領域,選擇與體育素養內涵最為相關的高水平專家并就理論模型的穩定系數予以適當報告,不僅有利于提高所構建的測評體系的質量,也有利于未來研究的進一步改進。就專家的選擇方式而言,如何選擇高水平專家也關系到構建測評體系的質量。理論上講,一方面主觀選擇專家容易造成一定的“臆斷”,極有可能選擇的專家不了解體育素養概念及其內涵;另一方面主觀選擇專家可能會遺漏體育素養領域及其相關領域的專家,無形中降低了專家庫的“質量”,影響所構建體系的質量。
除了內容不同,構建體育素養測量方法也存在不規范的地方。陳思同等[6]已經對我國一些體育素養測量工具提出了意見和建議,發現一些測評工具在研制過程中未采用嚴格的方法學程序,因此所提出的體育素養測量的構成內容有待論證。在國外研究中,除了一些現有的體育素養測量內容與當前公認的體育素養構成內容的一致性較低外,方法學上的問題依然存在。比如,PLAY和P4L的研制方法就未能像CAPL一樣,公開具體的方法學步驟。因此,學界無法判斷這些未公開方法學步驟的體育素養測評構成內容的科學性。因此,考慮到體育素養內涵的廣泛性,選擇哪些領域的專家能夠較好涵蓋概念的內涵范圍,通過什么樣的方法選擇專家才能保證專家質量的客觀性,同時以上述問題為基礎衍生出的新問題,如“根據專家的研究背景如何請專家進行判定,如何根據專家意見整合測評體系的測量指標,如何根據專家意見進行測評體系的修改等問題”,都是未來研究者需要考慮的。除與德爾菲法相關的技術問題,更多問題亟待方法學知識提供解決方案。
2.4 體系的應用
一般來說,能夠在實踐中服務科研目的的測量工具必須具有較強的可操作性。遺憾的是,現有體育素養測評工具的可操作性并未得到研究者重視。
在CAPL-2中,研究者對原有知識和理解部分的測評問卷進行修訂,認為該問卷的可操作性較強[32]。而其他研究并未報告測評工具的可操作性,而測評工具的可操作性需要在實踐中予以確認。諸如測評體系的時間、空間和實施經濟成本,這些有可能影響測評工具的應用以及測評質量。在時間上,測評時間太長可能會造成測試對象的消極情緒,進而“抵觸”測評過程,降低測評的有效性;在空間上,開展測評的空間過大可能會導致無法有效監控測評過程,潛在威脅測評質量;在經濟成本上,所需花費過大可能會提高整個研究項目的難度,影響后續研究的開展,最終造成研究項目的“流產”。以CAPL為具體案例,在配備5名測試者的情況下完成對每20~25位個體的測評(除行為部分中的身體活動測評)共計花費1.5小時。實際上,這還不包括行為部分中的身體活動測評,因為該指標采用的是“在連續7天中對個體的步行數(Walk Steps)進行測評”。可以看到,CAPL的測評時間花費較長,那么這些潛在的問題是否會影響測評。此外,現有測評工具的可操作性是以個人的測評時間為評估手段,假設將這些測評工具應用到大規模的人群測量中,比如類似我國學生體質健康測試,還會有哪些問題呢?現有研究尚無法給出明確答案,這也提示未來研究者需要對測評工具的可操作性進行分析,尤其是在特定的不同環境和不同人群中。
2.5 其他問題
除上述問題以外,體育素養測評仍存在一些其他不容忽視的問題尚未得到較好回答。如當前研究主要針對12歲以下人群[21],可能這一階段是發展體育素養的關鍵時期,而針對幼兒人群的測評鮮有報道。此外,對于老年人群的測評研究還處于理論模型構建階段[9]。這也說明針對不同年齡段人群的測評研究之間存在許多“真空狀態”。按照Whitehead的觀點,體育素養是貫穿全人生命周期的概念,應當對所有人群的體育素養測評予以足夠重視。因此,未來應該加強對不同年齡段人群的測評研究。
Whitehead將體育素養的發展階段分為學齡前、兒童、青少年、青年人、中年人和老年人6個階段,而健康個體生物發展軌跡基本遵循這6個階段的變化。但是有必要指出的是,每個人在不同階段的身體、心理和所處環境等特點都存在不同,同時體育素養概念又表明身體、心理和環境等這些屬性存在交互關系,那么標準化的測評工具尤其是定量測量工具是否能有效地對個體的體育素養進行測評。此外,在獨立的體育素養發展階段,比如兒童階段(一般指5~12歲),其身體和心理特點隨著年齡的變化也呈現顯著變化,那么標準化工具是否能準確反映出這些變化也值得商榷。同時,當前主要在體育教育環境還是身體活動環境下的測量也存在爭議[29,33]。而測量不同環境下不同活動的心理學特性,采用同樣的工具是否合適也尚無定論。在測評體育素養時,一個特性隨時間的“變異性”也需要研究者予以考慮。比如,短時間內知識水平隨著時間的變化不會產生太多變動,而動機和信心部分隨著時間以及環境的影響會產生顯著變化。也就是說,個體的一些體育素養特性是“短暫的”,其狀態會發生明顯變化。當前傳統的測評工具采用標準化方式,幾乎無法觀察個體一些特性的變化。因此,在測評體育素養時這些問題也需要慎重考慮。
體育素養的一些維度已經有成熟的測評工具。比如體能部分,美國FitnessGram針對美國兒童青少年體適能水平開發的標準參照測評工具,兒童青少年能夠通過此工具了解自己的體適能是否屬于健康水平。但是,體育素養的總體評價采用這樣的方式是否適合還不得而知。盡管CAPL采用這樣的方式,但是按照Whitehead的觀點,個體的體育素養不應該采用比較方式進行評估[14],因此傳統的常模參照和標準參照似乎不適合評價個體的體育素養水平,那么對體育素養的評估是否能按照以往經驗采用常模參照或標準參照還不得而知。Corbin[29]提出,體育素養的測評可以采用自評、個性化評價和人群評價,但是他的觀點僅僅處于構想階段,要落實到具體操作還需要更多研究。在這3種評價類型中,人群評價似乎有悖于體育素養個性化的理念。因此,體育素養是否需要進行人群評價值得探討。還有一個值得注意的地方,一些測評工具將不同維度進行了組合從而進行評價。這種組合方式看似是符合體育素養概念的定義,但是如何解釋這一組合概念的分數呢?Corbin[29]對此提出質疑。在實際的現場測評中,測評體育素養的成本也是一個重要因素。此外,采用過程性評價還是總結性評價又是另一個值得思考的問題。現有的一些測評工具僅能有效測評體育素養概念的部分,比如體能和技能。
3 體育素養測評的未來
第一,在確定體育素養概念的定義上優先考慮綜合性概念。Edwards等[21]研究表明,當前大部分研究都采用Whitehead的定義。因此,建議未來研究可以采用她的定義作為測評的起點,確定哪些構成元素納入測評范圍,這也有利于未來研究進行橫向比較和分析。由于Whitehead的概念扎根西方文化不一定適合我國研究,因此選擇一個兼具“國際性”和“民族性”的概念則是一個可取的辦法,陳思同等[4]提出的概念定義則為這種嘗試提供了依據。
第二,在確定概念后對于概念的操作化,優先考慮可以被操作化的構成元素,且這些構成元素已經具備成熟的測評工具。當然,這些暫時無法測評的構成元素,比如體育道德、構成元素之間的交互性以及概念的整體哲學性等,隨著研究的發展未來一定能得到令人信服的回答。
第三,在體系構建方面,所選擇的指標應該符合體育素養概念構成元素的范疇,確定初步的體育素養測評模型,所選擇的評判專家應該來自更為廣泛的領域。因此,專家的研究背景是否符合體系構建的需求需要進一步斟酌。以現有的研究技術,人工選擇和工具輔助相結合的方式則是可行的辦法。比如,研制開始前研究者可以依據經驗選定一些專家,作為后備人選,然后,采用CiteSpace等工具進行再次遴選,根據該軟件提供的數據輔以實證依據的參考,以提高專家選擇的合理性。
第四,有關體系應用上,應重視對測評體系應用效果的評估。體育素養測評體系的應用是一個動態改良過程,需要結合環境和人群特點以及測評效果進行調整和優化,以求用最小成本獲得最可靠準確的測評結果。
除以上之外,一些學者提出新測評思路有助于解決本研究無法回答的問題。由于傳統方法的局限,采用簡單、線性的方法無法有效測評體育素養概念,因此,Green等[14]、Longmuir[18]建議采用圖示法代替傳統的測量和評價方法。理由如下:
體育素養是個人且無法與他人進行比較的特性。Whitehead對傳統測評帶來的“橫向比較”表示擔憂,因為這不利于體育素養的個性化發展。此外,體育素養是一個涉及到個體天賦、所處環境和適應文化的概念,在此背景下每個人都是獨特的,無法進行比較。因此,采用圖示法這樣的方法適合記錄個人的體育素養發展。另一方面,體育素養是貫穿個體一生發展的動態且非線性的過程,傳統測量方法無法反映過程和結果[14]。采用時間歷史的方法是記錄體育素養發展的一個方式。Whitehead認為體育素養的發展沒有終點,而當前經典的測評方式基本采用常模和標準參照對個體進行評估。
如何從新的視角構建體育素養的測評呢?Green等[14]提出了一些構想。他們以體育素養的屬性是交互的,并以整體視角這一觀點切入,提出體育素養概念包含身體、情感、認識,體育素養的發展是非線性過程,因此提出了一些具體措施。在測評的本質上,體育素養測評要以行為變化為主要觀測點入手,與其相關的認知、心理和情感部分也需要進行測評,這些維度的權重相同;在測評過程中需要考慮文化和環境的特點;測評形式以自我比較為主要形式,避免傳統的常模參照和標準參照比較;測評目的以觀察增長為主,促進個體進一步提高;測評數據收集和分析通過觀察個體體育素養的增長,能夠反映個體的體育素養發展過程,通過不同的呈現方式,比如視頻、圖片和反思性文本來觀察個體的變化。
也就是說,未來的體育素養測評要以整體觀(身心一統的一元論)為測評的核心思想,放棄傳統的測評方式,建立以自我比較為基礎的測評體系,采用定性和定量相結合的方式,對個體的體育素養進行個性化的動態描述[14,21]。體育素養作為一個隱喻(形而上學)的學術概念,其測量并非是將其構成部分的逐一測量與再次整合[14]。盡管一些研究提供上述思路,但目前研究還未提出相關理論和依據。相信隨著未來研究的深入,體育素養的測評問題終將會被學者們一一攻克。
體育素養研究目前仍處于“問題多于答案的幼年期”,就如何測量體育素養這一命題而言,由于不同研究視角尚存的爭議,概念的綜合和復雜性以及操作過程中涉及到各方面問題,體育素養的測評研究還有很長路要走。本研究的目的,一方面旨在介紹當前關于體育素養測評的一些理論和實際問題,并提出一些嘗試性的解決對策甚至是假設。另一方面,也試圖“拋磚引玉”,希望更多學者參與到這一研究命題討論中,為體育素養測評研究的推動提供更多智慧。有必要說明的是,本研究中的部分問題目前仍無較好的解決方案,是當前以及未來研究面臨的挑戰,因此本研究對這些問題僅做一些建議性回答,為未來研究提供參考,同時期待著更多學者能夠參與到體育素養測評的研究中,為我國體育素養測評提供更多智慧。
參考文獻:
[1] 邵偉德,邵天逸,李啟迪. 學校體育價值論[J]. 北京體育大學學報,2016,39(7):83-88.
[2] CHEN A,SUN H. A great leap of faith:Editorial for JSHS special issue on physical literacy[J]. Journal of Sport and Health Science,2015,4(2):105-107.
[3] WHITEHEAD M. The concept of physical literacy[J]. European Journal of Physical Education,2001,6(2):127-138.
[4] 陳思同,劉陽,唐炎,等. 對我國體育素養概念的理解——基于對Physical Literacy的解讀[J]. 體育科學,2017,37(6):41-51.
[5] EDWARDS L,BRYANT A,KEEGAN R,et al. Definitions,foundations and associations of physical literacy:A systematic review[J]. Sports Medicine,2017,47(1):113-126.
[6] 陳思同,劉陽. 加拿大體育素養測評研究及啟示[J]. 體育科學,2016,36(3):44-51.
[7] 于秀,孫夕鷺,劉海燕. 城市學生體育素養評價指標的研究[J]. 沈陽體育學院學報,2012,31(5):1-5.
[8] 陽藝武. Physical Literacy:內涵解讀、中外對比及教學啟示[J]. 上海體育學院學報,2016,40(4):73-78.
[9] JONES G,STATHOKOSTAS L,YOUNG B W,et al. Development of a physical literacy model for older adults:A consensus process by the collaborative working group on physical literacy for older Canadians[J]. BMC Geriatrics,2018,18(1):13-24.
[10] LONGMUIR P,BOYER C,LLOYD M,et al. The Canadian assessment of physical literacy:Methods for children in grades 4 to 6 (8 to 12 years)[J]. BMC Public Health,2015,15(1):767-778.
[11] FRANCIS C,LONGMUIR P,BOYER C,et al. The Canadian assessment of physical literacy:Development of a model of childrens capacity for a healthy,active lifestyle through a delphi process[J]. Journal of Physical Activity and Health,2016,13(2):214-222.
[12] LODEWYK K,MANDIGO J. Early validation evidence of a Canadian practitioner-based assessment of physical literacy in physical education:Passport for life[J]. Physical Educator,2017,74(6):441-475.
[13] CAIRNEY J,CLARK H J,JAMES M E,et al. The preschool physical literacy assessment tool:Testing a new physical literacy tool for the early years[J]. Frontiers in Pediatrics,2018,6(9):138.
[14] GREEN N,ROBERTS W,SHEEHAN D,et al. Charting physical literacy journeys within physical education settings[J]. Journal of Teaching in Physical Education,2018,37(3):272-279.
[15] 陳琦. 學生體育素養的評價[J]. 體育學刊,2002,16(6):12-14.
[16] 趙雅萍,孫晉海. 加拿大青少年體育素養測評體系“生命護照”研究及啟示[J]. 成都體育學院學報,2018,44(4):92-97+102.
[17] 趙雅萍,孫晉海. 加拿大青少年體育素養測評體系PLAY解讀及啟示[J]. 首都體育學院學報,2018,30(2):10-15.
[18] LONGMUIR P,TREMBLAY M. Top 10 research questions related to physical literacy[J]. Research Quarterly for Exercise and Sport,2016,87(1):28-35.
[19] ZHU W,RINK J,PLACEK J,et al. PE metrics:Background,testing theory,and methods[J]. Measurement in Physical Education & Exercise Science,2011,15(2):87-99.
[20] KEEGAN R. A sceptic's introduction to physical literacy:Is it new? Is it science? And is it worthy of study?[J]. Journal of Science and Medicine in Sport,2014,18(Supplement 1):e101.
[21] EDWARDS L,BRYANT A,KEEGAN R,et al. 'Measuring' physical literacy and related constructs:A systematic review of empirical findings[J]. Sports Medicine,2018,48(3):659-682.
[22] HIGGS C. Physical literacy—Two approaches,one concept[J]. Physical and Health Education Journal,2010,76(1):6-10.
[23] WHITEHEAD M. Physical literacy:Philosophical considerations in relation to developing a sense of self,universality and propositional knowledge[J]. Sports Ethics and Philosophy,2007,1(3):281-298.
[24] 賴天德. 試論素質教育與學校體育改革(上)[J]. 中國學校體育,1998,18(11):64-66.
[25] 馮古首,王勇慧. 體育素養教育模式研究[J]. 山西師大體育學院學報,1999,6(2):24-26.
[26] 余智. 體育素養概念研究[J]. 浙江體育科學,2005,27(1):73-76.
[27] 楊獻南,鹿志海. 形式邏輯視角下的體育素養概念辨析[J]. 南京體育學院學報(社會科學版),2015,14(2):89-92.
[28] 祝大鵬. 運動員體育道德:概念、測量、影響因素與展望[J]. 武漢體育學院學報,2013,47(7):64-70.
[29] CORBIN C. Implications of physical literacy for research and practice:A commentary[J]. Research Quarterly for Exercise and Sport,2016,87(1):14-27.
[30] GUNNELL K,LONGMUIR P,BARNES J,et al. Refining the Canadian assessment of physical literacy based on theory and factor analyses[J]. BMC Public Health,2018,18(2):1044-1052.
[31] LONGMUIR P,GUNNELL K,BARNES J,et al. Canadian assessment of physical literacy second edition:A streamlined assessment of the capacity for physical activity among children 8 to 12 years of age[J]. BMC Public Health,2018,18(2):1057-1068.
[32] LONGMUIR P,WOODRUFF S,BOYER C,et al. Physical literacy knowledge questionnaire:Feasibility,validity,and reliability for Canadian children aged 8 to 12 years[J]. BMC Public Health,2018,18(2):1035-1043.
[33] ROBINSON B,RANDALL L. Marking physical literacy or missing the mark on physical literacy? A conceptual critique of Canadas physical literacy assessment instruments[J]. Measurement in Physical Education and Exercise Science,2017,21(1):40-55.