徐 榮
(湖南師范大學教育科學學院,湖南長沙,410081)
近年來越來越多的研究證實了0—3歲是個體發展的黃金時期,在這一階段,幼兒開始獲得基礎但具有變革性的發展技能,這些技能會對人的終身發展產生深遠影響。有研究證實,早期教育能對國家和社會發展產生重要影響,有利于國家培養高素質人才,從而有效提高國家的競爭力,促進個人的發展。[1-2]科學評估嬰幼兒的身心發展狀況是高質量開展早期教育的前提。處于早期教育階段的嬰幼兒與青少年和成人不同,他們的各方面能力尚未發育完善,因此,其發展評估的方法也具有獨特性。根據評估工具的不同,國內外常用的0—3歲嬰幼兒發展評估方法可分為三種類型:基于量表的評估、基于課程的評估和基于游戲的評估。本研究在介紹國內外具有代表性的嬰幼兒發展評估工具的基礎上,分析每種評估方法的特點,并通過比較,明確其優缺點,為早期教育實踐人員選擇適宜的嬰幼兒發展評估工具提供參考,為其運用評估方法與編制本土化評估工具提出建議,并得出未來有關嬰幼兒發展研究的啟示。
與其他方法相比,基于量表的評估具有很長的發展歷史。世界上第一個教育測驗量表——比納智力量表,其設計之初的目的就是篩選教育中的低能嬰幼兒。隨著歷史演進,量表評估的內容不斷變化,但其主旨一直未變,即診斷、篩選和判斷嬰幼兒是否有潛在的發育問題。專業人員編制量表、問卷等標準化的評估工具后,需要對測驗人員進行培訓,要求測驗人員嚴格遵守固定的測驗程序,準確記錄測試結果,并按照相應方法計算得分。最后通過與常模進行比較或根據量表說明進行分類,得出相應的評估結果,進而確定嬰幼兒在某一年齡段的發育是否正常。[3]
一是國際評估量表。貝利嬰幼兒早期發展量表(以下簡稱貝利量表)是一種在國際范圍內得到廣泛應用的標準化評估工具。貝利嬰幼兒發展量表(第3版)(BSID-Ⅲ)能夠作為嬰幼兒認知、語言、運動、社會情感和適應行為五大早期發展領域的篩查工具(此處的嬰幼兒指從出生到42個月大的嬰幼兒)。[4]然而,使用BSID-Ⅲ進行評估非常耗時,并且需要訓練有素的專業人員在可控的環境中工作。因此,有研究者開發了一些新的標準化工具來解決這些問題,如年齡和階段調查問卷(第三版)和麥克阿瑟交際發展量表。年齡和階段調查問卷(第三版)是用于識別1—66個月大的嬰兒在解決問題、交流溝通、精細動作、粗大動作和個人社會行為方面是否存在發育遲緩的風險的評估工具。[5]麥克阿瑟交際發展量表是一個被廣泛使用的、由照顧者報告的、用于評估嬰幼兒語言發展的工具。[6]與貝利量表相比,這兩個評估工具更便利,評估時間更短,使用方式也更簡單。
二是本土化評估量表。為了評估中國0—3歲嬰幼兒的發展,國內許多學者對貝利量表進行了修訂,并在多個城市與農村地區建立常模。[7-9]此外,有學者編制了適用于評估中國嬰幼兒發展的本土化量表。例如,CDCC嬰幼兒智能發育量表是根據貝利量表改編而成的,它是具有中國特色的指向0—3歲嬰幼兒認知和運動發展的評估工具。[10]中國0—3歲嬰幼兒心理發展量表改編自貝利量表,用于評估嬰幼兒的運動、言語和社會適應能力。[11]中國兒童發育量表由首都兒科研究所開發,并制定了全國兒童發育常模。[12]
綜上所述,用于進行診斷性評估的標準化量表或問卷能夠全面快速地評估嬰幼兒早期發展的多個領域,且常模的建立有助于評估者更準確地了解嬰幼兒的發展水平在同齡人中處于什么位置。但標準化的測量也存在缺乏靈敏度、測試過程過度結構化和缺乏對兒童背景的了解等問題。[13]例如,處于發展中的嬰幼兒的智力發展水平尚未穩定,標準化量表并不能準確反映他們的變化,而嬰幼兒的發展變化往往是非常細微的。[14]同時,基于量表的評估過程通常是高度結構化的,目的是消除無關影響,并符合既定的規范。由于這些限制,當嬰幼兒的行為可能由一個不熟悉的成人在一個不熟悉的地方評估,評估結果可能與嬰幼兒的真實水平相差甚遠。[15]此外,基于量表的評估通常要求比較高,對測驗時的人員與環境均有嚴格規定,因此,量表的生態效度較低,不利于在實際的教育實踐中大規模推廣使用。
基于課程的評估也被稱為課程本位評估(curriculum-based assessments,CBAs),指評估人員直接觀察嬰幼兒在課程中的表現,并根據收集的課程記錄制定教學決策、對嬰幼兒進行課程干預的一系列過程,該方法的一部分評估項目與課程內容一致。[16]兒童早期的評估應具有生態效度,使用真實的評估方法,允許家庭和專業人員之間的合作,并對兒童隨時間變化而產生的發展非常敏感。而與這些要求最為匹配的評估工具是基于課程的評估。[17]CBAs一般采用量表式的標準化測試,測試的目的是通過確定嬰幼兒對標準或非標準的測試項目的滿足程度來衡量嬰幼兒的表現。這種評估工具多運用于特殊兒童的干預領域。[18]
“嬰幼兒評估、評價和干預規劃系統”(assessment, evaluation, and programming system, AEPS)是兒童早期干預領域使用最廣泛的課程本位評估工具之一。它在美國、新加坡、保加利亞等國家的早期干預項目、早期學前教育項目和兒童保育項目中被廣泛使用。[19]AEPS基于對0—6歲存在殘疾風險或已經殘疾的兒童的初步評估和觀察,提供干預和評價信息,設計評價工具,監控兒童進步是能夠反映干預結果的課程內容,提供適宜兒童發展進程的標準化評估工具。目前,AEPS已出版第三版(AEPS-3),經過檢驗證明其信效度良好。AEPS-3包括精細動作(8個項目)、粗大動作(15個項目)、生活適應(15個項目)、認知能力(18個項目)、讀寫(15個項目)、數學(12個項目)、社會溝通(15個項目)和社會情緒(19個項目)八個維度[20],每個維度下有一系列的短期目標和長期目標,每一目標都使用三級評分系統(0=技能無表現,1=技能正在出現、需要提供新的信息,2=技能精熟)進行測量,且1分可以根據嬰幼兒表現打出兩個代碼,即A(Assistance)=協助和I(Incomplete)=不完整。[21]
除此之外,還有一些專門針對自閉癥、多動癥、腦癱兒童的基于課程的評估工具。例如,aSLP(adapted student learning profile)是一種針對多動癥兒童的課程本位評估工具,它包含接受性語言、表達性語言、自發語言、功能程序、學術前概念、游戲和社會互動概念六個維度,每個維度下的具體目標都使用李克特3點評分(1=很少或從未,2=有時或老師提供幫助時完成,3=經常或獨立完成)進行測量,來反映兒童是否掌握技能或掌握技能的程度。[22]
綜上所述,隨著課程改革而發展的課程本位評估已在國外廣泛應用,其與標準化評估相結合能夠更準確地評估兒童的發展,這既能彌補標準化評估的缺陷,也有利于對兒童開展長期的針對性評估。但目前國內的CBAs多關注3—6歲階段的兒童,例如高瞻課程評估和STEM課程評估[23],針對0—3嬰幼兒的課程評估工具尚不成熟,且已有的課程評估工具多集中運用于特殊教育領域。
游戲是嬰幼兒最喜愛的活動,即使是0—3歲的嬰幼兒也能夠積極投入游戲,并在游戲中盡情表現自己。這種表現雖然是無意的,但可以用來評估嬰幼兒的真實發展水平。基于游戲的獨特作用,研究人員開始關注基于游戲的評估?;谟螒虻脑u估與基于量表的評估在評估環境方面的要求相反?;诹勘淼脑u估要求測驗環境嚴謹,不同的嬰幼兒需要在同樣的環境中進行評估?;谟螒虻脑u估要求評估環境真實自然,力求與嬰幼兒平時的游戲環境相似,但與一般的日常游戲觀察有所不同。研究者需要提前確定評估嬰幼兒發展的哪一方面,根據評估目標創設對應的游戲環境,確保嬰幼兒在該環境中表現出來的能力與評估方向一致。例如,評估嬰幼兒的運動能力需要創設運動游戲環境,提供較多的運動材料。完成游戲環境與材料設置后,讓嬰幼兒進入游戲區域自由活動,此時評估人員進行非參與式觀察,記錄嬰幼兒在游戲過程中的表現,并根據評估工具提供的指標一一對應編碼,以此來評估嬰幼兒的發展水平。[24]
基于游戲的評估發展時間較晚,世界范圍內尚未出現較為成熟的評估工具,目前應用較廣的評估工具是以游戲為基礎的跨學科評價法(transdisciplinary play-based assessment,TPBA)。該評價法在2000年由美國丹佛大學Linder的研究團隊開發,其研究從游戲環境的創設、評估團隊的組成和評估流程的操作三方面進行理論闡釋,目的是為教育者提供在日常教育中可操作的理論抓手。TPBA通過設置家庭區、戲劇游戲角、藝術角、沙水區、手工操作角和大型運動器械區六個常見的兒童游戲區角,將0—6歲兒童置身于真實的游戲場景中,再由不同學科的人員從父母對兒童的認知、社會情感、人際交往與語言、身體動作四個方面進行評估,并提供有針對性的干預方案。[25]具體實施評估包括六個階段:非結構性游戲階段、結構性游戲階段、同伴游戲階段、親子活動階段、運動性游戲階段和吃點心階段。評估者在每個階段根據“TPBA觀察指南”對嬰幼兒的行為進行觀察和記錄,并且在活動后與家長進行交流,采集有關嬰幼兒的背景信息。[26]
2008年陳學鋒將該方法引入中國,他在《在游戲中評價兒童——以游戲為基礎的跨學科兒童評價法》一書中詳細介紹了TPBA,但之后僅有少數研究者使用TPBA對嬰幼兒的發展進行評估和干預。例如,王興華等人借鑒TPBA,設計開發了信效度良好的基于游戲的2—3歲嬰幼兒認知發展評價表,嘗試從象征與表征、問題解決、立體圖形匹配、探索建構、注意與參與五個方面評估兒童早期認知發展。[27]
與基于量表和基于課程的評估相比,基于游戲的評估優勢如下。一是游戲是幼兒喜愛的活動,創設的游戲情境真實自然,兒童能夠在環境中最大限度展現其真實的發展水平。[28]二是處于游戲中的兒童能夠能更真實地表現自己,在游戲中開展評估的人員是嬰幼兒熟悉的教師或父母,有利于收集較為客觀的觀察信息,同時,家長參與評估有利于研究者多維度、立體化地收集兒童相關信息,以此作為觀察信息的資料補充。三是基于游戲的評估對測驗流程的標準化程度要求較低,測驗人員具有較強的自主性,當兒童表現出明顯疲憊或對游戲無興趣時,可以依據被測嬰幼兒的表現靈活調整測試流程。[29]
綜上所述,當前國外關于0—3歲嬰幼兒發展評估工具的研究相對豐富,國內的評估工具多引進或改編自國外,但都具有本土化傾向,適用于中國實際情況。無論國內外,基于量表的評估、基于課程的評估和基于游戲的評估三種評估方法都各自有其優勢與局限。
第一,基于量表的評估方法因其標準化的測驗內容與操作要求,具有信效度較高、客觀性較強的優點,有利于建立大規模的常模,因此多用于診斷、鑒別和篩查嬰幼兒是否有發育問題,但由于其生態效度低,不適宜用于早期教育實踐?;诹勘淼脑u估過程通常將嬰幼兒置于一個陌生的地方,由陌生人對其評估,陌生感可能會造成嬰幼兒心理上的緊張和情緒上的焦慮,從而不能較好地反映其真實發展水平。
第二,基于課程的評估方法能夠對嬰幼兒開展長期評估,并且評估內容與課程內容高度相關,評估時的反饋能夠及時作用于課程目標,能夠對嬰幼兒開展針對性評估,以促進其發展。同時,該方法強調組建跨學科的評估人員團隊,要求教師、家長、醫生等不同領域的相關者一并加入評估過程。但目前國內外關于課程本位評估的工具多集中于特殊教育領域,關于0—3歲普通嬰幼兒的評估工具較少。
第三,基于游戲的評估方法能夠保證較高的生態效度,自然的游戲環境與熟悉的評估人員有利于嬰幼兒展現最真實的發展水平,從而保障數據的客觀與結果的科學。然而,該評估方法對評估者有較高的要求,評估者需要根據評估計劃有針對性地創設游戲環境,確保嬰幼兒能夠在環境中展現相應行為從而實現評估目標。[30]此外,生態效度高意味著該方法得出的研究結論難以推廣。基于此,未來0—3歲嬰幼兒發展評估研究需要綜合運用各種評估方法與工具,將標準化評估與真實觀察情境結合起來,打造多角度全方位的評估格局。
根據前文的梳理,當前國內0—3歲嬰幼兒發展評估工具可以從以下幾個方面進行改進。第一,開發專門評估0—3歲嬰幼兒發展的工具。已有評估工具的適用年齡范圍多為3歲以上,一些適用于0—6歲幼兒發展評估的工具并未劃分年齡層次。鑒于此,未來研究需要側重0—3歲嬰幼兒進行工具開發。第二,評估0—3歲嬰幼兒的發展應多采用基于游戲的評估方法。嬰幼兒在3歲前的主要活動是游戲,基于游戲的評估更能反映嬰幼兒的真實能力,但當前主流的評估方法是基于量表的評估。第三,針對特殊嬰幼兒和普通嬰幼兒的評估工具都需開發。當前許多基于課程和游戲的評估工具主要針對的是特殊嬰幼兒,評估普通嬰幼兒發展的課程和游戲本位評估工具還較少。[31]第四,未來研究者應聚焦于開展0—3歲嬰幼兒發展評估的實證研究。目前,國內針對0—3歲嬰幼兒發展評估的實證研究較少,且多集中于特殊教育和醫學治療等研究領域。
本研究梳理分析了0—3歲嬰幼兒發展評估工具的本質內涵、應用現狀、適用范圍及其優缺點,認為未來國內關于0—3歲嬰幼兒發展的研究可借助上述評估工具,從以下幾個方面進行研究。第一,開展評估工具的本土化研究。在引進和修訂國外評估工具的同時結合我國的實際情況,研發本土化的0—3歲嬰幼兒發展評估工具。第二,進行促進嬰幼兒發展的教育研究。對嬰幼兒發展進行評估的目的是為后續的嬰幼兒發展研究提供學理依據,基于課程和游戲的評估工具在這一方面具有顯著優勢。教育實踐者能夠在早期教育機構中運用基于課程和游戲的評估,在課程和游戲情境中觀察0—3歲嬰幼兒,并根據表現進行判斷,從而改進課程內容、保教方法和游戲環境,有針對性地促進嬰幼兒某方面的發展。第三,開展與嬰幼兒發展相關的跨學科研究。三種評估工具,特別是基于課程和游戲的評估要求評估人員多樣化,認為需要將教師、家長、醫生等各領域專家納入評估團隊,從不同學科和多主體探討嬰幼兒的早期發展及其影響因素,從而提高早期教育水平。