PETS-2（2008—2022）英語閱讀理解文本句法復雜度研究

2023-11-13 02:18:40陳曉紅丁二莉

英語教師 2023年15期

陳曉紅丁二莉

引言

句法復雜度、句法準確度和句法流利度作為研究語言發展的三大維度，已經得到廣泛研究。句法復雜度指語言產出中句法結構的多樣性及復雜性（Lu，Xiaofei 2010）。拉森—弗里曼（Larsen-Freeman 1997）提出語言復雜理論后，引起語言學界廣泛關注。已有研究探討句法復雜度與二語水平及二語寫作質量的關系，句法復雜度被認為是影響并度量語言水平及描述語言發展軌跡的一項重要指標（陸小飛、許琪 2016）。例如，句法復雜度是“三段式線性”式的，也就是沿著由并列從句到從屬結構，到復雜從句，再到短語式的發展道路（Norris&Lourdes 2009）。二語習得作為二語習得與教學中的重要組成部分，其句法復雜度與二語習得者學習水平及發展緊密相關，是衡量文本難度的一項重要指標。

全國英語等級考試（Public English Test System，簡稱PETS）面向社會所有公民，是非學歷性英語證書水平考試，考查應試者的英語交際能力及英語運用能力。其考試等級按難度從低到高劃分為一級（一級B級是全國英語等級考試的附屬級）、二級、三級、四級和五級。一級為初始級，對學生的測試要求與初中畢業生英語水平相當；二級為中下級，與普通高中優秀畢業生英語水平相當；三級為中間級，相當于學生中學畢業后，再到大專院校學習公共英語兩年，或者自學相同程度的英語課程；四級為中上級，相當于學生中學畢業后，在大學里再學公共英語至少三到四年，或者自學相同程度的英語課程；五級為最高級，相當于大學英語專業二年級學生學完后的程度，是專門為報考公派出國留學的學生開設的英語水平考試項目。這5個等級的考試標準以相同的能力量表為基礎，它們之間既存在明顯差異，又存在內在聯系。

在過去的幾十年里，有很多關于PETS英語閱讀理解的研究。例如，韻曉玲（2013）進行了全國英語等級考試三級閱讀理解測試內容效度研究；段辛（2017）從文本復雜度的角度對CET-4/6和PETS-3/4閱讀文本進行對比分析。雖然這些研究聚焦PETS英語閱讀理解的不同方面，但是目前鮮有研究從英語閱讀理解材料的句法復雜度入手。因此，從全國英語等級考試二級（PETS-2）英語閱讀理解材料的句法復雜度入手，運用語料庫數據驅動的方法，借助文本在線分析工具英語文本指難針和二語句法復雜度分析器，分析2008年至2022年PETS-2英語閱讀理解文本，探究句法復雜度變化規律，以及同一份試卷中閱讀理解材料句法復雜度變化和分布趨勢，從而希望對以后英語閱讀理解材料選擇、難度確定、教學大綱編寫及教育者研究和實際教學起到一定的參考作用。

一、研究設計

（一）研究問題

1.PETS-2英語閱讀理解材料句法復雜度有何變化，有怎樣的變化趨勢？

2.每年的試卷中不同句法復雜度的閱讀理解文本如何分布？

（二）研究工具

測試儀是一種在線自動分析儀，是在METS、PETS、CET-4、CET-6和NEEP等考試中基于大量測試材料的語料庫設計的，旨在為英語教師提供數據，幫助他們撰寫新的測試論文。它有7個功能：分級復雜性、設置基準、檢查實例句子、生成單詞列表、解釋復雜單詞、反饋結果和導出結果。測試人員根據單詞覆蓋率、句子平均長度、句子最大長度、文章長度和LD值等5個指標對句法復雜性進行分析。在本研究中，LD的指數值被用于分析閱讀材料的句法復雜性。

第二語言句法復雜度分析儀L2SCA是由陸小飛教授設計的自動分析儀。它使用14個索引分析第二語言寫作的句法復雜性。這14個指數是平均句子長度（meanlengthofsentenceMLS）、平均T單位長度（meanlengthofT-unitMLT）、平均子句長度（meanlength of clause MLC）、平均句子中的子句數量（clauses per sentence C/S）、平均T單位中的子句數量（clauses per T-unit C/T）、平均T單位中的復雜T單位數量（complex T-unit ratio CT/T）、平均子句中的從屬子句數量（dependent clauses per clause DC/C）、平均T單位中的從屬子句數量（dependent clauses per T-unit DC/T）、平均子句中并列短語數量（coordinate phrases per clause CP/C）、平均T單位中的并列短語數量（coordinatephrasesper T-unit CP/T）、平均句子中的T單位數量（T-units per sentence T/S）、平均子句中并列短語數量（coordinate phrases per clause CN/C）、平均T單位中的復雜名詞結構數量（complex nominals per T-unit CN/T）和平均T單位中的動詞結構數量（verb phrases per T-unit VP/T）。下面采用C/S、C/T、CT/T和T/S分析句法復雜性。

（三）研究語料

本研究的語料為2008年至2022年PETS-2英語閱讀理解文本。文本的平均長度約為345詞。從2008年到2012年，每半年一次的考試中有5個閱讀測試；從2013年到2022年，每半年一次的考試中有4個閱讀測試。閱讀測試總數為65個。所有閱讀測試都是通過網上下載真題進行OCR識別的。

（四）數據處理與分析步驟

第一步，整理文本，將文本全部轉換成純文本格式，每篇閱讀理解材料為一個文本。

第二步，分別上傳語料至英語文本指難針和二語句法復雜度分析器，匯總保存分析數據。

第三步，根據數據，選取LD值、C/S、C/T、CT/T和T/S等5個指標繪折線圖。為了比較不同指數的數據變化，形成了具有一對指數的折線圖。它們是囊括C/S指數和LD、C/T值，以及LD、C/S和C/T值的折線圖。因此，本研究中的折線圖總數為23。這些折線圖由MATLAB制作。

二、結果和討論

（一）LD值變化

從2008年至2022年的LD值的變化圖（見下頁圖1）可以看出，試卷中閱讀理解文本的LD值的總體趨勢越來越高。在2009年和2015年，閱讀測試的LD值逐漸變高。在2013年，閱讀測試的價值逐漸降低。因此，在每年的試卷中安排閱讀材料沒有特別的順序和規定。但在每年的測試中，至少有1種易讀材料和1種復雜材料。LD值每年都在逐步穩定地增長，最大值和最小值之間的差異時小時大。例如，2014年的最高和最低之間的差異是1.82，但2009年只有0.39。這意味著雖然閱讀理解文本沒有按照句法復雜程度的順序排列，但是它們的句法復雜程度變得更高，而且每年的變化不同。在2008年和2009年，LD的最大值和最小值之間的差異約為0.5；在2014年、2015年、2018年、2020年和2022年，最大值和最小值之間的差異約為2.0；在其他年份，最大值和最小值之間的差異約為1.0。可以看出，每年閱讀測試的差異是不同的，這意味著不同測試中閱讀材料的選擇不夠仔細。在PETS-2試卷中沒有嚴格的基準或標準控制閱讀理解文本的句法復雜性。

圖1：2008年至2022年LD值的變化

為了使每年的測試文章的變化趨勢更清晰，該折線圖基于65個閱讀理解文本的LD值繪制，顯示了2008年到2022年十五年間的變化：LD的最低值從低于1.5變為高于2.0；最高值也發生了變化，接近4.0。LD值有大幅的增長，意味著閱讀理解文本的句法復雜度越來越高。然而，該折線圖顯示15年間測試文章中的LD值不規律地變化，最大值和最小值之間的差異非常大。因此，可以得出結論，在選擇閱讀材料時，并沒有仔細評估句法復雜度。閱讀材料的采編應兼顧句法復雜度的持續穩定性。

（二）第二語言句法復雜度分析器四個指標的變化

為了使這項研究更科學和具體，本研究運用另一種自動分析儀分析PETS-2閱讀理解材料。在本研究中，選擇了14個L2SCA指數中的4個指數，分別是C/S（每個句子中的子句數量）、C/T（每個T單位中的子句數量）、CT/T（復數T單位比率）、T/S（每個T單位中的子句數量句子協調率），評估PETS-2閱讀理解文本中句法復雜度的變化（見圖2—圖5）。

圖2：C/S的變化

圖3：C/T的變化

圖4：CT/T的變化

圖5：T/S的變化

（三）每句子句和每個T單位的子句之間的聯系和區別

C/S和C/T都是L2SCA的子句，它們都關注子句的數量。然而，它們把子句放在不同的單位，因為C/S表示一個句子中的子句數量C/T表示一個T單元中的子句數量，因此，在測量句法復雜度方面呈現出不同的方面。C/S包括句法復雜度比率，而C/T是反映從屬量的一個比率。圖6折線圖顯示，這兩個指數分析的閱讀材料數據有很多重疊。這兩條線的趨勢是相似的，并無顯著差異。然而，C/S和C/T值的變化是無序的，并且最大值和最小值之間存在很大差異。

圖6：C/S值與C/T值之間的差異

本研究選擇5個指標評價PETS-2試卷中閱讀理解文本的句法復雜度。LD值是句法復雜度的量化，數值越大代表閱讀理解文本越復雜。圖1清楚地顯示，至少有1個簡易閱讀理解文本和1個復雜閱讀理解文本。出現這種現象是因為命題教師應遵守一些規則。其中一條規則是應考慮具有良好閱讀能力和閱讀能力差的學生。因此，教師必須選擇至少1個簡易閱讀理解文本，以確保學生能夠獲得基本分，還必須選擇復雜閱讀理解文本以滿足擅長英語閱讀的學生獲得更高的分數。然而，在同一年的測試中，4個閱讀理解文本并沒有按照句法復雜度來安排。圖1顯示LD值在十五年內變化很大，并且最大值和最小值之間的差異很大。除此之外，與測試儀給出的LD值的標準1.7—2.4相比，最大數量接近4.0，遠遠大于2.4。測試儀給PETS-3和CET-4的基準是2.4—3.5和3.5—4.5，而LD的某些值已經達到了這兩個基準。根據測試人員給出的基準，PETS試卷中的一些閱讀材料并不適合高職醫護專業的學生。過高復雜度會給學生在閱讀測試中帶來很多負擔，現在為他們提供具有CET句法復雜度的閱讀理解文本為時過早。圖2—圖5使用了4個指數，數據略有穩定變化。C/S從句子的子句數量評估句法復雜度，而C/T和CT/T以句法密度的方式評估從屬的句法復雜度。T/S評估協調的句法復雜度。可以看出，4個指數在不同年份的閱讀測試中都有所變化。第四和第五個數字用于比較，以找出Tester和L2SCA之間的差異，以及L2SCA的不同指數。從圖4可以看出，LD、C/S和C/T三個指數的值具有差異和相似性，它們都用于評估閱讀材料的句法復雜度，但在不同方面，它們有類似的增長趨勢。語法復雜度不能僅由其中1個指數描述。例如，當LD值低時，C/S或C/T值可能很高，而當LD值高時，C/S或C/T值可能很低。5項指標使研究更科學、合理。變化表明，PETS-2的英語閱讀理解材料在被選為閱讀文本之前，未經過仔細研究或分析，從2008年到2022年，PETS-2試卷中的閱讀材料選擇缺乏有效性。

三、總結和啟示

為了考查歷年英語閱讀理解文本句法復雜度變化規律，以及同一份試卷中閱讀理解文本句法復雜度的變化和分布趨勢，以2008年至2022年的PETS-2試卷共130篇閱讀理解文本為研究材料，使用語料庫的方法，借助英語文本指難針和二語句法復雜度分析器這兩個文本分析工具，選取5個不同指標對PETS-2閱讀理解文本加以分析，通過分析每篇閱讀理解的句法復雜度，最終得出如下結果：（1）從 2008年至2022年，PETS-2英語閱讀理解文本句法復雜度呈穩定升高趨勢，但難度最高值3.77與最低值1.30差異明顯，即句法復雜度上升幅度較大；（2）閱讀理解文本的句法復雜度逐年增長，但在試卷上并不按由易到難或由難到易的順序分布。

研究結果表明，PETS-2英語閱讀理解文本選材有一定的合理性，但其句法復雜度變化較大，說明出題者對材料的選取缺乏固定、科學的衡量標準。分析PETS-2英語閱讀理解文本的句法復雜度，希望能對以后PETS英語閱讀理解文本材料的選擇、難度的確定、教學大綱的編寫及教育者的研究和實際教學起到參考作用。尤其是對于高職英語閱讀理解材料的難度控制，出題人可以采用文本難度分析器分析不同文本難度，達到合理控制文本難度的目的。本研究的局限性在于只選用了2個分析工具、5個指標，未來的研究中可以增加其他工具和指標進行進一步分析。