楊 元 媛
(商丘師范學院 外語學院,河南 商丘 476000)
語料庫一般是語言品種或語言的標準樣本,因此語料庫是比較一個作者、一個或一些文本與同種語言其他特殊品種異同的很有價值的基礎[1]242-243。詞簇是一種特殊的頻繁出現的多詞組合,也被稱作多詞序列、多詞單位或詞塊[2]。Biber、Cortes、Hyland以及Mahlberg的多項研究運用語料庫研究中的詞簇這一概念,分析話語中高頻出現的多詞序列。多詞序列作為語言中的意義單位,受到了Sinclair、Partington等學者的廣泛關注。
出現在不同語域的詞簇,表現出各自獨特的結構和功能特征。Biber、Conrad & Cortes對詞簇的結構和功能進行了分類,提出了詞簇結構和功能類型的分析框架[3][4]。
應用這一框架,對文學文本的詞簇進行量化分析。本文對《哈克貝利·費恩歷險記》中詞簇進行量化研究,基于語料庫數據對最低頻數為5的151個四詞詞簇(1)①三詞詞簇往往是四詞詞簇的一部分,而相比五詞詞簇而言,四詞詞簇的使用更加頻繁,在結構和功能上也更富有變化性。所以文章將作品中的四詞詞簇作為分類研究的對象。進行結構和功能分析。
Biber等人.將四詞詞簇從結構上分為三類,具體為:包含動詞短語的詞簇、包含從句的詞簇、包含名詞短語 + 介詞短語的詞簇[3]。在《哈克貝利·費恩歷險記》中,出現最多的是包含動詞短語 (VP) 的詞簇,達65個;其次為包含名詞短語和介詞短語 (NP+PP) 的詞簇,57個;包含從句 (Dep Clause) 的詞簇出現率較低,為20個;還存在比較獨特的一類詞簇,即副詞短語 (Adv) 構成的詞簇,如and by and by,共9個。……