胡 海 珠
(河南師范大學 外國語學院, 河南 新鄉 453007)
?
基于語料庫的英語話語發射成分研究
胡 海 珠
(河南師范大學 外國語學院, 河南 新鄉 453007)
話語發射成分從不同的角度開始一段話語,是英語口語的重要特征之一,但在英語口語教材中經常被刪除。話語發射成分在使用中有自身的規律性,如詞長分布、連用順序、連用時的重心分布等,基于語料庫的方法為其研究提供了語料和數據基礎。話語發射成分很多情況下是說話者試圖達到語意連貫和表達精確的標記,在英語口語教學中不應該被刻意避免。
話語發射成分;語料庫;特征;英語口語教學
該研究的主要對象是目前為我國中學英語教學所忽視的口語話語發射成分。話語發射成分指的是那些用于話語之前、通過語音逗號(聲音上短暫的停頓)與后面的話語片斷分開、用于開始一段話語的成分,如well, you know, in other words and on the other hand 等。它們在口語中出現得非常頻繁,甚至已經成為口語的重要特征之一,起著組織話語結構、完成話語間形式和邏輯關系上的連接、幫助話題的進行和轉換等作用。在我們目前的口語教學中,這些成分并沒有被充分重視。在很多口語教材中,這些起著重要的交際功能的話語發射成分都被刻意地刪除掉了。我們把這些口語教材中被刪去的話語發射成分作為研究對象,旨在發現這些成分的總體使用特征,期待對我國目前的英語口語教學有所幫助。
國內外直接就話語發射成分的研究不很多,但是與之相關的研究成果頗豐,如Quirk[1]和Van Dijk[2]提出的“話題轉換標記”(topic shift markers)、Brown和Yule[3]的“話題邊界標記”(topic boundary markers)和“填充語”(fillers)、 Laurel J. Brinton[4]的“語用標記詞”(pragmatic markers)、Hasselgren[5]的“小詞”(Small-words)、Biber et al.[6]的“插入語”等。類似的研究還有“句子連接詞”、“語用小品詞”、“話語標記詞”和“修正標記詞”研究等。
研究者一般都是以直覺上的使用頻率為參考,給出一個大概的成分列表,或者先通過直覺列出部分成分再結合語料庫或具體的語言使用進行驗證,如Stenstr?m[7]。而國內的研究多是聚焦于某個或某些特定的成分而展開的,如朱小美 王翠霞[8]和謝楠[9]的well、李成團[10]的you see、徐捷[11]的you know、王琨 胡曉琴[12]和何靜秋[13]的all right等研究。這些語用標記詞一般被認為是空語義成分,使用自由,很難翻譯。
話語發射成分與話語標記詞有相互覆蓋的部分,但是又不完全等同。話語標記詞包括用于話語之前開始一段話語的成分如you know、用于維持話輪的話內模糊音如ehh 和 mhm、單獨使用的話語接受標記如yes和yeah、話內插入成分如like和sort of、升調的話后反問成分如eh 和 right,甚至反意疑問部分等。它們被用于話語之首、話語之中或話語之末,而我們所說的話語發射成分僅用于話語之首,可以看作“發話標記成分”。即使在句首,話語標記詞也通常是較短的成份,不包括多詞成分如the thing is, I tell you what, I was going to say, when you think about it, can I just ask you, as I said just now 等。但在話語發射成分的研究中,它們卻是內容之一。
(一)BNC語料庫
語料庫是“按照一定的采樣標準采集而來的、能夠代表一種語言或某語言的一種變體或文類的電子文本集”[14]3。它以“大量精心采集而來的真實文本(authentic text)為研究素材,主要通過概率統計的方法得出結論”[15]。BNC (英國國家語料庫)是一個一億詞容量的語料庫,包含不同來源的書面語和口語,代表了現代英國英語的使用情況。該庫有4,124個文本(100,106,008個詞),其中口語部分有863個文本(10,000,000個詞),占了總庫的百分之十。為了從BNC 語料庫中提取口語對話部分,我們先使用了BNC語料庫附帶的索引軟件得到一個所有對話文本的列表,再根據列表將這些對話文本放入單獨的文件夾,這樣我們就得到了一個BNC 語料庫中口語對話部分的子庫。
(二)PowerGrap索引軟件
該研究使用PowerGREP這一軟件進行自動檢索。PowerGREP是一個強大的檢索軟件,允許通過特殊的設定檢索文件或文件夾中的任何內容。檢索的結果呈現為一個可點擊的列表,雙擊檢索結果中任何一項都可以打開對應的文件。查找和替換功能允許使用者預覽查找和替換結果,收集功能可以為使用者提供數據信息。查找、替換和收集的結果都可以以執行時的形式儲存,以備以后的進一步操作。
BNC語料庫的原始文本有標點標記,每個詞被自動賦上了詞類碼,一共有65種詞類碼。通過觀察BNC語料庫的詞類碼,我們發現一詞的話語發射成分表現,分別對應副詞、并列連詞、從屬連詞、感嘆詞和模糊音五個詞類為五個詞類標注,即AV0, ITJ, CJC, CJS 和 UNC。一詞話語發射成分的檢索主要通過檢索以上詞類碼進行。多詞的發射成分的檢索首先用PowerGREP 軟件通過逗號標點來大量查找,然后手工刪除不是發射成分的部分。
(一)檢索結果呈現
1.一詞話語發射成分
一詞話語發射成分按詞類有以下這些:
副詞:well, so, now, right, just, then, okay, very, alright, perhaps, probably, still, really, actually, maybe, here
并列連詞:and, but, or, nor, plus
從屬連詞:if, cos, because, when, as, unless, although, before, once, whereas, while, after, until, since, till, whilst
感嘆詞:yeah, oh, no, yes, mm, ah, ooh, aye, hello, mhm, aha, bye, hey, cor, yep, eh, ha, hi, oi, gosh, hmm, hm, huh
模糊音:er, erm
2.一詞話語發射成分的連用
一詞話語發射成分經常被連用,典型的高頻使用情況如下:
兩詞并列使用:and then, yes (yeah) but (and), so if, and if, oh well, and (but) er(m), well if, yeah well, oh yes (yeah), oh no, erm and, and so, no but, now if, no no, but then, oh no, er(m) and (but), and and, mm mm, right so, and (but) when
三詞并列使用:and then when, yeah but if, and then if, no no no, er(m) and then (if), and then er, well yeah but, yeah and (but) then, and er then (so), and er if, but then again (if), oh yes yes, right so if
四詞并列使用:no no no no, and then and then, mm mm mm mm, and er and and , oh dear oh dear, oh no oh no, oh yeah yeah yeah, oh yes oh yes, But if if if, yeah but yeah but, yeah but then if, okay and then if, right okay so if
五詞并列使用:no no no no no, oh ya ya ya ya, dear oh dear oh dear, again and again and again, so certainly if if if, so so so yes so
六詞并列使用:and and and and and and, mm mm mm mm mm mm, no no no no no cos
3.多詞話語發射成分
我們檢索了二到十詞的多詞發射成分,但是結果中卻很少有長于六詞的成分。以下是相對高頻的多詞話語發射成分:
兩詞發射成分:I mean, you know, mind you, I think, thank you, you see, come on, it is (was), in fact, go on, I thought, and that;
三詞發射成分:in other words, as I say (said), first of all, the thing is, do you know, tell you what, by the way, this is it, the trouble is, I tell (told) you, I told you, still to come, at the moment, I must admit, I know that, in actual fact, I think that, I was thinking, having said that;
四詞發射成分:Thank you very much, I tell you what, on the other hand, at the same time, but the thing is, the only (other) thing is, I would think so, I have to say, can I just say (ask), can I ask you, did I tell you;
五詞發射成分:You know what I mean, I was going to say, as far as I know, I know what you mean, if you think about it, when you think about it, I hear what you say, from my point of view, can I just ask you, as a matter of fact
六詞發射成分:the fact of the matter is, as many of you will know, if you see what I mean, I was just going to say, I was going to say that
4.一詞和多詞發射成分的連用
多詞話語發射成分經常同一詞話語發射成分連用,如 and (but/so/well) I mean, and (but/so/well)I thought (think), but (and/well) you know (see), oh my god, I mean if, well it is, and in fact; well this is it, but (and/well) as I say, but (well) the thing is, and I was thinking, but (now) having said that, yeah but I mean, so in other words, and do you know; well thank you very much, but on the other hand, and the other thing is, and I tell you what, well I was just thinking, well (but) I mean you know; oh I see (know) what you mean, so thank you very much indeed 等。
(二)檢索結果分析
1. 詞長特征

詞長Types(higherfrequentwords)發射成分連用數量(形符)比例(形符)標準頻數(10,000)一詞發射成分and,well,er,yeah,oh,so,no,but,erm,yes,now,mm,right,just,or,then,ah,ok,ooh,there,here,aye,like,hello,al-right,perhaps,mhm,probably,still,really,actually,maybe ──232,04879.63283.97兩詞發射成分Imean,youknow,mindyou,Ithink,yousee,itis,infact,itwas,Ithought,myLords,andthatyeahbut,andthen,ohyes,ohno,yesbut,yeahand,andso,nobut,butthen,rightso,andnow,andalso,wellthen,butanyway25,0408.5930.64三詞發射成分inotherwords,asIsay,firstofall,doyouknow,thethingis,tellyouwhat,bytheway,thetroubleis,Itellyou,Itoldyou,stilltocome,Imustadmit,inactualfactwellImean,butImean,butyouknow,andyouknow,wellyousee,wellyouknow14,9425.1318.29四詞發射成分Itellyouwhat,ontheotherhand,atthesametime,theonlythingis,Ihavetosay,canIjustsaybutasIsay,butthethingis,wellthethingis,andIwasthinking,soinotherwords10,9683.7613.42五詞發射成分Iwasgoingtosay,asfarasIknow,ifyouthinkaboutit,whenyouthinkaboutit,frommypointofview,canIjustaskyou,IwasgoingtosayandItellyouwhat,andtheotherthingis,butontheotherhand8,4202.8910.30總數────291,418100356.62
從以上我們可以看出,許多我們預期出現的高頻話語發射成分并沒有出現,如generally speaking, to be frank,to be honest,in a word,in short,that is to say,what′s more和after all等。
總體來說,這些話語發射成分的使用頻率隨著它們長度的增加而降低。一詞發射成分占了所有話語發射成分的79.63%,說明說話者在口語中多用較簡短的成份開始一段話語。
2. 話語發射成分的連用特征
很多的一詞話語發射成分被說話者并列使用。它們不同于多詞話語發射成分:多詞話語發射成分是固定或半固定地被說話者所使用的,一個詞的出現總是預示著下一個詞的出現;但是一詞話語發射成分的并列使用相對靈活,不具有相互預示性。
被連續使用的一詞話語發射成分到達四個詞的長度時開始表現為簡單的重復,如No no no no no, Oh ya ya ya ya, Dear oh dear oh dear。因此我們可以說一詞發射成分并列使用時一般最長有四個不同的發射詞。四個詞類的發射成分連用的情況很少出現,如okay and then if 和 right okay so if,在整個語料庫中分別一共出現了兩次。從我們的檢索結果不難看出,一詞的話語發射成分在連用時呈現出一定的詞類順序特征。被說話者重復最多的詞類順序是:感嘆詞 (oh, well, okay, yes, yeah, no) + 并列連詞 (and, but) + 一般副詞 (so, then, also, actually) + 從屬連詞 (if, because, when)。And the retrieval result (see appendix 2-b) shows the following roughly most commonly used order in the co-occurrence, though there are certainly exceptions: They are also compatible with themselves except conjunctions。兩個連詞不會被說話者并列使用,除了but but之類的重復,但是其它詞類內部可以多詞并列使用。
一詞話語發射成分也經常和多詞話語發射成分并列使用。這些發射成分在被說話者使用時表現出一個顯著的特征,即這些一詞發射成分多是感嘆詞和并列連詞,并且總是被用于多詞發射成分之前,如well I mean, but as I say, but the thing is 和and on the other hand。you know actually 之類的并列理論上有可能出現,但是根據檢索結果,這樣的并列在實際使用中很少出現。模糊聲音如er和erm 出現相對自由。它們沒有意義,但是卻有其語用功能,我們可以稱它們為“模糊發話標記”。
3. 話語發射成分連用時的重心分布
一詞話語發射成分在并列使用時被說話者重復最多的詞類順序是:感嘆詞 + 并列連詞 + 一般副詞 + 從屬連詞。而在一詞發射成分與多詞發射成分連用時,一詞發射成分(通常為感嘆詞和并列連詞)總是被用在多詞發射成分之前。一般我們不說這些話語發射成分有哪些是不必要的或者哪些是更重要的,但是如果我們需要省略這些并列成分中的一些而保留另一些的話,那些離話語主體最遠的成分通常會被我們首先省去。這一點我們通過比較不同長度的一詞發射成分連用,或比較多詞發射成分與一詞發射成分并列的情況就可以看出。從這一點上說,話語發射成分在并列使用時總體應該是向心的,即無論是一詞話語發射成分連用還是一詞、多詞發射成分連用,其核心都是落在較后的位置。如果我們說口語中的話語發射成分正在不同程度地語法化,那么它們在并列使用時的順序,即它們離話語主體的距離,似乎反應了它們不同的語法化程度,離話語主體部分越遠,它們的語法化程度就越高。由于口語中語言使用的靈活性,不同成分的語法化程度與它們并列使用時的順序的關系只是一種總體特征,而不是規則。
(三)口語中話語發射成分使用的案例分析
以下是一段BNC語料庫的口語部分中的對話語篇:
A (student): You could assess them on on on that, and just say right I I think you’re a and A or a B on this particular booklet.
B (teacher): Mhm.
A: Because I’ve done it, with you. I mean, that’s no reason. But we shouldn’t be sort of saying, well look let’s not, lets all not do this booklet now.
B: Mm.
A: It’s something that we ourselves should look at.
B: Yeah, I I just wondered because there are some of them that don’t have any relevance to national curriculum and I want to…
A: Why?
B: I just thought maybe, you know, sort of miss them out do level one.
C: Do another type?
B: Do level one and level two, the ones that you you have to do and if there’s any time left at the end of the year do the ones that that you missed out.
C: That are left, aha.
A: Yeah!
B: You know that…
C: Ah
B: You know are, are non-essential.
說話者在討論做大綱以外習題冊的必要性。學生認為有必要做這個冊子,期待老師說“Right I I think you’re a and A or a B on this particular booklet”,以此評價他的努力。副詞 right 實施著表態功能,反應了老師在評論學生所作的努力時所持的態度或內心狀態,即“對你所作的努力我很贊同”。通過一個個人化的發射成分I think,說話者(老師)在告訴聽話者(學生)自己的評價是出自自己內心的想法。
I mean 實施話語交互功能,通常預示著說話者要對之前的話語進行更進一步的解釋。但是在這里說話者并沒有進行所謂的解釋,而是進行了意義轉折。事實上這里的I mean暗示了說話者的內心矛盾,相當于I know that I’ve done it with you is not a reason。But 是一個連接詞,實施語篇功能,意味著話語意義的轉折。學生接下來重復老師對他說過的“Well look let’s not, lets all not do this booklet now”。很明顯,老師并不認為做這類大綱要求以外的習題冊有必要。由于對學生行為的否定涉及學生的面子和心理,老師在提出否定意見時采取了盡量禮貌的否定方式,用Well 一詞緩和了自己的否定語氣,對于說話者(老師)來說是一個回應標記,而對于聽話者(學生)來說則是一個被否定的預示。Look 在這里也是一個回應標記,但是它通常也預示著否定的回答。
學生不希望老師用一句“Well look let’s not, lets all not do this booklet now”來回應自己的努力。對于這種意見,老師以yeah I just wondered開始表達了自己的想法。Yeah 是一個積極回應的標記,但是卻緊跟了一個小句I just wondered。這個小句在這里也是一個轉折標記。Just 一詞有“不很重要”之含意,是一個同時實施表態功能的成分,用來弱化否定對方時的語氣。我們注意到wondered 用的是過去時,對于師生角色中的高位角色,老師在表達自己意見時是足夠禮貌的。而wonder一詞也失去了它的字面意義,因為老師這時并沒有什么疑惑。I just wondered這一發射成分在這里暗示說話者內心一種輕微的妥協。因此,老師雖然還是對學生的行為進行了否定,但是這一否定以yeah I just wondered開始也暗示了他在保留自己不認可態度的同時對學生行為部分的肯定。當學生問及原因時,他又回答以I just thought maybe, you know開始。Maybe的模糊意義通常反應出說話者對接下來所表達內容的不確定性,或者表現出我們通常所說的“底氣不足”。除此之外,老師用了這個詞開始話語也是在提出不同意見時對自己語氣的緩和。You know 用于話語發射成分時通常用于喚起聽話者的聽話注意和會話涉入,同時它也是說話者在猶豫不決時內心進行話語處理的外在語言反應。而sort of與前面使用過的just一樣,使緊跟其后的話語顯得不那么被強化。接下來的兩個you know同樣是語言整理過程的外在標記,同時用于增加聽話者對緊接話語的認可。事實上,話語發射成分中的很多小句發射成分里經常出現心理性動詞,這一點從以上的表格中我們很容易看的出來。這些心理性動詞從某個方面反應了說話者的話語投入程度和對說話者注意力的要求。
話語發射成分是英語口語的重要特征之一,在很多情況下是說話者試圖達到語意連貫和表達精確的標記,是說話者交流思想的重要手段,而不是話語不連貫的標記。本族語者對這些話語發射成分有著很好的掌控能力,能使用這些微小卻又強大的成分準確地表達自己的想法。而語言學習者誤用或不用這些成分都可能會造成聽話者對說話者真正話語意圖的理解偏差。在我國的英語口語教學中,這些承擔重要話語解釋任務的話語發射成分并沒有得到足夠的重視,多被視為不重要、不必要或者破壞話語連續性的噪音信息,甚至在一些被認為足夠真實的日常口語對話中也被刻意地刪去了。
英語口語教師應該有意識地在課堂上合理使用這些成分,作為對學生的潛意識輸入。當然,這并不是說我們必須單獨地講授這些發射話語的成分,而是說我們應當把它們作為正常的語言現象去對待。而對于學生而言,更不必刻意的避開它們。如果能夠對這些成分的話語貢獻給予重視,相信英語口語的練習者會大有收益。
[1] Quirk. R. et al. A Comprehensive Grammar of the English Language [M]. London: Longman, 1972.
[2] Van Dijk, T. Text and Context [M]. New York: Longman, 1979.
[3] Brown, G., & Yule, G. Discourse Analysis [M]. Cambridge: Cambridge University Press, 1983.
[4] Brinton, L. J. Pragmatic Markers in English: Grammaticalization and Discourse Functions [M]. Walter de Gruyter & Co. D-10785 Berlin, 1996.
[5] Hasselgren, A. Small Words and Valid Testing [D]. Bergen University, Norway, 1998.
[6] Biber, D., Johansson, S., Leech, G., Conrad, S., & Edward, F. Longman Grammar of Spoken and Written English [M]. Beijing: Foreign Language Teaching and Research Press, 1999.
[7] Aijmer, K. English Discourse Particles: Evidence from a corpus [M]. Amsterdam/Philadelphia: John Benjamins Publishing Company, 2002.
[8] 朱小美 王翠霞. 話語標記語Well的元語用意識分析[J]. 安徽大學學報(哲學社會科學版), 2009 (1): 55-61.
[9] 謝楠. 視聽文本中話語標記語的語用功能及其漢譯中的信息缺失現象[J]. 外語與外語教學, 2009 (5): 56-59.
[10]李成團. 話語標記語you see的語用功能[J]. 外語教學, 2009 (5): 15-16.
[11]徐捷. 中國英語學習者話語標記語you know習得實證研究[J]. 外語教學理論與實踐, 2009 (3): 28-34.
[12]王琨 胡曉琴. 話語標記語Alright在英文口語中的話語結構功能[J]. 云南民族大學學報(哲學社會科學版), 2011 (4): 140-144.
[13]何靜秋. all right 在法庭審判話語中的動態順應分析[J]. 山西財經大學學報, 2012 (2): 58-67.
[14][15]梁茂成等. 語料庫應用教程[M]. 北京: 外語教學與研究出版社, 2010.
責任編輯:石長平
A Corpus-based Study of English Utterance Launchers
Hu Haizhu
(Faculty of International Studies, Henan Normal University, Xinxiang Henan 453007)
Utterance Launchers begin an utterance from different perspectives, and are one important feature of oral English. But they are always deleted in oral English textbooks. Utterance Launchers have their own regularities in use, such as those in word length, order and focus distribution in juxtaposition. The corpus-based method provides a corpus and data basis for the study of them. It is found that they are actually markers of the speaker’s efforts to be coherent in meaning and exact in expression, so they cannot be deliberately avoided in oral English teaching.
utterance launchers; corpus; features; oral English teaching
2014-09-28
胡海珠(1979—),女,河南西平人,碩士,講師,研究方向:應用語言學。
H08
A
1671-9824(2015)03-0071-05
基金支持:河南省哲學社會科學項目(2013BYY024)和河南省哲學社會科學項目(2013CYY025)的部分成果。