楊 元 媛
(商丘師范學院 外語學院,河南 商丘 476000)
EST語料庫的關聯標識分析
楊 元 媛
(商丘師范學院 外語學院,河南 商丘 476000)
“關聯標識”是一種聚焦和凸顯關鍵內容的話語組織標記。分析自建EST語料庫中的關聯標識,了解到在EST論文寫作中,本族語作者最常用關聯動詞模式強調重要內容,其中最常用的為V clause型式,另外,1p pers pron V n/clause型式出現頻次也較多。其次為名詞模式中的MN v-link型式。對這些關聯標識型式的關注,可以幫助科研工作者和學習者快速獲取并恰當表達論文重要信息,促進EST領域的學術交流。
EST;語料庫;關聯標識;模式
EST (English for Science and Technology),即科技英語,是科學家和技術人員為國際交流的需要,在應用中逐漸形成的一種語言變體。EST這種獨特的語體擁有準確、清晰、簡明等特征,在國際學術交流中廣泛使用。EST這樣一種文體形式出現在全世界大部分的科技作品,包括期刊論文、官方出版物、技術報告、實驗報告、技術標準和公開出版的專利產品介紹中。鑒于這種語言形式在科學交流中的重要地位,及對人們的生活和語言使用的影響,語言學家對于EST的語法結構和修辭格開展了研究和總結。
“關聯標識”(Relevance marker)是引用自Hunston 的一個術語[1]198,它指言辭或視覺上明顯標志出相對重要性或關聯性的詞匯語法手段,這種元話語手段具有明顯標識出內容相對重要話語的特征。Bednareks將其稱為“重要性參數”[2],Heino, Tervonen, & Tommola[3]128稱它為“顯著性標識”(Saliency marker)。
話語組織標記被廣泛接受為提升語言理解度的重要手段[4][5][6][7],然而對于強調重要或關聯信息的言語標識卻研究甚少。Deroey & Taverniers認為,“關聯標識”通過建立話語中語言點重要程度上的一個層級關系,起到組織話語的作用[8];Thompson & Hunston指出,關聯標識提供話語的“重要性或關聯性參數”,以呈現發話者的態度與評價[9]24。這些研究豐富了關聯標識的定義。對關聯標識研究產生重要推動作用的是Crawford Camiciottoli,其辨識出了小型商業學講座語料庫中起到“面向聽眾的關聯標識”作用的12個詞匯語法模式,包括關聯形容詞(如important)、元語言名詞(如point)等[10]93[11]98。Deroey & Taverniers基于英國學術口語語料庫,對英國課堂語言中的關聯標識作了較系統的分析[12]。但是,對于學術論文中關聯標識及其語法模式的研究尚未出現。
國內外開展ESP(English for Specific Purposes),即專門用途英語,需求分析的研究不少,如蔡基剛[13]、羅娜與陳春梅[14]、Abdelgawad Ahmed Alastal 等[15]。這些研究發現了學術英語技能方面的缺失,以及國內外對專門用途英語特別是學術英語學習和研究的迫切需求[16]。科技英語(EST)是整個外語教學,甚至專門用途英語或學術英語中最具有實踐價值和實踐意義的學科。相比目前流行的通用英語和熱門的商務英語,它更應引起我國外語決策者的重視,因為它涉及我國高校各學科能否實現學術國際化,這是建設一流大學和學科的關鍵;涉及我國科學技術和經濟發展的根本,涉及能否告別上一代科學工作者不能用英語閱讀專業文獻、寫學術論文的尷尬局面[17]。
研究數據基于作者創建的英語國家EST論文語料庫。自Elsevier Science(世界上公認的高品位學術出版公司,也是全球最大的出版商,已有100多年的歷史。除了出版圖書外,還是當今世界最大的學術期刊出版商,出版內容涉及生命科學、物理、醫學、工程技術及社會科學)中的國際著名工程技術類期刊:“Computers & Electrical Engineering”, “International Journal of Engineering Science” 和 “International Journal of Mechanical Sciences”,下載了100篇英語本族語作者論文,主要涉及機械、電子工程等學科。這些論文經識別、整理后建成語料庫,總庫容529,668詞[18]。語料庫建成后,運用CLAWS軟件自動附語法碼,以有利于對語法模式的檢索。
根據Swales & Burke[19]17、Crawford Camiciottoli[10]97和Giannoni[20]207的研究結果,在復現的詞匯語法模式中,起到關聯標識作用的詞匯主要有四類,其研究同時給出了這四類詞的列表,如形容詞Basic, Critical, Essential, Interesting, Significant等;元語言名詞Idea, Message, Point, Question, Bottom line等;動詞及動詞結構Remember, Stress, Be interested in, Bear in mind, Bring attention to等;副詞Essentially, Importantly; Significantly等。在這些關聯標識的詞匯和語法模式提取中,人工摒棄了一些未對論文內容進行評價和強調的純話語組織元素。
關聯標識索引行中包含的相似元素和結構可以用固定的模式(Pattern)表達出來[21]20。根據主要元素,或者“聚焦點”[22]49的不同,可以分為形容詞、名詞、動詞、副詞模式。
編寫正則表達式,應用語料庫軟件PowerGREP,對一些主要的關聯標識模式進行提取、頻數統計和分析,可以發現許多屬于英文EST論文的獨特詞匯語法特征。
(一)形容詞模式
形容詞的關聯標識模式中主要包含一個傳遞關聯性的形容詞,另外,一些表達個人評價和觀點的形容詞也被涵括在內,體現出涉及內容的重要性和人們對它的關注程度,如crucial[19]16,interesting[10]88[23]。
在PatternGrammar[21]的符號系統中,為呈現索引行的表層結構,某一Pattern的語法類別以大寫字母的形式表示,如形容詞模式:ADJ,動詞模式:V;Pattern中的其他元素用小寫字母表示,而其中包含的具體詞用斜體。本文沿用這種表達方式。
形容詞模式中所包含的形容詞都用作表語(見表1):動詞(v-link)將形容詞和指示詞(deic)、元語言名詞(mn)、先行詞it或what鏈接起來。在外置結構中,形容詞出現在從句之前;在wh-分裂句中,它出現于名詞(‘n’)或補語從句之前。
1.deic v-link ADJ
這種模式的基本結構為:具有回指作用的指示詞this或that,接系動詞,之后接形容詞,對前文中的陳述作出評價。此模式出現頻次較低,在EST語料庫中共出現2個,都使用形容詞important,且important前常有副詞very修飾,如:
(1)Thisisveryimportantin order to reduce the average localization error, as we will explain in Section 7.1.3.
(2)Thisisimportantfor reducing the probability of unnecessary retransmissions, but it introduces extra delay and makes network resources under-utilized.
2.mn v-link ADJ
這種模式中的元語言名詞對前文提到內容的相關性進行評價。此模式在EST語料庫中僅有一例,說明這種包含形容詞的評價模式很少被用來突出關鍵內容。
(3) This latterpointissignificant, since it will enable planning applications that require continuous monitoring, e.g., average annual daily travel.
與deic v-link ADJ類相同,元語言名詞的涵蓋關系使上下文更加銜接,但同時,讀者也需要對此類信息進行更多的處理,以便推測所指的具體內容。
3.it v-link ADJ clause
這一模式主要包含一些評價性的形容詞[24]92[23],用來強調一些突出的觀點[25]209。這里主要使用的形容詞有important和interesting,先行詞it之后常跟that引導的主語從句,完整地呈現出論文要突出和強調的話語內容。此模式在語料庫中出現23次,說明EST作者常用先行詞it加系動詞,再加形容詞,后跟that引導的主語從句這一模式,闡述重要觀點和內容。
(4)Itisimportanttonotethatthree aforementioned ion-selective electrodes were a part of the sensors array and thus, electronic tongue data included measurements with these three electrodes as well.
(5) However,itisinterestingtoseethatthere is a threshold in the signal strength, below which the Gaussian model is not valid anymore.
4.whatv-link ADJ v-link n/clause
一般情況下,wh-分裂句在語言表達中會起到強調的作用,但是在EST語料庫中,wh-分裂句中出現起強調作用形容詞的情形比較少見,僅出現一次。
(6)Whatisimportanttohighlighthereisthatneither the EO statistics nor the residual statistics computed from a large number of simulated, realistic networks can identify differences between the two AP sets in question under all circumstances where it is most critical to do so: object reconstruction.

表1 形容詞模式及其出現頻數(N=27)
(二)名詞模式
在名詞模式中,中心詞是一個元語言名詞(MN),其前可以出現起修飾作用的關聯形容詞。
此類相關標識大多具有前瞻性的特征,其中常見的元語言名詞有idea, point, question和thing等(參見Crawford Camiciottoli[10]92[11]98; Swales[26])。
1.deic v-link MN 與deic v-link adj MN
名詞模式deic v-link MN在語料庫中出現4次,而在Deroey & Taverniers[8]中出現頻次較高的deic v-link adj MN模式,在EST論文語料庫中未見出現。
如deic v-link MN模式的范例:
(6)Thisistruebecause the path is unique and the property of the FIFO channel ensures that a confirmation message will never surpass the late message.
(7)Thisisnecessarywhen a message arrives and confirmation messages are required for it may happen that a new message arrives, which by being kept in the buffer, is confirmed along with the one that arrived previously.
2.MN v-link
這種模式是名詞性關聯標識中最常見的一種,在語料庫中出現29次。作者在論文中常重復性地使用這種關聯標識模式。此種模式包含下列幾種情形:元語言名詞未被修飾的,較為常見的情形(ca.62.1%)(例8),元語言名詞后緊跟起修飾作用的介詞短語(ca.24.1%)(例9),元語言名詞后緊跟起修飾作用的關系從句(ca.13.8%)(例10)。
(8) In SLAM theideaisto generate a model of the environment via sensor inputs acquired by a mobile robot.
(9) Thusthepointofsampleacquisitioniskey to successfully monitoring of pollutant fate.
(10)Onequestionthatwasnotstudiedherewashow to pick the number of targets in the model for all our simulations we simply used.
Deroey & Taverniers[8]中,課堂語言里常用的adj MN v-link,there v-link MN 和there v-link adj MN模式,在EST論文語料庫中沒有對應的范例。這說明,以上三種包含元語言名詞的關聯模式在正式的書面語中基本不出現,即學術論文中基本不采用這些模式來突出關鍵內容。

表2 名詞模式及其范例與頻數(N=33)
(三)動詞模式
動詞模式(見表3)中常含有以第一人稱代詞為主語或無主語的心理或交際動詞,這些句子多為祈使句,在結構上多包含不定式形式。
1.1s pers pron V n/clause
1s pers pron V n/clause模式標示出作者本人對某一具體內容的評價,將第一人稱單數代詞I與動詞(如emphasize)等結合起來。動詞emphasize之前常出現表示意圖的情態動詞would,或表示意愿的結構would like to。這一模式在EST寫作中出現概率較少,語料庫中僅出現3次。
(11)Iwouldemphasizethatthis formulation, if required, solves the joint problem of concurrent fusion, tracking, navigation, and detection, along with association among data and sensors.
(12) Yet,Iwouldliketoemphasizeanother aspect of the problem: often mathematical theories of the mind where proposed before the necessary physical intuition of how the mind works was developed .
2.1p pers pron V n/clause
這種模式中,第一人稱復數代詞we與心理動詞結合在一起使用,產生一種論文作者集體認知的效果,將讀者和論文的內容緊密聯系起來。這一模式在語料庫中使用較為頻繁,出現65次。
含有動詞模式關聯標識的句子,以第一人稱復數代詞we開頭的頻數遠遠多于以第一人稱單數代詞I開頭的頻數。這說明,在EST語料庫中,作者常以復數人稱代詞為主語,強調關鍵內容。
(13) However,wewouldliketoemphasizethatthe surface reconstruction methods, illustrated in this paper are still effective irrespective of the type and number of sensors deployed in the data acquisition system.
(14)Weareinterestedinexaminingwhetheradding conjugation to such known boronic acid fluorescent reporters would result in more favorable spectroscopic properties in terms of wavelength and magnitude of fluorescence property changes.
3.V clause
含有這種模式的句子具有一定的祈使意味。一般的,這種模式中存在一個心理動詞,動詞之后為補語從句。在所有的關聯標識模式中,此模式出現頻次最高,頻數為349。說明這一動詞模式在EST論文中使用非常頻繁,被作者用來強調要突出的重要信息。此類結構較為復雜復合句的大量運用,也體現出科技論文的文體特征。
這種模式中最常出現的動詞為remember,remember之后常緊跟補語從句,提醒讀者再次關注之前提到的信息,使得這“重新激活”的信息在給讀者留下更加清晰深刻的印象。
(15)Itisimportanttorememberthatthere is no a priori association among data from different sensors; although n always stands for ns, these are independent indexes and no association among sensors is assumed.
(16) Perhaps,itismoreimportanttorememberthatthe contextual detection methods and the Dynamic Detection Model are based on mutually independent information.
除remember之外,動詞note也常見于此模式中,大多數情況下用于引起讀者對于某種具體方法的關注。
(17)Itshouldbenotedthatmethods like JPDA involve track maintenance but not track initialization.
Deroey & Taverniers(2012)中,課堂語言里另一些常見的動詞模式,如2 pers pron V n/clause,即以第二人稱代詞做主語的祈使句;1s pers pron v clause + 2 pers pron V n/clause,第一和第二人稱代詞結合使用的祈使句,如:I want you to notice...;TO-INF n/clause,以及動詞不定式結構后接從句表示強調等,在EST論文語料庫中均沒有出現。這也體現出學術論文區別于課堂話語的獨特語體特征。

表3 動詞模式及其范例與頻數(N=417)
(四) 副詞模式
副詞模式(見表4)中包含一個傳達某項內容重要意義的副詞短語。起關聯標識作用的副詞主要有importantly,significantly和essentially,且常出現在句首。副詞關聯標識在語料庫中共出現20次。
(18)Importantlywe note that the mobility threshold M.T = 0 was included in the simulations to test the effectiveness of such an extreme setting.
(19)Essentially, any behaviour or physiological component reflected in an external movement, no matter how small, can be measured and recorded.
常見的關聯副詞之前一般有程度副詞most修飾,體現出重要程度的加強。
(20) Mostimportantly, the approach is not subject to combinatorial complexity during data association.
(21) Mostsignificantly, these techniques are not in situ methods of analysis, and require environmental and patient sample collection to be performed separately and independently from laboratory-executed identification, detection and analysis.
此外,一些不提示關鍵內容的副詞形式被排除在關聯標識之外。如,當significantly修飾形容詞,表示數據上的差異時:
(22) The region to the right of the vertical dashed lines for left side and right side anomaly measure curves in the top plate on left column of Fig.10 can be considered to be the boundary of the crack initiation and crack propagation phases, where the growth of anomaly measure issignificantlyfaster than that in the crack initiation phase.
另外,當significantly提示產品性能改變的程度時:
(23) The results clearly show that the algorithm was able to automatically identify trackable objects (targets) in the presence of clutter, and that sensor fusion resulted in tracking and localization performance that improvedsignificantlywith an increase in the size of the UAV swarm.

表4 副詞模式及其范例與頻數(N=20)
綜合以上各種關聯標識模式,依據其分布特征和頻數,可以得到如下結果:動詞、名詞、 形容詞和副詞關聯標識模式中,動詞模式出現頻數為417次,副詞模式出現頻數為20次,名詞(33次)和形容詞(27次)模式介于其間。

圖1 動詞、名詞、形容詞、副詞關聯標識QQ圖
如圖1所示,動詞模式關聯標識出現頻數最高,遠高于名詞、形容詞和副詞模式的頻數,而副詞模式出現頻數最低。動詞、名詞、形容詞和副詞模式頻數形成非正態分布。
而在動詞關聯模式中,最常出現的為V clause類型(349次),其次為1p pers pron V n/clause類型(65次),名詞模式中的MN v-link類型(29次)與形容詞模式中的it v-link ADJ clause類型(23次)居于其后,接下來為副詞模式(20次)。deic v-link MN,1s pers pron V n/clause,deic v-link ADJ,mn v-link ADJ,what v-link ADJ v-link n/clause類型出現頻數很低,為4次及4次以下。

圖2 各類關聯標識模式的箱線圖
如圖2所示,V clause模式被歸為異常值,說明這種模式出現頻數遠遠多于其他模式的頻數,在提示論文關鍵內容上起著非常突出的作用。中位數值較低,下邊緣線與下四分位數重合,說明有較多關聯模式的出現頻數較低,這更突出了其他頻數較高關聯模式在展示論文重要內容中的意義和作用。
對于科研工作者來講,快速把握英語EST論文中傳遞的思想和強調的重點內容,并能夠用恰當的形式展示所寫論文的主要內容,突出關鍵信息,是一件很有意義的事情。然而,傳統的ESP研究未能從詞匯語法的角度,對句子中的許多關聯標識加以列舉,僅使用一些不是從語料庫中選取的范例,或者關注于一些看似典型,但實際并不常見的關聯標識,如the important point is。本研究表明,在實際應用中,關聯標識涵蓋的范圍相當寬泛,而其中最常見的類型,如V clause、1p pers pron V n/clause、MN v-link等類型是我們一般情況下憑借直覺想象不到的。研究可以幫助科研工作者和學習者識別各種真實常用且富于變化的關聯標識形式,引導他們去關注那些在EST論文寫作中頻繁出現、功能多樣的關聯標識,了解這些廣為接受的語言偏好,以快速把握論文的關鍵信息,促進在這一領域里的有效交際。
[1]Hunston, S.Evaluation and organization in a sample of written academic discourse.[A].In M.Coulthard (eds.)AdvancesinWrittenTextAnalysis[C].London: Routledge, 1994.
[2]Bednarek, M."An increasingly familiar tragedy": evaluative collocation and conflation [J].FunctionsofLanguage, 2008, 15(1).
[3]Heino, (A), Tervonen, E.and Tommola, J.Metadiscourse in academic conference presentations [A].In E.Ventola, (C) Shalom and S.Thompson (eds.)Thelanguageofconferencing[C].Bern: Peter Lang, 2002.
[4]Allison, D.and Tauroza, S.The effect of discourse organisation on lecture comprehension [J].EnglishforSpecificPurposes, 1995,14(2).
[5]Bj?rkman, B.The pragmatics of English as a lingua franca in the international university: Introduction [J].JournalofPragmatics, 2011, 43(4).
[6]Jung, E.H.The role of discourse signaling cues in second language listening comprehension [J].TheModernLanguageJournal, 2003, 87(4).
[7]Titsworth, B.S.and Kiewra, K.A.Spoken organizational lecture cues and student notetaking as facilitators of student learning [J].ContemporaryEducationalPsychology, 2004, 29(4).

[9]Thompson, G.and Hunston, S.Evaluation: An introduction [A].In S.Hunston and G.Thompson (eds.)Evaluationintext:Authorialstanceandtheconstructionofdiscourse[C].Oxford: Oxford University Press, 2000.
[10]Crawford Camiciottoli, B.Audience-oriented relevance markers in business studies lectures [A].In G.Del Lungo Camiciotti & E.Tognini Bonelli (eds.)Academicdiscourse:Newinsightsintoevaluation[C].Bern: Peter Lang, 2004.
[11]Crawford Camiciottoli, B.Thelanguageofbusinessstudieslectures[M].Amsterdam: John Benjamins, 2007.
[12]Deroey, K.L.B.and Taverniers, M.Just remember this: Lexicogrammatical relevance markers in lectures [J].EnglishforSpecificPurposes, 2012, 31(4).
[13]蔡基剛.“學術英語”課程需求分析和教學方法研究[J].外語教學與實踐, 2012(2).
[14]羅娜,陳春梅.理工科碩士研究生學術英語需求分析[J].當代外語研究, 2012(5).
[15]Abdelgawad Ahmed Alastal and Munir Shuib, Investigating the academic English language target needs of undergraduates at the Faculty of applied science at Al-Aqsa University: Students’ Perceptions [J].TheAsianESPJournal, 2012.
[16]蔡基剛,陳寧陽.高等教育國際化背景下的專門用途英語需求分析[J].外語電化教學, 2013(5).
[17]蔡基剛.國際科學英語和中國科技英語學科地位研究[J].浙江大學學報(人文社會科學版), 2016 (3).
[18]楊元媛.基于語料庫的科技英語論文四詞詞簇特點研究[J].外語教學理論與實踐, 2013(4).
[19]Swales, J.M.and Burke, (A) "It's really fascinating work": Differences in evaluative adjectives across academic registers [A].In P.Leistyna and (C) F.Meyer (eds.)Corpusanalysis:Languagestructureandlanguageuse[C].Amsterdam: Rodopi, 2003.
[20]Giannoni, D.S.Mappingacademicvaluesinthedisciplines:Acorpus-basedapproach[M].Bern: Peter Lang, 2010.
[21]Hunston, S.and Francis, G.Patterngrammar:Acorpus-drivenapproachtothelexicalgrammarofEnglish[M].Amsterdam: John Benjamins, 2000.
[22]Hunston, S.and Francis, G.Verbs observed: A corpus-driven pedagogic grammar [J].AppliedLinguistics, 1998, 19(1).
[23]Peacock, M.A comparative study of introductory it in research articles across eight disciplines [J].InternationalJournalofCorpusLinguistics, 2011, 16(1).
[24]Hunston, S.and Sinclair, J.A local grammar of evaluation [A].In S.Hunston and G.Thompson (eds.)Evaluationintext:Authorialstanceandtheconstructionofdiscourse[C].Oxford: Oxford University Press, 2000.
[25]Hewings, A.and Hewings, M.Anticipatory 'it' in academic writing: An indicator of disciplinary difference and developing disciplinary knowledge [A].In M.Hewings (eds.)AcademicwritingincontextPapersinhonourofTonyDudley-Evans[C].Birmingham: The University of Birmingham, 2001.
[26]Swales, J.M.Metatalk in American academic talk: The cases of point and thing [J].JournalofEnglishLinguistics, 2001, 29(1).
【責任編輯:郭德民】
2017-03-05
河南省教育廳人文社會科學研究項目“基于TED演講語料庫的關聯標識分析與混合式學習GUI構建”(編號:2016-gh-141)。
楊元媛(1978—),女,河南商丘人,講師、碩士,主要從事語料庫語言學與應用語言學研究。
H05
A
1672-3600(2017)07-0103-06