李艷芳,郭愛萍
(1.喀什大學外國語學院,喀什 844000; 2.太原理工大學外國語學院,太原 03000)
動態變化是語言的本質特征[1]。J.Ahmad強調,科技論文應該避免表達情感信息的詞匯或者其他不正式的語言成分,是一種典型要求文本正式度的文體[2]。然而,Hyland研究發現學術論文正式度呈現降低趨勢,尤其是在自然科學領域[3]。語言的這種態勢促使我們思考中國作者科技論文文本正式度。本研究通過自建中美作者科技論文語料庫,嘗試比較二者在文本正式度方面的差異,為中國學者寫出合乎科技論文行業規范的論文,提出合理化建議,同時為語料庫視角下文本正式度研究提供多維研究視角。
正式度是一個相對概念,往往由語言所產生的情境以及說話者的個人特點所決定,衡量正式度的標準是情境依賴程度、語言表達清晰度及介入性表達[4]。
關于科技論文正式度,國內外研究主要集中在歷時研究、對比研究和整體研究。其中,不同學科英語學術論文歷時研究發現,論文正式度呈現降低的趨勢[5];對比研究主要集中在英語本族語和非英語國家;整體研究體現在從正式度出發概括說明科技論文語體特征。
正式度的衡量指標主要有三個維度:一是詞匯,如詞匯密度、基于詞性文本正式度形容詞的密度;二是通過句法和語法衡量正式度;三是多維分析。Graesser研究結果表明,文本正式度增加意味著詞匯抽象程度、句法復雜度、指稱銜接和深層銜接的增加,而文本的敘事性不強。在此基礎上,給出了計算文本正式度的方法,即Formality=[referential cohesion+deep cohesion-narrativity-syntactic simplicity-word concreteness]/5[6]。
正式度是一個復雜的概念,需采用多維、多角度的方法衡量,因此本研究將基于語料庫,采用定量研究的方法,利用Coh-Metrix,以中美作者科技論文為研究對象,通過分析二者在敘事性、指稱銜接、句法難易度、詞匯體性和深層銜接這五個維度下文本正式度差異,為語料庫視角下文本正式度的研究提供一個多維研究視角。
本研究主要回答兩個問題:其一,中美作者在語體正式度方面有沒有差異,如果有差異,具體體現在哪些指標上;其二,造成中美作者語體正式度差異的原因是什么。
本研究的語料選自權威性核心期刊《Nature》,語料時間范圍為2014—2016年,選取中國作者科技論文55篇,美國作者50篇,總詞數為400426個,將中國作者語料庫命名為“Chinese Speaker Corpus”,簡稱CSC;美國作者語料庫命名為“Native Speaker Corpus”,簡稱NSC。
將text格式的文本導入Coh-Metrix進行分析,提取與文本正式度有關的50項指標,使用SPSS20.0進行描述性統計分析,對相關數據進行獨立樣本T檢驗,最后對存在顯著性差異的語言特征逐一分析。
深層銜接體現句子和小句間的連接關系;指稱銜接作為銜接手段的一種,對語篇的連貫起著重要的作用,反映的是相鄰句子間和所有句子詞匯重疊情況;句法簡約性通過句子長度、因果動詞和句法結構相似性體現句子難易程度;詞匯具體性指詞匯的意向、豐富性和具體性表;敘事性語言特點生動形象,文本句法結構簡單。由表1可知,中國的深層銜接、指稱銜接比美國高,美國的句法簡約性、詞匯具體性和敘事性得分比中國高。由此可見,中國正式度比美國高。

表1 各維度得分及總體正式度
1.敘事性維度分析
敘事性維度指的是文本是故事性的而非信息類。敘事性文本中詞匯熟悉程度較高、高頻詞語多、句法結構簡單。
顯著性差異指標包括CELEX所有詞詞頻對數、名詞短語前修飾語、詞性最小編輯距離和第一人稱單數。由表2可知,中國的所有詞的詞頻的對數比美國高,且存在統計學上的顯著性差異(P=0.04<0.05),由此說明中國作者的高頻詞匯使用比較多,而罕見詞匯使用比較少。
名詞短語前修飾語體現的是對中心詞語的修飾、限制、補充和說明作用。由表2可知,中國比美國高且存在顯著差異(P=0.04<0.05),究其原因主要是受漢語思維的影響,漢語習慣用“的”來體現定語,而英語中更加傾向于使用后置修飾語[7]。
第一人稱代詞單數結果顯示美國比中國多,作者采取一些評價性的語言表達自己的態度、觀點以及對他人觀點的認同程度來體現自己的立場,文本的互動性就會增強,可見中國的文本正式度偏高、互動性不高[8]。
Coh-Metrix基于最小編輯距離提供了衡量語義和句法相似性的指標,由表2可知,美國比中國高,意味句法相似度更高,也就是句法結構更加簡單[6],而句法越簡單,文本的正式度就越低,由此推知,中國的文本正式度比美國高。

表2 敘事性維度
2.指稱銜接
指稱銜接是語篇中的指代成分與所指對象之間的相互解釋關系,可通過簡短的指代形式表達上文已經提到的內容,從而使語篇銜接更加連貫[9]。
指稱銜接各指標的差距不明顯,由表3可知,實詞重疊和論元重疊中國和美國基本一致,但是反映詞匯多樣性的兩個指標MTLD詞匯多樣性和VOCD詞匯多樣性存在顯著性差異(P=0.028<0.05,P=0.014<0.05),因此,中國作者的詞匯多樣性比美國作者低,在詞匯的深度以及靈活使用方面遠不如美國作者。詞匯多樣性高,意味著文本詞匯使用豐富多樣,詞匯重疊的概率比較小,因此反映指稱銜接的名詞重疊、實詞重疊指標比較低。
指稱銜接維度下存在顯著性差異的是詞匯的最小編輯距離,指將一個字符串轉化成另一個字符串所需要的最小編輯操作次數,反映的是句子間的相似度。詞匯的最小編輯距離和指稱銜接和語義銜接相關性很高,反映的是句法的復雜度。由表3可知,中國作者的最小編輯距離比美國作者低,說明中國作者的句法相似度高,句法的復雜度低,從這個角度也能反映出中國作者的正式度比美國作者高[10]。

表3 指稱銜接維度
3.句法簡約性
句法簡約性意味著文本句子長度短、詞匯少、句法間的相似度高。復雜的句法結構中往往有很多的嵌入結構。難易度可以通過句子長度、謂語動詞前平均詞數和段落間句子相似性體現。
句法簡約性維度中存在顯著性差異的指標有因果動詞、段落間句子相似性和謂語動詞前平均詞數。因果動詞可以連接句子成分,使句子表達因果關系。由表4可知,中國的因果動詞比美國少,究其原因主要是中美思維方式和文化的不同,英語中通過因果連接詞或者因果動詞來表達因果關系,而漢語是通過語意和語句內關系的領悟來實現詞語和語句間的因果連接。
段落間句子的相似性反映文本句法結構的一致性,句子的相似性高說明句法結構簡單、文本正式度不高,更容易被讀者加工理解。由表4可知,中國的句法結構的相似度高,可能存在的原因是中國作者作為二語習得者在句法的靈活變換方面還有待提高。

表4 句法簡約性
謂語動詞前的平均詞數可以反映句法復雜度。讀者對于句法結構復雜的文本的理解比較困難,當文本中謂語動詞前的平均詞數、名詞短語前的修飾語、句子的長度都比較小的時候,文本的句法結構才容易被人們加工理解[11]。表4中的結果顯示,中國的謂語動詞前的平均詞數比美國高,由此可以推斷中國的句法結構比較復雜,因此中國的文本正式度比美國的高。
4.詞匯具體性
詞匯的具體性指的是詞匯意向性、豐富性和具體性。具體的詞匯通常會喚醒人們的心理表征,激發讀者的記憶,從而加深對詞匯的理解和記憶。意向性指的是一個詞在腦海中的心理想象的構建能力,具體性指的是詞匯的具體程度,豐富性指一個詞匯和其他詞匯的聯想能力。
由表5可知,中美在詞匯的意向性、具體性和豐富性這三個指標上雖不存在顯著性差異,但整體來看,中國在這三個指標上都比美國低。科技論文詞匯專業性強、詞匯表達準確清晰,中國的詞匯具體性維度得分低,說明中國的詞匯抽象程度高,因此文本的正式度就相對美國要偏高一些。

表5 詞匯具體性
5.深層銜接
深層銜接指的是句子和小句的邏輯關系,使讀者能夠準確把握文中邏輯關系進而預測文章結構。主要通過因果連接詞、邏輯連接詞、所有連接詞和時間連接詞表達文章邏輯關系。
由表6可知,中國的邏輯連接詞、所有連接詞、時間連接詞、目的小品詞和因果小品詞都比美國低,說明中國的深層銜接維度方面不及美國作者,但是不存在顯著性差異,唯一存在顯著性差異的是因果連接詞(P=0.042<0.05)。因果連接詞指的是語義上表示因果關系的詞語,在促進中美兩國作者科技論文的語篇銜接上有重要作用[12],究其原因主要是中國學者作為二習得者偏向于使用簡單句型,而本族語者更多使用復合句型,所以他們把原本可以用關系代詞和關系副詞表示的邏輯關系用連接詞來體現,所以連接詞的數量整體偏多。

表6 深層銜接
本篇研究采用文本分析工具Coh-Metrix,從敘事性、深層銜接、指稱銜接、詞匯的具體性、句法的簡約性這五個維度考察了中美作者科技論文語體正式度差異。研究結果表明,中國的科技論文的語體正式度比美國作者高,具體體現在名詞短語前的修飾語、CELEX所有詞詞頻對數、詞性的最小編輯距離、第一人稱代詞復數、詞匯最小編輯距離、VOCD、MTLD詞匯多樣性、因果動詞、因果連接詞、段落間句子的相似性和謂語動詞前的平均詞數這些指標上。動態變化是語言的本質特征,所以,作為二語習得者的中國學者應該意識到科技論文語體的變化,以本族語者英語為藍本,緊隨語體變化的趨勢,使自己的語言表達更接近于本族語者。