陳 虹
(安徽財經大學 文學院英語系)
廣義來講,每個語篇都建立在回溯的基礎上,因為閱讀是不斷積累信息的過程,沒有前面的信息很難理解當前的內容。俄羅斯學者И.Р.Гальперин(1981:106)語篇范疇理論中的回溯(ретроспекция)是一種特別的現象,它屬于語法范疇,故意把讀者的注意力引導至上文,使讀者關注先前敘述的事實內容信息,并同時能夠把先前的內容和當前的內容統攝為一體。因此,回溯范疇是作者構建語篇結構、表現主題思想的重要手段和方法,對它的研究有助于更好的理解語篇形式和內容上的關聯,具有重要的語言學意義。
目前,國內外學者對語言學中回溯范疇的研究主要集中在兩個方面。一是對其理論的探討,包括回溯的判定、基本特征、表現形式、作用和功能等;另一個是在對文學作品的時間范疇進行研究時,把它作為一種文學時間的延展方式。
回溯范疇在理論方面的研究至今沒有超出И.Р.Гальперин的思想框架,眾多學者都是以Гальперин回溯范疇理論為中心來進行研究。Гальперин(1981:105)認為,回溯由事實內容信息引起,其基本特征是時間發生前移,引導讀者回顧過去。А.Ф.Папина(2002:169)在此基礎上進一步認為,只要時間往回推就構成回溯。但Е.Е.Анисимова(2003:36)認為,Папина的觀點把回溯泛化了,只有在時間回推的過程中出現跳躍才出現回溯。我國學者史鐵強和安利(2008:45-46)比較傾向于Анисимова的觀點,他們認為,在語篇敘事中通常會有一個主線推動情節發展,但語篇并不總是呈現為線性,敘事中作者會插入議論或描寫,正敘中有時也會加入倒敘,因此語篇中存在著很多方法能讓主線推進出現暫停,讓敘事放緩,這種連續時空背景下的時間跳躍才是回溯產生的前提。關于回溯在語篇中的基本形式,學者們幾乎都贊同Гальперин(1981:106)基于語用目的不同而進行的三類型劃分方法:第一,恢復讀者或受話人頭腦中對此前已存信息的記憶,或傳達對理解語篇后續發展所必需的部分新信息;第二,使讀者或受話人能夠在新條件下或新的上下文中重新審視已存信息,并把回溯前后的信息加以對照;第三,體現那些與觀念內容信息間接有關的語篇個別部分。郭明(2012:265)在論著中曾提出過自己的三類型劃分:第一,“恢復讀者頭腦中已知信息或者表述針對過去的、新的、但對于理解下文必需的信息”;第二,“在新的條件下、在其他語境中,結合已知內容對這些信息進行想象、推理”;第三,“對概念內容信息間接相關的語篇片段進行整合”。把這個三類型劃分和Гальперин的三類型劃分相互對比,基本一脈相承,沒有很大區別。
回溯范疇由于與時間概念密切相關,因此也被置于文學時間的領域內進行研究。在文學作品的客觀時間模式下,說話人可以自由地對已知事實進行思考或回憶,即,存在著回溯式的時間延伸?;厮菔降臅r間延伸在文學作品中可以表現為作者運用倒敘或插敘的手法把敘述時間置換回過去,這是現實主義文學常用的推進情節的表現方式(車琳,2013:81-82)。它也可以表現為在機械時間坐標軸上的某一個準確位置,即依靠文學作品中人物的理智和主觀控制來回憶往事,這時的回溯往往表現為一個意識清晰、思維明確的作品人物有意識和目的的在記憶深處搜索一個確定事件,因此這種回溯具有時間上的客觀性和精確性,但卻不能體現心理時間的滲透和綿延(郭明,2012:107-113)。回溯式的時間延伸還可以構建文學作品的另一層時間,即意識流動時間。雖然它同樣主要依靠人物的思想和回憶來完成,但它是人物內心心靈時間的延展,是作品中的人物受到外界人或物的刺激后,在不經意間慢慢激活的、沉睡于無意識之中的記憶。這種回溯的時間形式可能是破碎、斷裂的,甚至是幻覺、超理性的,它常常被后現代主義的作家用在意識流小說中(盧婧,2005:45-49)。
在回溯范疇的研究中,幾乎全部的學者都把文學語體語篇作為研究對象,即使是對回溯理論的探討,所舉證的語例也幾乎都是文學作品中的,這不能不說是一個缺憾。在各種語體語篇中進行研究,才能保證對回溯范疇的研究具有普遍意義。
現在世界范圍內已建成的絕大部分語料庫遵循的都是詞匯主義思想,這些語料庫對能轉化為詞層面的研究十分合適(陳虹,2012:39-40)。但當研究上升到更高層次,如語篇層面時,這些已有的語料庫就可能不再適用,這時可以創建面向自己研究題目的語料庫(謝家成,2003:27)。大量的理論研究和實踐探索表明,依照常規的建庫原則,采用科學的建庫方法和程序,可以使自建的小型語料庫也同樣具有代表性(Meyer,2002;Biber,1994)。
遵照創建語料庫的一般原則、方法和步驟,我們建設了一個總詞次超過17.5 萬、擁有70 篇文本(30 篇文藝語體文本,20 篇政論語體文本和20 篇科技語體文本)、用于研究語篇范疇的小型俄語語料庫。庫中語料大部分來源于20 多個常用俄文網站隨機下載的公用語篇,少數語料是從國內著名出版社出版的俄語教材和教輔材料中隨機選用的語篇。小型自建俄語語料庫的全部語料通過手工操作方式進行了文本標注和面向研究問題的標注。
根據小型自建俄語語料庫的語料,可以對文學、科技和政論語體各語篇中回溯出現的類型和次數做出統計。表1是對自建庫中三種語體語篇中各類型回溯出現次數的匯總。雖然由于語料庫中不同語體語篇的數量不盡相同而使這個數據統計的比較意義不大,但它能讓我們粗略認識從語料庫中得到的回溯范疇數據的整體情況,并可以感覺到,有些類型的回溯只發生在特定語體的語篇中,有些類型的回溯在政論和科技語篇中出現的次數可能會比較少,事實是否如此,還有待于進一步驗證。

表1 回溯次數分布匯總表
為了對整個回溯范疇數據的主要特征和全貌進行比較全面的了解,可以利用均值和標準差對數據進行集中趨勢和離中趨勢的分析,利用公式計算出來的均值和標準差的統計結果詳見表2。

表2 回溯次數分布的統計分析表
從表2中的統計數據可以知道回溯在三個語體語篇中出現的總體平均次數為12次,次數分布標準差為13.47,這說明回溯在語料庫里語篇的次數分布是離散的。這一結論從回溯出現的次數最小值為0,最大為85 也能反映出來。觀察回溯具體表現類型的集中量數和離中量數可以發現,類型4 回溯是一個在自建語料庫所有語體語篇中平均出現次數最低、分布最集中的回溯類型。與類型4 正好相反的是類型3,它是自建語料庫中平均出現次數最多、最分散的一個。類型5 的平均值和標準差均比類型4 稍高一點,這說明它在自建語料庫語篇中的次數分布比類型4 多,但也相對更分散。
對表1和表2的數據觀察,不僅能夠對回溯整體情況和各類型情況有比較深入的了解,也能夠為進行統計分析時變量的選取和假設的建立提供參考依據??梢哉f對主要變量的統計數據進行描述性分析是進行假設檢驗的基礎和必要步驟。
要想對回溯在語篇中總體次數分布的影響因素進行分析,或者試圖找到導致類型4 和類型5 次數分布的原因,就要把回溯作為因變量,選取可能影響它的因素作為自變量,使用計量模型進行假設檢驗。
與其他語篇范疇一樣,至今學界都極少有對回溯進行實證分析的研究,也就無法找到相關經驗用來借鑒,究竟有哪些因素會對回溯的次數分布產生影響,是個值得探索的問題。語篇元標注是語篇外部特征的體現,我們可以嘗試把自建語料庫元標注系統中能夠使用的標注項都設定為回溯次數分布的影響因素。回溯范疇經常會被研究者與前瞻范疇聯系在一起,這兩個范疇之間大約存在著一定的影響關系。我們在以往的研究中發現語義獨立片段范疇與回溯有非常顯著的正相關關系,也就是說,語義獨立片段也可能是影響回溯在語篇中次數分布的因素之一。有鑒于此,我們對回溯在語篇中總體次數分布影響因素的研究,可以通過驗證如下三個假設來完成:假設一,回溯在語篇中的次數分布與語篇的功能范圍有關,即語篇的語體特征會影響回溯的次數分布;假設二,回溯在語篇中的次數分布與前瞻及語義獨立片段的次數分布相關,即回溯范疇與前瞻范疇、語義獨立片段范疇具有相關性;假設三,在任意語體語篇中,語篇字數越多,出現回溯的次數也會越多,即在回溯出現次數的影響因素中,篇幅長短因素比功能語體的因素作用更大。
還可以嘗試針對特定類型的回溯在語篇中分布次數的影響因素進行分析。在觀察表2中各類型回溯的數據時我們發現,在回溯的所有具體類型中類型3 離中趨勢最大,集中趨勢也最大,即這種類型的回溯很集中的分散在某些個別語篇中,因此很值得詳細研究一下它分布特征的影響因素。這樣可以選取回溯的類型3 和類型2與類型1 進行具體個案對照研究,探討它們各自分布特征的影響因素,這將有助于了解回溯各類型間分布特征影響因素的異同。
根據三個假設可以把前面提到的七個因素設為自變量,即功能范圍、語篇來源、語篇字數、作者性別、語篇發表時間、語義獨立片段出現的次數以及前瞻出現的次數。本研究中所有變量的定義和初步統計情況可見表3。

表3 回溯次數分布因素研究的變量描述
需要說明的是,在用STATA10.0 版本統計軟件在計算機上進行計算之前,需要把每個稱名型變量都轉換為虛擬變量。我們把時期自變量進行了簡單劃分:1830-1922年為沙皇時期,1923-1991年為蘇聯時期,1992-2015年為俄羅斯時期②。
回溯次數分布的影響因素分析可以使用廣義的線性回歸模型,并用普通最小二乘法進行參數估計。設符號HS 是模型中的因變量,表示回溯在語篇中出現的次數。把影響回溯在語篇中出現次數的因素設為X,作為模型中的自變量,根據廣義的線性回歸模型可以得到本項研究所需要的基本模型:

由于影響回溯次數分布的因素有七個,可以把它們分別代入基本模型,得到本研究所需要的拓展模型:

基本模型和拓展模型同時也可以作為回溯具體類型次數分布影響因素分析的基本模式和拓展模型。當基本模型作為回溯具體類型次數分布影響因素分析的基本模式時,模型左邊的因變量HS 不再表示總回溯次數分布,而是表示類型1、類型2或類型3 在語篇中的次數分布,模型右邊的因變量X,表示影響某類型回溯次數分布的影響因素。當拓展模型作為回溯具體類型次數分布影響因素分析的拓展模式時,模型右邊各項中的,……仍然分別表示各影響因素的系數,只是這里的影響因素是指影響某類型回溯次數分布的因素。把拓展模型和所有原始數據輸入10.0版本的STATA 軟件后,利用計算機運算可以得到相應結果。
總回溯次數分布影響因素的廣義線性回歸模型的計量結果如表2所示。樣本觀測值為70,說明自建語料庫中全部三個語體的70 個語篇都參加了運算,樣本是完全的。判定系數的值是0.686 0,說明建立的模型與樣本數據之間的擬合程度比較好。

表4 總回溯次數分布影響因素的計量回歸結果
根據前面設立的假設一,我們需要關注表4中的功能范圍變量。在功能范圍變量中,文學語體是對照組,政論語體與科技語體的系數值均為正,說明因變量與自變量之間正相關,即在總篇數固定、其他因素都不變的情況下,政論或/和科技語體的語篇越多,總的回溯次數也會越多,也就是說,在其他條件一致的情況下,文學語體語篇中的回溯次數比較少,政論和科技語體語篇中回溯出現的次數會比較多。觀察它們對應的P 值可以發現,只有政論語體與因變量之間的正向相關系在10%、甚至是5%的顯著水平上顯著;而科技語體與總回溯次數的分布正向影響關系是不顯著的。因此,我們可以得出結論,在其他條件不變、只有功能范圍發生變化的情況下,總回溯的次數分布可能會因語篇三種語體配置的不同而不同,其中可以確定的是,在5%的顯著水平上政論語體語篇的篇數越多,總回溯的次數也將越多。
為驗證假設二,需要在表4中分別查看語義獨立片段和前瞻兩個自變量的情況。語義獨立片段的系數值和P 值結果表明,它對總回溯次數分布的影響雖為正向但并不顯著。前瞻變量的系數值和P 值結果說明,前瞻對總回溯次數的影響是正向的,而且是極度顯著的。也就是說,在其他條件不變的情況下,語義獨立片段出現次數的多少,對回溯出現次數沒有多大影響;但前瞻出現次數的多少會極大影響回溯出現次數的多少,前瞻越多,回溯也會越多。
表4中的語篇字數變量結果表明,語篇字數與回溯次數分布呈正向影響關系,而且在5%的顯著水平上顯著。也就是說,在其他影響因素不變的條件下,在5%的顯著水平上語篇的篇幅越長,回溯出現的次數也會越多。
回溯類型1(回憶性的回溯)次數分布影響因素的廣義線性回歸模型的計量結果如表5所示。樣本觀測值70,等于全部自建語料庫的文本量;值為0.685 1,擬合度很好。

表5 回溯類型1(回憶性的回溯)的影響因素計量回歸結果
首先需要觀察表5中P 值小于0.1 的自變量,這樣就可以先確定對類型1 次數分布有顯著影響的因素。功能范圍中P 值小于0.1 的是科技語體,且系數值為負,這說明在控制其他因素的條件下,科技語體的語篇越多,回憶性回溯出現的次數會越少,這一結論不僅在10%的顯著水平上顯著,甚至在1%的顯著水平上顯著。自變量前瞻的P 值是0.000 0,系數值為正,這說明在其他條件一定的情況下,前瞻出現的次數越多,回憶性回溯出現的次數也會越多,它也在1%的顯著水平上顯著。自變量語義獨立片段的P 值表明,控制住其他變量時,語義獨立片段出現的次數越多,回憶性回溯出現的次數也會越多。從表5中還可以觀察到在時期變量中蘇聯時期的P 值也小于0.1,為0.056 0,系數值為正,這個結果說明在其他條件不變的情況下,發表時間屬于蘇聯時期的語篇數量越多,回憶性回溯出現的次數也會越多。
回溯類型2(引述性的回溯)次數分布影響因素的廣義線性回歸模型的計量結果如表6所示。樣本觀測值數量70,值0.316 4,稍低,但“在社會科學中,回歸方程中的過低是很正常的”,“一個看似很低的值并不意味著OLS 回歸方程沒有用”(伍德里奇,2010:38-39)。

表6 回溯類型2(引述性的回溯)的影響因素計量回歸結果
首先在表6中觀察P 值小于0.1 的自變量,即先選定在10%的顯著水平上對引述性回溯的次數分布有顯著影響的因素。這樣的自變量有四個:功能范圍中的政論語體和科技語體、語篇字數以及語義獨立片段。政論語體的P 值和系數值說明它甚至是在1%的顯著水平上對類型2 回溯有正向的影響關系。科技語體的P 值為0.090 0,系數值為正,說明它在10%的顯著水平上對類型2 回溯有正向影響關系。語篇字數的P 值和系數值結果表明,語篇字數與類型2 回溯在接近5%的顯著水平上具有正相關關系,即在其他條件不變的情況下,語篇篇幅越長,引述性回溯出現的次數就會越多。語義獨立片段變量的P 值為0.068 0,系數值為負,說明它與類型2 回溯在10%的顯著水平上具有負相關關系,也就是說,在其他因素不變的條件下,語義獨立片段越多,引述性回溯出現的次數反而會越少。我們還比較關注前瞻變量,它的系數值為正,但P 值為0.532 0,遠大于0.1,即它雖然與引述性回溯有正向影響關系,但這種關系并不顯著。回溯類型3(介紹性的回溯)次數分布影響因素的廣義線性回歸模型的計量結果如表4和5 所示。值為0.483 5,擬合優度一般,樣本觀測值數量為70。

表7 回溯類型3(介紹性回溯)的影響因素計量回歸結果
同樣可以先在表7中觀察P 值小于0.1 的自變量,即先選定在10%的顯著水平上對介紹性回溯的次數分布有顯著影響的因素。在表7中P 值小于0.1 的自變量有四個,分別為政論語體、科技語體、語篇字數以及前瞻。數據結果表明,政論語體在1%的顯著水平對類型3 回溯有正向影響關系,科技語體與類型3 回溯的次數分布在5%的顯著水平上存在正相關關系,語篇字數在1%的顯著水平上對類型3 回溯有正向影響關系,前瞻與類型3 回溯的次數分布在1%的顯著水平上具有正相關關系。
通過對計量結果的解讀和分析可以知道假設驗證的結果。第一,在其他影響因素不變的條件下,政論語體的語篇數量越多,回溯出現的次數也將越多,也就是說,功能范圍中的政論語體會影響回溯的次數分布,假設一成立;第二,在控制其他影響因素的條件下,前瞻出現的次數越多,回溯出現的次數也會越多,前瞻是影響回溯次數分布的重要因素之一,但語義獨立片段卻不是影響回溯次數出現的主要因素,它雖對回溯次數分布有正向的影響,但這種影響不顯著,因此,假設二部分正確;第三,在其他條件一定的情況下,語篇的字數越多,回溯出現的次數也會越多,假設三成立。
通過表4可以分析出回溯范疇整體上在語篇中次數分布的顯著影響因素情況,通過表5,6 和7 可以分別厘清回憶性回溯、引述性回溯以及介紹性回溯次數分布的顯著影響因素。觀察比較這些顯著影響因素可以發現它們中有的是全部因變量的正向影響因素,如語篇字數;有的在各個自變量中不相同,如語義獨立片段變量不是回溯總次數分布的顯著影響因素,但它與回憶性回溯次數分布有顯著的正向影響關系,與引述性回溯次數分布有顯著的負向影響關系,與介紹性回溯的次數分布沒有顯著的影響關系。不同類型的回溯在次數分布特征上一定存在著與總體情況相一致的顯著影響因素,但也會有自己獨特的顯著影響因素,即總體情況的顯著影響因素與各類型的顯著影響因素有同也有異。
利用語料庫和計量軟件對語篇層面上的特征范疇進行實證分析是一次有意義的嘗試,它是語言學作為社會科學向理性的自然科學靠近的結果之一。語言是一個非常復雜的系統,語篇更是一個開放的體系。語言研究已經很好的與哲學、心理學、社會學、人類學、教育學甚至經濟學等學科交叉融合,語篇的研究也可以從不同學科和角度切入,計量語篇研究也許有助于拓展人們對語篇研究的傳統認知。
注釋:
①結合Гальперин和我國學者史鐵強和安利對回溯表現形式的類型劃分,小型自建俄語語料庫把回溯劃分為六種類型,分別為類型1:回憶性的回溯;類型2:引述的話語或思想;類型3:介紹性的回溯;類型4:推斷、揣測性的回溯;類型5:非現實性的回溯;類型6:關鍵性事物引起的回溯。
②時期劃分的依據是蘇聯成立和解體的時間,蘇聯于1922年12月30日正式成立,1991年12月26日正式解體,以這兩個時間點作為粗略劃分俄羅斯歷史分期的界限。
③FS,ST,NC,SEX 和DP 分別表示功能范圍、語篇來源、語篇字數、語篇作者性別和語篇發表時間,是根據自建語料庫的元標注系統確定的。QZ 和YY 分別表示前瞻和語義獨立片段,是根據自建語料庫的文本標注符號確定的。