摘 要:本文介紹了文獻中常用的結合語料庫進行文學作品分析的一般方法,總結了這種新型工具的優缺點,并通過對一些實例的分析指出該方法的局限性,認為在深入閱讀文學作品的基礎上探討文本意義才是進行文學評論的最重要方法,而語料庫只能作為輔助手段。并對語料庫分析方法的適用范圍提出了自己的見解,即更適用于長篇文本。
關鍵詞:語料庫 文學作品 分析方法
借助語料庫進行文學作品的分析是近些年出現的語料庫語言學的一個應用。這些分析主要集中在對外國文學作品(尤其是英文文本)的分析上。分析的方法主要是以語料庫為依托,進行一些指標的統計。包括形符數、類符數、類符形符比、句子數、平均詞長、平均句長、句長標準差、段落數、平均段落長、段落長標準差等。其中形符數指的是文本中詞語的個數,與句子數一起反映文本的篇幅;類符數指的是文本中詞語的類別數,單獨來看雖然沒有什么意義,但與形符數一起構成的類符形符比(也叫詞匯密度)則反映用詞的多樣性和語體的正式程度。由于不同容量的語料庫類符/形符比不具可比性,故一般用標準化類符/形符比來衡量語料庫的詞匯密度。語體越正式,詞匯密度越高;反之,詞匯越口語化,密度越低。平均詞長是反映用詞的常用性程度和文本難易度的一項指標。而平均句長與句長標準差則反映了文本句子的長度,是否比一些簡易文本的句子要長。
肖普勤 黃鳳枝(2005)認為語料庫除了可以進行上述文本總體特征的統計,在主題和情節、人物刻畫以及修辭分析方面也有用武之地。如可以通過關鍵詞詞表了解文本的關鍵信息(包括故事主題、主要人物、時間地點、背景、一些重要的描述性信息等)和主要情節(楊建玫2002 有例證),如可以通過詞圖理清故事情節的開始、發展、高潮、結局等各環節,如可以借助人物關鍵詞來認識包括外貌、活動、性格、心理在內的人物形象,如可以通過確定適當的檢索項辨識作品中修辭方法的使用情況。
上述指標證明了語料庫量化分析的這一優勢,除此之外,李晉 郎建國(2010)認為,語料庫工具在發現文學文本的語言特征、驗證理論模式、支撐以往的文學評論、挖掘文本的隱含意義方面為研究者提供了更便捷的服務。宋沁潞(2008)認為,運用基于語料庫的數理統計與分析的方法來考察某個作家的語言特點,可以為文學的計量研究提供新的思路和方法、開拓語言學與文學邊緣交叉學科研究的新領域。楊秀珍 續娜 劉美瑜(2010)認為,語言研究者借助于料庫檢索工具可以觀察到用傳統方法無法發現的很多語言事實,能夠對語言本身進行更加客觀的描寫和解釋,增加解釋的說服力。針對文學作品中的詞匯,他們還進一步指出對于外語學習者來說,運用語料庫手段分析文學作品詞匯的方法有助于提高學習外語的效率,增強選詞、用詞的能力,從而提高對外國語言文化的欣賞水平。
盡管語料庫是一種新穎、快捷、有效的分析文學作品的方法,但前人也已看出其存在的不少缺陷。比如宋沁潞(2008)中提到的論文寫作的幾大難點都與語料庫有關,一是用分詞軟件進行分詞并詞性標注后存在大量錯誤,需要使用人工干預的方法進行校對;二是小說中涉及到的很多專有名詞,超出辭典范圍之外,很難通過分詞軟件進行識別,增加了研究難度;三是在小說中創造性運用的詞語單靠計算機很難識別,必須進行人工干預進行查找。該文最后針對用語料庫分析作家的語言特色這一點上還提到,研究一個作家的語言特色除了他使用的詞語之外還應該包含句法、句式和修辭方法的選用等方面,而這些研究僅僅使用語料庫和統計的方法很難做出令人滿意的結論。楊秀珍 續娜 劉美瑜(2010)提出了語料庫的另一個不足,即建立費時費力,且研究方法比較復雜,不易在短時間內普及。
筆者總結了一下上述觀點,概括出使用語料庫進行文學作品分析的四個主要的優點和缺點。優點包括迅速便捷;采用量化分析手段增強解釋的說服力;提供文學作品分析的新思路和新方法以及提高對文學作品的欣賞水平。不足包括會出現分詞和標注錯誤,需要進行人工校對;語料庫分析能力有限;語料庫建立費時費力和語料庫研究方法復雜。
筆者認同曹莉敏 李海濱(2010)的說法“語料庫方法僅僅是對傳統文學篇章分析的一種補充”,認為語料庫對于文學作品的分析能力有限,且以較淺層次居多。如宋沁潞(2008)雖在其碩士論文中用了兩章的篇幅來討論如何利用語料庫分析金庸小說的語言,但分析也僅僅停留在對高頻字(詞)、低頻字(詞)的研究上,得出的結論如“金庸小說共使用了三萬左右的詞條,其高頻詞都是單音節詞,結構助詞、人稱代詞和指示代詞占了很大比例?!皖l字主要出現在金庸小說的專名、詩句、奏章中。這些低頻字很多都是我們所不熟悉的生僻字,這部分字的使用一方面說明金庸文字功底的深厚及其文史知識的廣博,同時也進一步說明生僻字在構詞方面的缺陷?!ㄟ^《鹿鼎記》中用詞與《現漢》中詞語的對比,我們可以看出,金庸所使用的詞語主要還是以典范的現代漢語為基礎,為了創作的需要在專有名詞、習用語、成語、擬聲詞等方面有所創新。這些創新的詞語不會給讀者帶來閱讀上的障礙,反而因其大量使用帶有口語色彩的詞匯,或者將成語或俗語改造后使用,使得他的作品雅俗共賞,容易引起讀者的閱讀興趣。從這一點來講,這也是金庸作品得以廣泛流傳的一個重要因素。”這些結論,或者顯而易見,并不需要通過語料庫檢索這樣的方式加以驗證,或者對于金庸小說語言特色的研究并無太大價值,例如文章的第四章 金庸小說語言特色分析就不是在語料庫的基礎上進行的。筆者認為全文與語料庫相關的部分,只有兩點可算作閃光之處,一是作者在人工校對的過程中,發現了金庸創造性使用語言的用法,并通過分析該用法發現人物的形象特點,如“羞月閉花”、“一言既出,死馬能追”等詞刻畫出了韋小寶胸無點墨,語言粗俗的特點。二是作者認為金庸語言特色的一個重要組成部分為作品中大量的重疊形式,包括動詞、形容詞、量詞等的重疊,具有用語料庫進行研究的價值,但同時指出,目前使用漢語詞法分析系統卻又無法將其一一挑出從而進行研究。
另外,曹莉敏 李海濱(2010)中對《金鎖記》一文一些意象詞,色彩詞,疊音詞,象聲詞以及人物塑造的分析,其實已經脫離了語料庫本身,因而筆者認為使用語料庫并無多少意義。
筆者認為這是我們在利用語料庫進行文學作品輔助分析時需要時刻牢記的一點。語料庫可以從大的、較為概括性的方面,通過一些統計數據總結文學作品的一些大致特征。如楊秀珍 續娜 劉美瑜(2010)可以通過自建語料庫與Brown語料庫對比分析后得出,《暮光之城》系列小說所用詞匯普遍短小,詞匯密度較高,口語化特征明顯,多采用動詞,句子簡短,敘事簡潔、平實,可讀性強,適合青少年閱讀。再深入一些可以得出動詞中一般過去時的高頻使用突出小說神秘感,與吸血鬼和人類相戀的主題不謀而合,增強了小說的趣味性和可讀性。但分析也僅限于此,更加細致的分析必須依靠讀者自己的體會。筆者還有一點想法,即語料庫分析的方法比較適合篇幅較長,或某個作者筆下的一系列的文學作品,這樣的數據統計和分析可靠性較高,若對一則短篇小說進行語料庫分析似乎就有些多此一舉了。
結合語料庫進行文學作品分析,筆者認為這可以作為隨著時代發展產生的一種新手段,新方法來看待,但由于其較為粗略的局限性,我們不能完全依賴于此,更不能認為它能替代傳統的對于文學作品的深入閱讀分析。我們“唯有深入地閱讀和分析文本,熟悉包括創作背景等及文學評論界的研究現狀在內的內容,才能發現并充分論證文本的深刻內涵。”
參考文獻:
[1]曹莉敏 李海濱(2010)基于語料庫的《金鎖記》語言學分析,《語文學刊》第7期。
[2]賀亞男(2009)基于語料庫的文學語篇分析——以《外婆的日用家當》為例,《內江師范學院學報》第5期。
[3]李晉 郎建國(2010)語料庫語言學視野中的外國文學研究,《外國語》第2期。
[4]梁健麗(2009)1997——2007年語料庫研究標題分析報告——從10種外語類核心期刊的標題看語料庫研究的發展和趨勢,《吉林教育》第10期。
[5]宋沁潞(2008)金庸小說語言研究,山東大學碩士學位論文。
[6]肖普勤 黃鳳枝(2005)基于語料庫的文學作品分析方法初探,《外國語》第8期。
[7]楊建玫(2002)《警察與贊美詩》的語料庫檢索分析,《四川外語學院學報》第3期。
[8]楊秀珍 續娜 劉美瑜(2010)基于語料庫的《暮光之城》系列小說詞匯特點初探,《長春理工大學學報(社會科學版)》第2期。
[9]張海云 謝群芳(2010)基于語料庫的文學作品檢索分析——以越南中篇小說《志飄》為例,《解放軍外國語學院學報》第3期。
作者簡介:韓博,男,山西人,初級助教、內蒙古師范大學漢語言文學專業文學學士,北京語言大學漢語國際教育專業在職碩士研究生,現任職于包頭輕工職業技術學院。