佟玉平 汪琳

摘要:計量文體學作為一種新的文體學研究方法,將語言學與計算機技術密切結合,對文章的語言特色進行定量分析,對文章的語言用詞方式、語言規律進行描述。總統就職演講作為一種典型的政治性文體,對其語言規律進行歷時性探索可以看出,在美國兩百多年的歷史里演講這種文體的語言進化過程。從最開始的探索過程到逐漸意識到演講對群眾的煽動作用,演講的用詞開始形成一個整體的規律。
關鍵詞:計量文體學 總統就職演講 語料庫
中圖分類號:H315 ?文獻標識碼:A ?文章編號:1009—5349(2019)19—0116—02
總統的就職演講實際上是借用演講的語言技巧來塑造新總統的良好形象,甚至向觀眾展示語言背后隱藏的意識形態。目前國內學者對總統就職演講的研究涉及語法隱喻、人際意義分析、文體分析、中美領導人語言特色分析、話語策略研究,以及系統功能語法框架下的批評話語分析、評價理論分析等多個領域。本文將從文章的用詞風格和文體特征這一方向出發,通過計量文體學理論從歷時分析的角度對總統就職演講這一文體進行概括總結。
一、文獻綜述
計量文體學基于語料庫的研究,以計量的方式定量地分析文本,在語料庫語言學的基礎上對文本進行更深入的統計與分析。Leech和Short早就認為文體學需要統計這種定量分析來獲得客觀的分析結果,以支撐對語篇文體特征的主觀判斷。[1]Enkvist也曾認定文體特征具有統計學原理。他認為文體標記在不同文本內出現的密度顯著不同,這就是語言文體學被稱為定量科學的原因。[2]計量文體學中一項流行的研究是測定文體。它研究不同語篇中的詞長、句長等特征以確定其作用。[3]
本文將對美國總統就職演講這一特殊文體進行計量文體學分析,以一種全新的角度觀察總統就職演講這一文體的歷時發展過程,觀察隨著時間的變化對語言發展的影響。計量文體學、語料庫語言學等研究中經常以AntConc,Wordsmith等語料庫工具進行分析。本文在分析工具方面大膽創新,將語言學與計算機更深入地結合,用人工智能領域的編程語言python的文本分析功能對總統就職演講進行計量文體學分析。
二、整個就職演講語料庫的語言特征
首先,使用python中的nltk(自然語言工具包)下載所有的語料庫資源。它包含了大量語料庫資源,如古登堡語料庫、布朗語料庫、就職演講語料庫、路透社語料庫等,python也有第三方庫,科學計算包numpy和scipy可以幫助計算語料庫翻譯中常用的定量指標。計算完成后,利用統計模塊對數據進行均勻性檢驗、方差分析和卡方分析。描述性統計也可以通過繪圖庫matplotlib可視化。[4]
總統就職演講的總形符數是135689;總類符數是9097。這意味著總統就職演講語料庫中有135689個單詞和9097個詞匯。形符數除以類符數的百分比為13.99%,標準百分比為42.4%。從這個判斷來看,詞匯密度應該是一般的。在總統就職演講中共有4191個低頻詞。如果我們不看上下文,就很難用低頻詞來理解文本主題。就職演說語料庫中最常見的詞是3個字母的詞。接下來是2個字母的單詞,第三個是4個字母的單詞,然后是1個字母的單詞。超過一半的單詞不超過4個字母。最長的單詞有17個字母,最短的單詞有1個字母。
還可以看出,只有4906個詞重復使用,起著重要的語義作用。因此對文本的分析研究實際上是集中在這些重復和經常使用的4906個詞上。
三、歷時性語言特征
不同的總統在演講時可能有自己的語言風格和習慣。因此,在總結就職演說語料庫整體語言特征的基礎上,從不同總統語言習慣的角度分析其語言特征。
使用python編程,可以方便地獲取總字符數、單詞平均長度、英語單詞總數、句子數、平均句子長度、詞匯數和單詞重復次數等數據。根據單詞和句子的因素,獲得的數據將重新整合到表1中。
表1可以看出,單詞數最多的年份是1841年,而單詞數最少的年份是1793年。據統計,在長度上有四個不同的階段:(1)建國初期,從第一任總統到第四任總統,大部分演講都是有接近一萬的字符數。此時,話題相對有限。例如,華盛頓的第二次演講只說我來這里向你們宣誓。(2)從第五屆到第十六屆總統林肯,演講字數急劇增加,增加了一倍多,有超過5000字的演講,以第九屆總統哈里斯為代表。他的演講共8464個字。這是從“門羅派”到內戰結束的時期。(3)內戰后,胡佛第31次大蕭條是美國經濟發展成為世界強國時期。這一時期的講話時間較長,但總體上減少了。(4)從第32位羅斯福到現在的特朗普,篇幅大大縮短了。隨著時間的變化,總統就職演說越來越多地使用了簡短的詞語,這似乎與時代的變化是一致的,演說越來越簡潔。
從“平均句子長度”和“單詞重復次數”兩列來看,近百年來,句子越來越短,單詞越來越短,詞匯重復次數也越來越多,這一點更為明顯。
總統的講話通常是1個小時左右。最長的是1841年威廉哈里森總統的演講,長達2小時。但是總統演講的時間越來越短,基本上大約是20分鐘。
四、結語
作為一種特殊的政治性演講,總統就職演講是一種非常具有代表性的珍貴語料。本文從計量文體學角度出發對總統就職演講的語言特征進行分析。得到結論為總統就職演講的詞匯密度一般。近百年來,句子越來越短,單詞越來越短,詞匯重復次數也越來越多。作為一種政治性演講,其規律性越來越強,在語言使用層面也趨向規律性和簡潔性。
參考文獻:
[1]McEnery,Tony& Andrew W.CorpusLinguistics.An Introduction[M].Edingburgh:Edingburgh University Press,2006.
[2]桂詩春,寧春巖.語言學研究方法[M].北京:外語教學與研究出版社,2005.
[3]胡壯麟,劉世生.西方文體學辭典[Z].北京:清華大學出版社,2004.
[4]王天奇,管新潮.語料庫語言學研究的技術拓展——“Python文本分析:用可實現的方法挖掘數據價值”[J].評外語電化教學,2017(10):177. ? ? ? ? ? ? ?責任編輯:趙慧敏