李華鵬,薛 崢,郭彩霞
(1.山西大同大學數學與統計學院,山西大同 037009;2.湖北民族大學文學與傳媒學院,湖北恩施 445000)
一直以來,通過對著作情感態度、創作背景、創作目的等角度來進行賞析的傳統文學賞析方法是了解研究作家作品及作家本人的主要方式之一。傳統的經、傳、筏、釋、注等文獻在對著作進行解釋、表達個人看法,后世學習并傳承前人古籍,進而研究歷史文化的學習歷程中有著重要作用;在作品鑒賞、文學批判中占據重要地位。隨著計算機語言的發展,在對自然科學研究的同時,也有研究者致力于將計算機語言和統計分析方法應用于社會科學當中,以統計分析為支撐的文學分析方法開始出現并發展。例如,陳炳藻從詞匯統計角度對《紅樓夢》作者的研究[1],陳大康對《紅樓夢》后四十回作者的研究[2],李賢平對《紅樓夢》提出的觀點[3],韋博成對《紅樓夢》前八十回與后四十回文風差異的統計分析研究[4],鄧擎瓊、彭煒明、尹乾、趙世鳳、王學松等人運用Python 軟件對文本進行詞頻統計的研究[5],邱小燕對文本進行句子長度分析的研究[6],劉海燕、尹曉虎對多斯·帕索斯小說的句子分析等等[7]。
在歷史方面,三國時代自古就備受關注,直到《三國演義》的問世,將人們對這段歷史時期的研究興趣推向高潮,“三國熱”經久不衰。而作為三國時期的風云人物、《三國演義》中的主角之一,諸葛亮一直是各界學者不斷探討的焦點。近年來,有關三國和諸葛亮的電視節目、學術講壇越來越多,所發表的看法也越來越多元化。良莠不齊的觀點在網絡信息傳播十分發達的當今社會,幾乎沒有經過人們認真思考篩選就被默認為歷史,僅僅通過個人主觀判斷來作為評判歷史人物的依據,其說服力意不如從前。本文從統計分析角度出發,將定量與定性、統計與文學相結合,以數據為支撐,文學賞析為輔助,將《諸葛亮集》具有代表性的篇目進行分析。
詞頻統計,是利用軟件將所分析分本的txt 格式導入后,將文本中的詞匯按照出現頻率做出統計,從而對文本的詞匯運用和詞匯頻率進行分析。通過這種分析,可以初步判斷作品主題,作者的用詞特點、語氣風格等方面的內容。
句子長度分析指將所分析的文本txt格式導入編程軟件后,將文本的所有標點符號除去后,再根據分句原則,在原先文本的句號、問號及感嘆號所在位置用特殊符號代替,以此達到對句子進行分離。將分離后的句子首句設為一行,下一句另起一行,以此類推,最后統計出句子長短、字數等頻數。這種方式同樣也可以作為判斷作品風格等方面的依據。
選取出《諸葛亮集》中可以根據文章主題、涉及人物、事件時間、創作背景等因素確定出創作大致時間的文章,根據諸葛亮出山后的經歷和局勢,劃分出兩個階段。具體劃分情況如下文所述。另外,再選取可以集中體現作者思想的兩部著作《便宜十六策》與《將苑》。將兩階段有關文章及兩部著作分為四個文本集合,分別進行軟件分析,其中,對整體篇幅較長的第二階段文本集和《便宜十六策》文本集作詞匯頻數統計分析,對四個文本集均分別進行句子長度統計分析。
通過對詞匯統計選出高頻詞匯,可以從統計分析角度初步判斷在該文本集中所涉及的主要內容與主題;將詞匯進行篩選分類,可以初步統計該文本集大致涉及哪些方面的內容,從而推測作者在一些方面是否有所了解及了解情況如何。通過對句子長度統計繪制句子長度頻數圖,可以對圖形進行對比,從而初步判斷哪些文本集的行文形式有似,從而初步對兩部著作文本集創作時間進行歸類;此外,通過對文本句子長度與句子量的比較,結合具體內容與創作局勢背景,可以初步推斷出行文風格原因與文風變化原因。
《諸葛亮集》收錄了《三國志》、《三國志裴注》、《魏略》、《太平御覽》等史料有載諸葛亮所作奏表、書信、教令、軍令、兵要、雜文、序注等各類文體[8]。本文選取中華書局版《諸葛亮集》中部分篇目,依據史料對選取文章按當時局勢分為兩類,如表1所示。

表1 時間段分類篇數匯總
第一階段為建安十二年(公元207 年)至章武三年(公元223 年),即從劉備三顧茅廬到劉備駕崩階段;第二階段為建興元年(公元223年)至建興十二年(公元234年),即從劉禪登基之諸葛亮去世階段。兩階段篇目選取共計75篇。
中華書局版《諸葛亮集》卷三收錄了諸葛亮所作兩部著作,分別為《便宜十六策》與《將苑》,表2 對這兩部著作進行簡單篇數匯總。

表2 兩部著作篇數匯總
對整體篇幅較長的第二階段篇目集與《便宜十六策》兩部分進行詞匯統計,其中第二階段軟件自動識別詞匯共計749個,《便宜十六策》軟件自動識別詞匯共計759個,下文將分別對其進行具體說明。
根據文言文用詞、語法以及所得詞匯包含字眼,對軟件自動識別出的詞匯篩選出出現頻率前一百個的含有效實詞的詞匯,并繪制出頻數為前三十的高頻詞匯頻率圖見圖1。

圖1 第二階段文本高頻詞匯頻率圖
從圖1 中可以看出,在劉備駕崩后,諸葛亮所作文章大多與先帝、陛下、北伐有關,其中先帝出現頻率最高,天下和漢室次之。而與天下和漢室相關聯的內容就是北伐,可見,在第二階段的局勢下,諸葛亮的任務重心放到了輔佐教導后主和北伐中原上面,開始成為實現興復漢室使命的核心主干。
此外,將軟件自動識別的所有有關先帝、陛下、北伐方面的詞匯篩選出來,將同近義詞歸類,把三類主題的詞匯分類匯總后,所得結果如圖2所示。

圖2 三大主題詞匯頻率匯總圖
從圖1 和圖2 可以看出,后主繼位、三國鼎立時期,諸葛亮作品主題放在了劉氏父子和北定中原上,同時,有關平定南中方面的詞匯也較多。在頻率為前一百的詞匯中除了上述方面,還有當時的一些能臣干吏和社稷民生有關的內容。結合所選取篇目的具體內容來看,當時經過夷陵之戰,季漢急需恢復國力,又要穩定人心,與東吳交好,正值發展紡織、鹽鐵、水利,起用蜀地名士與青年俊杰之際,許多人才如杜微、蔣琬、費祎、董和、董允等得到重用,其中蔣琬、費祎后來更是接連成為掌權之臣。
《便宜十六策》是大致作于第二階段時期,其中十六篇文章涉及了治國、君臣、軍事、處事、用人等諸多方面,是對諸葛亮學識、思想、知識面和閱歷的很好體現。根據文言文用詞、語法以及所得詞匯包含字眼,對軟件自動識別出的詞匯篩選出出現頻率前一百個的含有效實詞的詞匯,并繪制出頻率為前三十的高頻詞匯頻率圖3。

圖3 《便宜十六策》高頻詞匯頻率圖
通過對詞匯篩選將所有有效詞匯大致分為兩方面主題,即治國修身與治軍用兵兩大類,分別占比52%和48%。在《便宜十六策》中,諸葛亮對兵法、軍紀、用人、用兵有多方面的見解,結合《便宜十六策》具體內容來看,可以猜測諸葛亮認為統帥和君主在對待下屬和賞罰制度上都要有極為嚴格的準則,一國之君要懂得馭將馭兵,一軍之帥要懂得如何在君主和下屬之間忠誠高效地任職;同時,不論作為君主還是統帥,都必須學會如何修養自己的心性,也要學會怎樣識人用人。這些文章說明諸葛亮在政治、軍事、法律等方面有系統的知識體系,而不單單只是片面、狹隘的個人觀點。
圖4 給出了所分析的兩個文本集頻率為前三十的高頻詞匯的詞云。

圖4 高頻詞匯詞云
對第一階段、第二階段、《便宜十六策》和《將苑》四個文本集進行句子長短統計分析,繪制出句子長度頻數分布直方圖,結果如圖5至圖8。

圖5 第一階段句子長短統計頻數圖

圖6 第二階段句子長短統計頻數圖

圖7 《便宜十六策》句子長短統計頻數圖

圖8 《將苑》句子長短統計頻數圖
從四張頻數圖對比可見,在劉備集團創業發展,局勢良好的時候,諸葛亮所留作品數目相對較少,句子長度總體短于第二階段。可以認為這與當時諸葛亮的實際權力、地位以及劉備本人對團體經營的投入度有關,在這一局勢下,諸葛亮職責相對輕松,整個集團也以戰事為主。史書記載劉備接手荊州時是赤壁大戰取勝后,接手益州時是在劉璋治理蜀地、相對富裕的情況下;而到了季漢國力遭受打擊后,隨著劉備的病逝,舉國重任幾乎移到諸葛亮一人身上,“事無巨細,咸決于亮”,這時諸葛亮需要管理的方面也增多,奏表及與人來往書信篇幅明顯增長,言語也更詳盡,這也符合《三國志》所載的當時有人把諸葛亮與周公等先賢對比,認為諸葛亮的言教“過于丁寧周至”的情況。而陳壽、李密人認為,導致諸葛亮文風如此的原因在于周公等人說教的對象是賢人,文辭自然典雅高級;而諸葛亮說教的對象主要是平凡下屬,說教內容以實事為主言辭自然樸實細致。
結合詞匯統計分析結果,對諸葛亮作品情感態度可以有如下解釋。在諸葛亮的作品中,不論是從一開始的《草廬對》,還是到后來的《出師表》,他都將興復漢室作為堅定的理想信念,終生為之奮斗,這也是千百年來人們敬仰他的原因之一。而自劉備駕崩,諸葛亮肩負托孤重任,因此,尤其在對劉禪的奏表中,除了興復漢室的感情,他還表達了對先帝劉備的懷念感激、報效厚恩之情及對劉禪的關心呵護、教導指點之意。至忠至誠,溢于言表。
通過對句子長度分析對比,可以看出在不同的時期、不同的歷史局勢背景下,諸葛亮的作品風格有些許差異。《諸葛亮集》收錄的從諸葛亮出山到劉備去世期間作品大多以書信為主,篇幅很短,陳述或者答復開門見山,論人多用直接比較,很少用修辭,往往只有三言兩語,如《與關羽書》、《與先帝書》、《答法正書》等等;而從劉禪即位到諸葛亮去世,《諸葛亮集》收錄的這段期間作品較多,篇幅長短不一,論事先做鋪陳,尤其在對后主的奏表中可以明顯感覺到語氣和緩、親切,敘述詳盡,議論方法常常對比、舉例等多種方法并行,且循循善誘、層層遞進,這些差異與年齡的增長及閱歷的疊加有關,也與諸葛亮所面對的對象的變化有關——在平輩與晚輩、同僚與君主之間轉換不同身份。
而從主題角度看,與其他作品從篇幅和表述方式來看有明顯不同的,就是有關北伐的幾篇文章,典型如《為后帝伐魏詔》、《出師表》、《后出師表》等,用詞慷慨,節奏緊湊,陳理清晰,說服力強;再如《正議》,作為一篇回復曹魏一干大臣勸降的書信,它更是一改往日樸實的語言,氣勢磅礴,用典頻繁。