王建紅,冉瑩雪
(華北電力大學 馬克思主義學院,河北 保定 071003)
R語言是一個優秀的數據分析和制圖的軟件環境,它的設計提供了廣泛且多樣的統計性與圖形化技術,并且具有很高的可擴展性。它的優勢之一在于其設計優良的高質量的作圖效果與數學符號及公式的應用。其中,基于Syuzhet package安裝包做出的圖即為從文本中提取情感和情感衍生的情節弧,集數據統計分析與數據可視化于一體,它附帶了四個情感字典,并將其科學整合以方便R語言用戶的使用。不僅如此,它也提供了一種能夠訪問并使用由斯坦福自然語言處理團隊開發的情感提取工具與繪弧標準化等多種方法?;赗語言syuzhet安裝包的情感分析能夠對廣泛龐雜的文本大數據高效整合與分析,使得文本情感的獲得更加科學與便捷。
具體而言,這種情感分析方法是將自然語言文本作為分析對象,將每個單詞的情感值按其內部情感詞典的標準模型進行分值評估,基于正向情感詞匯的情感值大于0,負向情感詞匯的情感值小于0的評判標準(絕對值越大表示情感傾向越顯著),最后以“句”為情感分值計算單位,將其進行內部整合與算法結合計算得出該句的情感值。到目前為止,由于syuzhet安裝包在英文文本的分析處理中較為成熟與全面,不必進行分詞、停用詞添加等繁瑣處理,但鑒于其程序開發還未涉及到中文語言的分析與處理,所以這一工具在國內自然語言處理、圖像處理等方面還未有廣泛應用。也正是因此為中國學者對于國外自然語言的大數據分析與研究提供了可靠的研究思路與技術方法。
具體到《資本論》情感趨勢與文本內容比較分析,由于其堪稱科學巨著,包含3卷內容,全卷全文里英文單詞多達九十五萬余字,這無論對于初學者或是有待對其深入研究的學者來說通讀全3卷都是較為龐大與復雜的工作?;跀道斫y計的syuzhet情感分析工具包,可以在較有效地降低主觀因素傾向性干擾的前提下準確掌握文本語言整體的情感演變,根據結果,再通過定量和定性研究結合方式,便能得出更為客觀的評判,使結論更具說服力。
1.文本預處理
首先是獲取研究對象的電子文本。鑒于上述說明且為使分析結果更為準確可靠,本文以英文文本為語言處理對象,其電子文本來源版本為
2.分析過程說明
本研究具體的文本內容分析對象為《資本論》全3卷整體情感趨勢曲線中高峰、低谷區間中所對應的原文,所以在出現具有顯著特點的情感曲線波段上進行標注并通過橫坐標上標注的句子數量進行對應范圍的截取并定位原文。其具體操作過程操作如下:
(1)情感值曲線的生成
鑒于R語言syuzhet安裝包下涉及到的情感分析功能眾多,基于本研究文本的特點與研究目的,將主要以下列兩點作為生成情感值曲線對應函數功能的選擇依據。
其一,降低噪聲由于文本對象句數眾多,每句話的情感值體現在作圖中會生成密集且變動劇烈的曲線且結果易受極值影響,所以在這里使用zoo::rollmean命令通過滾動平均值的計算對曲線進行降噪處理。
其二,平滑處理與擬合去噪之后的曲線還未能展現較為明顯的整體情感趨勢,為了可視化效果更佳,這里使用get_dct_transform函數來通過使用離散余弦變換(DCT)代替快速傅里葉變換,以更好地展現邊緣值在情感向量中的平滑版本。其中還包括在low_pass_size命令中對曲線的平滑程度進行設置,當其值設置為10時,擬合效果最佳,為2處低谷與2處高峰;但由于擬合處理在一定程度上會使波動范圍發生偏移,所以本研究以設置值為12時生成的曲線圖為基礎,重點分析最高峰與最低谷以及具有代表性的曲線段。
(2)定位原文
在情感值曲線生成后對高峰、低谷區間內的曲線進行標記,并通過截取顯著轉折點作為劃分定位范圍的依據。為使定位結果更加精準,通過定位到的范圍內的首句與尾句,摘取其區間內的所有文本,并按照句子語序進行2次情感值曲線作圖。作圖后通過比對整體情感趨勢變化中的該部分,對定位范圍進行縮減或擴大調整。需要說明的是,本研究中定位范圍的首句與尾句都已歸屬到其屬原文的具體章節,并最終以章節序號為定位范圍劃分。
在對于
圖1 降噪曲線

從圖1可直觀看出,馬克思在全3卷的表述中情感起伏較大,其中有高于分值為10的正向情感,以及低于分值為-5的負面情感,且分值集中在[-5,5]區間內的句子數量眾多;擬合的曲線也具有較明顯的波動起伏,整體以情感值0為基準點展開分布。由此可見,此著作的書寫與表達凝結著作者豐富且飽滿的情緒,而非只是平白敘述以追求所謂的客觀性與科學性。
從文本內容角度看,在資本主義生產方式的內在矛盾突顯、無產階級與資產階級激烈斗爭的社會背景下,馬克思代表著無產階級的利益,以濃厚的階級情感來書寫《資本論》,他以喚起工人階級和一切勞動人民起來革命為口號,用推翻資本主義制度、創建社會主義社會的目標為指引,毫無隱藏地表達出其憤怒的激情和磅礴的氣勢[1]。
為了使文本的整體情感趨勢更為可讀,得出基于原始情感值曲線的平滑與擬合處理后的曲線(見圖2)。
圖2 平滑與擬合處理曲線

經過平滑與擬合處理后的情感曲線可得出《資本論》的情感在整體上為上揚趨勢,雖經歷兩處顯著的低谷曲折,但曲線后半段總體情感發生趨勢為正向,且完整曲線中明顯劃分為正負兩向情感走勢曲線。經過擬合后的情感值分布范圍有所縮減,其處理依據基于R語言的內部算法,最終得出擬合后的情感值居于[-0.1,1]。
對應到文本內容后,可大致得出全3卷全文前1/3的文本情感較為負向,其之后雖成上升趨勢并在文本中間部分到達頂峰,但在后1/3處也出現了情感值大于零且相對較為平緩的敘述。
由于擬合處理會在一定程度上使高峰、低谷對應的句子范圍出現偏移,故在此使用擬合程度較低的情感趨勢圖作更為具體的探討(見圖3)。
圖3 范圍標記曲線

由圖3可見,全文情感趨勢曲線按照其波動情況共標記8處,H1-H4與L1-L4分別表示高峰(High)與低谷(Low)范圍,高峰與低谷劃定具有相對性,其中情感高峰4處、情感低谷4處,下面將按照行文順序對標記處進行文本[2]對應說明。
全書開篇通過對商品、貨幣等概念的引入表達出馬克思對于資本主義制度對推動社會新變化的肯定,其情感呈正向態勢但隨著敘述的遞進由情感值0.5處開始逐漸遞減。情感趨勢曲線第1處低谷(L1)的情感值介于(-1,-0.5],原文對應主要集中在第4篇(相對剩余價值的生產)的第13章(機器和大工業)部分。在這部分論述中,馬克思從對個別企業的微觀研究入手,對資本主義社會暴露的問題與各種剝削現象進行嚴厲的批判,特別是提到現代工場手工業中對廉價勞動力和未成熟勞動力的剝削以及打壓時,他采取原話引用、數據列舉等表達方法,并結合豐富的采訪調查資料、實際觀察情況作為佐證和引例,揭露了資產階級為了獲得利潤而利用殘酷手段、機器工具壓迫無產階級的種種罪行。資本的生產過程實質是資本家剝削雇傭工人的剩余價值,資本的生產過程核心就是剩余價值的生產[3]。對這一核心問題的闡述,馬克思在兩篇章節的基礎上總結了剩余價值理論,揭示出掩蓋資本主義經濟關系本質的假象同時,又結合豐富的個人情感與卓越文采,飽含對無產階級所受遭遇的同情與憐憫,并站在他們的立場,用尖銳犀利的眼光、辛辣諷刺的語言對資本主義社會進行強烈的抨擊與批判。
第1處高峰(H1)的情感值略高于L1,但其值范圍始終在(-0.5,0)之間,且較為靠近情感值-0.5,這說明此部分的論述情感雖較上部分相比有所緩和,但論述的問題與現象仍體現出較顯著的負面傾向。原文對應到第1卷第7篇(資本的積累過程)第22章(剩余價值轉化為資本)至第23章(資本主義積累的一般規律)第4小節。馬克思通過對這部分的理論闡述與相關事實論述,對“擴大規模的再生產的資本主義形式”開展深入挖掘。此部分引用的案例與訪談少于上一部分且對于規律、理論的客觀表述增加,所表達的激烈負向情感隨之略有減少,這也是情感值較之前有所上升的原因。
情感趨勢曲線的第2處低谷(L2)也是整體曲線中情感值最低部分區間,其值到達最低點并在很大程度上接近情感值-1。原文對應到第1卷第7篇資本的積累過程部分,具體到第23章第5小節(資本主義積累一般規律的例證)至第24章(所謂原始積累)。在涉及到資本主義積累的一般規律的例證闡述與解釋時,馬克思大量引用醫生、經濟學家的調查研究來體現英國一些地區在資本主義社會資本的積累過程中對窮苦人民造成的災難與打擊,說明了資本在積累的同時,貧困、勞動折磨、受奴役、無知、粗野和道德墮落也在積累。

圖4 情感最低區間范圍詞云圖
圖4展示了此部分的負向情感詞匯詞云圖??梢源篌w看出“slavery(奴隸)”“poor(貧窮)”“death(死亡)”“misery(悲慘)”“oppressed(虐待)”等詞為負向情感,其選自情感值為負值部分的文本,馬克思用壓抑低沉的詞句生動描述了原始積累帶給勞動者的痛苦與災難。就所謂原始積累來說,馬克思在這一部分對以暴力方式剝奪勞動者而實現資本原始積累的現象進行嚴厲批判,他認為,馬克思認為資本主義的原始積累過程就是征服、奴役、掠奪、殺戮過程。其中在講到資產階級對于工人、婦女、童工的壓榨與剝削行徑時,更是直言不諱地用言辭激烈的語言對事實進行描述。不僅如此,他還曾概括地說:“暴力是每一個孕育著新社會的舊社會的助產婆。暴力本身就是一種經濟力[4]?!贝送?,行文中形象化的表述更是引人入勝,通過運用不同寫作手法使理論命題形象可觀,例如,“資本來到世間,從頭到腳,每個毛孔都滴著血和骯臟的東西[4]。”這大大加深了讀者對他的敘述的理解,從而引起廣泛的共鳴與支持,這也正是在當時社會背景下無產階級將《資本論》視為圣經的原因之一。值得注意的是,馬克思在闡述資本主義積累的歷史趨勢時,更是對第1卷關于剩余價值的相關論述達到了極致,不僅揭示了資本主義私有制必然滅亡的客觀規律性,更突出了資本主義私有制為公有制所代替的歷史必然性,也為未來新社會的構建奠定了理論基礎。正如他在談及此話題時內心激動地寫道:“這個外殼就要炸毀了,資本主義私有制的喪鐘就要響了。剝奪者就要被剝奪了[4]?!?/p>
第一卷以壓抑又憤慨的批判語氣為感情基調,隨著行文的推進以及第一卷內容的結束,全書的情感開始出現較為明顯的變化與轉折。整體情感趨勢曲線中的第2處高峰(H2)為全書中情感值最高部分區間且集中分布在(0.5,1),集中趨向于情感值1,原文對應第2卷第2篇第15章(周轉時間對預付資本量的影響)至第3篇(社會總資本的再生產和流通)第19章(前人對這個問題的闡述)部分。從第2卷開始,對于資本的生產過程研究就轉為對其流通過程的剖析,其中心是分析剩余價值的實現問題[5]。

圖5 情感最高區間范圍詞云圖
圖5展示了此部分的高頻詞匯詞云圖?!癱apital(資本)”“money(貨幣)”“period(周期)”“value(價值)”“circulation(流通)”等詞匯為核心主題。馬克思通過對經濟運行規律、經濟范疇、流通過程等相關原理的發現與論述,大量使用科學規范的公式、數據來進行解釋與說明,陳述性與說明性語言居多,詞匯的情感表達偏正向。盡管第2卷與第3卷的出版還歸功于恩格斯的整理,但其在整理敘述過程中未添加過多個人情感,而是盡可能完整準確地將馬克思記錄在手稿中的理論新發現展示出來??梢?,對于資本運動中其復雜的本質和運動規律等經濟原理的敘述偏重于客觀性的解釋與說明,這也為此部分內容的情感值達到頂峰的現象做出了合理解釋。
第2卷的書寫與整理以客觀且規范的論述為主,它的結束又為第3卷的開啟提供理論上的必要準備。第3處低谷(L3)出現情感值急劇下降并分布在(0,-0.5)之間,且較接近于情感值-0.5。具體原文對應到第3卷第1篇(剩余價值轉化為利潤和剩余價值率轉化為利潤率)的第5章(不變資本使用上的節約)至第2篇(利潤轉化為平均利潤)。第3卷論述了資本主義生產的總過程,重點研究剩余價值在剝削階級內部的分配問題[6]。特別是在論述不變資本使用上的節約部分時,馬克思運用歷史與邏輯相統一的敘述方法,列舉了大量資本主義經濟中的實際材料,如通過引用報告、采訪等現實生產中的一手資料來對進一步印證所闡述的理論部分,即不變資本節約的形式所帶來利潤率的提高的根本原因就在于對大量剩余勞動的占有。在敘述中,馬克思依舊運用鋒利現實的文筆來抨擊資本主義制度下資本家為獲取更多利潤而采取的種種手段、揭露了掩蓋資本主義剝削的實質。
隨著行文的推進,全書后三分之一的情感開始向正向轉變。第3處高峰(H3)的情感值范圍位于(0,0.5)之間,原文對應到第3卷第5篇(利潤分為利息和企業主收入。生息資本)的第33章(信用制度下的流通手段)至第34章(通貨原理和1844年英國的銀行立法)部分。這一部分內容要考察信用制度下貨幣流通的問題,雖然在敘述中也大量穿插著引用的證詞材料,但多為大商人、公司股東等資本家的話語,他們用語言為自己辯護,故情感值偏正向與積極,這也是較之前幾處高峰值所對應文本特點的不同之處所在。但馬克思卻以此種直接引入資本家原話方式作為揭露他們利用信用制度謀取暴力行徑的方式。之后,隨著第5篇最后一部分的敘述,特別是第35章(貴金屬和匯兌率)部分,情感值達到第4處低谷(L4),但僅略低于H3并依舊介于(0,0.5)之間。此處敘述情感較為平緩,用客觀平實的語言分析了信用制度與國際間貨幣流通的關系,雖其間穿插銀行家的證詞解釋但敘述偏向原理性說明。
整體情感趨勢曲線的最后一處高峰(H4)僅略低于第2處高峰(H2),介于(0.5,1)之間。原文出自第6篇超額利潤轉化為地租中的第39章(級差地租的第一形式)至第45章(絕對地租)部分。這一部分主要圍繞對地租范疇的原理性說明,加之借助大量表格、公式和數字列舉來開展論述。在論述的語言中未過多體現對于土地所有者階級的強烈批判,更多側重于對這一經濟現象的原理說明。而與之形成對比的是,此高峰處之后的情感曲線出現顯著下降趨勢,也正是在第47章(資本主義地租的產生)部分,馬克思的批判情緒增加對土地所有者階級的寄生性質進行了無情鞭笞,意在徹底揭露他們對社會生產力發展的破壞作用。
通過整體情感趨勢曲線特殊區間的截取與對應原文的比對分析發現,馬克思高昂激烈的批判、諷刺挖苦的輕蔑、雄辯理智的解釋等充滿感情色彩卻又十分理性的敘述貫穿于《資本論》著作之中??煽闯鲚^有意義的現象是,文中4處低谷區間所對應的內容多涉及到對于一些實證材料的引用以及人物觀點的原述,富有較多濃厚的負面情感色彩詞匯與形象化敘述,這也使得整體上馬克思在第一卷對資本主義社會中的丑惡現象進行描述與批判時的情感色彩較為壓抑與低沉。而文中4處高峰區間所對應的內容多為經濟問題的原理性闡述,結合表格、公式等數據說明,學術性的敘述語言客觀且科學,情感表達趨于平緩,這也足以能夠說明后兩卷內容偏注重對經濟原理命題的論述與解釋。
全書3卷情緒整體趨勢呈前低后高、前劇烈后平緩走向,第1卷中明顯的情緒低谷與高峰區間的出現是馬克思在沉著冷靜地剖析了資本主義經濟規律,了解了資本主義和資產階級本質后的必然的情感反應,是他的全部情感和理智在與整個資本主義世界的斗爭中迸發出的產物。二三卷的敘述語言則較為客觀與嚴謹,情感表達較平穩與緩和,重點在于用嚴肅且明確的語言說明資本主義關系中復雜的經濟原理與命題,從而達到其揭示現代社會經濟運動規律、推翻資本主義制度、最終實現共產主義社會的創作目的。
馬克思用通俗易懂的敘述方法,深入淺出地展現了社會科學研究的敘事魅力所在。站在實證科學研究立場,從經濟事實出發的理論研究更彰顯了馬克思的科學品格。雖其間以豐富的情感表達為論述基調,但無可否認他階級立場與人民情懷的科學性,其“真性情”的流露便是對資本主義社會最真實徹底的揭露與批判。
毋庸置疑的是,《資本論》的寫作與論述中心突出,結構嚴密,不僅是科學的邏輯論述體系,更彰顯其是馬克思主義最厚重、最豐富的偉大經典巨著。除了上述所提到的行文風格與情感特色外,為配合特定的語境,馬克思還在論述時多次提到文學巨匠的作品、巧妙運用古代作家的詩篇以及恰當引用多國古老神話,加之以鋒利的文筆、形象地表達來彰顯其憤怒的激情和磅礴的氣勢,既飽含感情因素,也有理智成因。馬克思在嚴謹客觀的科學表述之外,其扎根勞動大眾、立足窮苦人民的真切之感,體現了他在引導世界勞動人民爭取徹底解放的號召下蘊含的深沉又飽滿的人民情懷。可見通過情感表達角度的特殊解讀,體會情感流露的真切與嚴謹理論的相融,更足以深化對《資本論》這一偉大的科學著作的認識與理解。