馮志偉
(杭州師范大學,杭州,310036)
今年是索緒爾(De Saussure,1857~1913)逝世100周年。
50年前,也就是在1963年,法國語言學家本維尼斯特(E. Benveniste)在索緒爾逝世50周年的紀念會上對索緒爾的學術貢獻作過這樣的總結:“在研究人類和社會的各種科學里,語言學已經(jīng)成為一門成熟的科學,成為在理論研究上及其技術發(fā)展方面最活躍的學科之一。而這門革新了的語言學,肇源于索緒爾,語言學通過索緒爾而認識了自己,并團結成一支隊伍。在同語言學交叉的各種思潮中,在語言學眾說紛紜的不同流派里,索緒爾所起的作用是不容懷疑的,這一顆閃閃發(fā)光的種子被他的弟子們接受下來,已經(jīng)化為萬丈的光芒,并勾畫出一派處處有他存在的風光”(Benveniste 1966)。本維尼斯特認為,從1913年逝世到1963年這50年的日子里,索緒爾的理論已經(jīng)從“一顆閃閃發(fā)光的種子”“化為萬丈的光芒”,產(chǎn)生了星火燎原的效果。
又是50年過去了,現(xiàn)在,我們已經(jīng)進入了信息網(wǎng)絡的新時代,我們在紀念索緒爾逝世100周年的時候,應當結合我們時代的特點,根據(jù)當代語言學研究的最新成果,從新的角度來進一步認識索緒爾的語言學理論。我認為,這是對這位著名語言學家的最好的紀念。
索緒爾的語言理論產(chǎn)生于風云變幻的19世紀末和20世紀初。它的產(chǎn)生并非偶然,與當時的社會科學思潮特別是與社會學、心理學、語言學的發(fā)展有密切的聯(lián)系。
當時社會科學正處于轉型的關口,兩大哲學流派——“德國唯心主義哲學”和“經(jīng)驗實證主義”都把社會看成一種結果,一種第二性的、派生的現(xiàn)象,而不是第一性的、實質的東西?;谶@樣的認識,關于社會的研究無法成為科學。而法國著名社會學家涂爾干(Emile Durkheim)、奧地利心理學家弗洛伊德(Sigmund Freud)通過他們各自的研究發(fā)現(xiàn):對于個人來說,社會不僅是個人行為的總和,也不僅是精神的偶然表現(xiàn),而是一個實體,并且是第一性的實體。因此,社會科學研究的不是孤立的社會事實本身,而是社會事實和社會意義的結合,要把社會事實放在整個社會框架中去探求它們的功能。他們的這種新理論使社會科學向科學性邁出了關鍵的一步。
索緒爾的語言學理論,正是在這樣的背景下產(chǎn)生的。
索緒爾在他的《普通語言學教程》(CoursdeLinguistiqueGénérale)一書中,討論了語言符號的特性問題。
索緒爾(1980:37-38)認為:“語言是一種表達觀念的符號系統(tǒng),因此,可以比之于文字、聾啞人的字母、象征儀式、禮節(jié)形式、軍用信號,等等。它只是這些系統(tǒng)中最重要的?!?/p>
“語言符號聯(lián)結的不是事物的名稱,而是概念和音響形象。后者不是物質的聲音,純粹物理的東西,而是這聲音的心理印跡,我們的感覺給我們證明的聲音表象?!?/p>
“我們試觀察一下自己的言語活動,就可以清楚地看到音響形象的心理性質:我們不動嘴唇,也不動舌頭,就能自言自語,或在心里默念一首詩?!?同上:101)
由于語言符號是一種兩面的心理實體,因此索緒爾把它表示為如下圖:

圖1 語言符號是一種兩面的心理實體
索緒爾把概念和音響形象的結合叫做符號,把概念叫做“所指”(signifié),把音響形象叫做“能指”(signifiant)。他說:“我們建議保留用符號這個詞表示整體,用所指和能指分別代替概念和音響形象。后兩個術語的好處是既能表明它們彼此間的對立,又能表明它們和它們所從屬的整體間的對立。”(同上:102)
由索緒爾的定義可以看出,能指和所指都是心理的東西,而由能指和所指組成的符號,似乎也只是心理的東西。這種觀點,在他解釋“語言”和“言語”的時候也說過:“言語活動是異質的,而這樣規(guī)定下來的語言卻是同質的。它是一種符號系統(tǒng);在這系統(tǒng)里,只有意義和音響形象的結合是主要的;在這系統(tǒng)里,符號的兩個部分都是心理的。”(同上:36)
“語言符號雖然主要是心理的,但并不是抽象的概念,由于集體的同意而得到認可,其全體即構成語言的那種種聯(lián)結,都是實在的東西,它們的所在地就在我們腦子里?!?同上:37)
這種本質上是心理的語言符號有什么特點呢?索緒爾指出了兩個特點:
第一,符號的任意性
“能指和所指的聯(lián)系是任意的,或者,因為我們所說的符號是指能指和所指相聯(lián)結所產(chǎn)生的整體,我們可以更簡單地說:語言符號是任意的。”(同上:102)
符號的任意性原則“支配著整個語言的語言學,它的后果是不能枚舉的;人們經(jīng)過許多周折才發(fā)現(xiàn)它們,同時也發(fā)現(xiàn)了這個原則是頭等重要的”。(同上:103)
“任意性這個詞還要加上一個注解。它不應該使人想起能指完全取決于說話者的自由選擇(我們在下面將看到,一個符號在語言集體中確立后,個人是不能對它有任何改變的)。我們的意思是說,它是不可論證的,即對現(xiàn)實中跟它沒有任何自然聯(lián)系的所指來說是任意的?!?同上:104)
“能指對它所表示的觀念來說,看來是自由選擇的,相反,對使用它的語言社會來說,卻不是自由的,而是強制的。語言并不同社會大眾商量,它所選擇的能指不能用另外一個來代替?!?同上:107)
“人們對語言說:‘您選擇罷!’但是隨即加上一句:‘您必須選擇這個符號,不能選擇別的?!呀?jīng)選定的東西,不但個人即使想改變也不能絲毫有所改變,就是大眾也不能對任何一個詞行使它的主權;不管語言是什么樣子,大眾都得同它捆綁在一起?!?同上)
自然會出現(xiàn)這樣的問題:既然語言符號是任意的,那么,為什么我們不能看到由這些符號所組成的語言的普遍的、突然的變化呢?
索緒爾指出了四種阻礙這種變化的因素;
(1) 符號的任意性?!胺柕娜我庑员旧韺嶋H上使語言避開一切旨在使它發(fā)生變化的嘗試”。(同上:109)由于符號的任意性,我們不能夠論證哪一種能指更為合理的問題。例如,“姐妹”這個詞為什么法語要用sur而不用sister(英語的“姐妹”),“牛”這個詞為什么德語要用Ochs而不用buf(法語的“牛”),等等,那是沒有什么道理可說的。這樣,也就缺少符號變化的基礎。
(2) 構成任何語言都必須有大量的符號。這一事實使得符號難于改變。
(3)語言系統(tǒng)的性質太復雜。他說,“因為這個系統(tǒng)是一種很復雜的機構,人們要經(jīng)過深入思考才能掌握,甚至每天使用語言的人對它也很茫然。人們要經(jīng)過專家、語法學家、邏輯學家等等的參與才能對某一變化有所理解;但是經(jīng)驗表明,直到現(xiàn)在,這種性質的參與并沒有獲得成功?!?同上:110)
(4) 集體惰性對一切語言創(chuàng)新的抗拒?!罢Z言無論什么時候都是每個人的事情;它流行于大眾之中,為大眾所運用,所有的人每天都在使用著它。在這一點上,我們沒法把它跟其他制度作任何比較。法典的條款、宗教的儀式,以及航海信號等,在一定時間內,每次只跟一定數(shù)目的人打交道,相反,語言卻是每個人每時都在里面參與其事的,因此它不停地受到大伙兒的影響。這一首要事實已足以說明要對它進行革命是不可能的。在一切社會制度中,語言是最不適宜于創(chuàng)新的。它同社會大眾的生活結成一體,而后者在本質上是惰性的,是一種保守的因素?!?同上:111)
索緒爾繼續(xù)寫道:“語言之所以有穩(wěn)固的性質,不僅是因為它被綁在集體的鎮(zhèn)石上,而且因為它是處在時間之中。這兩件事是分不開的。無論什么時候,跟過去有連帶關系就會對選擇的自由有所妨礙?!?同上)
“時間”與“說話的大眾”組成了表明語言實質的背景。“同社會力量的作用結合在一起的時間的作用”,使得“離開了時間,語言的現(xiàn)實性就不完備,任何結論都無法作出”(同上:116)?!耙菃螐臅r間方面考慮語言,沒有說話的大眾——假設有一個人孤零零地活上幾個世紀——那么我們也許看不到有什么變化;時間會對它不起作用。反過來,要是只考慮說話的大眾,沒有時間,我們就將看不見社會力量對語言發(fā)生作用的效果?!?同上)
第二,能指的線條性
能指屬聽覺性質,只在時間上展開,而且具有借自時間的特征:
(a) 它體現(xiàn)一個長度;
(b) 這長度只能在一個向度上測定,即它是一條直線。
這是一個似乎為常人所忽略的基本原則。它的后果是數(shù)之不盡的,它的重要性與符號的任意性規(guī)律不相上下,語言的整個機構都取決于它。
索緒爾提出的語言符號的這兩個特性,當然是十分重要的。然而,索緒爾以后的現(xiàn)代語言學的發(fā)展,特別是電子計算機出現(xiàn)以后自然語言處理的發(fā)展,嚴峻地考驗著索緒爾的理論。
索緒爾提出的語言符號的任意性這一特征受到了認知語言學的挑戰(zhàn)。
對于“語言象似性”(iconicity)的研究是認知語言學的一個重要方面。象似性是指在語言的能指和所指之間、語言的內容與表達形式之間存在著一種必然的聯(lián)系,兩者之間的關系是可以論證的,是有理據(jù)的(motivated),而不是任意的。
豪斯霍爾德(Householder)認為,英語中91%以上的詞具有理據(jù)性。萊考夫(G. Lakoff)和約翰遜(M. Johnson)曾以refrigerator(電冰箱)這個派生詞為例來說明單詞的理據(jù)性。這個派生詞是由re_frig_er_at_or等語素構成的,每個語素都有一個意義,它們都對整個詞的意義起到一定的構成作用,如果將它們組合起來,則可預測出其義為:“使物品再次變冷的某種事物”,當然整個的派生詞比起它的各個語素組合得出的意義會多些或少些,但可見這個派生詞的意義相對于語素的意義絕不是任意的。一般說來,構成派生詞的語素對大部分派生詞的意義都是有理據(jù)的。這種理據(jù)性也就是語言的象似性。
認知語言學把語言的象似性分為兩種:一種是“擬象象似性”,一種是“隱喻象似性”。
擬象象似性指的是句法結構與認知結構之間彼此映照的現(xiàn)象。如果語言表達中的長短、順序或者構成成分之間的關系與所表達的概念內容或經(jīng)驗內容存在一致的時候,我們就說,這種語言表達具有象似性。例如,下面兩個句子:
a. Mary doesn’t think he’ll leave until tomorrow. (Mary不認為明天之前他會離開)
b. Mary thinks he won’t leave until tomorrow. (Mary認為明天之前他不會離開)
句子a中的否定詞not與動詞leave相距較遠,否定leave的意義較弱;句子b中的否定詞not與動詞leave直接毗鄰,否定leave的意義較強。這說明,兩個單詞之間在形式上距離接近,在語義上就會得到加強。
擬象象似性有如下幾種:
(1) 順序象似性(sequencing iconicity):事件發(fā)生的時間順序或概念的時間順序與語言描述的線性順序相對應。例如,
a. He opened the bottle and poured himself a glass of wine. (他打開瓶子給自己倒了一杯酒)
b. She closed the window and they left. (她關上窗子,他們就離開了)
客觀世界中行為的先后順序與語言的句子中單詞的先后順序相對應,反映了客觀世界、認知和語言的一致性。
(2) 接近象似性(proximity iconicity):認知上相近的概念在語言形式的時間和空間上也接近。從信息處理的角度看,相鄰的概念就容易快速被激活,從而縮短處理時間。例如,在英語的名詞短語the famous delicious Italian pepperoni pizza和the old black wooden desk中,多個形容詞修飾中心名詞,與中心名詞概念越接近的形容詞離開中心名詞越近。在短語the beautiful big old red wooden house中,由于wooden對于house來說是最本質的,因此最靠近中心名詞house;而beautiful純粹是主觀性的,因此置于該名詞詞組的最前面;old對于房子來說既不是本質的(因為房子不可能一開始就是old的),也不是純粹主觀的(因為它與某一時間標準相關),因此比beautiful更靠近中心名詞,比wooden更遠離中心名詞;red不完全是本質性的(因為可以將房子重新油漆成其它顏色),但比old更加本質,因為old純粹取決于相對于建房時間的講話時間;至于物理特性big比beautiful的主觀性要小,但比old主觀性要大,所以置于beautiful與old之間。
(3) 數(shù)量象似性(quantitative iconicity):概念上信息量大、更重要、更難預測的信息,其語言表達也就更長、更復雜。例如,下面兩組句子:
a. On the Brighten train from Victoria, I met her. (在來自Victoria的Brighten列車上,我遇見了她。)
b. On the Brighten train from Victoria, I met this fair-haired, fragile and beautiful creature. (在來自Victoria的Brighten列車上,我遇見了這個金色頭發(fā)的、嬌嫩而又漂亮的美人。)
這兩個句子相比,句子b比句子a的信息量大,因而也就更長、更復雜。
(4) 對稱象似性(symmetric iconicity):在認知上具有同等重要性的信息,在語言中常常采用并列結構來表達,它們之間具有對稱性。
(5) 非對稱象似性(asymmetric iconicity):在認知上具有凸顯性的信息在語言中往往處于話題的位置。
第二種象似性是隱喻象似性。這種象似性是從一個概念到另一個概念,從一個認知域映射到另一認知域的象似性。人的概念結構映射客觀世界,語言映射概念結構,語言形式映射方位結構,因此,隱喻象似性是非常普遍的。方位隱喻(orientational metaphors)是指參照方位而形成的一系列隱喻概念??臻g方位來源于人們與大自然的相互作用,是人們賴以生存的最基本的概念:“上-下”、“前-后”、“深-淺”、“中心-邊緣”等,人們將這些具體的概念映射到情緒、身體狀況、數(shù)量、社會地位等抽象的概念上,形成了用表示方位的詞語來表達抽象概念的隱喻方式。
例如,用up隱喻“高興”,用down隱喻“悲哀”。形成“HAPPY IS UP;SAD IS DOWN”的方位隱喻。我們可以說,
I’m feeling up. (我感到興高采烈。)
You’re in high spirits. (你精神高昂。)
I’m feeling down. (我情緒低下。)
可見,索緒爾的語言符號任意性理論受到了認知語言學的嚴重質疑。
當然,語言象似性只是針對語言符號任意性理論提出質疑,未必能夠完全推翻索緒爾關于語言符號任意性的理論。這個問題還有進一步探討的余地。
索緒爾提出的語言符號的第二個特征——能指的線條性也受到了質疑。新的研究結果表明,語言的能指并不只是線條性的東西。
英國著名語言學家弗斯(J. R. Firth)提出“跨音段論”(prosodic),他認為,在一種語言里,區(qū)別性語音特征不能都歸納在一個音段位置上,例如,語調就不是處于一個音段位置上,而是處于前后相續(xù)的線條性的音段之外,籠罩著或統(tǒng)領著整個句子的東西。如果我們把語調這樣的跨音段成分算進去,語言的能指就不宜看作是線條性的東西,而應該看作是立體性的東西了。
弗斯的“跨音段論”只限于音位學方面。其實,在語言的其他方面,語言符號也不僅僅是線條性的,而是立體性的東西。所謂立體性,指語言符號具有分層結構,即層次性。
語言符號的層次性,在句子結構方面表現(xiàn)得特別明顯。美國描寫語言學派的語言學家早就指出,英語的“The old men and women stayed at home”(年老的男人和女人留在家里)這句話是有歧義的。如果我們把這一句話說給一些人聽,很可能有的聽話人會認為它的意思是“年老的男人和所有的女人(不論年齡大小)留在家里”,另一些聽話人會認為它的意思是“所有年老的男人和所有年老的女人留在家里”,還有的聽話人干脆不能作出決定,處于模棱兩可的狀態(tài)。事實上,“old men and women”這個名詞短語根據(jù)意義的不同有兩種不同的層次結構。如果注意到層次的不同,那么,這種意義上兩可的情況就可以得到解釋。
一種層次結構是
old men and women
這時,這個名詞短語的意義是“年老的男人和所有的女人”。
另一種層次結構是
old men and women
這時,這個名詞短語的意義是“所有年老的男人和所有年老的女人”。
一般地說,如果要判斷兩個語言片段A=a1a2...an和B=b1b2...bm是否具有同一性,至少應該滿足三個條件:
(1) A和B中對應的詞形相同,詞數(shù)相同。即有a1=b1,a2=b2,...,an=bm,且n=m。
(2) A和B中的詞序相同。即:如果有a1?a2,...,an-1?an,那么,則有b1?b2,...,bm-1?bm。其中,“?”表示前于關系。
(3) A和B中各個詞之間的層次結構相同。
索緒爾主張語言符號具有線條性,他只看到了第1條和第2條,而沒有看到第3條,這是他的局限性。今天,我們看到了第3條,發(fā)現(xiàn)了語言符號的層次性,應該說是一個很大的進步。
在自然語言處理中,常采用樹形圖來表示語言符號的層次關系。自然語言處理的理論認為,任何一個句子的線性序列的表層之下,都隱藏著一個層次分明的樹形圖。當一個句子的線性序列之下隱藏著兩個或兩個以上的樹形圖時,這個句子就會產(chǎn)生歧義,就會得到不同的解釋。
樹形圖由結點和連接結點的枝組成。樹形圖的各個結點之間,有兩種關系值得注意:一種是支配關系,它反映了上下結點之間的先輩和后裔的關系,一種是前于關系,它反映了左右結點之間前位和后位的關系。語言符號的線條性只反映了前于關系,而沒有反映支配關系,當然就有很大的局限。
例如,“富士山是日本的一座活火山”的樹形圖如下:

圖2 由括號式轉換為成分結構樹
這個樹形圖也可以表示為多層的括號結構:“[zi [di 富士山/n [vp 是/v [np 日本/n 的/u [np [mp 一/m 座/q ] 活火山/n ]]]] 。/w ] ”
樹形圖與自然語言處理中廣為應用的短語結構語法有著明顯的對應關系。喬姆斯基的短語結構語法,既能描述自然語言,也能描述程序設計語言,這種語法已經(jīng)成為了形式語言理論的重要研究內容。在形式語言理論中建立的短語結構語法與樹形圖之間的對應和聯(lián)系,正是基于對語言符號層次性的認識的基礎之上的。短語結構語法和樹形圖被廣泛地使用于自然語言處理中,幾乎每一個自然語言處理研究者天天都要與短語結構語法和樹形圖打交道,天天都要研究語言符號的層次關系。自然語言處理的發(fā)展,進一步加深了我們對于語言符號的層次性的認識,語言符號的層次性,確實比索緒爾提出的語言符號的線條性更為深刻。
中國傳媒大學依存樹庫研究團隊建立了依存樹庫(tree bank)。依存樹是句子中單詞之間依存關系的層次表示。
例如,包含英語句子“The student has a book”和“He reads an interesting book”的依存樹庫如下(用excel表示):

Annotation of two English sentences in the treebank
圖3依存樹庫(包含兩個英語句子)
這個依存樹庫的圖示如下:

圖4 依存樹
可見,語言符號不是線條性的,語言符號具有層次性。
語言符號不僅具有層次性,還具有網(wǎng)絡性。
中國傳媒大學依存樹庫研究團隊把依存樹庫中的依存樹轉換成漢語依存網(wǎng)絡。他們使用復雜網(wǎng)絡(complex network)的理論和方法依存網(wǎng)絡進行了研究(Liu 2009)。
如果把依存樹庫中的結點加以合并,形成如下的依存網(wǎng)絡(右圖是以單詞為結點的依存網(wǎng)絡,左圖是以詞類標記為結點的依存網(wǎng)絡):

圖5 依存句法網(wǎng)絡
使用這樣的方法,他們對于漢語的《新聞聯(lián)播》(xwlb)樹庫中的單詞結點進行合并,形成了如下的漢語句法網(wǎng)絡:

圖6 漢語《新聞聯(lián)播》樹庫
他們使用復雜網(wǎng)絡理論對于這個依存句法網(wǎng)絡進行分析。
為了衡量一個網(wǎng)絡的復雜性,最常用的復雜網(wǎng)絡參數(shù)是平均路徑長度、聚集系數(shù)和度分布。他們圍繞這三個參數(shù)對句法網(wǎng)絡進行考察研究。
句法網(wǎng)絡的平均路徑長度表示的是網(wǎng)絡中任意兩個結點之間的平均最短路徑長度,用
在句法網(wǎng)絡中,結點的度k指的是與該結點相連的其他結點的數(shù)目(或邊數(shù)),它在一定程度上反映了一個結點在網(wǎng)絡中的重要性。全部結點的度的平均值稱為句法網(wǎng)絡的平均度,它反映了句法網(wǎng)絡中詞與詞之間的平均組合能力。結點的度分布通常用分布函數(shù)P(k)描述,它表示一個隨機選定詞的度恰好為k的概率。
聚集系數(shù)C是一種用來衡量網(wǎng)絡聚集傾向或小集群形態(tài)的指標,它度量的是句法網(wǎng)絡中一個結點的兩個相鄰結點之間互連的可能性。
如果一個網(wǎng)絡有較小的平均路徑長度
這樣看來,表面上貌似線性的語言中,實際上隱藏著樹形圖結構,甚至還隱藏著復雜網(wǎng)絡結構。語言符號還具有網(wǎng)絡性。
近年來,社會媒體(Social Media)隨著互聯(lián)網(wǎng)應用的變革而迅猛發(fā)展。社會媒體是一種在線交互媒體,具有廣泛的用戶參與性,允許用戶在線發(fā)布和傳播信息,相互溝通與協(xié)作,組成虛擬網(wǎng)絡社區(qū)。因此,可以說社會媒體是以社會網(wǎng)絡(Social Network)為基礎的,以互聯(lián)網(wǎng)用戶創(chuàng)造和傳播信息為主要形式的,給予用戶極大參與空間的新型在線媒體。社會媒體具有參與、公開、交流、對話、社區(qū)化、連通性等特征。目前社會媒體主要包括微博(MicroBlog)、博客(Blog)、網(wǎng)絡論壇(BBS)、維基(Wiki)、社交網(wǎng)站(SNS)、播客(Podcast)等。
社會媒體的信息呈現(xiàn)形式多種多樣,包括文本、圖像、視頻等。語言學研究的是社會媒體中的語言文本及從語言文本中抽取出的話題。語言文本作為最基本的信息載體,在社會媒體中同樣處于主導地位。雖然圖像、視頻等多媒體信息在社會媒體中大量出現(xiàn)(特別是網(wǎng)絡熱點事件往往是由一幅圖像或一段視頻引起的),但圖像和視頻一般也都配有文字說明,更重要的是圍繞這些圖像和視頻展開的討論往往是文本形式。可以說語言文本才全面、完整地反應了社會媒體的內容信息、傳播與演化情況。
社會媒體語言的使用是由“話題”驅動的,文本的產(chǎn)生往往是圍繞一個個具體的“話題”展開的。在社會媒體中,話題之間既是相互關聯(lián)的,又是相互作用的。其中關聯(lián)性體現(xiàn)在空間位置和話題內容兩方面。社會媒體中討論的眾多話題總是分布在不同的網(wǎng)絡區(qū)域(版面或版塊),同一網(wǎng)絡區(qū)域一般同時存在多個話題,同一網(wǎng)絡區(qū)域的多個話題在內容上一般又是相關的。
話題之間的相互作用表現(xiàn)在話題強度的相互影響和話題內容的相互影響兩方面。每一話題都有一個生命周期,都有一個產(chǎn)生、發(fā)展、變異、消亡的演化過程,這一過程是受其他話題影響的。比如一個爆發(fā)性新話題的產(chǎn)生可能降低大家對已有話題的關注(“中日釣魚島沖突”話題的出現(xiàn)就降低了大家對“中菲南海爭端”話題的關注度),也可能引起大家對另一個老話題的重新關注(如重新觸發(fā)“中日當年擱置釣魚島爭議”話題的討論)。話題內容在其生命周期內一般會隨事件本身進展發(fā)生變化(如最近“中日釣魚島沖突”話題增加了“火控雷達”的內容),而一個話題內容的變化又可能引起其他與之關聯(lián)的話題的內容發(fā)生變化。因此整個社會媒體可以看做是一個以“話題”為基本單元形成的社會生態(tài)系統(tǒng)。橫向上看,同一時刻在網(wǎng)絡上存在成千上萬的話題,這些話題之間存在千絲萬縷的聯(lián)系并且分布在不同的網(wǎng)絡區(qū)域;縱向上看,不同話題在相互影響、相互作用過程中產(chǎn)生、發(fā)展、變異、消亡,構成一個動力學演化系統(tǒng)。圖7就是Cytoscape展示的微博文本中話題的依存關系復雜網(wǎng)絡及其參數(shù)計算界面。
語言符號的這種網(wǎng)絡特性,是對于語言符號線條性理論的嚴重挑戰(zhàn)。
索緒爾是一個出色的天才的語言學家,他是名副其實的現(xiàn)代語言學的奠基人,他的語言學說是語言學史上哥白尼式的革命,對于現(xiàn)代語言學的發(fā)展有著深遠的影響?,F(xiàn)代語言學的每一個領域,每一個流派,都直接或間接地受到了索緒爾語言學說的影響。他所說的語言符號的上述兩個特性,是在當時的語言學和自然科學發(fā)展的水平下提出來的。在索緒爾的時代,還沒有電子計算機,自然語言處理這樣的新興學科還遠遠沒有形成,語言學主要是與語言教學、文學、歷史、考古學等學科有聯(lián)系。在這種情況下,索緒爾當然不可能提出那些只有在電子計算機時代才能揭示出來的語言符號的新特點。
英國著名科學哲學家波普爾(Karl R. Popper,1902~1994)在為中文版《波普爾科學哲學選集》所撰寫的前言中說:“人們盡可以把科學的歷史看作發(fā)現(xiàn)理論、摒棄錯了的理論并以更好的理論取而代之的歷史。……我不懷疑我們有許多科學理論是真實的;我所要說的是,我們無法肯定任何一個理論是不是真理,因而我們必須作好準備,有些最為我們偏愛的理論到頭來卻原來并不真實。既然我們需要真理,……我們除了對理論進行理性批判以外,別無其他選擇”(波普爾1987)。正是本著這樣一種對于傳統(tǒng)的語言學研究結論進行理性批判的科學精神,我們需要大膽地對前輩語言學家的結論證實和證偽,在大量語言事實的基礎上進行理性的審視,這樣,我們就有可能提出不同的但更富于發(fā)展前景的學術意見。
在語言學研究中,我們盡最大的努力避免偏頗和錯誤。波普爾在他的同一篇前言中還說:“科學是可以犯錯誤的,因為我們都是人,而人是會犯錯誤的。因而錯誤是可以得到原諒的。只是不去盡最大的努力避免錯誤,才是不可原諒的。可是即使犯可以避免的錯誤,也是可以原諒的”(波普爾1987)。我們應當根據(jù)新的語言客觀事實,避免前輩語言學家做出的可能有片面性的結論,從而推動語言學的發(fā)展。

圖7 微博文本中話題的依存關系復雜網(wǎng)絡
隨著電子計算機的出現(xiàn)和發(fā)展,特別在自然語言處理出現(xiàn)之后,普通語言學的理論也應該相應地發(fā)展。我們不能墨守陳規(guī),滿足于已有的結論,而應該站在前輩學者的雙肩上,高瞻遠矚,汲取自然語言處理的新成果,從新的角度,用新的眼光,以新的方法來研究語言這一個極為復雜的符號系統(tǒng),從而得出更加符合語言客觀事實的結論,推動當代語言學的發(fā)展。
這就是我在索緒爾逝世100周年對于索緒爾語言符號特性理論的再思考,提出來就教于語言學界的同行。
Benveniste, E. 1966.ProblèmesdeLingistiqueGénérale[M]. Paris: Gallimard.
Liu, Haitao. 2009. Using a Chinese treebank to measure dependency distance [J].CorpusLinguisticsandLinguisticTheory5(2): 161-74.
波普爾.1987.波普爾科學哲學選集(紀樹立編譯)[M].北京:三聯(lián)書店.