姚雙云
(華中師范大學語言與語言教育研究中心,湖北武漢430079)
漢語時間詞的兩個核心要素及其理論價值
姚雙云
(華中師范大學語言與語言教育研究中心,湖北武漢430079)
“時基”與“時示”是現代漢語時間詞的兩個核心要素,時間詞的內部一般都包含了這兩個概念。現代漢語時間詞最主要的構造方式是“時示+時基”,其次是“時基+時示”。其內部構造規律可以作為判定時間詞的一個重要標準,在漢語的本體研究和自然語言處理領域均有應用價值。
時間詞;時示;時基;自然語言處理
世界上絕大多數語言都涉及到時間概念,但時間的表達手段與民族的心理特征和文化因素相關。漢語時間詞反映了漢民族表達時間的心理特征,顯著特點是具有時間定位和時間度量的雙重功能。比較而言,定位功能是首要的,度量功能是次要的。
作為漢語研究中的一個重要議題,時間詞方面的研究成果頗豐。但是,我們認為有一個極為重要的學術問題長期以來沒有得到應有關注:即構建時間詞的核心要素是什么。這個問題不僅涉及到時間詞的本體研究,也涉及到自然語言處理。因為,時間知識及其表示在自然語言理解中占據重要地位。正如該領域的權威學者愛倫所言:“支持自然語言的任何知識表示系統的一個中心模塊是對動詞和時間的處理。”①
本文旨在對現代漢語時間詞作定量研究,考察時間詞的內部特點與構成方式,以揭示其中蘊含的規律。我們嘗試將時間詞的構成規律形式化,為自然語言處理提供必要的知識支持。論文分析的材料主要來源于《現代漢語句法信息詞典詳解》②、《現代漢語詞典》③、《普通話基礎方言基本詞匯集》④以及《現代漢語通用詞表》⑤中涉及的時間詞。
時間詞與時間不是一個概念。時間詞表示時間,但是表示時間的詞不一定都是時間詞。朱德熙將時間詞定義為:時間詞是能做“在”“到”“等到”的賓語,并且能用“這個時候”“那個時候”指稱的體詞⑥。本文沿用了這一定義。
漢語的時間詞蘊含了兩個核心要素,本文稱之為“時基”和“時示”。所謂“時基”即時間的基點,它是時間表達的基礎與起點。“時示”即時間的指示,是時間表達的內部指向和顯示。可以打這么一個比方:“時基”好比時鐘上不同單位的指針,“時示”好比時鐘上的數字刻度。沒有“時基”和“時示”就好比時鐘失去了指針或者數字刻度,無法準確地顯示時間。“時基”和“時示”構成了漢語時間概念的核心部分,最能體現漢語時間詞的鮮明個性。
作為時間詞的核心要素,誰是時基,誰是時示,本來并不重要,語言的使用中它們發揮的是整體功能。不過在分析時間詞的內部構造規律時,有必要加以區分。判斷時基與時示可以依據它們各自所起的作用為標準。比方,時間詞“昨天”“今天”“明天”分別由兩個語素組成,第一個語素“昨”“今”“明”是時示,其作用是時間指示,第二個語素“天”是時基,其作用是時間參照。這三個時間詞均采用了“時示+時基”的組合方式。不過,在時間詞“今后”中,語素“今”的作用發生了改變,它的作用是時間參照,而時間指示的功能由方位語素“后”承擔。該詞中“今”為時基,“后”為時示,采用了“時基+時示”的組合方式。與“今后”類似的時間詞還有“年前”“年后”“世紀末”等。
時基和時示可以是準確表述,也可以是模糊表述。“一九九八年”、“二十一世紀”中的時基(年、世紀)和時示(一九九八、二十一)是準確表述。“飯前”“事后”中的時基(飯、事)和時示(前、后)是模糊表述。說話人選擇準確的還是模糊的表述,取決于交際的實際需要。
值得一提的是,利用時基和時示組合表達時間的意識自古有之。據張德芳的研究,兩漢時期河西及至敦煌地區十六時制時間詞分別為:夜半、雞鳴、晨時、平旦、日出、食時、日未中、日中、日失、餔時、下餔、日入、昏時、夜食、人定、合夜⑦。這些時間詞,大多可分析出時基和時示兩個核心概念。
1.普通話詞匯中時間詞內部構成
本文依據《現代漢語語法信息詞典詳解》中的“時間詞庫”對普通話中的時間詞作定量分析,該庫共收時間詞189個。189個時間詞中,雙音節時間詞數量最多,共179個,占總數的95%。三音節詞數量很少,只有10個,占總數的5%,分別是“星期一”“節假日”“本世紀”“產褥期”“端午節”“勞動節”“清明節”“上半年”“現階段”“中世紀”。
為了發現時間詞的內部組合規律,我們對189個時間詞的構成進行逐個分析,并對每個詞的組合方式進行人工標注。統計數據見表1。

表1 時間詞的構成方式
表1的數據表明,“時示+時基”的組合方式最多,共137個,占總數的72.5%,其次是“時基+時示”,有36個,占總數的19.0%。只含有時示的時間詞10個,分別為“后來”“過去”“將來”等。這些詞語實際上是以說話時的時間為參照基點。其他類型指很難分析出組合方式的一類。共6個詞語,分別是“白露”“谷雨”“寒露”“芒種”“驚蟄”“黎明”,其中有5個詞語是節氣名詞,古已有之。不考慮方式1與方式2內部的區別,時間詞中同時包含時示和時基的占總數的91.5%,可見,時示和時基是現代漢語時間的兩個核心要素。
2.方言詞匯中時間詞的內部構成
我們依據《普通話基礎方言基本詞匯》(詞匯卷上)中的“時間·節令”部分考察了時間詞的內部構成。初步觀察表明,方言詞匯中的時間詞與普通話時間詞的內部構成規律具有共同特性,也包含時基和時示兩個核心要素。方言詞匯中時間詞數量繁多,限于篇幅,我們只以其中4個詞目為例進行說明。總共涉及93個方言點,詞形相同的只列舉其中的一個方言點,見表2。

表2 方言時間詞的內部構成
表2中4個詞目,共有40種不同表達形式。從內部構成來看,都包含了時示與時基,且大多數采用了時示在前、時基在后的組合方式。如,“頭年”“上年”“昨年”“開年”“外前年”“向前年”“頂前年”等。只有少數詞語采用了時基在前,時示在后的構詞方式,如“年后”“年頭上”等。可見,方言時間詞構成規律與普通話大致相同。稍有區別的是,方言中三音節時間詞所占的比例比普通話略大,有些方言還有四音節時間詞。多音節時間詞主要是增加了一些語義非常虛的語素,如“子”“兒”“個兒”等等,這種現象在普通話中很少出現。方言詞匯中的三音節或四音節時間詞,在構詞方式上仍然可以分析出時示和時基兩個部分。以歙縣方言的“外前年”為例,此詞的構造包含兩個層次。第一層,“年”是時基,“前”是時示;第二層,整個“前年”是時基,“外”是時示。
綜上所述,無論是在普通話還是方言里,時間詞都蘊含了時示和時基兩個核心要素。
1.表時間單位的語素充當時基
表時間單位的語素是最有資格充當時基的,它們也是時基范疇中最活躍的成員。時間單位語素充當時基的時候,其位置可在前,也可在后。
a.時基在前。如:日前、周二、星期四、月底、年初、世紀末、春分、夏至。
b.時基在后。如:半夜、昨日、本周、八月、今年、初春、現代、宋朝、本世紀。
時間單位是人們根據經驗或科學測量得到的計量時間的尺度,以它們為時基,能夠對時間進行比較準確的初次定位。一般說來,樸素的時間表達不一定使用時間單位語素為時基,但是科學的時間表達離不開它們。
2.表活動的名詞性語素充當時基
表活動的名詞性語素可以充當時基,其位置一般處于時間詞的前面,采用“時基+時示”的構造方式,這一類時間詞有:飯前、飯后、課后、課間、事前、事后、戰前、戰后。
借用某一活動來充當時間的基點,符合時間參考的基本原則。根據李鐵根的研究,時間的參考標準有四⑧:(1)以說話人說話的時間為標準,如“今天”;(2)紀年標準,如1996年;(3)天文標準,如“春天”;(4)事件標準,如“出國后”。表示活動的名詞性語素充當時基就是以事件作為參照的標準。
3.視覺類名詞性語素充當時基
少數視覺名詞性語素也可以充當時基,常見的語素是“目”和“眼”,一般采用“時基+時示”的構造方式。如:目前、眼前、眼下。
視覺類名詞語素能夠充當時基與人類對時間的認知有關,在人們的觀念中,時間被當作一種可視的東西,原始的計時就是依靠眼睛觀察、度量的。
4.代詞性語素充當時基
少數代詞性語素可以充當時基,其位置一般位于時間詞的前面。常見的語素有“其”“之”“此”等等,如:其后、之前、之后、此前、此后。
此類語素往往能夠用來代指某一事件,本質上相當于事件后面加方位詞,可對時間定位。
1.表數量的語素充當時示
表數量的語素能夠充當時示,它們是時示中的重要成員。其位置可在前,也可在后。
a.時示在前。如:三月、四月、六號、十二點、一九九八年、十六世紀。
b.時示在后。如:周一、周三、初二、初八、星期一、星期四、年三十。
數量語素可以表示順序義,所以能夠對時間進行定位。
2.方位語素充當時示
方位語素是時示范疇中最重要的成員之一,方位語素充當時示,其位置也可前可后。
a.時示在前。如:前天、后天、上午、中午、下旬、前年、后年、中世紀、下世紀。
b.時示在后。如:月中、年中、年前、年后、飯前、飯后、午后、日前、日后、事后。
方位語素充當時示與它本身指示位置的語法功能有關,也與時間的特點有關。時間具有順序性,所以能夠用“前”與“后”來指稱⑨。有些方言時間詞是由兩個方位語素復合而成的。如:“上前年”(成都)、“外前年”(歙縣)等。
3.表身體部位的語素充當時示
一些表身體部位的語素能夠充當時示,其位置也比較自由。
a.時示在前。如:頭天、頭年、末日、末年、末世、頭晌上午(連云港)、頭午上午(濟寧)。
b.時示在后。如:周末、月底、月末、年尾、年底、年末、世紀末、月頭月初(吉首)。
有時候,身體部位語素可以和方位語素復合充當時示。如,“年頭里”(商丘)、“年頭上”(蘭州),分別由身體部位語素“頭”與方位語素“里”和“上”組合而成。
方位語素和身體部位語素都是反映空間關系的,所以可以充當時示。漢語中不少時間概念的詞語是從表示空間-視覺概念轉變來的。這個演變途徑符合人類思維的認知特點。一個詞語由表空間義轉化為表時間義,是由于隱喻的作用。Heine等將語法化看成是若干認知域之間的轉移過程,各個認知域從具體到抽象構成一個等級序列:人>物>事>空間>時間>性質。⑩
4.表自然現象的名詞性語素充當時示
部分表自然現象的名詞性語素可充當時示,位置居前。如:雨季、汛期、花期。
自然現象類名詞性語素充當時示是時間觀念在農業生產和生活中的反映,代表了一種樸素的時間觀,表達了一種模糊的時間概念。
5.形容詞性語素充當時示
一部分形容詞性語素可以充當時示,其位置一般在前。如:深秋、盛夏、酷暑、晚秋、白天、白日、黑夜、黃昏、幼年、少年、老年。
這一類時示包括表性狀、表顏色和表年歲的形容詞性語素。上例“深”“盛”“酷”“晚”表性狀,“白”“黑”“黃”表顏色,“老”“少”“幼”表年歲。從認知的角度上看,漢語中的這些形容詞代表了一個等級序列上的某個點,因而可以被投射到時間域,起指示時間的作用。
6.代詞性語素充當時示
一部分代詞性語素可以充當時示,其位置一般居前。例如:本周、本月、本世紀、他日、他年、這天、這會兒、那會兒。
代詞性語素具有指示代替的語法功能,因此能夠起到對時間定位的作用。
7.表時間的名詞性語素充當時示
少數表時間的名詞性語素可以充當時示,其位置通常居前。例如:昔日、昨日、昨晚、今晨、今日、今世、明夜、明年、古代、古時。
這些語素在特定的環境中(如成語)有時可以單獨使用,單用時本身能夠指示時間,具有定位功能,所以能夠充當時示。
8.動詞性語素充當時示
少數動詞性語素可以充當時示,其位置也有兩種情況。
a.時示在前。如:來年、來日、去年、傍晚、處暑、立秋、立冬、打秋立秋(重慶)、挨晚傍晚兒(蒙自)、擦黑傍晚兒(成都)、過冬冬至(青島)。
b.時示在后。如:年終、春分、秋分、夏至、冬至。
動詞性語素之所以能夠充當時示與時間的特點有著密切的關系。時間是運動的,所以時間又被擬人化,因此出現了由動詞性語素充當時示的現象。比如,時間的流動性,可以用“來”與“去”來表示,“來年”“來日”“去年”表示將來與過去的時間。
計算機理解和分析時間意義的前提是識別時間詞。因此,需要對時間詞進行準確的切分和標注。而實現這一目標必須依靠有關語言知識。關于詞類的判定邢福義先生提出了一些極為重要的判定原則和方法,有很高的應用價值。此外,本文認為,有必要將“時基”和“時示”兩個核心要素作為判定時間詞的另一個重要標準。用以解決時間詞標注上遇到的一些困難。先看三例:
(1)眼看婚期臨近,家中三封電報催他回家完婚。
(2)桂花的花期都是在中秋前后。
(3)只有在汛期水位升高,方可提前看見這塊水域。
我們利用中科院計算所開發的漢語詞法分析系統(ICTCLAS)對這兩個句子進行切分和標注,結果“婚期”標注為名詞(n)。而“花期”和“汛期”均標注為時間詞(t)。這一標注結果引起了我們的極大興趣:同為表達時間概念的三個詞語,為什么例(1)標注為名詞,而例(2)、例(3)標注為時間詞。查看分詞軟件中的詞表,發現“婚期”被界定為名詞,而“花期”和“汛期”都被界定為時間詞。查閱《現代漢語詞典》也未收入“婚期”一詞,可見,將“婚期”判定為時間詞缺少語言理論的支持。這顯然不利于計算機理解和分析句子或語篇中的時間意義。解決這一難題,可以根據本文的結論制定相應的語言學規則,依據規則即可對“婚期”的內部結構做出正確的分析。如前文所述,“婚期”“花期”“汛期”三者結構完全相同,均采用了“時示+時基”的構造方式,“婚”為時示,“期”為時基,“婚期”一詞主要的語法功能是對時間進行定位。據此,可將“婚期”判定為時間詞。再舉兩個例子:
(4)如果術前安排做心造影,就可能避免現在的開胸后又毫無意義地關上。
(5)許多醫生為術前的診斷、計劃和準備工作也付出了大量的心血。
上述兩例,“術前”同樣沒有被收入“時間詞庫”與《現代漢語詞典》,《詞表》亦未收入。根據本文的討論,“術前”可判定為一個時間詞,其構成方式是“時基+時示”,名詞語素“術”充當時基,方位語素“前”充當時示。它在構造方式上與“事前”“事后”“戰前”“戰后”等時間詞完全一樣。
自然語言的信息加工,必須有一套行之有效的編碼方法,即人們常說的形式化表示問題。以往的研究對時間詞的構成規律及其形式化問題未能引起足夠的重視。不能為面向自然語言處理的時間意義研究提供必要的知識支持。正如邢福義先生所言:“許多事實并未描寫詳盡,對于大量語言現象的認識還處于懵懂狀態,遠遠不能滿足中文信息處理的需求,因而跟不上時代發展的步伐。”鑒于此,本文窮盡考察了包括《現代漢語語法信息詞典詳解》在內的多個時間詞表,對時間詞的構成作定量分析,從大量的實例中概括出其組合規律。研究表明,現代漢語時間詞蘊含了兩個至關重要的核心要素“時基”和“時示”,它們是構建漢語時間概念的關鍵,也最能體現漢語時間詞的特點。提出“時基”和“時示”的概念對時間詞的形式化表示有重要意義,可以直接應用于漢語詞語自動切分和標注、漢語時間詞語編碼加工,對時間的形式語義研究和自然語言處理研究有重要的理論和實際價值。
本文揭示了時間詞的內部組合規律,指出蘊含在時間詞內的兩個核心要素:“時基”和“時示”。這一研究思路不僅適用于時間詞,也適用于處所詞。按照本文對時間詞的研究思路,我們發現處所詞也可以分析出處所的“基點”和處所的“指示”兩個核心要素。處所的“基點”有學者稱之為“基準”,即構成方所的實物,例如,“山上”“水里”的基準物分別是“山”和“水”。處所的“指示”是對基點進一步定位的語素,常由方位語素或形容詞語素等充當。例如,“地”能夠作為處所的基點,它們可以分別與表指示作用的“上”“下”組合,聯合構成處所詞“地上”或“地下”。
從處所詞的內部構成來看,也可分為兩種類型。
類型1:“基點+指示”。如:屋里、山上、山下、墻內、墻外、地上、地下、路口、路上、水面、路面、街上、院內、院外、園內、校內、校外、郊外、城里、城外、門前、門后、國內、國外、縣里、洞中、洞口、塔頂、路左、星際、背后、空中、海面、心頭、心上、體內、身上、身旁、華北、廠里、腹中、湖畔、床下、田頭、文中、區內、耳邊、島上、村北、夢中、胸前。
類型2:“指示+基點”。如:外屋、里屋、南方、北方、東面、西面、前臺、后臺、中游、左角、右角、別處、東側、西側、滿街、滿山、全縣、全校、高空、各地、前線、遠方、外地、近郊、中途、東郊、左岸、外地、末端、后院。
時間詞和處所詞分別反映了時間概念與空間概念。從認知的角度來看,時間域和空間域是可以相互投射的,可見,這兩個概念域具有某種天然的聯系。本文的分析表明,漢語在表達時間和處所概念時都包含了兩個核心元素——“基點”和“指示”。這為進一步研究時間詞和處所詞之間的共性和聯系提供了新的視角。
注釋
①詹姆斯·愛倫:《自然語言理解》(第2版),劉群等譯,北京:電子工業出版社,2005年,第311頁。
②俞士汶等:《現代漢語語法信息詞典詳解》(第2版),北京:清華大學出版社,2003年,第444-449頁。
③中國社會科學院語言研究所詞典編輯室編:《現代漢語詞典》,北京:商務印書館,2005年,第1-1830頁。
④陳章太、李行健主編:《普通話基礎方言基本詞匯集》,北京:語文出版社,1996年,第2126-2231頁。
⑤清華大學計算機科學與技術系、中國科學院自動化研究所:《現代漢語通用詞表》,北京:清華大學,2003年。
⑥朱德熙:《語法講義》,北京:商務印書館,1982年,第43頁。
⑦張德芳:《簡論漢唐時期河西及敦煌地區的十二時制和十六時制》,《考古與文物》2005年第2期。
⑧李鐵根:《現代漢語時制研究》,沈陽:遼寧大學出版社,1999年,第10頁。
⑨李向農:《現代漢語時間詞參照定位語表形式——X前/后》,《語言研究》1997年第1期。
⑩Heine,B.,et al.Grammaticalization:A Concept ual Framework.Chicago:The Chicago University Press.1991.
責任編輯 張靜
2010-03-29
國家社會科學基金青年項目“基于語料庫的關聯標記的語體差異性研究”(09CYY035);華中師范大學“211”工程重點學科建設項目“中華文化繁榮發展中的漢語學科創新”子課題(YYZX0916)