999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

漢語詞匯研究中的統計方法述評

2016-11-07 06:59:27周芷羽
文教資料 2016年19期

周芷羽

摘 ? ?要: 本文對統計方法在漢語詞匯研究中的應用現狀進行了概述,并對其在應用中的得失做出了分析與評價。本文認為,統計方法在詞匯研究中的重要性主要體現在三個方面:為所得研究結論的普遍性和客觀性提供了更有力的保障;能夠實現對語言規律更縝密、準確、深刻的認識;對于詞匯系統的共時研究和歷時研究具有特殊的必要性。其主要局限性則體現為:無法完全排除科研主體的主觀因素;簡約化的數字結果可能會掩蓋某些復雜曲折的現實情況。

關鍵詞: 漢語詞匯研究 ? ?統計方法 ? ?定量研究

統計學是關于從大量現象中抽取量的特征的科學理論[1]99,統計方法則是運用統計學原理,對反映某種客觀現象的數據資料進行搜集、整理、計算、描述、推斷等綜合處理,以揭示事物內在規律的方法[2]234。描述性統計和推斷性統計是統計方法的兩個基本組成部分,描述性統計是通過計算比例數、平均數、標準差、相關系數等統計量對數據進行歸納和描寫的方法;而推斷性統計則是以概率論為依據,在描述性統計的基礎上通過對樣本資料的分析推斷統計總體數量特征的方法,其基本內容包括參數估計和假設檢驗[3]12-13。

統計學的產生起源于對社會經濟現象的研究,發展至今已在自然科學和社會科學的研究中得到了更廣泛的應用[4]3-4。那么,在語言研究中使用統計方法,是否有其可行性?語言現象所客觀具有的數量形式表現、近年來統計方法在語言研究中的廣泛應用及其優勢的有效發揮,對這一問題作出了肯定回答。

一、統計方法在漢語詞匯研究中的應用

統計方法如何應用于漢語詞匯研究?要言之,即選取具有一定容量的語料作為樣本,對其中處于隨機狀態的某種詞匯現象進行搜集、整理等預處理,并最終通過量化分析得出其數量形式或數量關系,并據以揭示該數量特征之后的本質和規律。

在傳統小學研究中,“單文孤證為考據家之所不取,然則考據家必文多而證廣也。如此必將文之同義者,搜集以為證,已略含有統計之意義”[5]357。但這僅止于對例證的搜集,而沒有對數據資料的計算和量化形式的呈現,還稱不上統計。

顧炎武分別對《論語》、《大學》、《檀弓》中“斯”“此”的使用次數進行了計算,以“語言輕重之間”求其“世代之別”[6]349;阮元也曾在探討《論語》中“仁”字意義時示以“仁字之見于論語凡百有五”的統計數據[7]176:這些已經可以說是統計方法在漢語詞匯研究中的初步應用,但這種應用只是出于偶然的需要,而非對科學方法的有意識的運用,其使用不成系統,也未能普遍貫徹。

直到五四運動后,西方語言學理論和研究方法開始大量引入中國[8]478,漢語研究中才開始出現對統計方法的自覺運用。1922年,黎錦熙所撰《國語中基本語詞的統計研究》一文,首次對統計方法在詞匯研究中的應用問題進行了探討[9]1-4。

統計方法在詞匯研究中的廣泛應用,則以20世紀80年代專書研究的興起為開端[10]。如張雙棣所著《呂氏春秋詞匯研究》,全面貫徹了定量分析的原則,對《呂氏春秋》中各類語詞的數量及比重、同一語詞其不同義位所出現的次數等詞匯諸方面的數量表現及數量關系,均進行了嚴格的統計,以求準確描繪該專書詞匯的全貌及其內部結構規律[11]13-14。

20世紀90年代至今,計算機技術的普及和語料庫建設的興起,為統計方法在語言研究中的應用提供了有力的技術支持,同時統計方法本身的應用水平也得到了提高,漢語詞匯的統計研究取得了良好進展:早期的統計實踐多局限于對詞匯現象頻數和頻率的計算,而這一時期的統計研究已提出了“流通量”和“分布率”的概念[12]6。

二、漢語詞匯研究中統計方法的必要性和優越性

“一種科學只有在成功地運用數學時,才算達到了真正完善的地步”[13]8。定量方法的運用,是科學研究追求精密性和客觀性的必然要求;可以說,統計方法的應用對于漢語詞匯研究,具有相當的必要性和重要性。

1.統計方法為所得研究結論的普遍性和客觀性提供了更為有力的保障:傳統研究方法多依賴于研究者個人的經驗與感悟,雖然也可能取得正確的認識,但畢竟個人經驗有限而語言現象無窮,少數例證不足以總結出普遍規律,且這樣的研究結論難免受到個人主觀成見的影響;統計方法作為一種定量研究手段,以大量客觀現實為依據,在一定范圍內有可能對特定語言現象進行窮盡性的分析,因而在更大程度上保證了研究結論的普遍性和科學性。比如,王力先生認為從殷代到西周,“朕”只限用于領格;而唐鈺明則通過對殷周甲金文的窮盡性統計分析指出,“朕”其實還有作主格甚至賓格的用例[14]109。

2.僅僅從質的規定性方面了解語言現象是不夠的,只有準確把握其數量界限,才能夠實現對語言規律的認識的深刻化和精確化。統計方法的運用能夠實現對語言規律的更為縝密、準確、深刻的認識,這不但有助于克服定性描述中出現的含混模糊的情況,促進漢語研究的科學化、精密化,而且有利于培養嚴謹求實的數字化學術思維。比如,先秦漢語詞匯以單音詞為主是眾所周知的常識,但這只是一個籠統的定性描述,其具體情況如何,單音詞與復音詞兩者的數量關系如何,都需要更深入的了解。馬真對先秦八部著作進行了考察,統計得到復音詞2772個,并估計單音詞數量為一萬,則先秦復音詞與雙音詞數量之比將近3∶10[15]80。這一數據雖然還不是非常精確,但較之“單音詞為主”的含混表述與模糊印象,這一結論顯然更清晰、細致、深刻。

3.統計方法的應用對于詞匯系統的共時研究和歷時研究,有其特殊的必要性和重要性。傳統的訓詁研究以零碎的語詞為主要研究對象,多著眼于對具體詞義的考釋;現代詞匯學更加重視對詞匯整體系統性的研究,而整個詞匯數量之龐雜及其系統內部結構關系之薄弱又造成了詞匯系統研究的特殊困難。統計方法是處理分析大量語料的有效手段,只有借助統計方法,才能揭示整個詞匯各個方面的數量特征,從而為詞匯系統的斷代描寫奠定基礎。脫離了統計方法,對共時詞匯系統全貌的宏觀把握是難以實現的。在共時描寫的基礎之上,統計方法也為詞匯系統歷時演變的描寫提供了可能。張雙棣曾指出:“如果我們將某一時代的著作一部一部地都這樣做過窮盡性的統計分析,綜合起來,這一時代的詞匯語義的面貌就可以完整地、清晰地勾勒出來了。如果進而將每個時代的情況貫穿起來,理清發展脈絡,就可以對整個漢語詞匯語義發展的歷史有一個全面而完整的認識了。”[11]14

除此之外,統計方法以下兩個方面特征,對于增強研究結論的可靠性和說服力具有獨特的優越性。

1.在科學研究中應用統計方法,具有可觸摸性的特征[16]311。統計方法從客觀材料中獲取數據,統計結果以頻數、頻率等數據呈現,所得量化形式有形可感,一目了然,能夠更直觀地揭示規律;實在的數據使得研究結論有據可憑,可以避免泛泛而談,做到言之有據[11]13。

2.應用統計方法進行的研究,具有可重復性。只要提供相同的條件,就可進行重復操作,對既有結論進行驗證。可重復性是一個衡量研究質量高低的尺度[16]311;一項研究結論,如果不能接受實踐的再次檢驗,那么其可信度就是值得懷疑的。

三、統計方法的局限性及其在應用中須注意的問題

統計方法雖具有明顯的優勢,但也有其局限性:

1.任何科學研究的進行和研究手段的應用,都無法完全排除人作為科研主體所必將造成的主觀因素的存在,統計方法也不能例外。比如,許多學者對先秦重要文獻中的雙音詞數量及其所占總詞數比例做了統計,但對同一部著作的統計結果有不小的差異:據馬真統計,《論語》中復音詞數為159個[15]79,向熹的統計則是200多個[17]393;陳克炯統計《左傳》復音詞占總詞數比重為20.7%,但據黃志強在其碩士論文中劃定的《左傳》復音詞數,其比重幾達總詞數的30%(轉引自徐流《論同義復詞》)[18]17。對同一材料進行若干次分別統計,所得結果按理應當大致相同;之所以出現如此明顯的差距,是不同的研究者對雙音詞的認識和理解有所差異,自然造成劃定標準的不同。

這一問題的產生,固然可歸因于不同研究主體主觀因素的影響,因此與詞匯學現有理論水平的限制直接相關:目前,學界對于古代漢語中雙音詞的判定尚無有效可行的統一標準。可見,統計方法在詞匯研究中的應用,必須依靠正確理論的指導;研究方法的應用要充分發揮應有效用,亦有賴于理論本身的發展與進步。

2.統計方法具有可簡約化性的特點,能夠將錯綜復雜的社會現象簡化為直觀、單純的數據形式[16]311。然而,簡約化的數字可能會掩蓋某些復雜曲折的現實情況。比如,隨著詞匯統計的深入開展,發現單純將頻次作為衡量標準具有較強的片面性,因為有些詞雖然出現較多,但分布極不均勻;在此基礎上,提出了“分布率”和“使用度”等統計概念[19]67。因此,要獲得科學的結論,要求研究者結合背景資料,對統計結果進行全面的了解和深入的審察,避免被表面的數據所蒙蔽,并強調多層次、多角度的統計方法的綜合利用,以求全面準確地揭示語言現象的本質和規律。

另外,語言研究雖有統計方法這一有力工具,但其效用的充分發揮則有賴于研究者的正確掌握和運用;一旦使用不當,則不但其優勢得不到發揮,反而將得出錯誤的結論,對語言研究的科學性造成損害。因此,在詞匯研究中應用統計方法,應當注意如下問題:

1.統計方法的成功運用,必須具備一定的前提條件,首先即是對樣本的要求:樣本容量必須足夠大,才足以通過其數量特征得到傾向性規律的反映;反之,如果樣本容量沒有達到一定的要求,難以縮小相對誤差,那么所得到的統計結果就缺乏普遍性。除此之外,確保樣本的質量也至關重要。統計資料的完整、準確、真實是得到客觀的統計結果的重要前提,對于原始統計材料,必須進行去粗取精、去偽存真的甄別整理工作。例如,要進行古代漢語專書詞匯的統計研究,必須考察文獻的不同版本,擇善補正并加以校訂,得到可靠的語料,方可進行進一步的統計工作。其次,對于統計對象應有明確的認識和把握,進行統計時,須對統計對象進行辨別,對不合統計目的者予以剔除[20]164。

2.定量分析是定性研究的基礎,定量是為定性服務的;統計本身不是目的,而是進行研究的工具和手段。割裂定量分析和定性研究的統一關系,為定量而定量,盲目濫用統計方法以迎合時勢或炫耀技巧的做法是不可取的。研究者對于統計學原理應當有透徹的理解,對所得統計結果在統計學上的意義有充分認識,并據此對其后所隱藏的語言規律進行探求和揭示;否則,僅有數據的羅列和材料的堆砌,而缺乏理論的深入挖掘,那么語言現象的本質將無從揭示,統計方法的使用將喪失意義。

四、現狀與展望

雖然當前統計方法的應用在詞匯研究中已經得到了普遍認可和更大規模的實踐,但是從其應用現狀看,目前對詞匯的計量研究其實際水平并不高;除了統計方法應用水平相對較高的方言詞匯和語料庫領域已分別開始使用“相關系數”方法和“流通量”、“分布率”的統計概念外,其他詞匯研究領域對統計方法的應用仍停留在初步的描述性統計階段:其統計分析多僅限于對詞匯現象出現次數的絕對數量(如頻數)和相對數量(如頻率)的統計,所使用的統計方法無外乎初等數學中的簡單算術。正如蘇新春所言,當前的詞匯計量研究“仍較多地停留在一次性的直觀統計,較少進行多層面、多角度的數的分析,也很少使用復雜的數學公式來進行數值之間相關度、聚類分析等分析”[12]8。可見,漢語詞匯統計研究還有待進一步深入和開拓。

定量方法的使用,是社會科學從描述科學向精密科學過渡的必然要求[1]97;在此背景下,對統計方法應用水平的提高當予以更高重視,使其在語言研究中的優勢得到更充分的發揮。

參考文獻:

[1]宋健.社會科學研究的定量方法[J].中國社會科學,1982(6):97-105.

[2]歐陽康,張明倉.社會科學研究方法[M].北京:高等教育出版社,2001.

[3]張倫俊.社會統計方法[M].合肥:中國科學技術大學出版社,1988.

[4]徐浪,王青華.描述統計學[M].成都:西南財經大學出版社,2001.

[5]胡樸安.中國訓詁學史[M].北京:商務印書館,1939.

[6]顧炎武.日知錄集釋(校注本)[M].浙江:浙江古籍出版社,2013.

[7]阮元.揅經室集[M].北京:中華書局,1993.

[8]濮之珍.中國語言學史[M].上海:上海古籍出版社,2002.

[9]黎錦熙.國語中基本語詞的統計研究[J].國文學會叢刊,1922,1(1):1-4.

[10]蘇新春.漢語詞匯定量研究的運用及其特點——兼談《語言學方法論》的定量研究觀[J].廈門大學學報(哲學社會科學版),2001,(4):135-142.

[11]張雙棣.《呂氏春秋》詞匯研究(修訂本)[M].北京:商務印書館,2008.

[12]蘇新春.漢語詞匯計量研究[M].北京:商務印書館,2008.

[13][法]拉法格,[德]李卜克內西.憶馬克思恩格斯[M].北京:生活·讀書·新知三聯書店,1963.

[14]唐鈺明.定量方法與古文字資料的詞匯語法研究[J].海南師范學院學報,1991(4):106-109.

[15]馬真.先秦復音詞初探[J].北京大學學報(哲學社會科學版),1981(3):76-84.

[16]桂詩春,寧春巖.語言學方法論[M].北京:外語教學與研究出版社,1997.

[17]向熹.簡明漢語史(上)[M].北京:商務印書館,2010.

[18]徐流.論同義復詞[J].古漢語研究,1990(4):12-17.

[19]劉云.漢語詞匯統計研究述評[J].漢語學習,2009,2(1):62-69.

[20]程俊英,梁永昌.應用訓詁學[M].上海:華東師范大學出版社,2008.

主站蜘蛛池模板: 国产精品美女在线| 亚洲色欲色欲www网| 久久亚洲国产最新网站| 国产99精品久久| 丁香六月激情婷婷| 日本午夜在线视频| 亚洲一区二区三区麻豆| 色综合天天娱乐综合网| 91丝袜美腿高跟国产极品老师| 日本色综合网| 亚洲精品免费网站| 亚洲欧美日韩色图| 久久久久亚洲av成人网人人软件 | 很黄的网站在线观看| 久草视频精品| 57pao国产成视频免费播放| 伊人久久福利中文字幕| 免费毛片全部不收费的| 国产h视频免费观看| 永久免费无码日韩视频| 国产福利在线观看精品| 亚洲无码91视频| 97se亚洲综合在线天天| 日韩欧美国产三级| 久久大香伊蕉在人线观看热2| 国产特级毛片| 亚洲欧美综合精品久久成人网| 国产精品lululu在线观看| 亚洲Av综合日韩精品久久久| 四虎永久免费地址在线网站| 欧美日韩一区二区三| 成人91在线| 亚洲综合18p| 久久精品国产精品一区二区| 在线视频97| 丁香六月综合网| 国产精品性| 99无码熟妇丰满人妻啪啪| 在线亚洲小视频| 韩国自拍偷自拍亚洲精品| 毛片国产精品完整版| 国产一区免费在线观看| 操国产美女| 久久99国产乱子伦精品免| 国产精品999在线| 国产91在线免费视频| 国产福利不卡视频| 日本一区二区不卡视频| 午夜福利视频一区| 成人小视频网| 欧美性天天| 久久黄色毛片| 色老二精品视频在线观看| 人妻无码一区二区视频| 中文字幕无码av专区久久| 一级毛片无毒不卡直接观看| 国产日韩欧美精品区性色| 国产成人无码播放| 日韩毛片在线播放| 欧美精品亚洲日韩a| 国产喷水视频| 67194亚洲无码| 日韩一级毛一欧美一国产| 性欧美久久| 国产成人精品在线| 白丝美女办公室高潮喷水视频| 99久久精品国产麻豆婷婷| 国产精品美人久久久久久AV| 青青极品在线| 中文字幕亚洲专区第19页| 国产成人综合久久精品尤物| 精品91视频| 无码免费视频| 在线观看免费黄色网址| 日韩专区欧美| 欧美成人午夜视频免看| 1024你懂的国产精品| 激情无码字幕综合| 精品色综合| 亚洲伊人天堂| 广东一级毛片| 三区在线视频|