999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

復雜科技術語構詞中的語素化

2015-05-11 09:29:26于東等
中國科技術語 2015年2期

于東等

摘 要:復雜術語通常作為整體使用,具有詞的特征,其中包含的其他術語或通用詞的詞匯地位下降為語素,即語素化。在該視角下,具體學科的復雜術語構詞可描述為三層模型:首先學科基本概念由學科基元語素表征,然后由學科基元語素擴展構成固有語素組,最終由固有語素組擴展構成復雜術語。統計顯示,在通信學科中超過80%的術語均包含學科基元語素,幾乎所有術語均包含固有語素組。

關鍵詞:復雜科技術語,語素化,學科基元語素,固有語素組

中圖分類號:H083;N04 文獻標識碼:A 文章編號:1673-8578(2015)02-0015-06

Morphemization in Complex Terms Constitution

YU Dong RAO Gaoqi TANG Gongbo XUN Endong

Abstract: In Chinese, complex terms are usually used as one word, so other terms or general words that constitute the term can be seen as morphemes, so called morphemization. Under this view, complex term formation can be described as a three layer model: firstly, basic concepts of a subject can be described by a number of domain element morphemes; then, inherent morpheme groups are extended based on domain element morphemes; finally, complex terms are formed by using inherent morpheme groups. Statistics show that more than 80% terms in communication science contain domain element morphemes and almost all terms contain inherent morpheme groups.

Keywords: complex term, morphemization, domain element morpheme, inherent morpheme group

收稿日期:2014-12-11

基金項目:國家自然科學基金項目(61300081,61170162);國家科技支撐項目(2012BAH16F00);北京語言大學中央高?;究蒲袠I務專項資金(15YJ030006)

作者簡介:于東(1982—) ,男,山東日照人,博士,講師,研究方向為計算語言學。通信方式:yudong_blcu@126.com。

引 言

隨著科技不斷發展,新概念不斷涌現,作為概念載體的科技術語的數量飛速增長。在中文中,由于無法為每個概念創造全新的詞語,由多個“單詞”復合構成的復雜術語成為概念表示的主要形式。研究復雜術語的構詞結構,不僅可以發展對中文術語的認識,在實踐上還能夠為概念相似度計算、新術語發現、語義分析、機器翻譯和信息檢索等提供理論支撐。

在《現代術語學引論》[1]中,將“采用原有單詞構成詞組表示新的概念(的術語)”定義為“詞組型術語”,比如“碼分多址”“赫夫曼編碼”“高斯最小頻移鍵控”等。與詞組型術語相對應的則是“單詞型術語”,例如“比特”。而實際上,術語無論內部結構復雜或者簡單,其所指必然只有一個概念,從語法功能和語義的角度上看都是一個整體。

在構詞理論中,造詞材料一旦組合成詞,根據同類性原則彼此均要以“語素”的身份出現[2-3]。從這個角度而言,“詞組型術語”并非真正詞組或短語,詞組型術語定義中“采用原有單詞”所指的單詞,在復雜術語中應不再具有詞匯屬性,而成為構詞的語素。而且,“單詞型術語”本身經常用作“詞組型術語”的組成部分。其自身又分為兩類:可以單獨做術語和不能單獨做術語。這與合成詞中語素的表現十分相似。另一方面,構成術語的諸多“單元”(不僅僅是單詞)與其獨立使用時有所不同,出現了“語素化”的現象。原有單詞在術語中常出現語義壓縮、形態縮略、詞性變換等。將復雜術語看成為若干詞的組合,不如看成是若干語素或語素組的組合。因此,從語素角度分析術語構詞特征,更符合實際情況和語言理論。本文將具有內部結構的術語視為整體,姑且稱為復雜術語。在該視角下,我們從語素構詞角度研究復雜術語中語素形態和構詞特征。

此外,對于一個學科而言,學科中的術語和它本身表征的概念系統具有等價關系。概念系統的復雜性將體現在術語構詞中,具體表現為構成復雜術語的語素之間存在內在聯系和規律。以通信科學為例,選擇全國科學技術名詞審定委員會發布的《通信科學技術名詞》(2008版)[4]作為研究對象,并對其中的2107條術語進行了包括語素切分、語素類型在內的標注。通過分析這些復雜術語的語素類型和來源,并對其進入術語形成語素過程中的語素化現象進行分析和討論,我們發現特定學科術語紛繁復雜、數量巨大的背后是少數基元概念組合構成概念組,由概念組再組成術語概念的過程。具體到物質層面就是學科基元語素組成語素組,由語素組組合構成大量復雜術語。

一 科技術語構詞的語素化機制

邱艷萍在《概念整合在語素化構詞中的作用》中指出[5],語素化主要分為兩類:音節語素化和詞的語素化。前者指本來不表義的音節變成了表義的語素;后者則指漢語中已經存在的詞,它們的詞匯地位發生變化,由詞下調為一個構詞語素,以便派生新詞。本文的研究主要集中在后一種,即詞的語素化方面。endprint

對于復雜術語中,語素化現象又可以進一步分為兩種:第一種,是直接將詞語作為新詞的一部分使用。這樣的例子如“比特滑動”“插入損耗”“接入協議”等,這種現象在我們標注的術語中占較大比例。第二種,是將詞語進行若干形式變換和處理后,形成構成新術語的語素。這主要表現在語義和形態兩方面。在本文研究對象中,語義方面的語素化主要表現為語義范圍的縮小與轉化,如:

(1)瀏覽器——萬維網(Web)服務的客戶端瀏覽程序。可向萬維網服務器發送各種請求,并對從服務器發來的超文本信息和各種多媒體數據格式進行解釋、顯示和播放。(語義縮?。?/p>

(2)游牧性——用戶或終端慢速移動,或無需跨區切換的特性。(語義轉化)

其中,(1)內語素“瀏覽”的語義縮小為了“瀏覽網頁”,(2)“游牧”則完全脫離了其本義。

在形態上的表現有位移(相對于定義中的表達順序)和縮略,如:

(3)比特劫取——泛指借用分配給某些信息傳輸用的比特來傳送另外功能的操作。(位移)

(4)跳頻——無線傳輸中,射頻頻率按照某種特定算法發生的重復變化……(縮略與位移)

其中,(3)的原始定義中的實際動作是“截取”,“比特”是動作的受事,通常應出現在動作的后面。但語素化過程中“比特”出現了位移。(4)中“跳”所指稱的動作是“跳轉”,“頻”指稱“頻率”, 是“跳轉”的主語。它在語素化中發生了縮略,且同時發生了位移。

另一方面,術語和它本身表征的概念都具有系統性,這樣的系統性同樣反映在術語構詞的語素集合中??梢哉J為語素在術語內和術語間也具有語義上的聯系。具體來說,科技術語是具體概念的表征,對于一個特定概念而言,根據概念層級不同,一般存在上位概念、下位概念,實際上是學科概念體系中的一個分支節點。整個學科中,所有的概念可以形成樹狀結構,如圖1所示,“通信”和它的4種下位概念,構成該學科內概念體系的一棵子樹。

圖1 術語“通信”構成的概念樹

對于某個學科的術語而言,新術語的構詞與術語概念在概念體系中所處的層級高度相關。較上位的概念出現較早,往往是學科中的基本概念,因此其對應術語的構詞形式大多比較簡單,可認為是學科基本術語。而較下位概念,往往是上位概念在某種情形下的擴展或限定,其對應術語的構詞較多采用“上位概念+限定語/補充成分”的形式加以描述。這樣的情況在我們標注的數據中占83.4%。在這樣的結構中,上位概念往往由學科基本術語演化而得到,而限定語的來源則頗為廣泛。

從語素角度來看,術語“圖像通信”中,“圖像”和“通信”是詞匯語素化的典型,其中“圖像”是基本概念“通信”的限定成分。兩者均可進一步劃分為單字語素“通”“信”和“圖”“像”。而在該術語中,它們實際上能夠作為語素組整體出現。學界通常認為語素組具有和語素同樣的構詞、造詞功能[6]。為區別二者,本文將“信”“圖”這樣的單字語素稱為學科基元語素。復雜術語中學科基元語素和語素組在構詞中的作用將在第二部分進行詳細介紹。

二 從語素到復雜術語

對于大部分學科,隨著學科研究不斷深入,該學科的術語會逐漸增多,這是詞匯系統開放性的一個縮影。但通過觀察可以發現,特定學科中,大部術語都是復雜術語或者“詞組型術語”,其內部仍存在細分結構。正是這樣的細分結構,使得學科術語數量巨大,同時所使用的語素和語素組卻十分有限,即術語構詞中體現出語言宏觀的“有限單元形成無限組合”的特性。

為了描述這樣的有限單元,我們對通信學科數據集合進行了最小語素單元的劃分,以“最小音義結合單位”為依據,將術語集中的每條術語進行劃分,得到的語素可認為是該學科中不可再分概念(原子概念)的體現,我們稱之為原子語素。如(5)至(8)所示。

(5)通信——通(交流、溝通)+ 信(信息)

(6)雙工——雙(雙向)+工(工作模式)

(7)香農熵——香農(Shannon)+熵(熱力學標量)

(8)長波——長(長的)+波(電磁波)

通過觀察發現,類似(5)(6)(8)的術語雖是多語素復合詞,但也經常作為整體被語素化,成為復雜科技術語內部的一個語素組。相反,復雜科技術語并不直接操作原子語素,而是在語義上對原子語素進行了整合,通過使用語義更加明確的語素組實現構詞。

同時,語素組還可以有效減少語素多義同形的現象。語素組所表示的復合概念直接參與構成復雜科技術語所指稱的概念。且語素組在學科內重復使用,對整個術語的學科性起到基礎的構建作用。每種語素組和構成它們的原子語素間的對應關系又相對固定。如(9)(10)所示。

(9)高斯噪聲——高斯+噪聲(噪+聲)

(10)通信衛星——通信(通+信)+衛星(衛+星)

上述過程中,原子語素往往先組合成為語素組,然后再由這些語素組經過組合和變換,形成形式更為復雜的術語。其構詞層次結構如圖2所示。

必須強調的是,雖然語素組在語義和構詞上有重要作用,但是其并非一種新的語法單位:它只是語素之間的一種緊密結合。因此語素組也可以和語素直接構成詞,而不違背相似性原則。

圖2 復雜科技術語的構詞層次結構

對通信學科術語進行統計發現,原子語素的數量遠遠少于由其構成的語素組的數量,能產性也遠遠小于語素組。語素組的高能產性背后是少數學科基本概念組合構成大量概念組,然后再由概念組組成更復雜的概念的過程。因此可以認為,語素組這一中間層次的存在是復雜術語巨大能產性的基礎和關鍵。

此外,在術語構成成分中,根據語素來源不同,還可以進一步分析語素組成與學科概念體系之間的聯系,這樣的分析有助于學科術語制定和規范化,本文在第三、四部分對此進行討論。

三 學科基元語素endprint

構成學科術語集合的眾多原子語素也存在來源的差異。如例(8)中,“波”指代的概念是“電磁波”,符合通信學科的語境。類似還有“信”“頻”“香農”等。這些原子語素都具有通信學科的特征,即不(常)出現在非通信學科詞語中。本文將具有這樣性質的原子語素定義為學科基元語素,后文簡稱基元語素。而例(8)中語素“長”的語義和其在普通詞匯中無異,均表示“兩端之間距離大”。類似還有“雙”“短”“系統”“模型”等。這些語素常作為學科術語的限定成分出現,在構造復雜術語的過程中不可或缺,只是它們自己的語義不具有學科性,可認為是學科無關的通用語素。

表1中給出了通信學科術語集中統計得到的高頻基元語素示例及其頻率數據。通過標注和統計2107條術語,本文最終確定該學科的基元語素共130個。這些基元語素可以進一步分為音譯基元語素(如“香農”)和基本基元語素。在通信術語中音譯基元語素43條,基本基元語素87條。它們在術語中的分布情況如圖3所示。

統計發現,在術語集中包含基元語素的術語共有1694條,占全部術語的80.4%,其中由基本基元語素單獨生成的有1670條,音譯基元語素單獨生成的有120條。從統計來看,基元語素構造了學科中大部分的術語,說明學科相關的語義表示在術語這一詞匯系統中占據主導地位。

同時也注意到,仍存在一部分術語不包含任何基元語素,如“每戶平均收入”(電信運營商用于測定來自每個用戶收入的指標)。從字面上看,此類術語的學科特征不明顯,較難判斷其必然屬于通信學科。這是因為此類術語經常與學科內其他術語共同出現和使用,其代表學科屬性的部分在使用中為避免贅述而省略。

基元語素生成術語的能力差異巨大,如“網”共出現在214條術語中?!熬W”多次和“絡”組合并穩定出現在許多術語中。第四部分將對其進行詳細介紹。

四 學科固有語素組

和基元語素類似,本文將術語集中穩固組合、表達學科特定概念的語素組稱為學科固有語素組。在基元語素的基礎上,筆者進一步篩選出學科固有語素組。表2為通信學科術語集中統計得到的高頻固有語素組。

固有語素組并非完全由基元語素構成。如“無線”,“無”就是一個非學科基元語素,但是和基元語素“線”一同構成了在大量術語中穩定重復使用的語素組“無線”,并且表達了通信學科的學科語義。因此固有語素組的強大構詞能力不僅來源于基元語素的組合,也來源于基元語素和非基元語素的組合。

由圖4可以發現,出現頻率不小于10次的語素組有36條,在所有的語素組中占11.43%,說明少量固有語素組具有強大構詞能力。如(11)所示。

(11)數字(參與構建68條術語)

數字——數字 通信

數字——數字 信號

數字——數字 化

數字——數字 差錯

數字——數字 線 對 增益

……

較之基元語素,語素組的構詞能力分布表現出了更加明顯的長尾現象。這也從一個側面反映了學科術語的概念集中程度。此外,基元語素生成學科固有語素組的能力,也表現了類似的現象,如表3和圖5所示。

在術語集中,復雜科技術語的語素組平均長度為5.4(包括非固有語素組)。但是所蘊含的固有語素組大多為一個。這進一步表明了固有語素組對學科概念具有較好的表征特性,即復雜術語多由一個上位概念和其他非學科限定語復合構成。如圖6為“微波通信系統”這一術語從語素到語素組再到術語本身的構成過程。

五 語素化視角下的術語構詞

從語素化的視角出發,復雜科技術語的構詞更能體現術語所對應概念體系的特點。本文所提出的學科基元語素、學科固有語素組的概念,實質上就是學科概念體系在復雜術語中的映射過程??梢钥闯觯瑢W科術語的構詞就是概念組合的過程,表現在物質層面就是從學科基元語素到復雜科技術語的構建過程。

基元語素對于一個特定學科而言,起到基礎性作用,是構建該學科概念和術語的核心。并且我們有理由稍微大膽地認為它們也是構建整個學科知識的核心。如圖7中,圍繞基元語素“頻”,能夠構建出通信學科若干復雜術語。

對于術語規范化而言,制定術語集進行科技名字規范可以使用同樣的方法,即從基元語素出發,進行規范。一個理想的科技術語應當包含有學科基元語素或學科固有語素組,使得術語的學科性語義表征更為具體,亦不會引起混淆。

另一方面,隨著學科交叉的空前深入,不同學科的語素和語素組以前所未有的速度和規模互相滲透。而科技進步又使得大量學科概念成為日常生活中的一般概念。學科與學科之間和學科與通用之間的界限日益模糊。因而從基元語素和固有語素組的層面上對術語進行規范和界定將對術語工作提供有益的幫助。

參考文獻

[1] 馮志偉. 現代術語學引論[M]. 北京:商務印書館, 2011.

[2] 曹德和. 語速研究的性質、方法及語料來源[J]. 復旦學報:社會科學版,2003 (6):134-140.

[3] 劉力堅. 復合詞造詞材料的語素化問題[J]. 浙江師范大學學報:社會科學版,2005 (4):20-24.

[4] 科學技術名詞[M]. 北京:科學出版社,2008.

[5] 邱艷萍. 概念整合在語素化構詞中的作用[J].西南民族大學學報:社會科學版,2012 (S1):178-181.

[6] 丁建川.“語素組合體”述要[J]. 廣西社會科學,2005(7):162-165.endprint

主站蜘蛛池模板: 欧美国产在线看| 久久综合成人| 国产成人亚洲毛片| 精品国产香蕉伊思人在线| 日韩国产综合精选| 日韩在线影院| 国产精品亚洲精品爽爽| 精品久久久久久成人AV| 国产乱子伦无码精品小说| 久久频这里精品99香蕉久网址| 国产精品亚洲αv天堂无码| 毛片免费视频| 国产一二三区在线| 999国内精品视频免费| 伊人网址在线| 国产精品漂亮美女在线观看| 国产麻豆aⅴ精品无码| 一本一道波多野结衣av黑人在线| 久久精品人妻中文系列| 爱爱影院18禁免费| 亚洲精品国产日韩无码AV永久免费网 | 国产成人精品一区二区三区| 99久久精品久久久久久婷婷| 国产在线啪| 国产成人a在线观看视频| 99精品视频九九精品| 真实国产精品vr专区| 中文字幕波多野不卡一区| 日本欧美精品| 亚洲自拍另类| 亚洲中文字幕在线一区播放| 日韩区欧美国产区在线观看| 最新加勒比隔壁人妻| 国产精品欧美在线观看| 波多野结衣视频一区二区| 久久天天躁夜夜躁狠狠| 亚洲天堂2014| 久久男人视频| 欧洲在线免费视频| 欧美一区福利| 67194亚洲无码| 黄色三级网站免费| 丰满的熟女一区二区三区l| 97国产成人无码精品久久久| 亚洲色大成网站www国产| 网久久综合| 蝴蝶伊人久久中文娱乐网| 欧美天堂久久| 无码aaa视频| 99九九成人免费视频精品 | 久久综合丝袜长腿丝袜| 一级毛片免费的| 久久综合丝袜长腿丝袜| 狠狠色成人综合首页| 国产区免费| 国产av一码二码三码无码 | 在线观看免费黄色网址| 国模私拍一区二区| 免费黄色国产视频| 中国毛片网| 色老二精品视频在线观看| 国产午夜精品一区二区三| 国产色爱av资源综合区| 四虎永久在线视频| 日韩欧美国产区| 丁香婷婷在线视频| 亚洲无码日韩一区| 自拍偷拍欧美日韩| 精品视频福利| 欧美成a人片在线观看| 国产激情第一页| 91久久偷偷做嫩草影院| 国产呦精品一区二区三区下载| 内射人妻无码色AV天堂| 四虎国产在线观看| 午夜毛片免费观看视频 | 在线毛片免费| 久久青草免费91观看| 亚洲欧州色色免费AV| 婷婷六月激情综合一区| 国产主播福利在线观看| 欧洲成人在线观看|