大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室 基于大數(shù)據(jù)的城市科學(xué)研究北京市重點(diǎn)實(shí)驗(yàn)室

摘 要:大數(shù)據(jù)發(fā)展日新月異,新的應(yīng)用需求和實(shí)踐問題層出不窮,社會(huì)各界越來越重視大數(shù)據(jù)的基礎(chǔ)研究。百科全書作為知識門類的概述性著作,是開展和推動(dòng)基礎(chǔ)研究的重要載體。作為大數(shù)據(jù)知識傳播的工具,《大數(shù)據(jù)百科全書》不僅要有實(shí)用與新穎兼?zhèn)涞闹R內(nèi)容,并且還應(yīng)具備準(zhǔn)確嚴(yán)謹(jǐn)與通暢易懂的專業(yè)化語言文字表達(dá)。其中,術(shù)語是《大數(shù)據(jù)百科全書》不可或缺的有機(jī)組成部分,文章總結(jié)大數(shù)據(jù)領(lǐng)域的術(shù)語特點(diǎn),并以此提出《大數(shù)據(jù)百科全書》術(shù)語方面的收錄和處理原則。
關(guān)鍵詞:大數(shù)據(jù);百科全書;術(shù)語
中圖分類號:N04;TP39;H059文獻(xiàn)標(biāo)識碼:A DOI:10.3969/j.issn.1673-8578.2019.02.011
Features, Collection and Treatment Principles of Terminology in the Big Data Encyclopedia//Key Laboratory of Big Data Strategy, Beijing Key Laboratory for Big-Data based Urban Science Research
Abstract: The big data development is changing with each passing day. New demands in application and practical issues emerge in endlessly, and all sectors of the society pay an increasing attention to the basic research on big data. The Big Data Encyclopedia is a vital carrier to implement and accelerate such basic research for its knowledge category classification and overview explanation. In addition, the Big Data Encyclopedia is a tool to spread big data knowledge, so its content should be practical and novel, and its expression should be professional, accurate and precise. Considering terminology is an indispensable organic component in the Big Data Encyclopedia, we discussed features of terminology in big data fields, and proposed collection and treatment principles.
Keywords:big data; encyclopedia; terminology
2017年5月,中國大數(shù)據(jù)領(lǐng)域第一部專業(yè)百科全書——《大數(shù)據(jù)百科全書》正式啟動(dòng)編纂工作,該書將由大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室負(fù)責(zé)研究編纂,并經(jīng)全國科學(xué)技術(shù)名詞審定委員會(huì)(以下簡稱“名詞委”)審定發(fā)布。該書將在科學(xué)方法論的指導(dǎo)下,以歷史和發(fā)展的眼光,對大數(shù)據(jù)知識體系進(jìn)行全面梳理,覆蓋大數(shù)據(jù)理論、大數(shù)據(jù)戰(zhàn)略、大數(shù)據(jù)技術(shù)、數(shù)字經(jīng)濟(jì)、數(shù)字金融、數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)權(quán)法、大數(shù)據(jù)史九個(gè)方面,并以專業(yè)規(guī)范的百科全書語言的形式編纂成書,以期推動(dòng)大數(shù)據(jù)領(lǐng)域的知識傳播和普及,并為深入研究大數(shù)據(jù)提供基礎(chǔ)性研究素材。
《大數(shù)據(jù)百科全書》以大數(shù)據(jù)領(lǐng)域內(nèi)的豐富知識為主體,包括大數(shù)據(jù)領(lǐng)域的基本理論、重要事件、基本事實(shí)、基本概念、重要流派、重要機(jī)構(gòu)組織、重要著作和出版物、重要人物、重要政策文本等內(nèi)容。術(shù)語作為概念、理論的語言指稱,是《大數(shù)據(jù)百科全書》不可或缺的有機(jī)組成部分和研究重點(diǎn),主要分布在百科全書的立目用詞和釋文用語。
一 術(shù)語是《大數(shù)據(jù)百科全書》的有機(jī)組成部分
1.術(shù)語是大數(shù)據(jù)領(lǐng)域主要的專業(yè)用語
隨著大數(shù)據(jù)的飛速發(fā)展,相關(guān)知識體系逐步完善,其領(lǐng)域詞匯越來越豐富,相關(guān)術(shù)語所占的比重越來越大。術(shù)語是特定領(lǐng)域?qū)W科中的專門用語,是構(gòu)建學(xué)科體系的基本元素。根據(jù)詞匯使用范圍的不同,德國學(xué)者希爾默(A.Schirmer)將其分成通用詞和專業(yè)詞匯,專業(yè)詞匯由術(shù)語、專名①、行業(yè)用語等詞匯單位組成,其中術(shù)語是基本的專業(yè)詞匯單位[1]。與專名相比,術(shù)語稱謂的普通概念更具概括性,可以指稱客觀世界的一類客體,而專名往往處于概念體系的最底層,指稱客觀世界的唯一客體,包括人名、機(jī)構(gòu)名等等。同時(shí),術(shù)語與專名具有相通性,在某些情況下可以互相轉(zhuǎn)化。如“ENIAC”(Electronic Numerical Integrator and Computer),最初是指1946 年的第一臺電子計(jì)算機(jī),屬于專名,但由其發(fā)展而來的“電子計(jì)算機(jī)”已經(jīng)成為計(jì)算機(jī)科學(xué)術(shù)語。與行業(yè)用語相比,術(shù)語和行業(yè)用語雖都用于專業(yè)領(lǐng)域,且稱謂某個(gè)專門的概念,但術(shù)語更具規(guī)范性,而行業(yè)用語中常用具有俚俗色彩的口頭語,修辭色彩更強(qiáng)。如計(jì)算機(jī)領(lǐng)域從事軟件開發(fā)的工作人員也常常自嘲為“碼農(nóng)”。
2.術(shù)語是《大數(shù)據(jù)百科全書》的重要研究內(nèi)容
術(shù)語不僅僅是專業(yè)領(lǐng)域內(nèi)的語言交流的工具,還是對學(xué)科知識的凝練和濃縮,是科學(xué)理論的組成部分。術(shù)語既是語言單位,又是科學(xué)知識單位,術(shù)語符號與該知識領(lǐng)域的概念系統(tǒng)中的概念相互對應(yīng),它不僅是對專業(yè)領(lǐng)域內(nèi)理論概念的語言指稱,還是對在認(rèn)知過程中出現(xiàn)并完善的專業(yè)概念的形式化。它能夠概括、增加和傳遞科學(xué)知識,反映某一認(rèn)知領(lǐng)域的發(fā)展階段和程度[2]。《大數(shù)據(jù)百科全書》在全面梳理大數(shù)據(jù)領(lǐng)域的基礎(chǔ)理論、知識門類與發(fā)展實(shí)踐的過程中,必然要對其領(lǐng)域的相關(guān)術(shù)語進(jìn)行研究探索。以大數(shù)據(jù)領(lǐng)域概念為基礎(chǔ)的術(shù)語系統(tǒng),是歸納概括領(lǐng)域知識的符號系統(tǒng),在一定程度上體現(xiàn)了人們對大數(shù)據(jù)的知識系統(tǒng)的認(rèn)識,也是《大數(shù)據(jù)百科全書》框架體系的重要參考依據(jù)。
3.術(shù)語符合《大數(shù)據(jù)百科全書》的語言要求
術(shù)語是科學(xué)語言,其科學(xué)性、簡明性以及中立性等特性與百科全書的語言要求相符,使得術(shù)語成為《大數(shù)據(jù)百科全書》的重要用語。首先,術(shù)語的科學(xué)性要求術(shù)語要與所稱謂的概念一致,準(zhǔn)確傳遞概念內(nèi)容。其次,術(shù)語的簡明性要求術(shù)語簡明扼要,易讀易記,術(shù)語一般不宜過長。各語言中超過7個(gè)字(或詞)的術(shù)語短語數(shù)量有限。冗長術(shù)語在使用時(shí)往往會(huì)被簡化,從而構(gòu)成縮略形式。如“筆記本”(筆記本式計(jì)算機(jī))、“微機(jī)”(微型計(jì)算機(jī))等。最后,術(shù)語的修辭中立性是指術(shù)語不帶有修辭色彩、主觀情態(tài)性和其他表現(xiàn)力因素。在構(gòu)詞時(shí),避免使用方言或俗語詞匯[2]。這與百科全書準(zhǔn)確、平實(shí)、簡明的用詞特征相符。《大數(shù)據(jù)百科全書》要為相關(guān)讀者釋疑解惑,就必須具備真實(shí)、準(zhǔn)確、科學(xué)的大數(shù)據(jù)知識或信息。這不僅要求其內(nèi)容是大數(shù)據(jù)領(lǐng)域的客觀真理或規(guī)律,符合客觀實(shí)際,經(jīng)得起推敲和邏輯推理;同時(shí),作為內(nèi)容載體的文本語言力求嚴(yán)謹(jǐn)顯真,客觀準(zhǔn)確反映表達(dá)的內(nèi)容。這就要求其用詞表意準(zhǔn)確,選用恰當(dāng)、最能反映事物或現(xiàn)象真諦和精髓的詞語入文,忠實(shí)地表達(dá)概念,多選擇具有科技語體色彩并且表意準(zhǔn)確的書面用語,避免使用口語化或存在歧義的日常用語[3]。
二 大數(shù)據(jù)術(shù)語特點(diǎn)
《大數(shù)據(jù)百科全書》作為大數(shù)據(jù)領(lǐng)域的專業(yè)百科全書,應(yīng)盡可能體現(xiàn)所有或者至少大多數(shù)大數(shù)據(jù)領(lǐng)域的專業(yè)詞匯單位。因此,《大數(shù)據(jù)百科全書》術(shù)語的范圍以大數(shù)據(jù)術(shù)語為主,此外《大數(shù)據(jù)百科全書》還包括一部分相鄰領(lǐng)域的相關(guān)術(shù)語。同時(shí),大數(shù)據(jù)領(lǐng)域術(shù)語的一般規(guī)律和基本原則決定了《大數(shù)據(jù)百科全書》的術(shù)語特點(diǎn),并深刻影響著《大數(shù)據(jù)百科全書》術(shù)語的收錄和處理。
1.前沿性
大數(shù)據(jù)作為近年出現(xiàn)的新興領(lǐng)域,相關(guān)新事物、新概念、新技術(shù)層出不窮,大數(shù)據(jù)領(lǐng)域術(shù)語更具有鮮明的時(shí)代性。大數(shù)據(jù)領(lǐng)域知識相比其他傳統(tǒng)學(xué)科更為年輕,該領(lǐng)域大部分科技術(shù)語較其他學(xué)科術(shù)語發(fā)展歷程較短。相關(guān)的概念作為新概念的期限一般不長,很快就進(jìn)入使用階段。它們既是在某一段時(shí)期內(nèi)科學(xué)技術(shù)領(lǐng)域的研究熱點(diǎn),也是社會(huì)大眾關(guān)注焦點(diǎn)的科技名詞。“大數(shù)據(jù)”一詞首次使用于1997年,20世紀(jì)末到21世紀(jì)初期,逐漸為學(xué)術(shù)界的研究者所關(guān)注。直到2014年,“大數(shù)據(jù)”作為我國科技新詞②之一,由全國科學(xué)技術(shù)名詞審定委員會(huì)正式對外發(fā)布試用。同時(shí),大數(shù)據(jù)領(lǐng)域的新詞數(shù)量多,發(fā)展快,很多術(shù)語尚未形成共識和規(guī)范,這為大數(shù)據(jù)領(lǐng)域的術(shù)語整理提出挑戰(zhàn)。
2.跨學(xué)科性
大數(shù)據(jù)術(shù)語的跨學(xué)科性來源于大數(shù)據(jù)領(lǐng)域多學(xué)科交叉發(fā)展的特點(diǎn)。大數(shù)據(jù)與多門學(xué)科都有緊密聯(lián)系,其理論基礎(chǔ)來自多個(gè)不同的學(xué)科領(lǐng)域,包括計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、信息科學(xué)等,其知識系統(tǒng)本身具有極高的復(fù)雜交叉性[4]。大數(shù)據(jù)領(lǐng)域固有術(shù)語③較少,大數(shù)據(jù)領(lǐng)域部分基礎(chǔ)詞匯來源于相鄰學(xué)科的術(shù)語混合,也存在受其他學(xué)科影響而獲得新義的術(shù)語。根據(jù)國家標(biāo)準(zhǔn)《GB∕T 35295—2017 信息技術(shù) 大數(shù)據(jù) 術(shù)語》,大數(shù)據(jù)術(shù)語中包含“數(shù)據(jù)、數(shù)據(jù)處理、數(shù)據(jù)管理、關(guān)系模型、關(guān)系數(shù)據(jù)庫”等與信息技術(shù)密切相關(guān)的通用術(shù)語。大數(shù)據(jù)術(shù)語的跨學(xué)科性對整理術(shù)語及術(shù)語集界限的確定造成了一定的困難。
3.融合性
隨著大數(shù)據(jù)與經(jīng)濟(jì)社會(huì)各領(lǐng)域進(jìn)一步融合發(fā)展,大數(shù)據(jù)應(yīng)用也向各細(xì)分領(lǐng)域延伸拓展,其領(lǐng)域詞匯也逐漸擴(kuò)展到各細(xì)分的應(yīng)用領(lǐng)域,并在相互作用時(shí)產(chǎn)生術(shù)語的混合體。2017年5月,名詞委聯(lián)合大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室首次對外發(fā)布塊數(shù)據(jù)、主權(quán)區(qū)塊鏈、秩序互聯(lián)網(wǎng)、激活數(shù)據(jù)學(xué)、5G社會(huì)、數(shù)據(jù)鐵籠、數(shù)權(quán)法等大數(shù)據(jù)十大新名詞。這些新詞不僅反映大數(shù)據(jù)的創(chuàng)新與發(fā)展,更是大數(shù)據(jù)在各個(gè)領(lǐng)域融合應(yīng)用的結(jié)果。融合術(shù)語集有的模糊不清,有的基本術(shù)語完全保留了原義,有的略有修改,有的經(jīng)過專業(yè)化后完全改變了原義,因其成分不純,這些術(shù)語界線的確定和系統(tǒng)化顯得更為復(fù)雜[5]。
三 《大數(shù)據(jù)百科全書》的術(shù)語收錄和使用原則
新聞出版總署等多部門曾明確發(fā)文要求“各編輯出版單位今后出版的有關(guān)書刊、文獻(xiàn)、資料,要求使用公布的名詞。特別是各種工具書,應(yīng)把是否使用已公布的規(guī)范名詞作為衡量該書質(zhì)量的標(biāo)準(zhǔn)之一”。大數(shù)據(jù)作為新興學(xué)科領(lǐng)域,相關(guān)術(shù)語規(guī)范標(biāo)準(zhǔn)尚未完善,部分大數(shù)據(jù)術(shù)語的規(guī)范和選擇還處于過程階段。《大數(shù)據(jù)百科全書》作為大數(shù)據(jù)知識傳播的重要載體,理應(yīng)在整理、規(guī)范大數(shù)據(jù)術(shù)語方面承擔(dān)更大的責(zé)任,發(fā)揮更大的作用。
1.適量使用術(shù)語,在保證科學(xué)性的基礎(chǔ)上注意通俗性
《大數(shù)據(jù)百科全書》的讀者對象主要是政府的政策制定與執(zhí)行部門、研究機(jī)構(gòu)、企事業(yè)單位中從事大數(shù)據(jù)相關(guān)研究和應(yīng)用的人士。其中,既包括大數(shù)據(jù)領(lǐng)域的專業(yè)人士,也包括其他大數(shù)據(jù)領(lǐng)域的相關(guān)人士,受眾范圍相對寬泛。由于個(gè)人專業(yè)水平和文化素質(zhì)等因素的影響,這些受眾對大數(shù)據(jù)的專業(yè)認(rèn)知存在差異。為盡可能滿足每一位讀者的需要,《大數(shù)據(jù)百科全書》的語言運(yùn)用要處理好通俗化的問題,總體控制相關(guān)術(shù)語的收錄數(shù)量、釋義篇幅、使用范疇,盡可能避免使用艱深晦澀的專業(yè)術(shù)語,使得其知識的縱深適合。具體注意事項(xiàng)有以下幾點(diǎn):一是釋義時(shí)僅在必要的情況下使用術(shù)語,在可以不用術(shù)語時(shí),要選用大眾熟知的表達(dá)方式;二是在使用過于艱深羞澀的術(shù)語時(shí)需對術(shù)語做出解釋和說明;三是根據(jù)語言經(jīng)濟(jì)原則,要盡可能避免術(shù)語套術(shù)語,忌循環(huán)使用術(shù)語解釋術(shù)語。
2.謹(jǐn)慎對待科技新詞,避免使用爭議詞
人們對大數(shù)據(jù)領(lǐng)域的認(rèn)識有一個(gè)逐漸清晰的過程。在大數(shù)據(jù)相關(guān)概念產(chǎn)生和構(gòu)建的過程中,部分詞匯的內(nèi)涵有可能不夠明確,概念不夠穩(wěn)定,學(xué)界對其認(rèn)識也有個(gè)過程,在此過程中出現(xiàn)了大量科技新詞。隨著時(shí)間的推移,有的科技新詞逐步穩(wěn)定,進(jìn)入成熟的概念體系,而有的科技新詞會(huì)被更為規(guī)范的術(shù)語代替。
作為一部規(guī)范性的權(quán)威辭書,《大數(shù)據(jù)百科全書》具有可信的精確性、時(shí)代性以及相對的穩(wěn)定性的特點(diǎn),其科技新詞和爭議詞的處理是積極但又比較謹(jǐn)慎的。對于這部分詞語收錄的意義不僅在于對其進(jìn)行實(shí)錄和保留,更重要的是對其定型、規(guī)范釋義和傳播指導(dǎo)。一方面,《大數(shù)據(jù)百科全書》的科技新詞收錄標(biāo)準(zhǔn)是嚴(yán)格的,態(tài)度是慎重的。詞的理據(jù)④上,要求名詞合理,符合漢語的構(gòu)詞規(guī)律,排除和限制不規(guī)范的詞語;詞的使用上,要求收錄具有生命力⑤和普遍性⑥的詞語。一些偶發(fā)詞⑦依賴于既有詞和特定語境,且復(fù)用率極低,其意義也是臨時(shí)性的,這類詞應(yīng)當(dāng)避免。另一方面,有些問題雖未最終穩(wěn)定下來,或者說尚未“蓋棺定論”,但已形成人們熟知的話題,形成穩(wěn)定下來的問題,也具有收錄的意義。諸如類術(shù)語、準(zhǔn)術(shù)語、偽術(shù)語這類專業(yè)詞匯(見表1),它們是大數(shù)據(jù)術(shù)語發(fā)展過程的產(chǎn)物,是大數(shù)據(jù)領(lǐng)域概念的唯一稱謂,對于那些能夠反映重要研究成果、對大數(shù)據(jù)發(fā)展影響重大的關(guān)鍵性代表性的詞匯,在經(jīng)過認(rèn)真篩選和審慎取舍后,應(yīng)當(dāng)和術(shù)語一同收入《大數(shù)據(jù)百科全書》條目表中,但在釋義中一般不推薦使用。對于這些專業(yè)詞匯的規(guī)范需要極為謹(jǐn)慎,以避免誤導(dǎo)讀者。
3.科學(xué)選擇術(shù)語,規(guī)范術(shù)語使用
對于經(jīng)過時(shí)間沉淀或已形成共識的術(shù)語,我們須以科學(xué)術(shù)語規(guī)范意識為引領(lǐng),積極學(xué)習(xí)大數(shù)據(jù)相關(guān)的國家術(shù)語標(biāo)準(zhǔn),關(guān)注名詞委的新詞發(fā)布,及時(shí)了解學(xué)界術(shù)語發(fā)展,不用已被淘汰的舊名稱或概念的非推薦名,如“3D打印”(以后應(yīng)使用“三維打印”)。
在具體術(shù)語收錄時(shí),綜合考慮以下因素進(jìn)行取舍:術(shù)語的重要性、使用頻率、主體所屬、系統(tǒng)性、術(shù)語的構(gòu)成能力、術(shù)語集收詞是否全面、時(shí)間因素和搭配特點(diǎn)等。對于已有規(guī)范的多領(lǐng)域交叉術(shù)語,不同學(xué)科術(shù)語標(biāo)準(zhǔn)參差不齊。大數(shù)據(jù)領(lǐng)域具有跨學(xué)科交叉的特點(diǎn),其基礎(chǔ)學(xué)科相應(yīng)術(shù)語的規(guī)范形成的時(shí)間不同,規(guī)范制定的專家和出發(fā)點(diǎn)不同,形成的標(biāo)準(zhǔn)也不盡相同。同時(shí),同一個(gè)術(shù)語,由于使用的地域不同,術(shù)語常常發(fā)生分歧。例如,“程序”這個(gè)術(shù)語,美國為program,英國則為programme。在中文術(shù)語中,由于我國臺灣地區(qū)特殊的地理、歷史和政治因素的影響,許多術(shù)語與大陸不同。如海峽兩岸計(jì)算機(jī)科技術(shù)語中,兩岸不一致的約占40%以上[6]。對于以上情況,有兩個(gè)最基本的原則:一是遵循服從主學(xué)科的原則,即在以大數(shù)據(jù)為核心內(nèi)容的前提下,篩選術(shù)語;二是擇善而從,考慮術(shù)語出現(xiàn)的時(shí)間先后,以及目前的使用頻率。同時(shí),未選擇的術(shù)語的緣由應(yīng)做相應(yīng)的交代。
注釋
① 專名即專有名詞。
② 科技新詞指稱的是科技領(lǐng)域中近年出現(xiàn)的新概念,是新理論、新技術(shù)、新物質(zhì)等的名詞。
③ 固有術(shù)語指本語言中早已存在或已構(gòu)成的術(shù)語。
④ 詞的理據(jù)是指用某個(gè)詞稱呼某事物的理由和依據(jù)。
⑤ 新詞的生命力是指經(jīng)過時(shí)間的考驗(yàn),這個(gè)詞是否能流傳并穩(wěn)定下來。
⑥ 普遍性是指該詞是否能推廣并被大多數(shù)人共同理解。
⑦ 偶發(fā)詞是指為了某種修辭目的而臨時(shí)造出來的一種詞流,又可稱為翻造詞語或自鑄新詞。
參考文獻(xiàn)
[1]葉其松.術(shù)語學(xué)核心術(shù)語研究[D].哈爾濱:黑龍江大學(xué)博士論文,2010.
[2]劉青.中國術(shù)語學(xué)概論[M].北京:商務(wù)印書館,2015.
[3]袁暉,李熙宗.漢語語體概論[M].北京:商務(wù)印書館,2005.
[4]李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012(6):647-657.
[5]格里尼奧夫.術(shù)語學(xué)[M].鄭述譜,吳麗坤,孟令霞,譯.北京:商務(wù)印書館,2011.
[6]張蕾,代曉明.交流兩岸名詞術(shù)語,促進(jìn)科學(xué)文化繁榮:就海峽兩岸科技名詞交流對照工作訪全國人大常委會(huì)副委員長、中國科學(xué)院院長、全國科學(xué)技術(shù)名詞審定委員會(huì)主任路甬祥院士[J].中國科技術(shù)語,2009(4):5-7.