摘 要: 本體論已經成為跨學科的熱門術語,并且成為多個學科的研究題目。探討本體論的概念含義,本體論在不同的學科中的借用意義,特別是它與術語學的關系以及在術語學中的概念意義和中文的譯名問題,對于把握當今術語學研究中的知識本體趨向有著重要的作用。
關鍵詞: 本體論,術語學,語義網,術語翻譯,知識管理
Ontology and Terminology—On Chinese Translation of the Term “Ontology”LIANG Ailin
Abstract: Ontology has become a cross-disciplinary buzzword and a research topic for many disciplines. The discussion of the conceptual meaning of the “ontology”, the borrowed meanings of the term used in different disciplines, particularly, its relationship with terminology and its conceptual meaning in terminology as well as the issues of the translated names in Chinese are of significant impact for us to understand the present ontological trend in terminology research.
Key words: ontology, terminology, semantic web, term translation, knowledge management
一 什么是本體論?
本體論這個詞在哲學中有著悠久的歷史,中文的譯名很不一致,有譯“本體論”“本體”“本體科學”“知識本體”“概念集”“本體模型”等,在技術文獻中直接使用“ontology”的情況則更為常見,因為這個詞在英文中使用已久,其含義是單一、清晰的,[1]為此,《科技術語研究》雜志在2004年第4期專門組織了相關領域的專家對“ontology”的概念定義及其譯名問題展開了討論。正如曹樹金和馬利霞所述,目前得到普遍認同的定義是:“本體是共享概念模型的明確的形式化說明(an ontology is an explicit specification of a conceptualization) 。”[2]這個定義出自美國學者湯姆·格魯勃(Tom Gruber)。該定義包含了概念化、形式化、清晰化和共享四層含義,是從人工智能和知識表征方面來綜合定義本體論的通常意義(注:詳見Gruber, T.R. What is an Ontology? http://www-ksl.Stanford.edu/kst/What-is-an-ontology.html.)。從形式上來講,本體論是一種邏輯理論的表述。由客觀世界某一領域的事物或現象的本質(即本體)到人們對這些事物或現象的本質通過認識活動所形成的認識結果(即概念體系),再從概念體系到人們用特定的符號系統或語言將某一概念體系做出明確的或形式化的表示或表達,這個定義總共涉及了三個層面的東西。[1]全如瑊建議將“ontology”譯為“邏輯可操作概念系”(人工智能領域)。[3]筆者認為在術語學中譯作“知識本體”(注:此處用“知識本體”的譯名是筆者在討論本體論概念用于術語學中的個人看法,鑒于本體論在我國還沒有統一譯名,人們一般接受“本體論”,所以筆者在文章中有時用“本體論”,有時用“知識本體”,即把它們作為可以互換“通用”的詞語。)能夠較好地說明其新的含義,因為知識本體已類似于詞典或者術語表,它能夠使電腦處理更多內容的細節及其結構。知識本體還包括將人們有興趣的領域正規化為一套概念、關系和定理(axiom)。
可見,本體論已經由最初的哲學概念,經引入到信息科學與人工智能等領域后而被賦予了新的含義,例如:“給出構成相關領域詞匯的基本術語和關系以及利用這些術語和關系構成的規定這些詞匯外延的規則的定義”[2]。筆者認為:要正確理解本體論的概念,需要把它放在信息技術、知識工程、語言工程、術語知識網絡的環境中來認識。特別是近些年來,在國外,原來的術語庫已經開始轉向術語知識庫(terminological knowledge bases,TKB)的開發上。術語知識庫常被人們稱之為知識本體庫,即不僅要定義知識庫中的知識類別或術語,而且要限定這些不同知識類別之間的關系,換言之,術語學科的研究范疇已經擴大至知識的表征、知識管理及語義網方面。例如:術語學和本體技術如何在多種環境中為新的語義網用戶提供術語學的服務,術語管理又如何從信息技術和自然語言處理等研究成果中獲益,具體來說,術語工作者如何用知識本體為不同的用戶群體創造知識資源和構建術語管理體系。
二 本體論與術語學
首先來看一下術語學的定義。英文術語學(Terminology)除了指專業領域和學科的詞匯意義外,主要是指在一個領域內,用專門語言系統組織概念和術語名稱的學科,術語學也是一門認識知識組織體系與傳播知識工程體系的符號科學。近年來,“術語管理中的一個發展趨勢就是從原來對術語數據庫(例如術語匯編類型的數據)的描述轉為從知識工程體系對術語知識體系的描述” [4]。術語編撰人員一般采用術語庫或者詞典形式,包括電子或者紙張印刷形式,系統地描述專業領域的術語。術語詞典學可以說是應用術語學的理論成果、方法和原則來系統描述術語數據的學科。薩格的關于術語學的三個詞義中的第一個意義,即“用于收集,描述與展示術語的方法與做法”,以及近年來,“術語管理中的一個發展趨勢就是從原來對術語數據庫(例如術語匯編類型的數據)的描述轉為從知識工程體系對術語知識體系的描述”[5],指的正是術語詞典學的意思。術語詞典編撰人員要記錄術語數據,首先需要確定學科領域,使用者的組別,單一語種還是多語語種,包括術語詞典的類別,與之相關的信息組合等,即進行范疇或類別單元的分析。然后再進行概念單元、語言單位、參照單位和身份確認等方面的分析。例如術語概念的確定,所屬的概念體系和概念關系;術語的詞形、句法、語義用法信息,術語的同義詞方面的信息;術語的語境和文獻信息;術語的編碼、日期等信息。術語學與術語詞典學的區別就如同詞匯學與詞典學的分別。術語詞典與普通詞典的不同在于,術語詞典一般采用概念體系而非詞義分析的方法,術語詞典是針對專家而非一般普通人的詞典,術語產品可以是電子網絡形式,如術語庫,也可以是紙張的印刷形式。術語詞典按照系統分類編輯,其特定專業的學科知識來自知識庫,它重在描述概念和術語,包括概念體系中術語的各種概念關系(如屬種關系,層次與非層次的關系等)。術語詞典一般不記錄一詞多義現象,即一個概念對應一個術語,但是可以一個概念有若干個同義術語。
其次是本體論與術語學的關系。術語詞典(包括術語庫)與本體論的相似之處在于:兩者都是在知識庫中把概念、術語定義及其概念間的關系加以明確限定,只不過人工智能意義上的本體論,是使計算機在處理詞匯內容方面,更加有序,更加全面翔盡。本體論也熱衷于描述專業領域,也有一整套的概念、原則、關系和方法,例如構建一些模型來幫助計算機處理復雜而零散的信息,促進知識共享。
布丁認為:術語學與本體論分別在以下幾個方面近似和有差異。相同之處:(1)都出自傳統的邏輯,都用亞里士多德的分類說和概念的層次劃分;(2)作用相同,都對信息、數據、知識、專業內容進行組織管理;(3)目標都是對某一個領域達成共識,分享知識,讓知識清晰化,特別是把人們一些不清晰的知識在計算機里變得清晰化一些;(4)兩個學科都為相關的專業領域構建知識,都是在大腦思維中進行組織,都通過提供充分必要的定義而達到無歧義的交流。不同之處:(1)兩者形式化和清晰化的程度不同;(2)本體論的形式化包括使用邏輯推理規則(如上層的第一順序邏輯、框架邏輯、描述邏輯等表現體系)及限制條件;(3)針對的對象有所不同,本體論的對象是軟件的代理程序(agents),而術語針對的對象是人;(4)術語學局限于特定專業領域的概念和命名,注重專業領域的語言和交際功能,注重跨文化的相對性和跨語言層次的許多不對稱的東西,注重多語言的分析,術語學可以用有控制的自然語言描述,來服務于知識本體構建。(注:參見Budin, Gerhard.在西安電子業務和元數據標準化國際論壇上的論文“Terminologies, Lexicons, and Ontologies—Standardizing toward Semantic Interoperability and Metadata Federation for E-Learning, Knowledge Management and Content Development”.http://www.cnis.gov.cn/openforum.2004-05-19.)從以上術語學與知識本體的關系,我們不難看到兩者相融合的趨勢,特別是術語詞典學中出現的本體論趨向和電子數據化的趨向,其目標無非就是促進信息知識的互通,方便信息的查詢與檢索,完成自動推理和自然語言的處理。
最后來看知識本體的類型。知識本體分為以下幾種類型:(1)形式化本體(構建世界通識知識基礎),用“形式化”的語言來表示所模擬的概念和概念關系;(2)語言本體(構建詞匯知識基礎),例如:構成語義詞匯網的Word Net (詞網),由普林斯頓(Princeton)大學開發(注:詳見WordNet:http://www.cogsci.princeton.edu/cgi-bin/webwn.);(3)多語種本體,比如歐盟開發的Euro Word Net;(4)術語知識本體,比如歐盟的FFPOIROT(譯為“用知識本體技術預防金融欺詐的信息資源”)(注:詳見FFPOIROT Project:http://www.ffpoirot.org.),就是一個涉及英語、法語、荷蘭語和意大利語的術語知識庫。中國開發的知網(注:關于中國知網(How Net Knowledge Database)的介紹及其發展現狀,讀者可詳細閱讀董振東和董強關于知網——中文信息結構庫http://www.keenage.com的文章。關于中國臺灣的中英雙語知識本體詞:English-Chinese Ontology/WordNet Interface. http://ckip.iis.sinica.edu.tw/CKIP /ontology/.)和中國臺灣中央研究院完成的中英雙語知識本體詞網的建設,也代表著這方面的成果與方向。實際上,術語本體是未完全形式化、規律化的知識本體,或者說術語未完全形式化,現今一些大型與特定領域的資源都是這種術語本體類型,在自然科學、醫學領域、術語與知識組織系統是部分的形式化,例如由詞庫系統、層次類別系統、命名系統、分類系統、文檔系統等組成術語知識系統,把術語概念體系中相關的概念或者不同的概念真正地連接起來。經過幾十年的發展,術語庫網絡體系已經在歐美、亞洲、非洲和拉丁美洲地區建立起來,國際跨地區的術語網,地區、國家和各級組織機構與部門的術語網也正在或者已經建立。雖然各術語庫網絡之間還沒有形成一體化的組織體系,有時還互相忽略對方的存在,還缺少實際的接觸和合作,但是術語學在人類知識工程體系和知識管理中的重要性早已凸顯出來。電子信息技術在術語知識管理中的應用已經出現了模擬與表現術語知識的新方法和新的研究工具。術語資源管理中新方法和新工具的使用會產生新的術語交換格式,術語界和人們關注的術語資源的互通互換由此正在成為現實。術語網不僅會連接起來,而且會成為一個富有意義的語義網,術語管理在人類知識傳播與交流的過程中將會發揮日益重要的作用。雖然有多少種不同的術語資源和術語知識庫便會有多少不同的用戶,但是不同的術語資源至少有一個共同的特征,即由于對用于特定知識領域的詞匯的描述要組織得有序、有條理,術語的描述就會根據使用者(人還是機器)及所描述的專業領域不同而不同。現用表格形式來簡要說明術語學與本體論的異同:

三 本體論的中文翻譯問題
哲學意義的“本體論”概念早已隨著信息技術、知識管理等學科的發展要求而有了跨學科的借代意義,即本體論的概念在不同的學科有了不同的概念意義,本體論作為一個跨學科的時髦詞,并成為不同學科研究人員感興趣的研究題目,其目標就是利用本體技術和以術語學為基礎對網絡的信息材料進行內容的描述,構建語義網。由于推動本體論研究發展的驅動力主要來自知識工程學和知識管理學科,筆者認為應該按照學科的概念來翻譯本體論。在哲學學科中,一部分學者認為還是應該繼續保持中文的譯名“本體論”或“本體”,因為作為哲學的、原始的定義,“ontology”(哲學上的本體論)是哲學的一個分支,研究自然存在以及現實的組成結構。它試圖回答“什么是存在”“存在的性質是什么”等等。本體論依然指關于存在的研究,關于現實存在的屬性和組織方式等,哲學本體論這個術語的定義及其中文譯名在當今的用法中仍然具有普遍的意義并指導著其他的學科。然而,誠如鄒詩鵬所指出的那樣:在學界“問題仍然集中于如何理解和翻譯ontology, 大多數的意見認為應當放棄‘本體’及‘本體論’,而選擇‘存在’及‘存在論’,或者干脆就是‘是’及‘是論’”[6] 。而從哲學意義的本體論被引入到其他新的學科的情況來看,保留中文“本體論”的譯名還是有必要的,因為其他學科還是借用了“ontology”在哲學上的基本概念意義,只不過是隨著當今信息技術的發展而延伸與發展出了新的意義。另外,在哲學的意思中,英文“ontology ”是個不可數(或不具備數的概念)名詞,并無復數形式,但是引入到其他學科中后,現今英文的“ontology”在實際的用法中,早已有了復數的、可數的名詞形式“ontologies”,這從前文知識本體的不同類型以及英文文獻中都可以找到證明。
在計算機科學領域與信息系統中,人們普遍接受的定義依然是湯姆·格魯勃關于“本體是概念化的清楚詳細的說明”(an ontology is a specification of a conceptualization )的簡要回答。本體論指通過一種本體語言(例如RDFS)來對概念化的東西進行編碼的結果。可見,計算機科學與信息系統中的“本體論”的概念,雖然源自哲學的概念,但是有了新的含義,不妨根據語境的情況,分別翻譯為“概念集”“本體模擬”或者“本體科學”“本體技術”等。在術語學領域,由于知識工程學和知識管理的推動,本體論的概念在術語學科也有了新的發展,本體論是用來定義某一領域的知識主體,所以不妨把“ontology”翻譯為“知識本體”。如果要對“本體論”這個術語應用到其他“新”學科的中文譯名加以規范的話,指除哲學之外應用在術語學、人工智能、語言學、包括信息技術等不同領域中,以知識管理和構建語義網為目標,筆者提議不妨統一為“知識本體”的譯名。中文譯名要完全與英文的概念意義等值有著一定的難度,原因是這個跨學科的名詞應用到不同的學科領域已有著不同的含義,即使在同一個學科中,人們對于本體論的定義及應用范圍也還沒有達成一個統一的認識,加之英文“ontology”本身就是一個多義詞。筆者就這個術語的探討難免有理解偏差的地方,希望能夠引起人們對這個問題的思考。
對“ontology”中文翻譯問題的討論,再次說明了本來屬于某一學科或某一理論的術語,也可能轉而成為另一學科或另一理論的術語,這叫“術語轉移”(transterminologization)。這種現象可能發生在單個術語身上,也可能是系統中某一“術語塊”的整體轉移。isomorphism(同形,同構)就是一個從數學轉向化學,進而又轉向語言學的一個術語。鄭述譜認為,不同的學科,對看似由相同的詞素或詞構成的術語所指稱的概念,往往會有不同的定義。這些術語應該看做是同音異義(homonymy)術語。他舉例說,同樣都說“言語”,在心理學或生理學中所指的概念,與語言學,特別是索緒爾的語言學理論所指的概念,那是不一樣的。具體來說,心理學中的“言語”主要是指言語活動的過程。而語言學中,“言語”也兼指言語活動的產物。在索緒爾筆下,“言語”則是與“語言”嚴格對立的概念。他的結論是:“雖然都說成是‘言語’,但它們并不是同一個術語,而是分屬不同學科、不同理論的不同術語。即使在同一學科內,不同的理論,對看似相同的術語,也可能下不同的定義。從另一方面說,科學理論的創新,也常常是從對現有術語背后的概念提出置疑、修正直至提出全新的術語開始的”[7]。總之,術語既是對已有科學認識的固定,也可能成為新認識的生長點,特別是在跨學科術語相互借用、內涵不斷增多和學科發展不斷重疊交錯的情況下。術語學這門跨學科的發展以及它的指導意義也就在于此。
參 考 文 獻
[1]王惠臨.Ontology 含義及中文翻譯探討.科技術語研究,2004,6(4):8-10.
[2]曹樹金,馬利霞. 論本體與本體語言及其在信息檢索領域的應用.情報理論與實踐, 2004(6): 632-637.
[3]全如瑊. Ontology 譯成什么?——兼談翻譯與術語.科技術語研究,2004,6(4):11-12.
[4]梁愛林.從術語學的角度看知識管理體系的建設.科技術語研究,2005,10(4):4-9.
[5]Sager, Juan C. 1990. A Practical Course in Terminology Processing.Amsterdam: John Benjamins.3.
[6]鄒詩鵬. “Ontology”格義.新華文摘,2005.9:39-41.
[7] 鄭述譜. 從術語學角度說“進化”及其泛化. 求是學刊,2006(4):23-26.
梁愛林:惠州學院外語系,516007