李小亞
(廣西民族大學(xué)相思湖學(xué)院,廣西南寧 530001)
法律語言學(xué)本身是一項交叉性較強的學(xué)科,自誕生成為獨立的學(xué)科以來它便由于實用性和實踐性較強而成為備受關(guān)注和使用的應(yīng)用工具之一。從我國現(xiàn)階段的發(fā)展狀況來看,我國相關(guān)專業(yè)領(lǐng)域?qū)τ诜烧Z言學(xué)的研究已經(jīng)從傳統(tǒng)的理論研究轉(zhuǎn)向?qū)嵱眯愿鼜姷膽?yīng)用研究當中,由于從理論向?qū)嵺`的跨越本身需要很多改變,因此主觀性較強的研究手法便不適用于這類研究,法律實踐應(yīng)用性目的的實現(xiàn)還要依靠現(xiàn)實證明和量化當中去,更多依靠的是理性主義和客觀的精神,結(jié)合過往實踐中所積累的經(jīng)驗來對法律語言學(xué)進行有效探究。結(jié)合語料庫的建設(shè)特點,該文通過對其構(gòu)建的理論基礎(chǔ)、使用方法、技術(shù)使用、分類特點這4 個角度進行探討。
由于法律語言學(xué)具有一定的社會實用性,因此在漢語語料庫的構(gòu)建中其理論基礎(chǔ)必不可少的會涉及對社會語言的使用。語料庫的實際研究過程中,它更加側(cè)重于一種按照從上到下的方法來研究,將語言對象作為一種社會類型的現(xiàn)象來分析,通過社會交際和實際發(fā)生的語言進行綜合分析,因而法律語言在這一基礎(chǔ)上也具有一定的社會屬性,漢語語料庫在構(gòu)建過程中也應(yīng)當貼合法律的語言交際,將其的形成與改變進行綜合。
語言已經(jīng)從傳統(tǒng)的理論層面的研究轉(zhuǎn)向了應(yīng)用層面的研究,研究者也更加關(guān)注語言知識和相關(guān)成果對現(xiàn)實問題的解決作用性。法律語言作為應(yīng)用屬性較強的項目,其發(fā)展過程要充分立足于實際,并將其的應(yīng)用發(fā)展過程上升到理論的認識和總結(jié),并回歸于法律實踐的過程中,讓法律語言在實踐中不斷完善自身的建設(shè),保證語言的事實性、理論性、客觀性。語料庫在實際的運用中也應(yīng)當通過結(jié)合現(xiàn)實的方法和描寫來對語言現(xiàn)象進行總結(jié),并應(yīng)用于法律語言之中。
法律本身的客觀性、科學(xué)性、公正性等要求不同的司法環(huán)節(jié)必須樹立嚴格的工作態(tài)度,法律語言學(xué)亦不例外。因此,在語料庫的構(gòu)建時期,必須對語言的運用和解釋等工作進行科學(xué)性的研究,在涉及文本、語音、語言的使用過程中,也必須對語料的運用和發(fā)展奠定基礎(chǔ),在引用科學(xué)的數(shù)據(jù)分析上來對歸納性進行總結(jié),使其更具科學(xué)性和客觀性。
漢語語料庫針對法律部分的建庫是基礎(chǔ)性的工作。在該過程中,前期的語料素材采集、規(guī)劃存儲、分類構(gòu)建、管理歸屬等都是根據(jù)不同的語言特點來進行的。從實際的法律語言特點來看,語料庫的建庫要采取語料附碼、對原始文本的理論構(gòu)建,并嚴格遵循語料采集的原則,在分類處理的前提下對取料原則進行分析,并保持其時效性和平衡性。
對法律語料的加工重在對語料整體的分析當中。從實際的加工程序和步驟來看,主要有檢索、統(tǒng)計、標注、語義分析等,在這一過程中要充分對語料進行索引分析,在語法、詞匯的充分運用的基礎(chǔ)上來對語篇資料進行整體的加工編著[4]。除此以外,語料庫語言的研究充分利用區(qū)分法和驅(qū)動法,在附碼軟件的使用下來對法律語言中出現(xiàn)的詞匯和語義等的詞表使用頻率進行表示,并進行延伸的詞匯檢索、索引、排除歧義等的調(diào)查使用。
在語料庫的分析過程中,其語料的使用合理性在于對語境和功能的調(diào)查分析。在不同的分析條件下,通過定量分析和定性分析進行有效檢驗,從而保證法律語料分析的事實性和客觀性[5]。在分析技術(shù)的使用過程中,數(shù)據(jù)挖掘技術(shù)的使用對于語料分析來說有著十分重要的作用,在海量的離散數(shù)據(jù)經(jīng)過技術(shù)分析后將知識進行精煉化。由于語料本身具有一定的脫離性,它們遠離原有的語境,因此在研究過程中必須正視其客觀性、事實性。
法律語料庫在構(gòu)建過程中不可忽視地具有一定的局限性。從其本身的使用特征來看,主要有時間上的局限性和建庫方式的局限性。從時間上來看,由于本身建庫的側(cè)重點的目的不同,法律語料庫在不同的時代特征上有著不同的特點,因此在時間上很難把握實際的度量;從建庫方式來看,由于法律語料獲取的方式較為單一,法律語料庫在實際的庭審過程中的運用缺失精準性,這就是因為其轉(zhuǎn)錄和標注的技術(shù)不夠精準。
法律語料的加工困難重重。首先就是對語料本身所具有的含義的理解,由于語料庫上的語言脫離原本的語境容易引起歧義,因此在國家標準的分詞規(guī)范下這一加工過程得到了一定的緩解。在對檢索平臺和標準的使用基礎(chǔ)上能夠?qū)ψ衷~和句子進行檢索,平臺搭建的困難性也正是體現(xiàn)在此。
法律語料在實際的運用當中會考慮到很多分析因素,諸如對不同統(tǒng)計方式的思考,對原有語境的思考,對語料的離散程度的思考等,這些都是影響法律語料在實際應(yīng)用中的精準性和科學(xué)的因素[7]?;诖?,在實際的應(yīng)用分析中應(yīng)采取不同的方法來對其進行檢驗,對不同的變量因素和程度進行綜合考量,在研究的基礎(chǔ)上通過實踐來驗證其正確性和可行性,由此來提高信息的正確度和可信度。從根本上來看,法律語料庫所提供的應(yīng)用類型是對語言事實的反映,缺少對社會語境信息的分析。在這一基礎(chǔ)上,必須對社會語言學(xué)等學(xué)科進行充分利用。
法律法規(guī)的語料庫構(gòu)建是針對不同國家的法律法規(guī)、國際社會上所使用國際條約、不同行政區(qū)域所使用的規(guī)章制度和各級地方的司法解釋等的文件。法律法規(guī)語料庫的應(yīng)用在這一類別具有法律效力,因此在分類構(gòu)建中必須正視不同語句使用的科學(xué)性和標準化,盡量減少因語料庫使用不當或者因法律條文語句的歧義、漏洞等所產(chǎn)生的語言不規(guī)范的現(xiàn)象。
專用文書也是司法文書語料庫。在該類型的語料庫構(gòu)建過程中是具有特定語言領(lǐng)域的,這類文書的使用主要針對案件處理的不同環(huán)節(jié)進行使用的,比如:偵查階段、檢察機關(guān)使用階段、審判環(huán)節(jié)過程中等都會運用到的專用文書語料庫。在該類型的語料庫中,主要運用到的是以句子和篇章為主,司法文書的使用對于語言結(jié)構(gòu)和語體等都有嚴格的要求,根據(jù)不同的刑事案件、民事案件、行政案件等都有不同的用途。
司法鑒定語料庫的構(gòu)建主要應(yīng)用在口語和文本的鑒定識別過程中。在實際的實踐過程中,由于語料庫本身是針對文本作者識別使用,因此在搜集和整理的基礎(chǔ)上語料庫的特征更加注重對詞語長短、語句長短、詞語使用頻率、語法結(jié)構(gòu)等進行整理統(tǒng)計分析,并在通過統(tǒng)計和檢索來對文本作者本身的個人特征進行有效調(diào)查。從我國現(xiàn)階段來看,法律語料庫的分析在司法鑒定當中的使用案例很少,而口頭的言語分析在其中卻有著較強的實踐特征。該類語料庫能為司法鑒定提供真實可靠的有效信息。
由于法庭審判本身涉及的案件較多,因此其應(yīng)用范圍也更加廣闊。在不同案件類型的語料庫中,民事案件、刑事案件等各有不同點,前者側(cè)重于對離婚財產(chǎn)糾紛等的語料庫搜集,后者更加側(cè)重于對走私、毒品、洗錢等的語料庫進行搜集,并應(yīng)用于實際的法庭審判中,根據(jù)不同案件的事實分析和心理分析,對犯罪嫌疑人的思想、身份群體、社交關(guān)系等進行有效調(diào)查。庭審語料庫的使用對陪審團和案件記錄有著重要的影響作用。
綜上所述,在法律語言學(xué)下的漢語語料庫的構(gòu)建應(yīng)用前景較好,其應(yīng)用范圍較廣,根據(jù)現(xiàn)階段發(fā)展狀況和對未來的趨勢所見來看,漢語語料庫的發(fā)展方向?qū)蚋佣嘣姆较虬l(fā)展。在時代的不斷進步和發(fā)展過程中,信息科技不斷突破原有的發(fā)展水平,順勢而衍生出的還有多語種語料庫、網(wǎng)絡(luò)語料庫和其他的信息處理語料庫等,這些使用的技術(shù)也更加先進,對于法律語言學(xué)的研究提供客觀辯證發(fā)展的應(yīng)用幫助。