文 / 姜曉娜
我國是一個統一的多民族國家,多樣性亦是我國語言較為突出的特征。十里不同音,各個地域的語言差異相當大。據統計,目前55個少數民族只有回族、滿族使用漢語,絕大多數少數民族還有自己的本族語言。更有甚者,有的少數民族內部也使用多種語言。全國語言數量在80種以上。語言文字的多樣性主要聚焦在檔案管理方面,即除了國家通用語種漢語和漢字作為語言記錄檔案外,還有為數眾多的檔案是用我國主要地域方言區的語言文字來記錄的。地域方言語料檔案既是我國不同地區人民在生產生活中溝通交流的工具,也是民族文化的載體、情感聯系的紐帶、國家的非物質文化遺產。做好地域方言語言檔案資源的保存與管理工作,對于留存我國不同區域經濟社會發展的歷史印記、繼承與發展不同區域的傳統文化、促進民族之間的團結與融合,起著不可小覷的作用[1]。鑒此,我們有必要對漢語方言進行合理的保護。但是,從整體上來看,目前我國語言檔案數據庫建設還不完善,正處于探索階段,特別是在“互聯網+”的大數據環境下,如何有效地進行語言檔案建設成為檔案學及社會語言學領域的一個重要論域。
20世紀末,語言學專家對我國處于瀕危狀態的地域方言進行了積極的保護與搶救工作。他們利用計算語言調查軟件對不同地域方言進行了共時與歷時的收集,用錄音、錄像等電子設備錄制方言語言資源,構建有聲語料數據庫,原生態語言的語音、詞匯、語法、篇章等共時語言得以保存。但一直以來,這些珍貴的語言材料并未被相關機構作為收藏對象,僅是分散地保存于少量的研究人員手中,對于瀕危方言的保護非常不利,甚至導致方言搶救工作成為社會記憶斷層現象[2]。
方言作為區域群體的重要特征,與一個民族的產生、形成、發展以及變化密切相關。方言作為見證一個民族發展的活化石,具有相對的穩定性,承載著民族發展過程中的傳統文化訊息。換言之,它就像一座歷史博物館,館內陳列著各個歷史時期留下的文物[2]。所以,從保護某一區域文化遺產的角度來看,建立有效的瀕危方言語料資源檔案保護機制對于我國顯得格外重要,有利于長期保護其原生性與完整性。
目前,瀕危方言非遺文化資源的收集、整理、建檔等工作取得了一定的成效,但方言語料資源的檔案保存工作仍需進一步改進。
首先,目前我國的方言保護工作尚處在起步階段,管理機制尚不健全、方針政策還不明確、國家扶持力度弱,方言保護工作步履維艱。加之,方言檔案資源在語料的收集、歸類、整理以及鑒定等程序上所需要的相關人才匱乏,有關部門及高校未能積極承擔此重任,方言保護工作更難開展。其次,建立有聲語料檔案資源庫是方言保護的一項重要工作。該項工作需要強大的信息技術支持來解決信息來源層、數據集成層和服務集成層等方面的問題。但是,現今應當承擔此項任務的地方高校卻很少有實際行動。再次,確立方言檔案資源能組建什么樣的服務,以及怎么實現服務,是擺在專業機構建設上的難點。并且,方言檔案資源對社會的服務功能尚不完善。最后,建成的檔案未能及時向公眾開放,造成了方言保護工作與民眾及實際效益脫節的現象。
方言語料檔案庫建立伊始,研究者只是考慮將紙質文檔囊括其中,卻忽視了有聲語料檔案資源的收集。方言有聲語料檔案不僅有著天然的開放性,而且具有一定的地域特征。然而,我國的方言保護只是停留在紙質與寫實記錄方面,而具有證據屬性、富有表現力的有聲語料卻鮮有人問津。顯然,有聲語料的收集工作急需大批專業人員,只依賴紙質檔案不足以保障瀕危方言的原貌。
檔案收集難在保障瀕危方言的穩定性,對原生態語言的收集貴在保留原有面貌。采集和及時保存是必要工作,因為瀕危方言使用人數較少,極易受到周邊語言的影響。同時,在采集過程中,翻譯人員用詞主觀性強度、語音音位混淆現象等不確定因素都會不同程度地降低瀕危方言的保真度。
我國方言檔案的管理具有綜合性和復雜性特征,各地區的信息化建設參差不齊,且方言檔案資源缺乏跨區域共享性。方言檔案資源庫的建立并非為了某一個群體,而是為了繼承和弘揚中華優秀文化,并為研究者提供更好的查詢服務。由于人口流動、時代變遷,使用某種方言的人多集中在某一廣大區域或是鑲嵌分布在某些小區域。若不實現區域共享,研究者便很難全方位、多層次地認識該種瀕危方言。因此,實現方言檔案資源的跨區域共享刻不容緩。
一方面,語料的收集應尋找瀕臨方言的記錄志愿者以及傳承人錄制,以保證語料的質量。另一方面,語料的收集和保存應當同時進行,為減少不確定因素的干擾,應使用多元化的方法進行收集。
根據收集方法性質的不同,語料的采集分為自然語料和誘發式語料[3]。在自然語料的采集過程中,常用語料庫需要采集擁有固定程式、數量有限且結構單一的言語行為;研究人員還可以用自然觀察法獲取自然語料。誘發式語料是指研究對象在研究人員的誘發和引導下,調動記憶,以報告、表演或文字的形式呈現出來[4]。具體的方法主要有語篇完型任務、情景模擬的角色扮演及研究人員理解的口頭報告。語料收集后,所有可讀文件標注國際音標,以期發揮語料的跨區域性價值。現有的語料標注大部分使用漢語拼音,但是研究瀕危方言語料并不一定是使用漢語的人,因而國際音標的使用大大提高了收集語料的普適性。
隨著科技的飛速發展,網絡已走進千家萬戶。網絡的即時性為搭建信息化語檔信息網絡平臺提供了技術層面的支持。匯總整合國內繁復檔案資料,建成一體化、多元化的數字檔案體系,成為未來方言文化保護工作的重點[5]。
搭建信息化語檔信息網絡平臺需要進行檔案化管理。檔案化管理還可以實現電子資源的高效利用,為社會提供方便、快捷的檔案資源。在瀕危方言的保護工作中,電子檔案可以為研究者提供不受時空限制的最新資源。此外,檔案化的電子資源格式被統一規定為只讀文件。檔案化的電子資源與紙質文件相比,儲存于相對穩定的媒介上,不易受自然因素影響,維護相對容易。與此同時,數字化檔案的長期保存與維護需要相關技術人員在數據庫產生時處理好編碼方案、專業符號、術語錄著、國家通用語言、文字版本收集等信息技術方面的問題。
信息化語檔有著文字檔案無法比擬的優勢,搭建信息化語檔信息網絡平臺能夠對方言生態實行動態監測。方言有聲檔案的建立指向方言資源與地理信息管理,包括方言的語言說話發音人、語料的種類以及語音采錄地理位置等重要信息。地理位置、宗教形態等地域特有的信息與之聯系,從而發現方言衰退在二者之間的聯系。
搭建信息化語檔信息網絡平臺可以實現瀕危方言檔案資源的共享。雖然國內各個地區的方言語檔不同,但是利用網絡平臺便可實現跨區域共享,將資源利用到極致。研究人員可利用網絡快速地獲取各地的瀕危方言語檔,為研究帶來極大便利。此外,瀕危方言語檔資源應當供廣大人民群眾使用,進一步提升瀕危方言保護工作的社會價值。
多模態話語是人類感知通道在交際過程中綜合使用的結果。模態是指交流的渠道和媒介,包括語言、技術、圖像、顏色、音樂等符號系統;多模態話語則包含視覺模態、聽覺模態、嗅覺模態、觸覺模態和味覺模態[6]。多模態語言對于提升信息處理的準確性和速度可提供很大的幫助。此外,多模態語言還可為信息資源建設提供服務,在建立資源共享的工作上發揮巨大作用。
多模態語言檔案數據庫的建立是在語料收集的基礎上進行語言檔案管理、語言檔案分析,然后建立多模態檔案庫,最后進行語音識別、語音教學、語音合成等工作[7]。這樣便可將語言與其他相關資源如圖像、色彩等整合在一起,方便研究人員把握瀕危方言的語義及其不同情境下的感情色彩,大大加快工作進度。若配以高速攝像頭、呼吸帶等最新研究設備,還可以進行跨學科研究,為研究瀕危方言提供極大的便利。其中,多模態語言檔案數據庫由三個子數據庫組成,分別是語音子數據庫,圖像、視頻子數據庫以及文本子數據庫[7]。這三個數據庫是多模態語言檔案數據庫的重點建設對象,三者在各自獨立的基礎上又緊密聯系、相輔相成,為用戶提供方便快捷的資源。
自然狀態下發生的話語活動往往具有多模態性。計算涉及模態和符號系統的數量是識別多模態話語的有效途徑。學術界普遍把包含兩種或兩種以上的話語模態稱之為“多模態”。如果被測話語只有一種模態,卻包含多種符號系統,那么我們也稱之為“多模態”話語[8]。
建設多模態話語可以將語言和圖像、色彩及其他符號系統的資源進行有機整合,展現出語言系統在交換過程中發揮的作用,可以展示其他符號系統的作用與意義,使整個話語過程表現得更加充分、全面,使研究人員更易做出分析判斷。
方言檔案資源的管理涉及多個機構,跨越多個領域,這使工作變得復雜,建成后的檔案資源的共享性及開放性也因此受到忽視。當今社會,發達的信息科技使得各個機構跨區域共享資源、互惠互助成為可能[9]。借鑒保護少數民族瀕危語言的方法,瀕危方言的保護工作必將跨越多個領域,任何機構或組織不可能孤立地完成這項任務。所以,實現資源共享十分必要,成為瀕危方言保護工作的最基本原則之一。
瀕危方言保護工作離不開人民大眾的支持。大部分檔案應該面向公眾開放,瀕危方言來源于民眾也必將再次走近人民大眾,開放性是瀕危方言語料檔案保護的另一原則。只有鼓勵、支持人民大眾重拾瀕危方言,才能最終實現瀕危方言的傳承和發揚。令人遺憾的是,各個機構未設置對公眾開放接觸檔案的途徑[9]。在未來的工作中,實現檔案對外開放也應是工作的重點。