[摘 要] 手語語料庫對手語語言學研究與聾人群體有著重要的意義。手語語料數據的類型大致包括個人經歷敘述、會話、訪談和詞表。各國手語語料庫項目均使用各種誘導任務來采集手語語料,并使用口語研究中廣泛使用的語料誘導材料,且均采取多種措施以減少觀察者悖論。借鑒國外手語語料數據的類型及其采集方法,全面采集手語語料數據,將國外先進和成熟的手語語料采集方法應用到我國手語語料庫研究工作中。
[關鍵詞] 手語;語料庫;誘導
[中圖分類號] G762
一、手語語料庫的重要性
(一)手語語料庫在手語語言學研究中的重要性
為了促進對手語結構和使用的理解,需要更大規模的、可機讀的自然語言數據集——手語語料庫。在手語語言學領域,手語語料庫不僅用于進一步理解手語的結構和使用,還可以檢驗目前對手語的語言描述和分析所提出的觀點,這些觀點通常來自少量手語者的小規模手語語料庫,而手語的使用通常會有很多變異,這種情況下小規模手語語料庫就容易出現問題[1]。手語的變異在很大程度上是由于手語處于獨特的社會語言環境中,如手語是年輕的少數群體語言,母語手語者很少,手語代際傳遞的缺失等等[2]。因此,即使是母語手語者通常也很難確定什么樣的手語才是合理的手語結構。在這種情況下,手語語料庫對大量手語文本的標注處理,可能會揭示一些不為人所知的手語結構,這種手語結構可能無法通過手語使用者的直覺或手語專家的分析而發現。多年來,許多研究工作都集中在普遍語法的證據上,語言學開始更多地關注語言多樣性[3],手語研究可以在我們對語言多樣性的理解中發揮更大的作用。許多手語研究者在類標記結構、一致動詞和代詞等方面進行了手語語法與相應口語語法的比較研究[4-6]。在我國,復旦大學龔群虎的通用手語語料庫研究項目“基于漢語和部分少數民族語言的手語語料庫建設研究”[7]、由南京特殊教育師范學院承擔的國家語委重點科研項目“國家手語詞匯語料庫建設”[8]均已經產生了一系列重要科研成果。
手語語料庫在為后代記錄今天所使用的手語方面具有重要的意義,它可以幫助人們更好地了解手語的發展歷程,記錄手語的演變過程。近年來,越來越多的學者認為手語是瀕危語言[9-10]
,而手語語料庫則可以記錄和保留當前所使用的手語。在發達國家,醫學進步以及助聽器和人工耳蝸技術改變了聾人手語的傳播方式[11-12]。手語存在于獨特的社會語言環境中。有研究者認為,只有5%—10%的聾人群體將手語作為第一語言從聾人父母那里習得,而大多數手語使用者是在聾校或社會上的聾人同伴那里習得的[13]。因此,雖然手語群體一直存在,也會有聾人父母繼續將他們的語言傳遞給他們的聾或健聽的孩子,但隨著社會和科學技術發展帶來的影響,這種情況很可能在不久的將來發生改變。在我國,隨著近年來國家通用手語推廣工作的深入,少數民族手語乃至地方手語可能面臨式微。有調查顯示,少數民族聾人學習和使用國家通用手語的意愿較強,一致贊成制訂和推廣使用國家通用手語[14]。有學者調查了全國105個設區市的聾校,結果發現,教師使用國家通用手語(詞匯) 的情況總體良好,71.26%的聾校教師有通過自學方式(如網絡、電視、書籍、手機 App等) 學習國家通用手語的經歷,僅有16.89%的教師使用情況不佳[15]。也有部分學者認識到手語保護的意義。李恒等人認為,少數民族手語在全球范圍都存在使用人數日益減少的問題,但它對于語言本體研究、語言接觸以及民族歷史文化等都有重大意義,應重視其保護工作[16];張帆認為,應對地方手語予以保護,通用手語的研制應以各地聾人地方手語為基礎[17]。
(二)手語語料庫對聾人群體的意義
創建手語語料庫對聾人群體也有潛在的好處。手語語料庫的實證研究將為手語教材的改進提供有用的信息,從而改善手語教師和手語翻譯的培訓以及聾童的教育現狀。越來越多的人意識到,手語語料庫對于解決聾人群體的關切問題發揮重要作用,即需要更多的語言描述來支持手語教學、手語翻譯培訓和聾教育。詞匯語料庫對心理語言學研究中關于語言過程的理解至關重要,世界各國都建立了口語詞匯語料庫,匯編了大量口語和書面語的詳細信息,這些資源對語言教學課程的開發也至關重要[18]。長期以來,口語語料庫一直被用于生成詞頻列表,而這些詞頻列表又被用于設計學習詞典而廣泛用于教學(如柯林斯詞典、朗文當代英語詞典)。我國于2021年面向全球免費開放的全球漢語中介語語料庫,也在對外漢語教學的相關研究中發揮了重大作用。研究者通過該語料庫發現了前人未曾發現的一些中介語現象,極大地提高了漢語作為第二語言教學研究的水平[19-20]。而手語的詞頻研究則很少,目前僅有對美國手語、新西蘭手語、英國手語、澳大利亞手語的研究[21-24]。在這幾項研究中,只有澳大利亞手語和英國手語的詞頻研究是基于可機讀的語料庫。在英國手語語料庫(British Sign Language Corpus)項目啟動之前,英國手語也沒有可用的詞頻數據。英國手語詞頻研究的動機正是為了解決聾人群體的問題,即需要更多的語言描述來支持手語教師等利益相關者[25],它展示了語料庫對英國手語教學界和研究界的巨大益處。值得一提的是,在瑞典手語語料庫(Swedish Sign Language Corpus,簡稱SSLC)的基礎上開發的瑞典手語第二語言語料庫(L2 Corpus in Swedish Sign Language)是一個學習者語料庫,迄今為止在第二語言手語研究中是獨一無二的,因為大多數關于第二語言手語的研究結果都是基于非手語學習者[26]。我國學者趙曉馳認為,手語語料庫可以促進手語教學質量的提高[27];劉學達也認為,研究手語語料庫高頻詞具有教學意義并開展了初步研究[28];倪蘭通過60000多條手語數據的語料分析,篩選出中國手語常用手勢2500個左右(其中初級詞匯500個左右,中級詞匯1000個左右,高級詞匯1000個左右),據此編寫了一系列中國手語教程,通過詞匯分級、語法分級,建立循序漸進的語言學習模式[29—30]。盡管目前還存在著技術限制以及缺乏全面的手語詞匯數據庫,但世界各地各種手語語料庫的創建為進一步的手語常用詞研究奠定了基礎。
二、手語語料數據的類型及其采集方法
(一)手語語料數據的類型
雖然各國手語語料庫項目所收集的語料數據類型有所不同,但都有一個明確的共識,即不同的語料體裁類型都應進行采集,以最大限度地提高代表性。手語語料庫中包含的語料類型通常與語料庫的總體研究目標有關。英國手語語料庫的語料數據收集有四種,包括個人經歷敘述、會話、訪談和詞表[31],這四種語料類型被認為是對社會語言變異研究的最低要求。
1.個人經歷敘述
個人經歷敘述大致包括對個人生活中的事件、經歷的敘述,很多國家會要求調查對象介紹自己的手語名字。英國手語語料庫的個人經歷敘述(主要是為了讓調查對象熟悉拍攝工作),請調查對象敘述生活中有趣、印象深刻或重要的事件,持續時間不超過五分鐘[32]。德國手語語料庫在采集之初通常會要求調查對象解釋其手語名字(而不是姓名指拼)的緣起(2分半鐘左右),還要準備一個手語笑話(2—7分鐘)到現場表達,這和手語名字一樣,都是聾人文化的一部分。這些任務幫助調查對象通過表達他們熟悉的內容來活躍氣氛增加自信。然后開展個人經歷敘述,講述自己生活中的故事,主持人提前根據調查對象的具體情況準備問題(20分鐘左右)[33]。意大利手語語料庫的語料數據收集有一個任務是持續約10分鐘的個人敘述[34]。澳大利亞手語語料庫也有解釋性話語任務,要求調查對象解釋其手語姓名的含義和起源。
2.會話
會話一般是安排兩個調查對象開展自由談論(有時會給定談論的大致主題),而語料庫工作人員通常對會話不做干預也不做任何限制。英國手語語料庫的會話持續時間為30分鐘,調查對象可以自由地談論任何他們想談論的事情[35]。瑞典手語第二語言語料庫收集的數據是根據歐洲委員會的歐洲語言共同參考框架(CEFR),在特定目標領域(如家庭、當地環境和興趣)中開展訪談與會話[36]。愛爾蘭手語語料庫主要有會話以及聾人就其如何看待愛爾蘭手語的訪談等形式,條件允許的情況下還會開展特定語域的手語語料數據采集(例如某些職業活動的描述)[37]。意大利手語語料庫的語料數據收集也是從3名同齡手語者進行45分鐘的自由對話開始[38]。日本手語語料庫也側重于手語會話語料數據,該任務由兩個部分組成:一是調查對象在拍攝開始前觀看動畫視頻,然后向另一名調查對象講述其內容;二是兩名調查對象一起觀看動畫視頻以確認他們對視頻的理解[39]。瑞典手語語料庫要求所有調查對象都帶上他們自己選擇的談話伙伴[40]。
德國手語語料庫采集過程中的相關會話任務豐富多樣[41],大概包括以下8個方面。(1)安排一個計劃和協商主題的會話,向調查對象展示一周日程安排并指示其安排兩次各兩小時的會議,協商內容是為朋友的婚禮制造驚喜并談論一周內的其他活動,目標詞匯涉及星期幾等時間詞語、各種常見活動(看醫生、度假、工作、去電影院和劇院、體育活動,等等)。(2)安排一個討論,主題包括聾人問題(人工耳蝸植入、聾人回歸主流)和一般性問題(禁煙),由于一些聾人不習慣反思社會問題或為自己的觀點辯護,需要主持人在關鍵時刻提出問題以使討論繼續(20分鐘左右)。(3)自由會話。工作人員不在場,調查對象可以談論任何他們喜歡的事情,話題大概有手語語料誘導任務本身、聾人俱樂部活動、家庭成員及其聽力狀況、朋友、交流和工作等(15分鐘)。(4)為了誘導出否定的詞句,安排調查對象觀看從世界各地收集的16個警告和禁令手語并討論其可能是什么意思(16分鐘左右)。(5)從25個主題(工作與職業、能源與環境、家庭與親屬、儀式、慶祝和聚會、情緒和感覺、服裝和時尚、交流、伙伴關系、愛情和性、學校和教育、體育和游戲、旅行等)中選擇2個主題開展會話,主題的分類借鑒了此前對德語基本詞匯和德語詞典編纂的研究。每個主題都以書面德語短語的形式呈現,并配有4至8張照片或圖畫。由于德國手語語料采集的12個地點都各有8對信息員,工作人員準備了8個不同的主題集,每個主題集由4個主題組成,每一對調查對象均從這4個主題中選擇2個主題開展會話(32分鐘左右)。(6)調查對象互相談論他們所在地區的特產,兩個調查對象都居住在該地區至少10年。談論的主題包括:該地區的節日、熱門旅游目的地、典型活動、著名人物、著名景觀傳統和習俗、該地區的典型特產、烹飪特色等。這項任務的目的是收集地名、著名節日等的手語表達,目標語料數據類型是語篇(20分鐘左右)。(7)兩個調查對象一起看一部5分鐘的視頻并談論它,這部電影的特別之處在于沒有對話,兩位主角通過向對方展示寫在一張紙上的英語詞來進行交流,視頻的結尾請觀眾判斷女主角是否失聰。這項任務的目的是收集表達愛、感情、假設的手語。為了確保調查對象理解英語書面語,工作人員添加了德語字幕(非必選,8分鐘左右)。(8)請調查對象談論其參與的一個聾人事件,工作人員提供聾人事件的德語名稱和相關的視覺材料(如海報和圖片),一般涉及國家級活動(如聾人文化節、手語戲劇節、聾人體育節)、國際活動(如聾人奧林匹克運動會Deaflympics和聾人之路Deaf Ways)。該任務的目標是記錄聾人文化,并誘導出相應的個人敘述和會話(21分鐘左右)。
3.訪談
訪談一般是由工作人員提出問題或者給出語料誘導材料,調查對象使用手語回答。英國手語語料庫還有15分鐘關于語言態度和意識的簡短訪談(由聾人現場工作者主持),訪談的問題涉及手語的定義以及它與英語的不同之處,了解與地區、年齡、性別、手語習得年齡和聽力狀態相關的變異,以及對手語教學的態度、對手語的“正確”使用和手語標準化的觀點[42]。瑞典手語第二語言語料庫收集的數據還包括圖片描述,包括兒童繪本《青蛙,你在哪里?》(Frog,Where Are You?)中的一張圖片以及從意大利學者Volterra設計的圖片誘導任務中選擇的圖片;復述電影“The Plank”中的一個短片[43]。波蘭手語語料庫項目中共計約24項面談任務[44]。意大利手語語料庫的語料數據收集也設有兩名同齡手語者一組的問答任務,該任務是用來誘導出特殊疑問句,因為研究者預計該句法結構有較多的變異,而該句法結構不太可能在其他語料類型中大量出現。例如,一人持有一張車禍現場圖片,另一人需要填寫一個車禍情況表,但看不到圖片所以需要向前者詢問填表所需信息[45]。在澳大利亞和荷蘭等國的手語語料庫中,與聾人群體有關的不同觀點的討論和交流通過訪談的方式進行[46-47]。澳大利亞手語語料庫使用一項障礙游戲任務,要求調查對象識別兩張圖片的多個不同之處。
德國手語語料庫在采集語料中的相關訪談任務也經過了專業的設計[48],大致包括以下6項內容。(1)要求調查對象觀看視頻和圖片形式的誘導材料并用手語復述(17分鐘左右)。(2)要求調查對象復述5到6張德國無字連環幽默漫畫《父與子》(Vater und Sohn)的圖片故事(4分鐘左右)。(3)要求調查對象報告當他們聽說或經歷了一個令人震驚或感動的事件時,他們做了什么,感覺到了什么。其中涉及重大的歷史時刻(如阿波羅飛船登月、柏林墻的倒塌)、世界杯的重大足球比賽、災難(如印度洋海嘯、切爾諾貝利核事故)、恐怖襲擊(911、肯尼迪遇刺)以及戴安娜王妃等著名人物的去世。還有一個主題是聾人特有的,即著名聾人演員Gunter Trube的意外死亡,這一事件對德國聾人來說是一個巨大的沖擊。該任務的目的是誘導調查對象開展生動形象的敘述和會話,每個調查對象均從6個主題中選擇1個(20分鐘左右)。(4)一個調查對象描述任務,另一個調查對象復述一個圖片故事,組成一個組合任務。一個調查對象先從8項活動中選擇一項熟悉的活動,每項活動都由一系列動作組成(如制作果醬、更換汽車輪胎、裝飾圣誕樹等,共16項),其目標語料數據類型為逐步描述和解釋。此外,研究的目標是誘導出短語來構建描述動作序列的文本,另一個調查對象復述一系列圖畫故事。例如,“旅行”,調查對象看一個關于克服困難的圖片故事。對系列圖片的手語復述開始之前要關閉顯示屏,該任務的目的是誘導出表達空間和方向的手語,共有17個場景的圖片故事,因為已有調查表明,在其他敘述材料中沒有合適的刺激可用于引出上述目標手語(17分鐘左右)。(5)由調查對象說明年輕一代和老年一代人之間不同的手語打法(非必選,7分鐘左右)。(6)如果還有時間,可以再加兩個任務:復述一個關于酒店火警的手語故事和城市地圖的路線描述。
4.詞表
詞表任務一般是由語料庫工作人員給出書面語詞表或者相關圖片,調查對象用手語打出相應的手語詞。英國手語語料庫的調查對象會參加一項詞匯誘導任務,在該任務中調查對象用手語打出102個概念所對應的手語,這些概念因其已知或懷疑有高水平社會語言變異而被選出[49]。美國手語詞匯數據庫的語料來源則是已有的心理手語語言學實驗。例如,Mayberry等人對432個美國手語的主觀頻率評級的研究,Vinson等人對英國手語熟悉度等的研究,以及英語語料庫SUBTLEXus中的低頻和高頻英語詞,等等。由25—31名聾人觀看以美國手語和英語書面語制作的說明(英文說明見附錄)以及每個詞的視頻,根據對該手語詞日常使用的頻率給予主觀性評級(1=非常罕見,7=非常頻繁)[50-51]。德國手語語料庫安排了一場34個地域變異較大的詞語的誘導,調查對象查看有或沒有插圖的德語詞語并打出相應的德國手語,并給出一個簡短的手語例句,詞條有面包、雞蛋、水、男人、女人、生日、滿意、錯誤,此外還有12個月、4個季節、11種顏色詞(12分鐘左右)[52]。意大利手語語料庫的語料數據收集也給每個手語者42張圖片命名以考察相關手語詞的變異,包括類標記、復合詞、顏色名稱、姓氏、指拼詞、月份名稱、一些新手語等[53]。
我國的國家手語詞匯語料庫主要使用漢語詞表來采集手語詞匯,該方法的優點是簡單高效,其弊端是這樣的方法受限于聾人對漢語詞的理解水平和手漢之間的轉化能力,需要事先對詞表含義有一個充分的理解;同時也攝錄了一些會話和語篇(尚未對外開放)供進一步研究使用。該漢語詞表的來源參考了當時國家手語盲文研究中心對《中國手語》一書進行增補的詞匯以及《現代漢語常用詞表》。另外還專門收錄了一些專題詞匯,如性與生殖方面的詞匯(解決聾校性教育之需)、數字詞(了解數字在表基數、序數、年齡、時間、錢幣等不同概念時的變體)、新詞新語(了解新詞新語在聾人手語中的反應及聾人手語的新發展)。對藏語地區的手語,增加了一些藏族特有詞匯。詞表初步擬定后,請多名兼通手語和漢語的聾人對詞表進行審核,一是確認表中的漢語詞是否都有對應的手語詞;二是有的手語詞對應的漢語是一個短語(如“梳頭發”“很長的時間”),這個需要在表中增補。最終,形成了一個約6500詞的詞表[54]。
(二)手語語料數據的采集方法
1. 各國手語語料庫項目使用各種誘導任務來采集手語語料
很多手語語料庫項目使用了各種誘導任務,以誘導出包含特定語法結構的手語表達。澳大利亞手語語料庫使用的是美國手語形態成套測試(Test Battery for American Sign Language Morphology)中的兩類測試視頻:動作動詞產出(Verbs of Motion Production,以下簡稱VMP)和名詞-動詞產出(Noun-Verb Production,以下簡稱NVP)任務。VMP包括40個動畫視頻,旨在誘導出一系列動作動詞的表達,這同時也是誘導出運動的類標記(也稱“描繪性動詞”)的好方法。NVP的視頻材料能誘導出描述各種類型的及物事件的短句,還能誘導出“名詞-動詞對”(指通過移動或非手控特征來區分名詞和動詞的詞條)的表達[55]。
2.各國手語語料庫項目使用口語研究中廣泛使用的語料誘導材料
口語研究中廣泛使用的材料和方法,也可以用于手語語料的誘導。目前,手語研究中比較常用的誘導材料有《小小鳥智斗黑貓》(Canary Row),出自華納兄弟公司出品的《傻大貓和崔弟》(Tweety and Sylvester)系列動畫片;視頻“《梨的故事》(Pear Story)視頻、兒童繪本《青蛙,你在哪里?》(Frog,Where Are You?)等,這些視頻和圖片被用來誘導調查對象敘述故事,這種誘導方法最初用于口語研究,現在也用于手語研究,目前已經用于英語手語語料庫、澳大利亞手語語料庫、荷蘭手語語料庫和德國手語語料庫等。波蘭手語語料庫項目中使用的誘導材料是與漢堡大學的德國手語語料庫團隊合作設計的[56]。愛爾蘭手語語料庫也使用了《青蛙,你在哪里?》和Volterra的圖片誘導任務,除此之外還有“梨的故事”和伊索寓言等誘引材料[57]。有的手語語料庫還使用了書面語刺激來誘導敘述——兩個伊索寓言的英語書面語版本——《狼來了》和《龜兔賽跑》,調查對象被要求用手語復述故事[58]。德國手語語料庫和荷蘭手語語料庫還使用聾人群體的笑話來誘導出手語敘述[59]。采用誘導材料時,還應考慮到文學和文化的差異,如《伊索寓言》在很多國家都很有名,但在德國更多人是看《格林童話》長大的。最后,即使是這樣普通的故事,在聾人群體中也可能不為人所知。
我國也有學者將國外的誘導材料應用到國內手語研究中。例如,倪蘭在研究上海手語時應用了誘導材料《青蛙,你在哪里?》,還根據國內實際采用了《灰姑娘》《小紅帽》《亡羊補牢》等故事作為誘導材料[60]。衣玉敏在研究上海手語和南京手語時應用了6個無字繪本,其中就有《青蛙,你在哪里?》,此外還增加了常見的中外故事等[61]。孫玲在研究上海手語時采用了《青蛙,你在哪里?》和《父與子》等繪本作為誘導材料[62],等等。
3.各國手語語料庫均采取多種措施以減少觀察者悖論
各國手語語料庫均采取多種措施以減少觀察者悖論。觀察者情緒是指觀察者收集日常言語資料所采用的訪談法影響到資料的自然狀態,與訪談初衷相悖。語言變異研究的是某個群體語言的方言變體,即說話者在不被觀察的情況下所體現出的多樣性。盡管理想的情況是觀察聾人在沒有被觀察的情況下如何使用手語,但調查對象實際上是被多臺攝像機和照明設備包圍的,他們也充分了解手語語料庫項目的目的,是利用收集的手語語料數據創建一個對外開放的在線手語語料庫。調查對象不僅知道其手語會被研究人員看到,還可能被任何擁有可訪問互聯網的人看到,這形成了一種獨特的觀察者悖論。而鑒于語料庫數據集需要在線公開并可對內容進行搜索,其標注在未來也要在線公開。所以,調查對象必須同意公開其手語使用的視頻數據,這使收集的手語語料數據的真實性存疑,因為調查對象可能會比其他情況下更仔細地監控其手語表達。這種情況在雙語群體中尤其復雜。聾人都不同程度地掌握著手語和書面語,存在著各種各樣的語言混合變體。手語自我意識較強的聾人雙語者,會有意識地減少英語語碼混合,以達到特定的語言效果。英語手語語料庫對英國聾人群體手語使用情況的觀察表明,在大多數非正式場合中,聾人雙語者最常使用的手語變體可能是自然手語和“接觸手語”,盡管文法手語也很常見。所以英國手語語料庫采取多種措施以盡可能多收集英國手語方言變體數據,而不是文法手語(以英語為主)。英國手語語料庫中的調查對象在獲得知情同意的過程中會得到保證,自由會話數據不會對外開放(不會在互聯網上公開提供,只供大學研究人員使用),以此希望調查對象能夠因為這一前提而自由交談,使收集的語料數據能夠盡可能涵蓋各種方言[63]。而其余三種數據類型(即個人經歷敘述、訪談和詞表)均對外開放。在一些訪談中,一些調查對象提到了使用手語的某個特定的人或群體的名字。例如,某個訪談中的一個問題試圖讓調查對象回答其對“好的”或“漂亮的”手語的判斷,一些調查對象舉例說明他們認為是“好的”(有時是“不好的”)手語時說出了相應手語者的名字。對于這些語料,研究者決定像限制自由會話數據一樣限制這種訪談數據的訪問,即只有注冊研究人員在簽署保密協議后才能查看這種訪談數據。相關手語變異研究結果表明,英國手語語料庫在采取上述措施后采集的手語語料數據,與不對外開放的美國手語語料庫語料數據并沒有太大的不同。同時,英國手語語料庫攝錄的語料視頻數據明顯質量更好(對應的美國手語語料攝錄沒有使用專業的攝影棚和燈光)[64]。上述研究和措施也為我國手語語言學研究提供了借鑒。
三、國外手語語料數據的類型及其采集方法對我國手語語料庫研究的啟示
(一)手語語料數據的采集類型應全面
手語語料數據的采集是一個復雜的過程,需要采用科學的社會語言學調查方法來確定調查對象、地區并采集語料。目前,我國除國家手語詞匯語料庫主要使用漢語詞表來采集手語語料之外[65],其他一些高校也會建立手語語料庫供研究使用,但由于種種原因均不對外開放,公眾較難獲取[66],難以探知其手語語料采集類型的全貌。由于已有手語語料庫多數是以漢語詞匯為基礎,還需尋找聾人自然手語語料并從中提取無法與漢語詞匯一一對應的手語詞匯作為補充,以研究樣本的全面性和代表性來確保研究結果的科學性。隨著手語語料庫標注工作的進展和深入,應擴充語料數據的類型,增加個人經歷敘述、會話、訪談等語料數據類型,使手語語料庫的語料數據采集更趨全面。
(二)將國內外先進和成熟的手語語料采集方法應用到我國手語語料庫研究工作中
應將國內外先進和成熟的手語語料采集方法,擇優應用到我國手語語料庫研究工作中。應當認識到手語詞與漢語詞并不能做到一一對應,應采取有效的手語誘導方式并避免漢語的誤導。可設計并使用有針對性的誘導任務來采集相應的手語語料。各發達國家手語語料采集工作中廣泛使用的語料誘導材料應酌情予以借鑒,并根據我國國情和文化特點適當增補合適的誘導材料。最后還應采取適度保密原則等多種措施以減少觀察者悖論現象,避免健聽工作人員在場時導致的漢語混合變體、語碼混合、文法手語等情況出現。
[參考文獻]
[1]Schembri A, Johnston T. Sociolinguistic Aspects of Variation and Change[M]//Sign Language: An International Handbook.Belin:De Gruyter Mouton, 2012: 788-816.
[2][46][55][58]Fenlon J, Schembri A, Johnston T, et al. Documentary and Corpus Approaches to Sign Language Research[J]. Research Methods in Sign language Studies: A Practical Guide, 2015: 156-172.
[3]Evans N, Levinson S C. The Myth of Language Universals: Language Diversity and Its Importance for Cognitive Science[J]. Behavioral And Brain Sciences, 2009(5): 429-448.
[4]Schembri A. Rethinking ‘Classifiers’ in Signed Languages[M]//Perspectives on Classifier Constructions In Sign Languages. New York: Psychology Press, 2003: 13-44.
[5]Schembri A, Cormier K. No Agreement on Agreement: Are We Missing the Point[C]//From Gesture to Sign: Pointing in Spoken and Signed Languages Workshop. Lille:Université Lille, 2009.
[6]Cormier K, Schembri A, Woll B. Pronouns and Pointing in Sign Languages[J]. Lingua, 2013:230-247.
[7]全國哲學社會科學工作辦公室.“基于漢語和部分少數民族語言的手語語料庫建設研究”中期檢查情況[EB/OL]. (2015-07-30)[2023-03-31]. http://www.nopss.gov.cn/n/2015/0730/c357614-27385401.html.
[8][53][65]趙曉馳,任媛媛,丁勇.國家手語詞匯語料庫的建設與使用[J].中國特殊教育,2017(1): 43-47.
[9][11]Johnston T A. W(h)ither the Deaf Community? Population, Genetics, and the Future of Australian Sign Language[J]. American Annals of the Deaf, 2004(5): 358-375.
[10]Schembri A. Documenting Sign Languages[J]. Language Documentation and Description, 2010(7): 105-143.
[12]Knoors H, Marschark M. Language Planning for the 21st Century: Revisiting Bilingual Language Policy for Deaf Children[J]. Journal of Deaf Studies and Deaf Education, 2012: ens018.
[13][31][32][35][42][49][63]Schembri A, Fenlon J, Rentelis R, et al. Building the British Sign Language Corpus[J]. Language Documentation and Conservation, 2013(7): 136-154.
[14]劉艷虹,顧定倩,程黎,等.我國七個少數民族使用手語狀況的調查研究[J]. 教育學報,2016(3): 96-103.
[15]王琦,唐佳益.聾校教師國家通用手語使用現狀及影響因素研究[J].中國特殊教育, 2023(2): 35-43.
[16]李恒,吳鈴.世界少數民族手語保護:現狀與啟示[J].世界民族,2014(3): 96-102.
[17]張帆.通用手語建設與地方手語保護的思考[J].現代特殊教育,2016(16): 64-69.
[18][50]Caselli N K, Sehyr Z S, Cohen-Goldberg A M, et al. ASL-LEX: A Lexical Database of American Sign Language[J]. Behavior Research Methods, 2017(49): 784-801.
[19]張寶林. “全球漢語中介語語料庫”(1.0版)面向全球免費開放[J].世界漢語教學,2021(1): 125.
[20]張寶林,崔希亮. “全球漢語中介語語料庫”的特點與功能[J].世界漢語教學,2022(1): 90-100.
[21]Morford J P, MacFarlane J. Frequency Characteristics of American Sign Language[J]. Sign Language Studies, 2003(2): 213-225.
[22]McKee D, Kennedy G D. The Distribution of Signs in New Zealand Sign Language[J]. Sign Language Studies, 2006(4): 372-390.
[23][25]Cormier K, Fenlon J, Rentelis R, et al. Lexical Frequency in British Sign Language Conversations: a Corpus-based Approach[C]. School of Oriental and African Studies, 2011.
[24]Johnston T. Lexical Frequency in Sign Langua ges[J]. Journal of Deaf Studies and Deaf Education, 2012 (2): 163-193.
[26]Schnstrm K, Mesch J. Second Language Acquisition of Depicting Signs: A Corpus-Based Account[J]. Language, Interaction and Acquisition, 2022(2): 199-230.
[27]趙曉馳.高校聽人手語教學現狀與建議[J].科技資訊,2018(35): 174-176.
[28]劉學達.中國手語語料庫高頻詞初步分析及標注探討[D].上海:上海外國語大學,2022.
[29]倪蘭.中國手語教程(初級)[M].上海:復旦大學出版社,2020.
[30]倪蘭.中國手語教程(中級)[M]. 上海: 復旦大學出版社,2022.
[33][41][48][52]Nishio R, Hong S, Konig S, et al. Elicitation Methods in the DGS (German Sign Language) Corpus Project[C]//Workshop on the Representation and Processing of Signed Languages, LREC. Valletta, Malta: LREC, 2010: 178-185.
[34][38][45][53]Geraci C, Bayley R, Branchini C, et al. Building a Corpus for Ltalian Sign Language. Methodological Issues and Some Preliminary Results[C]//Proceedings of the LREC2010 4th Workshop on the Representation and Processing of Sign Languages: Corpora and Sign Language Technologies. Valletta, Malta: European Language Resources Association (ELRA), 2010: 98-101.
[36][43]Schnstrm K, Nesch J. Use of Nonmanuals in Adult L2 Signers in Swedish Sign Language-Annotating the Nonmanuals[C]//Proceedings of the LREC2014 6th Workshop on the Representation and Processing of Sign Languages: Beyond the Manual Channel. Reykjavik, Iceland: European Language Resources Association (ELRA), 2014: 153-156.
[37][57]Leeson L, Nolan B. Digital Deployment of the Sgns of Ireland Corpus in Elearning[C]//Sign-Lang@ LREC 2008. European Language Resources Association (ELRA), 2008.
[39]Bono M, Kikuchi K, Cibulka P, et al. A Colloquial Corpus of Japanese Sign Language: Linguistic Resources for Observing Sign Language Conversations.[C]//LREC. 2014: 1898-1904.
[40]Mesch J, Wallin L. Gloss Annotations in the Swedish Sign Language Corpus[J]. International Journal of Corpus Linguistics, 2015(1): 102-120.
[44][56]Kuder A, Wójcicka J, Mostowski P, et al. Open Repository of the Polish Sign Language Corpus: Publication Project of the Polish Sign Language Corpus[C]//Proceedings of the LREC2022 10th Workshop on the Representation and Processing of Sign Languages: Multilingual Sign Language Resources. Marseille, France: European Language Resources Association, 2022: 118-123.
[47][59]Crasborn O A, Zwitserlood I. The Corpus NGT: an Online Corpus for Professionals and Laymen[C]//3rd Workshop on the Representation and Processing of Sign Languages (LREC). ELDA, 2008: 44-49.
[51]Mayberry R I, Hall M L, Zuaigzne M. Subjective frequency ratings for 432 ASL signs[J]. Behavior Research Methods, 2014(2):526-539.
[60]倪蘭.中國手語動詞方向性研究[D].上海: 復旦大學,2007.
[61]衣玉敏.漢語手指字母在上海手語和南京手語中的使用情況[J]. 金陵科技學院學報(社會科學版),2017(1): 83-87.
[62]孫玲.上海手語底層結構到表層的實現機制研究[D].上海:上海大學,2021.
[64]Fenlon J, Schembri A, Rentelis R, et al. Variation in handshape and Orientation in British Sign Language: The Case of the‘1’Hand Configuration[J]. Language amp; Communication, 2013(1): 69-91.
[66]王一博.手語工具書數字出版的特點和發展路徑探析[J].新聞研究導刊,2022(8): 215-217.
Review of Data Types and Collection Methods Used in Sign Language Corpus
REN Yuanyuan1 ZHAO Xiaochi2
( 1. School of Fine Arts and Design, Nanjing Normal University of Special Education Nanjing 210038;
2. School of Special Education, Nanjing Normal University of Special Education Nanjing 210038)
Abstract:
Sign language corpus is of great significance to the study of sign language linguistics and the deaf community. The types of sign language corpus data generally include personal experience narration, conversation, interview and word list. Sign language corpus projects in various countries use diversified tasks to collect sign language corpus and use corpus materials widely used in oral language research. Various measures are taken to reduce the observer paradox. We should learn from the types and collection methods of foreign sign language corpus data, comprehensively collect sign language corpus data, apply advanced, mature methods of sign language corpus collection at home and abroad to the research of Chinese sign language corpus.
Key words: sign language; corpus; elicitation
(特約編校 史玉鳳)
* 2018年教育部人文社會科學研究青年基金項目“基于語料庫的中國手語常用詞規范化問題研究”(18YJC740080)、國家語委委托項目“地方手語資源調查和保護研究——京滬老年聾人手語采集與保護”(WT135-72)、江蘇高校青藍工程“手語翻譯”優秀教學團隊、南京特殊教育師范學院教改重點課題“手語教學視頻資源庫建設研究”成果。
** 任媛媛,碩士,副教授;研究方向:手語及聾人漢語習得等。E-mail:ryy@njts.edu.cn。
*** 通訊作者:趙曉馳,博士,教授;研究方向:手語與聾人教育、漢語史。E-mail:zhaoxiaochi262@163.com。