陸少兵,陳堅林
(1. 上海電機學院 外國語學院,上海 201306;2. 上海外國語大學 外語戰略研究中心,上海 200083)
陳堅林,上海外國語大學外語戰略研究中心教授,博士,主要從事語言政策和規劃研究。
教學研究中,需要使用不同的研究方法,以確保研究的科學性。量化和質性研究是常見的兩種類型。質性研究在解釋社會現象、探討動力機制和影響因素方面優勢明顯。
訪談法和問卷法是教學研究常用的數據收集方法。問卷收集的定量數據有成熟的方法進行分析處理,然而訪談收集的質性語料卻缺少科學、有效的分析方法。大多采用傳統方法來處理,如人工統計或用Excel來統計、檢索關鍵詞。有的采用話語分析法[1]、個案分析法[2]或扎根理論[3]來分析訪談語料。研究者需要逐句逐段分析語料,反復閱讀,多次檢索,深度挖掘;或者對多個個案提煉出的范疇進行自下而上的層層歸類,以及建構模型。傳統分析方法適用于規模較小的訪談語料,其對于規模較大的訪談語料而言,不僅費時、低效,而且無法掌握數據全貌和特征;關鍵詞的選擇也大多取決于研究者的個人判斷,而非基于全要素信息,因此得出的結論不一定客觀、科學。簡言之,訪談話語的分析受到研究者自身經驗、研究視角的影響,不同研究者會有不同的闡釋和解讀;加之研究過程難以復制、結果難以重現,故而研究結論難以驗證、推廣。
缺乏可靠、高效的訪談分析方法,無疑影響教學研究的客觀性、科學性,也制約了研究的深度。因此,如何科學、高效地分析訪談話語就成為質性研究的一大難點。無論采用話語分析、個案分析、扎根理論,還是使用Excel檢索關鍵詞,訪談分析中的一個關鍵步驟就是建立訪談分析編碼表。有了科學的訪談分析編碼表,就有了分析框架。它就像一個使用手冊或指南,使整個訪談話語的分析有了可靠的路徑和依據。
質性研究的新思路就是汲取量化分析的優點,將訪談話語等質性數據量化處理。借助語料庫語言學研究工具,利用檢索、統計技術對訪談語料進行量化分析,這種方法就是內容分析法。運用內容分析法對訪談話語進行分析的研究已比較成熟,但在外語教學研究領域還不常見。以“內容分析法”為關鍵詞,在中國知網檢索,截至2016年10月,有關外國語言文學領域的文獻只有18篇。這18篇文獻中僅有7篇發表于中文核心或CSSCI期刊。
對這18篇文獻進行進一步分析發現,有些研究雖有內容分析法之名,但所選樣本規模較小,采用人工統計,實則使用的是話語分析、文本分析或語篇分析方法。有的研究混淆了文獻計量法和內容分析法,二者存在較大差異。外語學科領域內容分析法主要用于對研究文獻進行梳理分析[4][5],其次是教材分析[6][7][8],將內容分析法用于對訪談話語分析處理的僅有1例。[9]
內容分析法的優點在于,通過將質性數據量化處理,利用話語分析軟件對語料進行檢索,結合統計分析技術,直觀、科學地呈現訪談話語的特征和規律,能夠避免盲人摸象、以偏概全的情況。話語分析法緊密結合具體語境和情景,對說話人言語行為的動機和意圖進行推理、分析。理想的情形是在對整個訪談話語特征、規律和全貌有效把握的前提下,根據研究需要或研究問題進行深入、細致的話語分析,揭示說話人的深層動機或心理動因。
運用內容分析法處理訪談話語,需要借助話語分析軟件和語料庫語言學的研究成果。AntConc是由日本早稻田大學的Laurence Anthony用Perl 5.8 程序語言編寫開發的一款跨平臺語料分析軟件。該軟件兼容性好,可跨平臺在Windows、OSX 和Linux系統下運行,具有詞語檢索、詞表生成、主題詞計算、詞語搭配和詞族提取等多種功能。目前大量應用案例集中于英語語料的分析,利用該軟件分析漢語語料的研究并不多。
訪談分析框架的構建,通常由研究者根據個人經驗和判斷進行選擇、歸納、分類。使用AntConc軟件,可以輕松實現對整個訪談語篇進行詞類全信息統計。再結合研究問題,在對高頻關鍵詞進行語義聚類處理基礎上,可以初步構建起訪談話語分析框架,對整個訪談語料進行高效、便捷的分析。下文將結合具體研究,介紹如何在外語教學研究中使用語料分析軟件和內容分析法分析漢語訪談話語。
1.研究對象及數據來源
為了解上海地區英語學習者的學習觀念和自主學習行為特點,研究者先后進入上海五所學校,聯系任課教師,征得教師和學生同意,在上課前或下課前15分鐘發放調查問卷,進行現場問卷調查。問卷回收后,研究者隨即從學生中征集志愿者,進行大約1小時的集體訪談。訪談采用半結構式,使用了訪談問題清單。訪談前,征得受訪學生同意,進行現場錄音,同時輔以要點筆記。整個訪談調查共進行了五次,有53人參加。錄音超過5小時,轉寫成文本,合計約4.4萬字。為保證轉寫質量,又請獨立人士根據錄音對轉寫文本進行了審校。
集體訪談效率高、效果好,但若運用不當也可能彼此抑制,無法確保每位參與者擁有相同話語權。此外,由于集體訪談在學校進行,教師的影響和受訪者彼此相識也可能會對訪談內容的真實性造成一定影響。為彌補以上可能的缺陷和不足,研究者又選取受訪者進行在線訪談。根據問卷上自愿留下的聯系方式聯系其本人,通過社交軟件進行在線交流。研究者聯系了25人,最后答應并成功進行在線訪談者有16人,其中女生9名,男生7名。這些在線訪談經過轉寫整理,大約1萬字,歸入一個文檔,作為個人在線訪談數據。
2.內容分析法流程
研究中一個最大的難題就是如何處理、分析這些以訪談數據為代表的質性數據。解決思路是采用內容分析法,將非定量的文獻材料轉化為定量的數據,并依據這些數據對文獻內容進行定量分析,揭示數據內在的關聯,做出基于事實的判斷和推論。定量是內容分析法區別于話語分析法以及其他傳統分析方法的顯著特征,是達到“精確”和“客觀”的一種必要手段。量化處理就是把樣本信息轉化為機器軟件可識別處理的數據化形式的過程。具體而言就是運用統計學方法對類目(categories 或dimensions)和分析單元 (items或tokens) 出現的頻數 (frequency) 進行計量,通過頻數、百分比、卡方分析、相關分析以及T-test等揭示訪談數據的特征。定量并不排斥解釋,在得到一組說明或展示樣本特征的數據后,需要對這組數據進行解釋,即說明數據的意義。在定量分析基礎上對數據的深入分析與闡釋,可以避免數據解釋的隨意性和主觀性,使結論更科學、客觀。
遵循定量與定性分析相結合的研究思路,借助話語分析軟件,用數理統計方法,對文本特征進行梳理,在關鍵詞檢索、統計的基礎上,結合上下文語境和研究問題,能夠進一步深入挖掘文本內容。內容分析法一般包括“確定研究總體和研究目標、選擇分析單位、設計分析維度、抽樣和量化分析材料、進行評判記錄和分析推論”六部分。整個訪談數據的分析過程按以下步驟進行:
(1)對訪談轉錄文本進行分詞處理,形成機器、軟件可自動識別的語料;
(2)將預處理的訪談數據輸入話語分析軟件,進行處理;
(3)根據詞頻檢索表,對高頻詞按照語義進行分類(categorization),參照問卷量表維度,形成編碼表維度,亦即分析類目;
(4)選擇典型高頻詞作為檢索關鍵詞,即訪談話語分析單元(analysis items);
(5)建立訪談話語分析編碼體系,即確定編碼表并進行界定;
(6)基于話語分析軟件的檢索、統計結果,根據訪談話語編碼表,對量化處理后的數據進行分析、解讀,展示其特點、趨勢和規律;
(7)在對關鍵詞定位基礎上,進行話語分析,推斷受訪對象的態度和心理;
(8)結合內容分析、話語分析,進一步解讀、闡釋,并與定量分析相互比照。
3.訪談話語的預處理
由訪談錄音轉寫而來的文本是數據分析的基礎,對大量數據進行內容分析,僅靠人工進行審讀、標注、統計、分析尚且不足,需要借助軟件。包括AntConc在內的話語分析軟件,只能識別、處理英語等西方語言,不能直接識別、處理漢語。漢語以“字”為基本書寫單位,詞語之間沒有明顯的區分標記。在對漢語語料進行分析前,需要對其進行詞語切分和詞性標注處理,只有計算機軟件才能識別、處理,這個過程就是分詞(parsing)。如果沒有好的中文詞法分析系統,漢語語料分析的正確率會受到很大影響。分詞工作量大,完全靠手工進行詞性標注和詞語切分無法想象。為此,中科院計算所研發了“漢語自動智能分詞系統”(ICTCLAS)。這款軟件可以很好地對漢語語篇智能分詞,在國內外相關軟件評測中表現最佳。本研究使用的是中科院計算所研發的32位Windows版ICTCLAS5.0(2011版)。將文本導入分詞軟件,進行分詞處理,可得到分詞后的文本。
4.訪談分析編碼表的構建
將非定量的文獻資料轉化為定量的數據,關鍵是要對訪談數據賦予計算機可以識別的代碼,即編碼。編碼根據多個分類標準對訪談資料進行歸納總結,它是一個從訪談資料中逐漸提煉概念的過程,即用簡短的詞組或詞語來概括訪談資料中的人物、事件、概念和主題等。[10]一系列的編碼構成一個編碼體系,形成編碼表。有了編碼表,話語分析軟件就可以開展進一步的統計分析,因此編制編碼表是內容分析法的核心。
分析維度又稱分析類目,是根據研究需要將資料內容進行分類的標準,它是編碼的基礎。設計分析類目,一可采用現成的分析維度系統,二可根據研究目標自行設計。本研究根據研究目標和問卷量表編制因素,自行設計分析維度系統。分析維度應遵循以下原則:(1)分類完全、徹底,適用于所有分析材料;(2)分類標準一致,即從眾多屬性中選取一個作為分類依據;(3)分類層次明確、清晰,逐級展開,不能出現層次混淆、重疊;(4)兼顧后期數據處理的需要。據此,可按照以下步驟設計分析維度,進行測試、調整,確定編碼表。
第一,根據研究問題和量表維度及因素設計編碼分析體系。整個編碼分析體系分為三層:第一層可劃分為觀念、環境、行為;第二層分別對觀念、環境、行為進行細分,如環境包含學習氛圍、師生關系、同伴關系、教學制度等;第三層繼續細化,從待分析材料中選擇與觀念、環境、行為相關的典型高頻詞。
第二,根據分析維度和對第一個訪談轉錄文本的詞頻分析,結合研究問題,選擇相關的高頻詞作為編碼表分析單元,例如“信心”包括自信、自信心、成就感等。
為確定分析單元,在確立編碼表前,需從訪談數據中抽樣,進行預分析,選定典型高頻詞。預分析選擇了上海大學和上海商學院的訪談數據,導入經過分詞處理的訪談文本,選擇詞頻統計功能,運行AntConc軟件。從輸出結果中選取詞頻數大于2的字詞,因數量較多,統計結果不作贅述。
具體而言,上海大學訪談數據共有10624個字符(word tokens),不同字詞數(word types)有989個。上海商學院小組訪談轉寫文本總字符數為7778個,不同字詞數為799個。在上海大學訪談文本中“自己”出現61次,“自主”出現16次,而“自習”“自學”加起來達到20次,其他如“同伴”“學生”“室友”“朋友”合計達到50次,“時間”出現36次,“計劃”“規劃”“安排”出現30次,“目標”“要求”“目的”“需要”“需求”“任務”出現32次,“堅持”“努力”“主動”“勤奮”出現24次;“習慣”出現8次等。對這些高頻詞,根據語義進行聚類,建立訪談分析編碼分類。
自主性:自由(自己、自我、自身)、自覺(主動、被動、自愿、自發、自學、自習)
自我管理:規劃(計劃、安排、設計:目標、路徑、方法)
監督/約束(限制、逼迫、壓力)、
執行:執行(力)、投入
時間管理(忙碌)、緊(張)、空閑、多、雜、碎片化
目的:目標、考試、需求、欲望、動力、追求、決心
反思:思考、總結、回顧、回首
性格情感:拖延(拖沓、懶、惰性、懶惰、懶散)、隨意/性、興趣/喜歡)
效能感:效能感(成就感、自信、自信心、信心)
意志力:意志、毅力、堅持、耐心、控制力、自制力、自控力
環境:氛圍、師生、同伴、朋友、室友(關系)、(教學)制度/體制
學校(周圍、寢室、教室、食堂、圖書館、課外(外部)
在對檢索出來的高頻詞按照語義進行歸類之后,同設計調查問卷所涉及的維度進行比對,發現在對高頻詞的語義歸納和分類中,出現了一類調查問卷維度所未涵蓋的新類目,即“環境”。該類目既包涵“關系”“氛圍”等隱形文化因素,又包括“制度”“體制”等規則因素,還涵蓋“宿舍”“圖書館”“網絡”等有形載體,彌補了問卷維度的不足。據此初步確定了訪談數據編碼體系中的分析維度和分析單元,設計出“訪談數據分析編碼表”(見表1)。

表1 訪談數據分析編碼表

(續表)
建立“訪談數據分析編碼表”之后,就可以把它作為研究工具,對整個訪談話語進行全面、深入的分析與解讀了。
對訪談話語分析類目和分析框架的構建通常較為主觀,常由研究者根據個人經驗進行選擇判斷、歸納分類。使用AntConc軟件可以高效、客觀、科學地構建起訪談話語分析框架。話語分析軟件和內容分析法二者相結合,為科學、高效地分析處理外語教學研究中的訪談話語提供了一條可行之道,也為質性研究提供了一種較為科學、可靠的研究方法。
參考文獻:
[1]蔣躍,李璐. 英文電視訪談節目中模糊語言構建權勢關系的分析研究[J].外語教學,2010,(1):27-30.
[2]何木葉. 學習策略生成的自傳作品和訪談研究[J].寧波大學學報(教科版),2014,(5):69-70.
[3]錢春花, 徐劍, 胡潔雯.譯者勝任力構建: 共詞分析、翻譯行為事件訪談與實證研究[J].外語界,2015,(4):18-19.
[4]王立非, 江進林.“十一五”期間國家社科基金外國語言學立項熱點及分布分析[J]. 外語教學與研究,2011,(5):772-778.
[5]索格飛, 翁立平, 顧力行. 我國30年跨文化交際/傳播教材的分析性評估(1985—2014)[J]. 外語界,2015,(3):89-94.
[6]何安平. 語料庫輔助的基礎英語教材分析[J].課程·教材·教法,2007,(3):44-49.
[7]朱茜, 徐錦芬. 國外優秀英語教材詞匯和語法的布局、復現及練習方式[J].外語教學理論與實踐,2014,(4):25-34.
[8]陳柏華, 吳月文. 高中英語教材跨學科分析——以人教版必修模塊為例[J].課程·教材·教法,2012,(4):49-54.
[9]楊永建, 韓雪, 牛健, 李瑩. 遠程開放教育英語專業學習者完成學業的要素分析[J].遠程教育雜志,2011,(6):59-65.
[10] 孫曉娥. 深度訪談研究方法的實證論析[J].西安交通大學學報(社科版),2012,(3):101-105.