吳 繁
北華大學外國語學院
本文提出學習策略T檢驗智能分析技術并以此為理論基礎,基于日本國內關于聽力策略學習的現行研究,以日本某大學本土班級和留學生班級的學生為研究對象,分析不同語言學習能力的學生在自主聽力學習過程中學習策略方法的選擇行為;并運用學習策略T檢驗智能分析技術研究不同能力的學習者在學習策略項目及學習策略運用上的差異。通過參照日本國內既有的關于學習策略先行研究的數據統計方法并根據Oxford的SILL計量表制作調查問卷。問卷中包括直接學習策略問題與間接學習策略問題,關于直接學習策略為記憶策略、認知策略、補償策略;關于間接學習策略為元認知策略、情義策略、社會策略。調查對象具體為日本某大學經濟學部二年級本土學生(89人)和留學生(69人)。首先,通過制作調查問卷把被調查者所使用的聽力學習策略數字化,完成學習策略采集;其次,通過T檢驗數據分析技術對調查數據進行比較判斷,完成學習策略預處理;最后,通過主題模型智能分析技術對直接策略與間接策略各表現結果和被調查者成績差異間的潛在關聯進行研究,完成學習策略挖掘。項目研究成果可為國內日語教學改革提供一定的理論指導與數據保障,同時項目也存在擬解決的技術難點和關鍵技術。
項目的技術難點為如何通過T檢驗技術有效分析兩組相關的調查數據(本土學生和留學生,并且兩者在一起進行聽力學習,非獨立學習),目前T檢驗技術主要應用在醫學病理篩查與工程探傷檢測方面,應用在教學數據分析方面的案例很少。T檢驗主要用于樣本含量較小,總體標準差未知的正態分布,其是用T分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否有決定性意義。由于項目存在兩組相關樣本,這增加了T檢驗的運算隨機性和相關參數的設置的復雜性。因此,項目采用雙總體相關樣本T檢驗技術來檢驗兩組調查樣本所獲得數據的差異性。項目關鍵技術為主題模型智能分析技術,其把概率分布與貝葉斯先驗理論引入到數據挖掘中。主題模型有三個結構層次:特征詞層、主題層和文檔層,其可以揭示直接學習策略與間接學習策略各表現結果(主題)與學習策略調查題目(特征詞)及被調查者成績差異(文檔)之間的潛在關聯,其中計算主題模型提取相關信息的耦合度;確定主題模型中最優主題數量;設計主題聚類算法是該技術關鍵所在。
項目研究內容、擬解決的技術難點和關鍵技術,如下圖所示。

圖1 項目研究內容、擬解決的技術難點和關鍵技術