陳新元,陳慶強,陳但淡,陳美
(1.福州墨爾本理工職業學院 福建 福州 350121;2.福建工程學院,福建 福州 350118;3.福建農業職業技術學院,福建 福州 350007)
中外合作辦學是當代社會、經濟、文化全球化趨勢的必然產物,是我國高校國際化改革與發展的重要組成部分。合作辦學能夠幫助中外雙方整合資源、共享教學資料,促進教學理念、管理機制和實施方式的交流,有助于人才培養對接國際標準。
作為一所高職高專層次的中外合作辦學高校,外方基于產出的專業課程模塊是我校人才培養方案的特色之一,但外方教學中遇到以下問題:⑴ 師生母語不同,可能存在交流障礙;⑵ 部分同學專業基礎薄弱;⑶ 疫情防控期間,所有外方課程都采用線上教學,但線上教學師生交流效率較低。
目前我校在外方專業課程中配備中方合作教師,提供翻譯和答疑服務。但是,由于師生比低,合作教師任務較重,此外,課上答疑會占用講授時間,干擾教學進程,同時也浪費沒有疑問的同學的時間。
根據上述情況,答疑占用的講授時間可表示為:

其中:tlost表示答疑占用的講授時間; 為回答問題的平均時間;為問題數;tidle表示其他同學被浪費的時間;ns為學生總數; 為存在疑問的平均學生數。
由公式可知若問題典型性較低,即大部分同學沒有疑問,而教師在課上作了解答,則整體浪費的時間較多。
許多研究致力于解決上述問題,如引入翻轉課堂[1]、團隊教學[2]等教學手段/形式,增加師生交流的時間或提高師生比,但課堂時間有上限,教學團隊也無法無限擴充。也有研究借助軟件工具或教學平臺提高教師答疑/師生交流的效率,但問答知識大多無法復用,教學中斷問題也沒有徹底解決。
問答系統[3]有望解決上述問題,自動化答疑幫助學生跨越語言和專業能力等障礙,知識復用應對重復性問題,教師負擔減輕,教學連續性得以保證,也滿足了部分學生希望匿名提問的心理。此前研究提出了跨語種問答框架,集成傳統Q&A檢索與知識圖推理,同時建立問答知識與具體教學情境的關聯以改善問答表現;本文引入該系統輔助外方線上教學。
本研究主要工作如下:⑴ 在已有問答系統基礎上進行功能擴展,包括構建學生關注模型,提取知識路徑并實現個性化的學習推薦,辨識學習熱點,集成思政模塊和數據統計分析等;⑵ 設置教學團隊的角色和任務,調整教學內容交付方式,將問答系統融入教學框架;⑶ 實踐驗證,通過教師訪談、學生問卷和后臺數據分析評估系統輔助教學效果。
本文后續在第2節介紹相關工作,引出第3節和第4節的系統功能擴展和教學實施優化,第5節在教學實踐中評估方案,第6節總結并提出未來的工作方向。
許多學者致力于中外合作辦學的相關研究,林金輝等[4]分析了引入國外優質高等教育資源的意義,以及監管體制和質量保障機制的設計;覃美瓊等[5]分析、總結了中外合作辦學中的典型問題;劉楊等[6]通過抽樣調查統計中外合作辦學中學生的滿意度,分析影響因素并在此基礎上設計提升策略;朱飛等[7]2020則對我國42所世界一流大學建設中外合作辦學機構/專業的現狀與發展作了綜合性的探討。師生交流/問答是相關研究中的熱點。
疫情期間線上教學廣泛開展,這也是未來教育趨勢之一,高等職業教育擴招和面向社會提供培訓服務都存在線上教學的需求,但線上師生交流效率較低。已有研究關注該問題[8,9],國內外也有在線教學平臺做了針對性的設計,例如:
⑴ OnlineTED:學生可使用課堂討論功能主動發起師生交流[10],但沒有對交流和討論的數據進行抓取、處理和分析,無法為下一屆或其他專業/班級的相同課程提供教學/學習參照。國內的騰訊課堂、網易云課堂與之類似。
⑵ Tweedback:設計了3種交流渠道,包括預定制問卷、問題墻和學生端提問通道。課堂上學生可以向老師提問,教師可即時答疑,課后平臺匯總數據并打包發送給課任教師。學生亦可在問題墻上匿名(可選)提問/回復,問題發起人可以對最優應答給予獎勵,學生還可以“支持”墻上的問題,支持數高時說明該問題較普遍,系統優先將其發送給教師并提醒答疑,但這一功能可能打斷教師教學思路。此外,問答內容分離在不同的內容形式中,學生問題以文本形式存儲,教師看到熱點問題后卻是語音回復,數據存儲中兩者不存在關聯,知識同樣無法復用。該系統對小眾問題考慮較少。
⑶ AMATI (Another Massive Audience Teaching Instrument):嘗試融合OnlineTED和Tweedback的特點并改進,問題墻與Tweedback基本一致,但允許教學團隊的其他成員即時回答熱點問題,避免授課教師注意力分散;學生還能對教師的答復進行反饋或進一步提問。AMATI實現了問答關聯和知識復用,其存儲機制支持為問答對附上標簽,但沒有實現問答對與具體教學情境的鏈接/映射。
⑷ Slack:提出了線程概念,課堂參與者可針對特定問題發起子會話(即線程),僅邀請部分成員參與;教師也可以將有共同疑問的學生集中起來,統一答疑,減少重復工作。問答以相同內容形式存儲,會話元信息中包含了教學情境。線程設計可避免公共頻道上信息泛濫,但多線程可能分散教師注意力。
問答系統、知識圖譜構建與知識更新的相關研究另文說明,此處略。本文使用的問答系統實現了線程功能,允許學生/教師自定義聊天頻道并選擇參與者;學生也可匿名在問題墻上發問/應答;問答數據可復用。在此基礎上開發擴展功能,教學中設置答疑教師保證講授連續性,調整知識交付方式以便學生聽課和查看答疑信息,實現問答系統與教學框架的銜接與融合。
使用此前開發的集成傳統Q&A功能與知識圖推理的智能問答系統,該系統實現了情境信息集成與情境感知,問答準確率較高。問答系統依賴的垂直領域知識圖譜數據源包括:課標/大綱、教學計劃、教材和參考書、課件、實驗指導書、習題試題及解答、模擬企業生產環境的項目任務資料,以及已有問答知識等;此外借助Scrapy框架抓取網絡文本資源,使用三方庫進行驗證碼識別和Ajax請求模擬等。
為進一步提升該系統輔助教學的能力,開發擴展功能,包括構建學生關注模型,提取知識路徑并實現個性化的學習推薦,辨識學習熱點,集成思政模塊,提供數據統計分析功能。
構建學生關注模型,幫助系統/教師理解學生的需求和興趣,實現更精準的問答檢索和學習指導,包括關注特征采集、建模和持續更新。
首先導入/記錄學生在現有教學平臺和問答系統上的知識瀏覽和檢索情況,建模關注、點贊、收藏、評論、轉發等行為,目前實現了主題和關鍵詞的自動監控,其他數據手動輸入。
采用概率模型建模學生在一定時間內對于特定知識領域的偏好,定義為:

教學實施中按模塊記錄權重;為對學生的整體學習情況進行評估,引入時間遷移參數優化整體關注模型,表示為F'=WT'+α·F,其中F為上一階段的整體關注情況。α的最優取值大多落在[0.2,0.4]。目前使用流動圖(圖略)展示學生的關注變化情況,教師可自定義篩選條件并詳細展開,計劃優化可視化效果并與學生項目/階段得分情況(從已有教學平臺導入數據,使用雷達圖展示,此處略)比對,分析學習情況。
關鍵詞及其主題攜帶時間屬性,因此知識連接具有方向性,設計知識路徑生成算法,挖掘長尾分布的知識價值。路徑結構參考對應職業技能等級認證中工作場景和具體任務的模塊劃分,以及職業院校技能競賽相關賽項中的環節銜接,人工核查。從學生關注模型中提取重點關鍵詞進行個性化的學習推薦。
知識路徑示例(根據關鍵詞“容器數據”展開)如圖1。

圖1 知識路徑示例
重點考察度中心度(共現情況)和中介中心度(路徑連接能力),發現學生的認知核心詞,與主題/核心關鍵詞比較,教師人工判斷學生對模塊/項目核心內容的理解是否存在普遍性偏差,相應調整教學過程/內容/方法,亦可發現學習難點。課程熱點統計的詞云展示略。
無論以Web或者安卓APP方式登陸系統,都會彈出專業相關的每日知識;此外設置思政版塊,以趣味故事的形式潛移默化的培養工匠精神、民族意識和團隊意識。每日知識(以3月18日為例)如圖2所示。

圖2 每日知識示例
使用Metabase開源框架實現可視化,向師生提供分析面板(圖略),教師可直觀看到系統并發數和資源開銷,特定問答的滿意度和反饋(可根據主題、日期或關鍵字檢索),不同學生的系統使用數據及學習情況,班級/專業學習熱點,問答數據修改記錄等,還可自定義報警條件,觸發時系統向教師推送通知。學生也可看到自己的歷史問答記錄和系統使用數據。
在問答系統及擴展功能的基礎上調整教學實施,設置教學團隊的角色和任務,優化教學內容交付方式,將問答系統與教學有機融合。
引入答疑教師的角色,使講授教師得以專心授課不被打斷,保證學生接受知識的連貫性。答疑教師的核心任務是調整Q&A系統匹配的問答對候選集的排序或修改其內容;對匹配不到的問題判斷其難度、重要性和普遍性,選擇針對個人/群體的即時簡要回答或課后詳細解答,將數據錄入系統。其他工作還包括:輔助問答系統的前期數據建設,問答情境信息標注/修改,為Q&A系統中其他學生給出的答案進行打分、點評或補充修改,根據系統的統計分析數據和學生反饋對已有問答知識進行深度處理等。答疑教師與講授教師并行開展工作,盡量不干擾后者的教學秩序;課間或課后講授教師與答疑教師交流,亦可根據系統數據對后續教學進行調整。答疑教師可以是專任講師、實驗教師或兼職教師,或是掌握課程知識的高年級學生。
使用分屏(線上)/第二投影儀(線下)展示當前教學內容在整體課程中的位置和性質,當前教學情境下普遍性問答的知識摘要,以及教學過程中出現的重要問答(重要性由問題墻熱度和答疑教師人工判斷)。展示內容根據情境切換和答疑教師設置不斷更新,答疑教師根據實際情況切換中/英文。期初課程引入階段告知學生可自由選擇是否觀看分屏/第二投影儀,但主要注意力應跟隨講授教師思路。學生也可通過瀏覽器或APP隨時查看相關問答的詳細信息,包括系統返回結果,教師/學生應答和教師點評、補充,關于該問題的完整討論等,可自定義檢索/篩選操作。
通過教師訪談、學生問卷和后臺數據統計分析3種渠道評估問答系統輔助教學的效果。
教學團隊共6位教師都使用了系統(人均>2 h)并輪流擔任答疑教師。邀請教師們面談,內容包括:⑴系統UI設計和操作難度;⑵系統功能和性能;⑶系統對于學習者的作用;⑷系統對教學的輔助作用。訪談流程如下:⑴介紹訪談目的和流程;⑵按照內容提綱提問并記錄教師評價;⑶自由交流,請教師分享心得體會,提供改進建議。教師評價/建議匯總如下。
系統界面簡潔,功能層次布局合理,上手難度較低;Web端特別是可視化面板可以補充內容;課程引入階段最好介紹系統并指導學生使用。
系統網絡帶寬占用小,訪問速度快,不卡頓,很適合作為線上實時教學的輔助,但建議增加外網訪問通道(因應用系統備案流程較長,目前運行在校園內網,外部需通過VPN訪問);系統功能基本符合要求,使用關鍵詞和自然語言檢索都能獲得較為準確的答案,課程重難點、參考資料、評價標準等各類信息都可以有效獲?。恢R路徑和學習推薦很有特色,但自動生成的知識路徑常有遺漏,需要人工校對補充;同近義專業術語的識別能力很強,中英文問答準確率沒有明顯差異,建議增加中譯英功能。
教學中發現,大部分學生使用Q&A系統的頻率逐漸提高,并且從開始時的簡單問題查詢逐步發展為將其作為Debug的重要工具,側面說明了系統對于學生自主學習有一定幫助;學生的關注模型和班級/專業的學習熱點是系統亮點,有助于學生自我評估或了解課程重難點;建議未來進一步與教學平臺集成,讓學生在同一界面上看到自己的平時分、作業/小測情況以及當前的班級/專業排名。
統計分析功能模塊對于發現學生的普遍性問題很有幫助;教師答疑工作量大幅降低,教學連續性也得以保證;課程開始時,答疑教師的負擔較重,需要參與知識庫的建設和優化或對學生提出的問題和系統返回的答案逐一審查、補充、修改,但后期工作量較小,重復性工作比例大幅降低,更多的是對新的探索性問題的分析和解答;每日知識的思政教育很有意思,教師也會去看。
教學輔助示例:外方開發服務框架的專業課程在講到Harbor集群搭建的時候,原本課程重難點是在主從架構搭建和負載均衡上,但教學過程中發現,學生更關注集群訪問驗證(>40%的問題與此相關,遠大于主從架構的約18.3%),即SSL機制和具體配置。調查后發現,學生缺乏安全驗證的前置知識和技能基礎,因此設置了教學難點并相應調整課堂時間分配,同時布置了自主學習任務。
參與課程評估的學生為2019級信息工程系計算機(43人,21.3%)、云計算(43人,21.3%)、大數據(78人,38.6%)和物聯網(38人,18.8%)共4個專業的學生(共同外方課程)。課程實施前將不同專業的學生混編為3組,每組成績分布相仿,第1組不告知Q&A系統,也沒有開通訪問權限,第2組使用不帶情境信息的Q&A系統,第3組使用完整Q&A系統;第2、3組Q&A系統的其他功能、設置和數據相同。
課程實施前期,從第2、3組中隨機挑選參與者,面對面交流,收集其對系統的評價和建議,大部分同學(>70%)認為系統界面友好,操作難度低,但有部分學生(約17%)認為分屏/第二投影儀會造成一定干擾。
課程結束前30天,使用問卷星平臺收集學生數據和系統評價,問題維度包括參與者基本信息、課程體驗、學習質量、Q&A系統評價、系統提問次數、提問的優先選擇等。設計問卷跳轉邏輯,沒有使用Q&A系統的學生不會被問到相關問題。對上述主要變量進行結構劃分并使用克朗巴哈系數進行一致性檢驗,各維度α>0.6,說明問卷整體信度較高。202名參與者中,186名(92.1%)完成了問卷調查。3組同學根據課程難度、學習體驗和整體學習質量給出關于課程的主觀綜合評價,由低到高分為1到5級,評級分布如表1所示,可見使用完整Q&A系統的分組對課程體驗和學習情況的整體評價較高,進行卡方檢驗,(=17.855,p<0.05,說明存在統計學上的顯著差異。(注:3組同學最終成績分布的檢驗結果(=16.182,p<0.01,同樣存在顯著差異。)

表1 課程主觀評級分布
期末調查中,認為分屏/第二投影儀產生干擾的同學下降到約7%。絕大部分同學認為適應后基本不會對正常學習,或跟隨講授老師的思路造成影響。
使用完整Q&A系統的學生有16.9%將其作為提問的首選,僅次于向教師提問(74.6%);使用不帶情境信息系統的學生中只有7%將其作為提問首選。面對面交流時,考慮到教師問答效率,有更高比例的學生認同將系統作為首選提問途徑;但幾乎沒有同學認為,Q&A系統的問答質量優于教師答疑。
后續僅針對使用完整Q&A系統的參與者進行數據分析:其性別、年齡、地域和APP/Web使用經驗分布如圖3所示。

圖3 參與者性別、年齡、地域和APP/WEB使用經驗分布
學生對于系統功能和界面設計、響應速度、問答準確率、整體體驗的評價,以及對系統輔助學習、幫助克服語言障礙、提高學習興趣的評價如圖4所示。將提問次數統計(圖4右下角)與系統后臺數據比較,91.5%的同學回答準確。

圖4 學生評價匯總
91.9%的同學使用關注模型回顧/總結了自己的學習歷史,78.0%的同學多次使用(>3次);86.0%的同學關注過當前學習熱點,77.4%的同學多次查看;81.2%的同學使用過基于知識路徑的學習推薦,75.3%的同學多次使用該功能;所有同學都看過自動推送的每日思政知識,查看過思政板塊和多次查看的比例分別為89.2%和82.8%。
將性別、年齡、地域和APP/WEB使用經驗分組分別與后臺提問次數分組進行卡方檢驗,男生/女生的提問次數在不同分組區間內不存在顯著差異,(=0.979,p=0.806,如表2所示。年齡(=2.440,p=0.486)、地域(=15.533,p=0.625)和APP/WEB使用經驗(=3.987,p=0.263)一樣。

表2 性別—提問次數的卡方檢驗
為進一步驗證,以上述4個因素為自變量,準確的提問次數為因變量進行獨立樣本T檢驗,性別—提問次數t=-0.435,p=0.665,年齡—提問次數t=-0.021,p=0.983,地域—提問次數t=0.227,p=0.823,APP/WEB使用經驗—提問次數t=-0.563,p=0.575,結論相同,樣本總體呈現方差齊性,即不存在顯著差異。與此類似,學生對系統功能與界面設計、響應速度、問答準確率、是否有助于克服語言障礙、學習興趣是否提高等方面的評價在不同提問次數區間內也不存在顯著差異。
但是,學生對于系統整體體驗,以及其對學習幫助的評價與提問次數分組進行卡方檢驗時發現了顯著差異,分別為(=14.222,p<0.05和(=18.106,p<0.01,說明認為系統體驗好、對學習有幫助的同學更傾向使用Q&A系統提問。
分析學生成績數據,峰度達到1.293,并未呈現標準的正態分布趨向,較多同學成績落在[73,78]和[83,88]兩個區間內,極值較少,總體呈現負向偏斜,偏斜度-0.413,即整體水平低于均值。
為驗證系統輔助學生學習的作用,將學生成績分組與提問次數分組進行卡方檢驗,(=39.908,p<0.01;進一步以準確的提問次數為自變量,準確成績為因變量進行方差分析,F=27.979,p<0.01,說明存在顯著差異。
取提問次數在[5,15]、[15,30],[30,50]區間以及>50的4組同學,以次數為自變量,成績為因變量進行方差分析,如表3所示,可見提問次數在[30,50]區間的學生,其成績差異尤為顯著。

表3 提問次數—成績方差分析
為進一步探討提問次數與學生成績的關系,利用Pearson系數進行雙變量相關性分析,提問次數>50的分組中,r=0.514,p=0.486,其他分組分別為r=0.624,p<0.01([30,50]),r=0.095,p<0.05([15,30])和r=0.397,p<0.01([5,15]),整體r=0.543,p<0.01。說明兩者存在顯著正相關,特別是提問次數在[30,50]的學生分組在0.01層次上顯著。
通過P-P圖判斷提問次數與成績是否存在線性趨勢,整體成績與[30,50]分組成績的P-P圖如圖5所示,樣本殘差存在上下波動,但計算發現后者絕對差異較小,可認為大致服從正態分布,因此通過線性回歸模型對[30,50]分組同學的數據進行統計檢驗,調整R2=0.390,可視作使用提問次數預測成績有39%的解釋力度,回歸效果顯著?;貧w模型中常數項a=80.51,回歸系數0.191。

圖5 成績分布 P-P圖
進一步對教學各模塊的難度區間劃分與提問次數分組進行卡方檢驗,(=47.840,p<0.01,存在顯著差異;難度區間與成績分組的檢驗結果(=22.791,p<0.05;但兩種情況下均未發現顯著正相關性,有待進一步探討。
外方課程中的部分實踐項目以小組為單位(每組6-8人)進行,對小組得分區間與提問次數分組進行卡方檢驗,(=23.326,p<0.01,進一步驗證發現r=0.878,p<0.01,存在顯著正相關性。此外,發現各組的提問大多來自其中1-2名成員,隨機抽取6個小組,來自提問次數最高的2名成員的問題占各組總提問次數比例分別達到58%、61%、75%、45%、51%和39%,嘗試將其應用于班級/小組核心成員判斷。
學生參與回答問題的積極性較高,不同程度地參與了21.2%的問答對,未來考慮改進角色權限設置,進一步發揮優秀生在智能問答框架中的作用。但學生使用問題/答案投票功能的頻率較低。
本研究利用智能問答系統輔助外方專業課程教學,在已有基礎上開發擴展功能,相應設置教學團隊,調整知識交付方式,最后在教學實踐中通過教師訪談、學生問卷調查和后臺數據分析等方式評估驗證方案功能/性能。未來工作計劃包括:⑴擴展知識路徑,實現知識交叉,根據前置課程的學習情況判斷本課程可能的難點或知識/技能盲區,優化知識推薦,預測后續課程的學習情況;⑵關聯多模態學習資源,如通過預定義實體列表和鏈接的方式實現視覺資源融合,以及基于學習者興趣的資源類型推薦;⑶改進評估機制,如加入系統與自主學習能力的關聯分析等。