王晶晶 高曉雅
摘要:《自然語言處理》課程是計算機及人工智能專業的一門重要課程,其研究內容是計算機科學領域與人工智能領域中的一個重要方向。針對《自然語言處理》課程理論性較強、知識體系龐大的特點,該文基于現有的實踐教學方法提出了新的教學思路,即“認知驅動+編程鞏固”教學方法。具體而言,該文首先介紹了《自然語言處理》課程的教學內容,其次分析了當前實踐教學體系中存在的問題,最后詳細闡述了新的“認知驅動+編程鞏固”教學方法。
關鍵詞:自然語言處理;實踐教學;認知驅動;編程鞏固;人工智能
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)18-0160-02
開放科學(資源服務)標識碼(OSID):
Analysis and Practice of “Natural Language Processing” Course Teaching
WANG Jing-jing, GAO Xiao-ya
(School of Computer Science and Technology, Soochow University, Suzhou 215006, China)
Abstract:"Natural Language Processing" is an important course for computer and artificial intelligence majors, and its research is an important direction in the field of computer science and artificial intelligence. Considering that the course is highly theoretical and has huge knowledge system, this paper proposes a new teaching method based on the existing practical teaching method, namely the "cognitive drive + programming consolidation" teaching method. Firstly, this paper introduces the teaching content of the "Natural Language Processing" course. Secondly, this paper analyzes the existing problems in the current practical teaching field. Thirdly and lastly, this paper elaborates on the new "cognitive drive + programming consolidation" teaching method.
Key words: natural language processing; practical teaching; cognitive drive; programming consolidation; artificial intelligence
1 引言
《自然語言處理》課程屬于人工智能專業選修課,是一門融語言學、計算機科學、數學于一體的科學,它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法,是計算機科學領域與人工智能領域中的一個重要方向[1-2]?!蹲匀徽Z言處理》課程理論性較強、知識體系龐大,其主要教學內容包括:詞法分析、句法分析、語義分析、文本分類、對話系統,統計機器翻譯等,傳統的教學方法只能使學生了解自然語言處理的理論知識,難以理論聯系實際并靈活運用,此外,固有的理論教學模式降低了學生學習的興趣和積極性,也無法培養學生的創造性思維。針對上述傳統教學體系存在的問題,本文在先前的改革實踐教學研究[3-7]的基礎上提出了新的“認知驅動+編程鞏固”教學方法,達到了現代教育對教師與時俱進、因材施教的要求。
2 《自然語言處理》課程概述
本節著重介紹《自然語言處理》課程的教學內容以及教學目標。
2.1 教學內容
本課程向高年級本科生介紹自然語言處理的基本概念以及自然語言處理涉及的多個子領域[8],包括:1)自然語言處理概述:主要介紹自然語言處理研究的內容、發展歷史以及研究現狀;2)語言模型:主要涉及n元語法、數據平滑和語言模型中的熵知識;3)概率圖模型:主要講解貝葉斯網絡、馬爾可夫模型、隱馬爾可夫模型、最大熵模型和條件隨機場;4)詞法分析:主要講解漢語自動分詞的基本問題、漢語自動分詞方法、命名實體識別任務和詞性標注任務;5)句法分析:主要講解句法分析的流程、英文的上下文無關語法、基于PCFG的基本分析方法、詞匯化的短語結構分析方法和依存句法分析;6)語義分析:主要介紹詞義消歧任務和語義角色標注任務;7)篇章分析:主要涉及篇章分析的基本理論、篇章的銜接性分析和篇章的連貫性分析;8)文本分類:主要講解文本分類、情感分類、文本特征的表示方法、文本特征的選擇方法和分類器的選擇;9)自動文摘:主要介紹單文檔自動摘要和多文檔自動摘要;10)信息檢索與問答系統:主要介紹信息檢索技術、問答系統、閑聊型對話系統以及任務型對話系統;11)統計機器翻譯:主要講解機器翻譯研究內容、基于噪聲信道模型的統計機器翻譯原理、IBM翻譯模型、基于短語的翻譯模型和基于神經網絡的翻譯模型。
2.2 教學目標
本課程旨在培養學生了解自然語言處理以及機器學習中的一些基本算法,以及對于文本處理的解決思路有一個初步的認識。本課程的具體教學目標如下:
(1)基本概念:學生能夠掌握自然語言處理的基本概念、自然語言處理各個子領域的區別、機器學習的基礎算法以及自然語言處理目前的最新研究進展。
(2)文本分類:首先,學生能夠使用Python編程語言以及PyTorch深度學習開源框架實現基于SVM/LSTM/BERT的文本分類方法。其次,學生能夠分析自己實現的方法中存在的問題,以及能夠給出可行的解決方案。
(3)拓展運用:學生能夠結合自然語言處理與機器學習等人工智能技術解決新出現的自然語言處理問題。
3? 實踐教學體系中存在的問題
由于《自然語言處理》課程是一門理論性強、知識體系龐大的新興學科,在采取傳統實踐教學中存在多種問題,具體而言如下:
(1)學生學習興趣低、積極性不高。本課程內容雖然涉及當前人工智能領域的前沿熱門研究,但是照本宣科講解理論知識打擊了學生學習興趣,慢慢做出遲到、早退、無故曠課等錯誤行為,甚至發生在課堂上睡覺、聊天、發呆、玩手機等惡劣現象。
(2)教學難度提升。本課程涉及詞法分析、句法分析、語義分析、文本分類、對話系統,統計機器翻譯等多個模塊內容,是知識體系龐大復雜的綜合性學科,傳統的教學方法以教師口述書本知識為主,輔以幻燈片投屏播放重點內容,此方法雖然講解精細全面,然而在課時固定的情況下,教師無法將教學內容按時教授完畢,這無疑增大了教學的難度。
(3)教學質量降低。本課程是計算機專業和人工智能專業的重要課程,對教師教學質量的要求十分嚴格。固有的理論教學模式導致教學內容乏味枯燥,課堂氛圍沉悶,學生與教師課上及課后的互動性下降,最終導致教學質量降低,教學目標難以實現。
因此,傳統的教學模式不適用于本課程。
4 “認知驅動+編程鞏固”教學方法
本節詳細介紹了新提出的“認知驅動+編程鞏固”教學方法。
4.1 “認知驅動”教學
“認知驅動”教學法,即基于學生認知的教學方法。不同于傳統教學方法以教師的角度去執行,該方法從學生的角度去執行,以學生現有的認知水平為起點并規劃學習的內容,讓學生根據自己對自然語言處理的現有認知去探索研究某一子領域內容,教師在此過程中扮演了觀察者以及評估者的角色。”認知驅動“教學法一方面可以提高學生學習的興趣和積極性,培養學生在學習過程中的獨立思考能力和創新思維,另一方面可以幫助教師掌握每一位學生的知識基礎,基于因材施教的理念為學生設計不同的教學策略。
例如,在講解“文本處理”方法時讓每一位學生根據自己的現有認知表述什么是文本處理,如何對文本進行處理。有些同學數學基礎較強,可以將文本處理的過程用數學公式形式化描述,還有些同學編程能力較強,用偽代碼算法框架描述了文本處理的流程。
4.2 “編程鞏固”教學
“編程鞏固”教學法,即基于編程實踐的教學方法。不同于傳統教學方法致力于教授理論知識,該方法致力于理論聯系實踐,教學目標以編程實踐能力為重點,教學內容以編程實踐作為載體。通過階段性地布置編程實踐作業,讓學生在實踐中鞏固理論知識?!熬幊天柟獭苯虒W法一方面可以提高學生的動手能力和合作能力,另一方面可以幫助教師掌握學生當前的學習情況以及及時對教學安排做出調整。
例如,在完成“文本分類”實踐作業時,教師不限制學生的實現方法,引導學生自由地討論后讓其各自獨立的設計解決方案并編程實現,最后安排結果分析探討環節,鼓勵學生之間互相找尋對方方法的不足之處以及提出改進方案。
5 結束語
《自然語言處理》是當前高校計算機及人工智能專業的一門新興課程,其內容涉及語言學、計算機科學、數學等知識。本文分析了當前教學實踐過程中存在的問題并就此提出了新的教學規劃及內容改革,即,“認知驅動+編程鞏固”教學方法。該教學方法主要包含兩個方面:一方面采用認知驅動的方法讓學生根據自己對自然語言處理課程的認知運用現有的知識給出文本處理的解決方案,這調動學生學習的興趣與積極性,另一方面采用編程鞏固的方法讓學生將解決方案通過代碼實現出來,這鍛煉了學生的動手能力。在實際教學過程中,本文提出的“認知驅動+編程鞏固”教學方法成功提高了教學質量,這對其他新興課程及知識體系龐大的綜合課程具有重要的示范作用。教學方法的改進與創新是一項長期的工作,在未來的工作中,還需時時發現問題,總結問題,以及和同行前輩交流問題。
參考文獻:
[1] D.Manning, HinrichSchtze..統計自然語言處理基礎[M]. 苑春法等譯 北京:電子工業出版社,2007:1-418.
[2] 邱錫鵬.神經網絡與深度學習[M].北京:機械工業出版社,2020:1-448.
[3] 李霞,路美秀.自然語言處理課程的實踐教學研究[J].福建電腦,2015,011(000):68-69,155.
[4] 李霞.面向本科階段開設的“自然語言處理”課程教學研究[J].福建電腦,2013,29(7):50-51,65.
[5] 何苑,郝夢巖.基于自然語言處理的計算機專業數學課程教學研究[J].長治學院學報,2016,33(2):86-88.
[6] 鐘茂生,黃曉輝,張紅斌.“問題引導+項目驅動”并舉的自然語言處理課程教學改革實踐[J].計算機教育,2018(6):72-75.
[7] 李霞.跨學科思想在自然語言處理課程中的實踐[J].計算機教育,2014(1):92-95.
[8] 宗成慶.統計自然語言處理[M].2版.北京:清華大學出版社,2013.
【通聯編輯:王力】