999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

培養實踐能力的新時代本科自然語言處理課程改革思考

2024-11-02 00:00:00龍梓傅向華張藤方
大學教育 2024年20期

[摘 要]在當前人工智能大模型的新時代背景下,自然語言處理領域展示出了完全不同于以往的問題解決路徑。在新時代的需求導向下,自然語言處理領域的人才不能局限于傳統方法的理論實踐,需要具有靈活使用前沿知識和技術來解決問題的實踐能力。在這種背景下,本科自然語言處理課程出現了理論課知識過時且復雜、實驗課實踐內容門檻過高、課程內容與工程實踐脫節等問題。針對這些問題,文章提出了本科自然語言處理課程的教學改革方案,通過簡化理論課知識結構、重構實驗課實踐內容、加強理論與實踐融合等方法,使課程內容符合當前大模型時代的要求,培養學生對前沿技術的實踐能力。

[關鍵詞]實踐能力;自然語言處理;大模型;課程改革

[中圖分類號]G642.0 [文獻標識碼]A [文章編號]2095-3437(2024)20-0052-06

近年來,我國人工智能產業發展迅速,政府陸續出臺多項政策,如《新型數據中心發展三年行動計劃(2021—2023年)》《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》等,鼓勵人工智能行業發展與創新,積極推動人工智能產業的持續發展。同時,人工智能產業已成為新一輪科技革命和產業變革的核心驅動力,積極推動傳統產業轉型升級,并且催生了很多新興產業,對國民經濟、國防和社會的發展至關重要。持續高速發展中的人工智能產業需要大量專業人才隊伍的支撐,高校作為人工智能人才輸出的重要陣地,承擔著培養人工智能人才的重要使命。教育部積極推進新工科建設,發布了《教育部高等教育司關于開展新工科研究與實踐的通知》《教育部辦公廳關于推薦新工科研究與實踐項目的通知》等,全力探索形成領跑全球工程教育的中國模式、中國經驗,助力高等教育強國建設。

自然語言處理(Natural Language Processing,簡稱NLP)作為人工智能領域的重要分支,在推動現代科技進步方面發揮著不可替代的作用,是整個人工智能產業的重要組成部分[1]。因此,高校在本科階段開設高質量的、注重實踐能力培養的自然語言處理課程尤為重要。然而,自然語言處理課程通常是作為專業課程面向計算機相關專業的碩士研究生開設,課程內容多為偏向算法理論基礎,相對應的實驗課內容也偏向機器學習相關算法的復現和優化。此外,隨著深度學習技術的不斷發展和進步,在NLP領域中傳統的機器學習模型逐步被基于深度神經網絡的模型取代,而大語言模型的出現則進一步改變了NLP領域一直以來的問題解決路徑[2]。新時代對NLP領域的應用型人才提出了不同需求,不再強調對NLP基礎處理以及傳統方法的細致理解,而是需要應用型人才能夠深入掌握預訓練語言模型的深度模型結構和預訓練技術,并具有針對具體任務進行提示工程和微調訓練的能力。

本科自然語言處理課程在具體教授過程中面臨著如下三個問題:一是理論基礎知識學習需要較多前置知識,本科生難以學習和理解;二是復現算法的實驗需要較強的代碼能力,本科生難以完成;三是以輔助學生研究為教學目的的課程內容設計與工程實踐要求脫節,難以滿足本科生對課程的期望。本科自然語ID1GMCrqMfwhjrez1oTj0Q==言處理課程應該更加注重對學生實踐能力的培養,側重讓學生在應用實踐中深入理解理論知識和鍛煉工程能力。針對上述問題,本文提出從如下三個路徑對本科自然語言處理課程進行教學改革:一是簡化并分解理論課中的核心內容,以成體系的結構教授相關知識;二是整理并重構實驗課內容,以循序漸進的方式調整實驗課內容;三是以優化和改良的方式開展實驗課內容教學,建立實驗課與實踐過程的聯系。本文將基于教學改革結果進行深入分析,探討改革過程中遇到的挑戰和取得的成效,相關經驗和教訓可為其他高校的教學改革提供有益的借鑒和啟示,推動人工智能教育的進步和發展,以使人工智能教育的成果跟上時代且滿足業界的應用需求[3]。

一、本科自然語言處理課程面臨的主要挑戰

自然語言處理通常是計算機科學及相關專業的專業選修課,屬于人工智能方向的核心應用類課程。課程教學目標是使學生掌握NLP領域的基礎知識并且能夠應用一些核心技術解決NLP常見任務。以深圳技術大學為例,本科自然語言處理課程總學時為72學時,包括課內實踐18學時以及課外實踐18學時。以應用能力培養為核心導向,課程內容通常涵蓋三個部分:第一部分為NLP基礎技術,例如分詞、序列標注、命名實體識別、文本分類、文本聚類等;第二部分為NLP深度學習技術,包括基于深度學習的文本分類與文本生成技術、機器翻譯、QA(問答)系統等;第三部分為NLP領域的預訓練語言模型及相關技術。課程教學形式包括理論課講述與實驗課實踐,通過指導學生完成一些實踐項目,讓學生在應用實踐中深入理解理論知識并鍛煉工程應用能力,最終使學生能夠運用NLP相關技術來解決實際問題。

通過調研、分析和反饋,教學團隊對目前自然語言處理課程的教學內容和教授方式進行了分析和總結。以培養學生實踐能力和工程能力為目標,新工科背景下的新時代本科自然語言處理課程面臨著如下三個問題和挑戰。

(一)理論基礎知識學習需要較多前置知識,本科生難以學習和理解

在自然語言處理課程的理論課教學中,教師通常會先介紹語料數據的基礎處理,如分詞、命名實體識別、詞性標注、句法分析等分粒度的階段工作;然后講授一些自然語言處理的基本任務的傳統算法基礎和知識,如文本分析、機器翻譯、信息檢索、問答系統等具體任務的機器學習方法;最后逐步介紹自然語言處理的一些高級應用方法,如預訓練語言模型與微調訓練、多模態信息處理等[4-5]。然而,對于上述內容,學生需要掌握一定的前置知識才能理解。例如,在講授通過序列標注方法進行命名實體識別時,就會涉及隱式馬爾科夫模型、條件隨機場等復雜的前置知識。因此,在自然語言處理課程的理論課教學中,由于學生前置知識的缺乏和課時的限制,教師通常需要在有限的時間之內講授大量理論復雜且關聯緊密的知識,容易出現教師難以講明白、學生難以聽懂的問題。針對這一問題,教師應該根據本科學生的特點,對課程內容進行簡化和整理,以更加系統和易懂的方式組織理論內容來進行講授。

(二)實驗課門檻較高,需要學生擁有較強的代碼能力,本科生難以獨立完成

自然語言處理的實驗課通常要求學生復現理論課上所學的算法或機器學習模型并處理給定的數據集,最后通過觀察處理結果并進行算法優化來促進學生對基礎知識的理解和運用。然而,自然語言處理中,部分常用技術的復現門檻較高,要求學生具有較強的代碼能力,且難以在有限的實驗課時中完成。例如,序列標注主流的深度模型多為Bi?LSTM(雙向長短期記憶)+CRF(條件隨機場)[6]的復雜結構,本科學生難以獨立地在有限時間內復現這種模型。因此,教師會提供參考代碼,僅要求學生完成模型的訓練和驗證,或直接舍棄部分模型不要求學生進行實驗。毫無疑問,這兩種實驗內容的設計方式都難以實現預設的培養學生動手能力的目標。針對這一問題,教師應該根據本科生的能力對實驗課內容進行調整和重構,以循序漸進的思路設計更有效的自然語言處理實驗課方案。

(三)課程內容設計與工程實踐要求脫節,難以滿足本科生對課程的期望

目前的自然語言處理課程中,理論課主要介紹諸如機器學習、模型結構等自然語言處理技術,而實驗課的內容組織方式多為命題式,即給學生布置針對理論課的具體問題,協助學生針對具體的理論知識點進行練習和實踐。然而,這種以理解知識為目的的課程內容組織方式與目前以解決問題為目的的項目實踐過程之間存在一定的差距,導致本科生難以將所學習到的知識與實際項目的實踐過程有效地對應,難以將理論知識運用到項目實踐過程。例如,學生通過實驗,能夠運用序列標注技術進行命名實體識別的處理,但在面對從文本中挖掘特定種類的詞匯的實際需求時卻沒有想到可以同樣通過序列標注技術來實現??梢?,學生面對具體問題時的實踐能力和靈活創新能力不足。針對人工智能產業對傳統產業的優化以及對新產業的催生,課程內容應該側重培養學生使用自然語言處理的知識對產業轉型過程中遇到的問題進行分析的能力,以及運用自然語言處理技術進行解決方案的探索和靈活創新的能力。

二、教改思路與方案

針對上述問題,教學團隊嘗試對自然語言處理課程所涉及的理論課知識結構、實驗課實踐內容,以及理論與實踐相互融合等方面進行課程設計和改革。為了適應當前新時代人工智能大模型技術的特點和要求,教學團隊將本科自然語言處理課程分為“NLP概述與基礎處理”“NLP深度學習應用”“NLP預訓練技術”三個部分,其中,“NLP概述與基礎處理”部分相較于以往的課程將會進行簡化,留更多的課時用來教授“NLP預訓練技術”,同時調整“NLP深度學習應用”部分的課程內容,讓深度學習部分的知識能夠更好地幫助學生銜接預訓練相關的知識內容。

教學團隊所設計的自然語言處理課程具體細節如表1所示。下面具體說明課程中各個具體細節的設計思路和設計目的。

(一)簡化理論課知識結構

簡化NLP基礎處理的知識內容,側重對深度學習與大語言模型相關技術的講解,著重從實用工具角度引導學生掌握NLP相關技術的使用思路與調優方法。在此之前,在自然語言處理的理論課教學中,教師通常會花費大量學時向學生講授NLP領域的基礎處理和一些基本任務。但在當前的新時代,深度學習和大語言模型已經成為幾乎所有NLP任務的首選方案。因此,從實際應用與項目實踐的角度來看,已經不適合再在課程中花費大量學時來講授NLP基礎處理和基礎任務等內容了。如表1所示,教學團隊嘗試對自然語言處理課程的理論課內容進行調整和設計,減少NLP基礎處理和基本任務等內容的課時數,回避NLP基礎處理中較為復雜的算法理論知識,將課程的重心放在深度學習與大語言模型相關技術方面。同時,在教授過程中著重引導學生以工具選型的方式挑選符合項目場景的NLP技術和相關工具。例如,在教學分詞處理時,減少關于詞典分詞、序列標注分詞等分詞方法的理論講授,通過對比jieba、PKUSeg、Stanford Segment等常用分詞工具及方法的優缺點,引導學生根據任務需求有取舍地選型。在教授序列標注時,簡化關于隱馬爾可夫模型[7]及LSTM(長短期記憶)+CRF深度模型等序列標注方法的原理講授,更多側重于對比傳統方法和深度學習方法的優缺點。教學團隊認為可以通過這種工具視角來教授學生根據實際項目選擇合適的方法,并對技術進行有效的優化,以此來培養學生的實踐能力和問題解決能力。

(二)重構實驗課實踐內容

從模型視角設計從文本分類到文本生成的深度模型的實現路徑,引導學生循序漸進地實現前文預測后文的文本生成模型。NLP課程的實驗課通常會要求學生通過動手編寫經典常用的深度模型來完成NLP任務,但這有較高的代碼能力門檻,因此在實際授課過程中,教師通常提供相關代碼給學生,讓學生進行簡單的數據復現實驗,而這明顯不符合鍛煉學生實踐能力的目的。針對這一問題,教學團隊通過對實驗課內容進行細致的整理分析,最終考慮從模型視角設計從文本分類到文本生成的深度模型的實現路徑,讓學生能夠循序漸進并完整地編寫出文本生成模型。具體而言,如表1所示,教學團隊按照模型逐步復雜化并最終導向文本生成模型的課程設計思路,設置了“文本分類實踐”“序列標注實踐”“文本生成實踐”3個實驗內容。其中,“文本分類實踐”通過簡單的分類任務引導學生實現諸如輸入序列數據序號化處理、輸出唯一分類結果等基本框架;“序列標注實踐”引導學生將序列標注過程看成不同時刻上的多次文本分類過程,從而可以在復用文本分類模型的輸入處理的基礎上,通過引入按時序輸出分類結果等內容的方式快速實現模型;“文本生成實踐”則進一步引導學生將文本生成模型也理解為分類模型,通過在序列標注模型基礎上調整標簽集的方式快速實現文本生成邏輯。圖1展示了上述循序漸進引導學生完成困難的文本生成深度模型的過程,即根據自然語言處理領域各任務常用深度模型的特點,通過復用之前的實踐結果的方式來盡可能減少各個實踐任務之間的跨度和代碼工作量,讓學生可以在有限時間內得到充分的實踐鍛煉,并最終獨立編寫出完整的文本生成深度模型,為后續大模型與預訓練相關內容提供教學基礎。

(三)設計相互對應的理論課內容與實驗課內容

通過案例驅動的方式鼓勵學生運用理論課知識提升實驗課上相關任務的完成效果,引導學生將理論課知識與相關實踐方法融會貫通。教學團隊以貫穿整個課程的幾個項目案例作為驅動,鼓勵學生靈活運用理論課上學習的技術和知識來不斷提升實踐效果,以此來促使學生更好地理解和融合理論課內容和實驗課內容。例如,如圖2所示,教學團隊以“新聞文本分類”作為驅動案例,在“NLP概述與基礎處理”的理論課上教授學生分詞方法、詞袋模型特征化等知識,實驗課則對應讓學生運用理論課知識對新聞文本進行分類。在“NLP深度學習應用”的理論課中講授文本分類的深度模型,在實驗課中則安排針對與之前一樣的新聞文本通過深度模型來執行分類處理,引導學生分析前后兩次處理的區別并對比兩次分類結果的優劣。在“NLP預訓練技術”的理論課中講授BERT[8]模型及其微調技術,實驗課則對應安排學生使用預訓練模型繼續對同樣的新聞文本進行分類處理并再次對比分析分類結果。在講授了大語言模型及其相關提示手法技術的理論課之后,讓學生設計提示文本[9]來使用大語言模型完成同樣的新聞文本分類任務。教學團隊認為可以通過這種方法,讓學生充分理解對同一個NLP任務可以采用多種不同的解決方案,并通過對比分析實踐結果,充分理解理論課所教授知識的優劣和選型邏輯,在動手實踐應用的過程中充分地鍛煉實踐能力。

三、結語

本文總結了教學團隊在對注重實踐能力培養的新時代本科自然語言處理課程進行教學改革時的思路和經驗:一是調整理論課知識結構,簡化NLP基礎處理的知識內容,側重對深度學習與大語言模型相關技術的講解,著重從實用工具角度引導學生掌握NLP相關技術的使用思路與調優方法;二是優化實驗課實踐內容,從模型視角設計從文本分類到文本生成的深度模型的實現路徑,引導學生由淺至深地逐步實現前文預測后文的文本生成模型;三是設計相互對應的理論課內容與實驗課內容,通過案例驅動的方式鼓勵學生通過理論課知識來提升實驗課上相關任務的完成效果,引導學生將理論課知識與相關實踐方法融會貫通。

目前上述課程改革舉措已經得到了實施和驗證。通過調整課程內容,自然語言處理課程主要包括三個部分,其中理論課部分包括如表1所示34學時的理論課授課部分與2學時的學生展示實踐成果部分,實驗課部分包括18學時的課內實踐部分,以及18學時的課外實踐部分。此外,教學團隊利用百度在線網絡技術(北京)有限公司所提供的飛槳AI Studio人工智能學習實訓社區平臺,首度讓學生能夠在線上平臺上完成人工智能課程的實驗內容,大幅減少了實驗過程中協調算力資源與環境部署的困難,讓學生能夠專注于實驗內容本身。教學團隊后續將嘗試將課程改革創新舉措有選擇地推廣到其他應用型人工智能專業課程,為其在大語言模型時代的課程建設提供思路與經驗。

[ 參 考 文 獻 ]

[1] 車萬翔, 竇志成, 馮巖松, 等.大模型時代的自然語言處理: 挑戰、機遇與發展[J]. 中國科學:信息科學,2023, 53(9):1645-1687.

[2] 張宜浩, 劉小洋.新工科背景下自然語言處理課程教學改革[J].計算機教育,2023(1):96-99.

[3] 高岳,楊小康.前沿導向的人工智能課程內容重構:以上海交通大學“人工智能理論及應用”課程為例[J].高等工程教育研究, 2022(6):52-55.

[4] 鄔昌興,羅國亮.深度學習背景下的“自然語言處理”課程教學研究[J].教育教學論壇,2021(29):137-140.

[5] 吾買爾,買買提,汪烈軍.基于人工智能技術的“自然語言處理”課程教學模式改革與探索[J].無線互聯科技,2020,17(10):92-94.

[6] HUANG Z H,XU W, YU K. Bidirectional LSTM?CRF models for sequence tagging [DB/OL].(2017-11-16)[2024-02-26].https://www.doc88.com/p?9929655991647.html.

[7] EDDY S R. Hidden Markov models[J].Current opinion in structural biology, 1996,6(3):361-365.

[8] DEVLIN J, CHANG M W, LEE K, et al. BERT: pre?training of deep bidirectional transformers for language understanding[DB/OL].[2024-02-26].https://arxiv.org/pdf/1810.04805.

[9] BROWN T B, MANN B, RYDER N, et al. Language models are few?shot learners[DB/OL].[2024-02-26].https://www.researchgate.net/publication/341724146_Language_Models_are_Few?Shot_Learners.

[責任編輯:周侯辰]

主站蜘蛛池模板: 国产精品v欧美| 国产精品尤物在线| 丁香婷婷激情网| 国产成人久视频免费| 99国产在线视频| 性视频一区| 国产精欧美一区二区三区| 福利姬国产精品一区在线| 国产鲁鲁视频在线观看| 一级做a爰片久久毛片毛片| 日韩毛片免费| 欧美色丁香| 亚洲成综合人影院在院播放| 午夜精品久久久久久久无码软件| 天天躁夜夜躁狠狠躁躁88| 久久综合色视频| 亚洲精品国产日韩无码AV永久免费网| 免费一级毛片在线播放傲雪网| 日韩a级片视频| www.国产福利| 国产在线视频自拍| 亚洲国产精品不卡在线| 日韩欧美国产综合| 114级毛片免费观看| 国产网站黄| 萌白酱国产一区二区| 国产在线一区二区视频| 怡春院欧美一区二区三区免费| 99re视频在线| 成人国产精品网站在线看| 国产综合欧美| 日韩精品一区二区三区免费在线观看| 亚洲区欧美区| 国产精品hd在线播放| 中文国产成人精品久久一| 尤物国产在线| 精品91视频| 亚洲人成网站色7777| 又猛又黄又爽无遮挡的视频网站| 亚洲欧美日韩另类在线一| 成人在线综合| 日韩精品久久无码中文字幕色欲| 亚洲中文无码av永久伊人| 日韩中文字幕亚洲无线码| 99国产精品免费观看视频| 中文字幕欧美日韩| 国产综合网站| 国产无人区一区二区三区| 成人精品午夜福利在线播放| 好吊日免费视频| 日本欧美视频在线观看| 久久77777| 日本欧美视频在线观看| 亚洲视频四区| 久久6免费视频| 中文字幕亚洲另类天堂| 亚洲AV无码乱码在线观看代蜜桃| 亚洲天堂高清| 亚洲日本中文字幕天堂网| 亚洲第一区精品日韩在线播放| 中文字幕亚洲专区第19页| 在线中文字幕日韩| 丰满人妻中出白浆| 精品亚洲国产成人AV| 国产成人综合网| 综合天天色| 欧美色视频日本| 国产亚洲高清视频| 国外欧美一区另类中文字幕| 国产日韩欧美一区二区三区在线| 久久国产精品麻豆系列| 欧美日韩一区二区在线免费观看| 亚洲天堂在线免费| 最新国语自产精品视频在| 国产成人精品在线1区| 国产精品美女网站| 国产最新无码专区在线| 尤物精品国产福利网站| 久久久久久久蜜桃| 全部免费毛片免费播放| 国内毛片视频| 韩日无码在线不卡|