羅世奇 田生偉

摘? 要 結(jié)合地方院校的特點(diǎn),發(fā)揮鄂東南地區(qū)的戰(zhàn)略地位與優(yōu)勢,在目前人工智能概論課程的基礎(chǔ)上,增加課程互動(dòng)環(huán)節(jié)、翻轉(zhuǎn)課堂,探索在新形勢下進(jìn)行自然語言處理項(xiàng)目式教學(xué),為數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的開展奠定堅(jiān)實(shí)的基礎(chǔ)。
關(guān)鍵詞 人工智能;自然語言處理;項(xiàng)目式教學(xué);大數(shù)據(jù)技術(shù)
中圖分類號:G642.0? ? 文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2020)04-0104-02
Introduction of Natural Language Processing Project Teaching Strategy//LUO Shiqi, TIAN Shengwei
Abstract This paper combines the characteristics of local colleges and universities to give play to the strategic position and advantages of the southeastern region of Hubei. On the basis of the current intro-duction to artificial intelligence, increase the interactive part of the?course, flip the classroom, explore the introduction of artificial inte-lligence and natural language processing project-based teaching in the new situation, and lay a solid foundation for the development of data science and big data technology.
Key words artificial intelligence; natural language processing; pro-ject-based teaching; big data technology
1 前言
隨著人工智能時(shí)代的發(fā)展,數(shù)據(jù)海量爆炸式增長。從20世紀(jì)中葉人工智能被提出,到現(xiàn)在的深度學(xué)習(xí)、知識圖譜、區(qū)塊鏈,人工智能技術(shù)經(jīng)歷了一系列的起伏。湖北理工學(xué)院于2018年申報(bào)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)獲批,從2018年9月開始,在全校范圍內(nèi)開設(shè)人工智能概論公選課,之后將繼續(xù)開設(shè)大數(shù)據(jù)概論公選課。人工智能人才培養(yǎng)已經(jīng)成為社會(huì)發(fā)展的趨勢。本文將探索項(xiàng)目式教學(xué),增加課程互動(dòng)環(huán)節(jié)、翻轉(zhuǎn)課堂,為企業(yè)培養(yǎng)“三用”(能用、好用、耐用)人才。
2 背景
湖北理工學(xué)院地處黃石市,是以工科為主,重點(diǎn)培養(yǎng)應(yīng)用型人才的省屬普通高等學(xué)校。學(xué)校設(shè)置“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)勢在必行。
2015年8月19日,國務(wù)院發(fā)布《關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》,提出信息技術(shù)與經(jīng)濟(jì)社會(huì)的交匯融合引發(fā)了數(shù)據(jù)迅猛增長,數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源。隨后的11月,中共中央十八屆五中全會(huì)提出國家大數(shù)據(jù)戰(zhàn)略,將大數(shù)據(jù)上升為國家戰(zhàn)略。我國在“十三五”規(guī)劃中提出:“實(shí)施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享。”2016年12月18日,工業(yè)和信息化部印發(fā)《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》,制定了“創(chuàng)新驅(qū)動(dòng)、應(yīng)用引領(lǐng)、開放共享、統(tǒng)籌協(xié)調(diào)、安全規(guī)范”的發(fā)展原則,全力推進(jìn)“中國制造2025”。在這樣的契機(jī)下,大數(shù)據(jù)領(lǐng)域必將迎來建設(shè)高峰和投資良機(jī)。
2016年9月,湖北省為貫徹落實(shí)《國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》,頒布《湖北省大數(shù)據(jù)發(fā)展行動(dòng)計(jì)劃(2016—2020年)》,該計(jì)劃就立足本省的固有優(yōu)勢,發(fā)展湖北省大數(shù)據(jù)產(chǎn)業(yè)的主要任務(wù)、推進(jìn)思路和發(fā)展目標(biāo)等方面提出明確要求。
2017年8月,湖北省黃石市政府發(fā)布《黃石市智慧城市建設(shè)“十三五”規(guī)劃》,規(guī)劃指出以推進(jìn)大數(shù)據(jù)建設(shè)、“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃為契機(jī),全面加強(qiáng)信息基礎(chǔ)設(shè)施建設(shè),加快推進(jìn)產(chǎn)業(yè)轉(zhuǎn)型升級,培育發(fā)展經(jīng)濟(jì)新動(dòng)能,不斷提高社會(huì)管理精度,主動(dòng)創(chuàng)新民生服務(wù)新模式,挖掘改革創(chuàng)新和融合發(fā)展的新潛力,打造創(chuàng)新驅(qū)動(dòng)和智能轉(zhuǎn)型新優(yōu)勢,全面實(shí)現(xiàn)“興業(yè)、惠民、善政”的目標(biāo),推動(dòng)全市經(jīng)濟(jì)和社會(huì)發(fā)展邁上新臺階。
從上文可以看出,發(fā)展大數(shù)據(jù)產(chǎn)業(yè)和培養(yǎng)大數(shù)據(jù)人才,不僅是國家的發(fā)展戰(zhàn)略選擇,而且是湖北省實(shí)現(xiàn)科學(xué)發(fā)展、轉(zhuǎn)型升級的必然選擇,還是黃石市實(shí)現(xiàn)跨越發(fā)展、后發(fā)趕超的有效途徑。截至目前,全國有250所高校開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè),湖北省開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)的高校有11所,分別是中國地質(zhì)大學(xué)(武漢)、武漢理工大學(xué)、武漢輕工大學(xué)、武漢工程科技學(xué)院、湖北大學(xué)、湖北工業(yè)大學(xué)、湖北工程學(xué)院、中南財(cái)經(jīng)政法大學(xué)、華中農(nóng)業(yè)大學(xué)、華中師范大學(xué)、武昌理工學(xué)院。可以看出,鄂東南地區(qū)沒有一所高校開設(shè)該專業(yè),武漢地區(qū)有10所高校開設(shè)該專業(yè),占總數(shù)的90%。2018年,湖北理工學(xué)院申報(bào)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)并獲得批準(zhǔn)。
3 項(xiàng)目式教學(xué)探究
應(yīng)用型本科院校不僅要培養(yǎng)學(xué)生扎實(shí)的理論知識,更重要的是培養(yǎng)學(xué)生的實(shí)踐動(dòng)手能力。理論是實(shí)踐的基礎(chǔ),實(shí)踐是理論的升華,扎實(shí)的實(shí)踐能力是學(xué)生就業(yè)強(qiáng)有力的保障,同時(shí)為企業(yè)培養(yǎng)“三用”人才也是高校的社會(huì)責(zé)任。通過項(xiàng)目式教學(xué),高校的專業(yè)/課程需要與時(shí)俱進(jìn),結(jié)合地方應(yīng)用特征,同時(shí)發(fā)揮學(xué)科優(yōu)勢。人工智能概論課程是“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)的基礎(chǔ),這門課程涵蓋了多學(xué)科的知識。人工智能概論研究領(lǐng)域廣泛,通過多學(xué)科技術(shù)的融合,能培養(yǎng)復(fù)合型人才。通過人工智能+X模式,結(jié)合其他學(xué)科的知識背景,運(yùn)用項(xiàng)目式教學(xué)的相關(guān)理論,達(dá)到活學(xué)活用的效果。
自然語言處理是研究計(jì)算機(jī)處理人類語言的一門技術(shù),包括分詞,詞性標(biāo)注,命名實(shí)體識別,實(shí)體關(guān)系抽取,句子/段落/篇章級別情感分析,地域、宗教、性別歧視識別,機(jī)器翻譯,信息檢索等研究領(lǐng)域。利用項(xiàng)目式教學(xué)研究人工智能+自然語言處理,主要是利用深度學(xué)習(xí)知識對自然語言文本進(jìn)行處理與分析。目前國內(nèi)研究比較好的高校有哈爾濱工業(yè)大學(xué)、清華大學(xué)、北京大學(xué)、中國科學(xué)院、蘇州大學(xué)、新疆大學(xué)等。地處“一帶一路”建設(shè)要點(diǎn)的新疆大學(xué),對于中亞語系的研究較深,主要涉及漢語、維吾爾語、哈薩克語、藏語、土耳其語等。通過參考這些領(lǐng)先院校的先進(jìn)經(jīng)驗(yàn),為項(xiàng)目式教學(xué)奠定堅(jiān)實(shí)的基礎(chǔ)。
首先,從網(wǎng)絡(luò)媒體中抽取相關(guān)的語料,建立相應(yīng)的語料信息。語料庫的構(gòu)建并不是一蹴而就,需要經(jīng)歷一個(gè)漫長的時(shí)間。結(jié)合地方語言構(gòu)建語料將是一個(gè)很好的選擇。2019年年初,學(xué)校公共文化研究中心隨州方言調(diào)查項(xiàng)目完成并通過驗(yàn)收。通過地方語言的研究,挖掘方言所承載的地方文化精髓,為建設(shè)湖北方言文化多媒體平臺、出版湖北語言資源集、保護(hù)與傳承湖北方言文化、建設(shè)國家語言資源庫作出新的貢獻(xiàn)。語料信息構(gòu)建完成之后進(jìn)行分詞,目前分詞工具眾多,代表性的有兩種。
1)語言云,以哈工大社會(huì)計(jì)算與信息檢索研究中心研發(fā)的語言技術(shù)平臺(LTP)為基礎(chǔ),為用戶提供高效精準(zhǔn)的中文自然語言處理云服務(wù)。
2)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),是中科院計(jì)算所研制的中文詞法分析系統(tǒng),2009年調(diào)整命名為NLPIR分詞系統(tǒng),主要功能包括中文分詞、詞性標(biāo)注、命名實(shí)體識別、新詞識別,同時(shí)支持用戶詞典,支持繁體中文,支持GBK、UTF-8、UTF-7、UNICODE等多種編碼格式。
如圖1~圖5所示,分詞之后,根據(jù)詞性以及句子成分對文本進(jìn)行實(shí)體關(guān)系抽取、詞頻統(tǒng)計(jì)分析、文本分類、情感分析等。
4 結(jié)語
本文通過項(xiàng)目式教學(xué)方法,剖析新形勢下人工智能概論課程同自然語言處理知識相結(jié)合的教學(xué)理念,相信具有地方特色的人工智能培養(yǎng)思路及培養(yǎng)模式改革,可面向地區(qū)經(jīng)濟(jì)發(fā)展構(gòu)建可持續(xù)的專業(yè)課程體系和培養(yǎng)體系,也必將對湖北理工學(xué)院應(yīng)用型人才培養(yǎng)產(chǎn)生深遠(yuǎn)意義及影響。
參考文獻(xiàn)
[1]黃美儀,陳長城,張立.培育面向人工智能大時(shí)代的創(chuàng)新人才:佛山市禪城區(qū)創(chuàng)新創(chuàng)客教育實(shí)踐探索[J].教育與裝備研究,2017(12):9-12.
[2]田生偉,于炯,帕里旦·吐爾遜,等.實(shí)踐教學(xué)在軟件工程專業(yè)教學(xué)中的改革與建設(shè)[J].中國教育技術(shù)裝備,2011(27):20-22.
[3]田生偉,于炯,帕力旦·吐爾遜,等.軟件工程創(chuàng)新創(chuàng)業(yè)實(shí)踐人才培養(yǎng)模式改革[J].中國教育技術(shù)裝備,2013(21):54-56.
[4]錢育蓉,于炯,王衛(wèi)源.產(chǎn)學(xué)研結(jié)合的軟件工程專業(yè)碩士研究生培養(yǎng)模式:以新疆大學(xué)軟件學(xué)院為例[J].教師,2014(17):22-24.
[5]賀文武,劉國買.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)核心課程建設(shè)的探索與研究[J].教育評論,2017(11):31-35.
[6]歐衛(wèi)華,夏道勛,等.“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)實(shí)踐教學(xué)體系構(gòu)建研究[J].軟件導(dǎo)刊,2018,17(5):107-109.
項(xiàng)目來源:湖北理工學(xué)院2019年校級教學(xué)研究項(xiàng)目(基金編號:2019C07);新疆維吾爾自治區(qū)科技人才培養(yǎng)項(xiàng)目“自治區(qū)重大教改項(xiàng)目:邊疆區(qū)域環(huán)境下的卓越軟件工程師培養(yǎng)模式研究”(基金編號:QN2016YX0051);湖北理工學(xué)院2019年度校級科研項(xiàng)目(19XJK03Y)。
作者:羅世奇,湖北理工學(xué)院,助教,研究方向?yàn)閻阂獯a(435003);田生偉,新疆大學(xué)軟件學(xué)院院長,教授,博士生導(dǎo)師,研究方向?yàn)樽匀徽Z言處理(830046)。