陳燕 郎坤 王聰
[摘 要] 針對管理類研究生大數(shù)據(jù)課程建設(shè)問題,從大數(shù)據(jù)課程內(nèi)容理論體系、課程內(nèi)容體系、課程實(shí)驗(yàn)與實(shí)踐體系、課程應(yīng)用工具與模型系統(tǒng)體系等角度考慮大數(shù)據(jù)課程的前驅(qū)和后繼,探討大數(shù)據(jù)課程建設(shè)內(nèi)容,對如何上好研究生大數(shù)據(jù)課程進(jìn)行探討,并提出合理建議。
[關(guān)鍵詞] 大數(shù)據(jù);課程體系建設(shè);管理類研究生
[基金項(xiàng)目] 中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助“航運(yùn)與綜合交通運(yùn)輸大數(shù)據(jù)關(guān)鍵技術(shù)與管理決策研究”(3132019353)
[作者簡介] 陳燕(1952—),女,遼寧大連人,博士,大連海事大學(xué)教授,博士生導(dǎo)師,研究方向:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘、大數(shù)據(jù)等。
[中圖分類號] G643? ? [文獻(xiàn)標(biāo)識碼] A? ? [文章編號] 1674-9324(2020)19-0275-02? ? [收稿日期] 2019-09-30
一、引言
隨著大數(shù)據(jù)的迅速發(fā)展,各高校逐年遞增大數(shù)據(jù)課程,迫使科學(xué)工作者不僅要了解大數(shù)據(jù)的概念、知識及如何分析處理大數(shù)據(jù),而且高校的學(xué)生也要及時補(bǔ)充大數(shù)據(jù)專業(yè)知識。據(jù)500強(qiáng)公司統(tǒng)計(jì)數(shù)據(jù),85%的公司都籌劃推出大數(shù)據(jù)項(xiàng)目。這也表明大數(shù)據(jù)課程開設(shè)的必要性。在國外多數(shù)高校都開設(shè)了大數(shù)據(jù)課程并針對大數(shù)據(jù)立項(xiàng)開展應(yīng)用研究。
二、本科大數(shù)據(jù)課程建設(shè)內(nèi)容
筆者曾提出關(guān)于本科大數(shù)據(jù)課程建設(shè)內(nèi)容包括:(1)大數(shù)據(jù)課程理論體系;(2)大數(shù)據(jù)課程內(nèi)容體系;(3)大數(shù)據(jù)課程的實(shí)驗(yàn)體系;(4)大數(shù)據(jù)的應(yīng)用工具與大數(shù)據(jù)課程的模型系統(tǒng)。本專業(yè)的學(xué)生可以根據(jù)大數(shù)據(jù)的前驅(qū)和后繼課程來選擇自己的課程內(nèi)容,具體內(nèi)容可參考《高校大數(shù)據(jù)課程內(nèi)容體系探討》等相關(guān)文獻(xiàn)。
三、研究生大數(shù)據(jù)課程建設(shè)內(nèi)容探討
(一)管理類研究生大數(shù)據(jù)課程內(nèi)容理論體系
將管理類研究生細(xì)分為:博士與碩士研究生,開設(shè)的研究生課程則在大數(shù)據(jù)課程的學(xué)識和難易程度作更細(xì)的規(guī)定,針對博士研究生,可以根據(jù)下述的前驅(qū)、后繼及大數(shù)據(jù)本身的課程,按照知識結(jié)構(gòu)及體系,選擇課程理論。因此,管理類研究生大數(shù)據(jù)課程理論體系總結(jié)為三部分。
1.前驅(qū)課程理論:高等數(shù)學(xué)理論、線性代數(shù)理論、多目標(biāo)優(yōu)化理論、高級統(tǒng)計(jì)學(xué)理論、計(jì)算機(jī)軟件與硬件理論、計(jì)算機(jī)組成原理理論、數(shù)據(jù)結(jié)構(gòu)建模理論、圖論、網(wǎng)絡(luò)理論、編碼理論、計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)理論、電子線路理論、有限自動機(jī)理論、信息集成與云存儲理論、數(shù)據(jù)庫高級管理理論、操作系統(tǒng)理論、多維信息組織與綜合管理理論、面向?qū)ο蟮母呒壵Z言程序設(shè)計(jì)方法與理論、綜合管理與群決策理論、多維數(shù)據(jù)建模理論與方法、非結(jié)構(gòu)化數(shù)據(jù)挖掘理論與方法等相關(guān)理論。
2.大數(shù)據(jù)課程理論:非結(jié)構(gòu)化異構(gòu)數(shù)據(jù)整合與標(biāo)準(zhǔn)化理論、非結(jié)構(gòu)化公共信息平臺建立機(jī)制與相關(guān)理論、機(jī)器學(xué)習(xí)與深度數(shù)據(jù)挖掘模型及相關(guān)理論、分布式并行計(jì)算理論與方法、編譯理論與方法、壓縮編碼理論與方法、非結(jié)構(gòu)化數(shù)據(jù)庫建立與壓縮存儲方法(如:圖數(shù)據(jù)庫、圖像存儲與壓縮數(shù)據(jù)庫、聲音與視頻壓縮及存儲、文本數(shù)據(jù)庫壓縮存儲等)相關(guān)理論。
3.后繼課程理論:非結(jié)構(gòu)化智能群決策支持系統(tǒng)建模理論、大數(shù)據(jù)開發(fā)工具與超網(wǎng)絡(luò)環(huán)境下深度挖掘理論及應(yīng)用、非結(jié)構(gòu)化超文本處理技術(shù)與應(yīng)用理論、一體化運(yùn)輸綜合監(jiān)控管理與智能群決策支持系統(tǒng)應(yīng)用理論、多維存儲技術(shù)與虛擬計(jì)算、以運(yùn)輸領(lǐng)域?yàn)橹鞯闹R圖譜理論方法及應(yīng)用研究、非結(jié)構(gòu)化數(shù)據(jù)庫建立理論方法及應(yīng)用研究、快速多維空間信息搜索引擎理論方法及應(yīng)用研究、大數(shù)據(jù)與城市計(jì)算理論及模型應(yīng)用研究、圖數(shù)據(jù)庫的關(guān)聯(lián)分析與知識發(fā)現(xiàn)模型及理論、圖像與視頻(聲音)分析模型與存儲理論應(yīng)用研究、物流等領(lǐng)域模擬與仿真理論與模型系統(tǒng)應(yīng)用研究等理論。
(二)管理類研究生大數(shù)據(jù)課程內(nèi)容體系
1.前驅(qū)課程教材:《高等數(shù)學(xué)》《計(jì)算機(jī)概論》《計(jì)算機(jī)原理》《線性代數(shù)》《高級統(tǒng)計(jì)學(xué)》《離散數(shù)學(xué)》《Office、JAVA編程》《面向?qū)ο蟪绦蛟O(shè)計(jì)》《信息科學(xué)相關(guān)課程》《數(shù)據(jù)結(jié)構(gòu)》《網(wǎng)絡(luò)與設(shè)計(jì)》《計(jì)算與方法》《信息檢索》《數(shù)據(jù)庫原理》《運(yùn)籌學(xué)》《模糊數(shù)學(xué)》《公共信息平臺建立方法》《軟計(jì)算》《數(shù)據(jù)倉庫建立方法》《編譯原理》《數(shù)據(jù)挖掘技術(shù)與應(yīng)用》《linux操作系統(tǒng)》《科學(xué)知識圖譜》。
2.大數(shù)據(jù)課程:大數(shù)據(jù)技術(shù)與應(yīng)用、文本挖掘、機(jī)器學(xué)習(xí)、深度挖掘模型系統(tǒng)。
3.后繼課程:大數(shù)據(jù)工具、架構(gòu)、平臺建立技術(shù)與方法,非結(jié)構(gòu)化異構(gòu)數(shù)據(jù)處理與模型應(yīng)用,交通運(yùn)輸大數(shù)據(jù)處理及模型應(yīng)用研究。
(三)管理類研究生大數(shù)據(jù)課程教學(xué)的實(shí)驗(yàn)與實(shí)踐體系
對于管理類研究生而言,最好在實(shí)驗(yàn)和實(shí)踐時,先熟練掌握建立數(shù)據(jù)庫的技術(shù)與方法,再掌握建立數(shù)據(jù)倉庫的技術(shù)與方法,然后進(jìn)行數(shù)據(jù)倉庫的數(shù)據(jù)挖掘,以及挖掘模型的建立等試驗(yàn)環(huán)節(jié),最后建立基于大數(shù)據(jù)公共信息平臺的數(shù)據(jù)挖掘與非結(jié)構(gòu)化數(shù)據(jù)分析模型系統(tǒng)。
大數(shù)據(jù)課程的實(shí)驗(yàn)體系的主要內(nèi)容有:(1)掌握一種面向某領(lǐng)域的搭建大數(shù)據(jù)試驗(yàn)系統(tǒng)和平臺的技術(shù)與方法;(2)具備安裝大數(shù)據(jù)應(yīng)用環(huán)境的細(xì)茸軟件,如:大數(shù)據(jù)環(huán)境下Hadoop軟件系統(tǒng)等相關(guān)運(yùn)行軟件系統(tǒng);(3)能夠運(yùn)用某一種自然語言處理軟件,如:提供一個簡單而強(qiáng)大的應(yīng)用接口,以提供全文索引與搜尋所用;(4)語言技術(shù)平臺(LTP)的應(yīng)用實(shí)踐,重點(diǎn)任務(wù)是掌握某自然語言翻譯的全過程,如(以英語為例):根據(jù)語法樹和實(shí)際語言正則表達(dá)式特點(diǎn),進(jìn)行語法分析然后切分字符去停用詞最后形成目標(biāo)句子。
(四)管理類研究生大數(shù)據(jù)的應(yīng)用工具與模型系統(tǒng)
1.管理類研究生大數(shù)據(jù)的應(yīng)用工具。前驅(qū)課程應(yīng)用工具:MATLAB、SPSS、SAP、C語言、JAVA、VB、OLAP、匯編語言程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)、計(jì)算軟件、模擬仿真軟件、DB2、VFP、DelphiI、Oracle、Access、mysql。
2.大數(shù)據(jù)應(yīng)用工具:Cloudera、MongoDB、Talend、OpenRefine、Datacleaner、Excel(MS)、RapidMiner、IBM SPSS Modeler、Teradata、Silk、chartio。
3.后繼課程應(yīng)用工具:Lunix、自然語言翻譯軟件、weka、Hadoop、R語言、python、Hive、Hbase、Hdfs、Storm、Flume、Scala等。Unix、Spss26升級版本、數(shù)據(jù)與數(shù)據(jù)可視化工具如SQL等、基于Sqoop、Flume、Qozie、Hue協(xié)同框架的應(yīng)用等、非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)與模型應(yīng)用、大數(shù)據(jù)相關(guān)項(xiàng)目研究。
4.管理類研究生大數(shù)據(jù)的模型系統(tǒng)。按照管理類研究生研究方向及內(nèi)容,將管理類研究生大數(shù)據(jù)的模型系統(tǒng)內(nèi)容歸納如下:預(yù)測模型系統(tǒng)、基于文本挖掘的相關(guān)推薦模型系統(tǒng)、最優(yōu)化模型系統(tǒng)、聚類與模糊聚類模型、快速發(fā)現(xiàn)知識相關(guān)算法、大數(shù)據(jù)的知識圖譜、大數(shù)據(jù)與城市計(jì)算等。
四、如何講好研究生大數(shù)據(jù)課程的探討
除了上述提到的大數(shù)據(jù)課程內(nèi)容理論、教材內(nèi)容、實(shí)驗(yàn)與實(shí)踐體系內(nèi)容要求外,還應(yīng)該根據(jù)每位研究生具體情況和實(shí)際能力因材施教。
(一)教材體系方面
1.基礎(chǔ)理論與技術(shù)體系教材包含大數(shù)據(jù)采集技術(shù)與理論、非結(jié)構(gòu)化數(shù)據(jù)整合與存儲技術(shù)及方法、大數(shù)據(jù)公共信息平臺建立技術(shù)與方法、搭建大數(shù)據(jù)架構(gòu)技術(shù)與方法等。
2.綜合管理類教材包含數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、大數(shù)據(jù)環(huán)境下數(shù)據(jù)庫與數(shù)據(jù)倉庫的建立技術(shù)方法、一體化運(yùn)輸環(huán)境下綜合管理與監(jiān)控管理決策方法、物流信息管理與決策、預(yù)測與決策支持系統(tǒng)、客貨運(yùn)量預(yù)測與決策分析等。
3.大數(shù)據(jù)模型系統(tǒng)教材內(nèi)容的選取在選擇其教材時,應(yīng)該注意該課程的覆蓋面是否滿足大數(shù)據(jù)課程內(nèi)容的要求。比如:某研究生具備信管專業(yè)基礎(chǔ),那么,應(yīng)該在數(shù)學(xué)建模方面多實(shí)踐優(yōu)化和非結(jié)構(gòu)化圖像處理等模型系統(tǒng);如果某研究生來自數(shù)學(xué)專業(yè)的,那么,應(yīng)該在計(jì)算機(jī)綜合信息管理與決策模型方面增加實(shí)踐環(huán)節(jié)。
(二)注重大數(shù)據(jù)的實(shí)驗(yàn)與實(shí)踐環(huán)節(jié)
大數(shù)據(jù)課程不能紙上談兵,是一門實(shí)踐性和理論性非常強(qiáng)的課程,因此,打鐵得自身硬,需要講授本課程教師具備強(qiáng)的實(shí)踐能力。本課程在教師的選拔上應(yīng)該符合如下的要求:(1)具備搭建大數(shù)據(jù)架構(gòu)的能力;(2)具備計(jì)算機(jī)多維數(shù)據(jù)組織與建模能力;(3)具備結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)建模、處理與決策分析能力;(4)具備高級語言程序設(shè)計(jì)基礎(chǔ)與實(shí)踐能力。
五、結(jié)語
本文在提出大數(shù)據(jù)課程相關(guān)要求的同時考慮到大數(shù)據(jù)課程的前驅(qū)和后繼,進(jìn)而完善了研究生大數(shù)據(jù)課程的建設(shè)體系,從而更系統(tǒng)地完成研究生教學(xué)。
參考文獻(xiàn)
[1]陳燕.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:清華大學(xué)出版社,2011.
[2]陳燕.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].大連:大連海事學(xué)院出版社,2006.
Discussion on the Construction of Big Data Course System for Graduate Students Majoring in Management
CHEN Yan, LANG Kun, WANG Cong
(School of Shipping Economics and Management, Dalian Maritime University,
Dalian, Liaoning 116026, China)
Abstract:Aiming at the construction of Big Data course system for graduate students majoring in management, this paper considers the preliminary and follow-up work of Big Data course from the aspects of course theory system, course content system, course experiment and practice system, course application tool and model system. It explores the course construction content and how to teach the course well, and puts forward reasonable suggestions.
Key words:Big Data; course system construction; graduate students majoring in management