
【摘? 要】通過 3年具體課堂教學(xué)實(shí)踐,深入探討大數(shù)據(jù)科學(xué)融入應(yīng)用統(tǒng)計(jì)學(xué)課堂教學(xué)促進(jìn)高級(jí)技能創(chuàng)新人才培養(yǎng)模式轉(zhuǎn)型,得到具有現(xiàn)實(shí)指導(dǎo)意義的經(jīng)驗(yàn)和方法,為應(yīng)用統(tǒng)計(jì)學(xué)本科教學(xué)中如何融于大數(shù)據(jù)科學(xué)提供科學(xué)依據(jù)、具體形式和方法。
【關(guān)鍵詞】大數(shù)據(jù)科學(xué);課堂教育;模式轉(zhuǎn)型
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)的規(guī)模、類型、結(jié)構(gòu)和增長速度發(fā)生質(zhì)的飛躍,大數(shù)據(jù)科學(xué)主要研究應(yīng)用計(jì)算機(jī)科學(xué)技術(shù)進(jìn)行大數(shù)據(jù)處理、分析和預(yù)測,解決工程、社會(huì)等領(lǐng)域?qū)嶋H問題,應(yīng)用統(tǒng)計(jì)學(xué)作為大數(shù)據(jù)平臺(tái)最核心的科學(xué)之一,是大數(shù)據(jù)時(shí)代最重要的基礎(chǔ)學(xué)科專業(yè)[1]。
我校當(dāng)前應(yīng)用統(tǒng)計(jì)學(xué)課堂教育模式已無法適應(yīng)大數(shù)據(jù)科學(xué)發(fā)展對(duì)人才的需求,存在偏理論傳授、重學(xué)術(shù)引導(dǎo),而輕技能的形成和實(shí)踐能力的培養(yǎng),特別是重知識(shí)傳授和技能模仿、輕知識(shí)創(chuàng)新和技能形成,嚴(yán)重阻礙我校應(yīng)用統(tǒng)計(jì)高級(jí)技能創(chuàng)新人才培養(yǎng)。針對(duì)應(yīng)用統(tǒng)計(jì)學(xué)課堂教學(xué)的現(xiàn)狀,于2018年申報(bào)教學(xué)改革項(xiàng)目“進(jìn)行大數(shù)據(jù)科學(xué)融入應(yīng)用統(tǒng)計(jì)學(xué)課堂教學(xué)促進(jìn)高級(jí)技能創(chuàng)新人才培養(yǎng)模式轉(zhuǎn)型”的研究,[2]通過研究發(fā)現(xiàn)大數(shù)據(jù)技術(shù)的主要數(shù)學(xué)基礎(chǔ)知識(shí)包含概率論與數(shù)理統(tǒng)計(jì)、線性代數(shù)、最優(yōu)化方法和離散數(shù)學(xué)等。
首先,概率論與數(shù)理統(tǒng)計(jì)與大數(shù)據(jù)技術(shù)開發(fā)的關(guān)系最為密切,條件概率、獨(dú)立性等基本概念、隨機(jī)變量及其分布、多維隨機(jī)變量及其分布、方差分析及回歸分析、隨機(jī)過程(特別是Markov)、參數(shù)估計(jì)、Bayes理論等在大數(shù)據(jù)建模、挖掘中占有重要地位。大數(shù)據(jù)具有天然的高維特征,在高維空間中進(jìn)行數(shù)據(jù)模型的設(shè)計(jì)分析就需要一定的多維隨機(jī)變量及其分布方面的基礎(chǔ)。Bayes定理更是分類器構(gòu)建的基礎(chǔ)之一。特別是條件隨機(jī)場CRF、隱Markov模型、n-gram等在大數(shù)據(jù)分析中可用于對(duì)詞匯、文本的分析,可以用于構(gòu)建預(yù)測分類模型。以概率論為基礎(chǔ)的信息論里面的信息增益、互信息等特征分析的方法在大數(shù)據(jù)分析中也有非常重要的作用。
其次,線性代數(shù)知識(shí)與大數(shù)據(jù)技術(shù)開發(fā)的關(guān)系也很密切,矩陣、轉(zhuǎn)置、秩?分塊矩陣、向量、正交矩陣、向量空間、特征值與特征向量等在大數(shù)據(jù)建模、分析中也是常用的技術(shù)手段。特別是在互聯(lián)網(wǎng)大數(shù)據(jù)中,許多應(yīng)用場景的分析對(duì)象都可以抽象成為矩陣表示,大量Web頁面及其關(guān)系、微博用戶及其關(guān)系、文本集中文本與詞匯的關(guān)系等等都可以用矩陣表示。以矩陣為基礎(chǔ)的各種運(yùn)算,如矩陣分解則是分析對(duì)象特征提取的途徑,因?yàn)榫仃嚧砹四撤N變換或映射,因此分解后得到的矩陣就代表了分析對(duì)象在新空間中的一些新特征。所以,奇異值分解SVD、PCA、NMF、MF等在大數(shù)據(jù)分析中的應(yīng)用非常廣泛。
第三,最優(yōu)化方法為大數(shù)據(jù)模型求解提供了多種途徑,通常是基于微分、導(dǎo)數(shù)的優(yōu)化方法,例如梯度下降、爬山法、最小二乘法、共軛分布法等。
第四,離散數(shù)學(xué)是所有計(jì)算機(jī)科學(xué)分支的基礎(chǔ),其中計(jì)算機(jī)課程中的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫、算法設(shè)計(jì)與分析、又是能夠進(jìn)行大數(shù)據(jù)分析和處理的基礎(chǔ)。
由以上分析培養(yǎng)計(jì)劃我們確定在如下課程中融入大數(shù)據(jù)技術(shù)科學(xué):
1《統(tǒng)計(jì)計(jì)算及應(yīng)用軟件》學(xué)分1.5,實(shí)驗(yàn)0.5學(xué)分,融合R語言進(jìn)行數(shù)據(jù)處理,Python完成網(wǎng)絡(luò)爬蟲和微信機(jī)器人應(yīng)用
2《概率統(tǒng)計(jì)》學(xué)分5,融合大數(shù)據(jù)與概統(tǒng)、概統(tǒng)與R的關(guān)系
3《統(tǒng)計(jì)學(xué)導(dǎo)論》學(xué)分2.5,實(shí)驗(yàn)0.5學(xué)分,融合大數(shù)據(jù)的統(tǒng)計(jì)假設(shè)檢驗(yàn)
4《運(yùn)籌學(xué)》學(xué)分2,課程設(shè)計(jì)2學(xué)分,融合大數(shù)據(jù)最優(yōu)化求解案例
5《回歸分析》學(xué)分2,融合最小二乘法應(yīng)用及行列式、矩陣的運(yùn)算、特征分解、奇異值分解
6《多元統(tǒng)計(jì)分析》學(xué)分2,課程設(shè)計(jì)1學(xué)分,融合大數(shù)據(jù)高維特征建模及非線性模型求解,仿真案例
7《時(shí)間序列分析》學(xué)分2,課程設(shè)計(jì)2學(xué)分,融合具有時(shí)間序列特征的大數(shù)據(jù)應(yīng)用對(duì)現(xiàn)狀分析及預(yù)測
8《數(shù)據(jù)分析與處理》學(xué)分2,融合大規(guī)模數(shù)據(jù)存儲(chǔ)和處理,并行運(yùn)算及云計(jì)算,高維矩陣奇異值分解方法
9《抽樣調(diào)查技術(shù)與應(yīng)用》學(xué)分2,課程設(shè)計(jì)2學(xué)分,融合大數(shù)據(jù)抽樣方法的基本原理和應(yīng)用案例分析
10《統(tǒng)計(jì)預(yù)測和決策》學(xué)分2,課程設(shè)計(jì)2學(xué)分,融合向量機(jī)和神經(jīng)網(wǎng)絡(luò)基礎(chǔ)理論及預(yù)測模型案例分析
11《統(tǒng)計(jì)建模》學(xué)分2,課程設(shè)計(jì)2學(xué)分,融合大數(shù)據(jù)處理核心統(tǒng)計(jì)模型簡介及案例分析
根據(jù)大數(shù)據(jù)技術(shù)發(fā)展現(xiàn)狀和應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)發(fā)展需要,2021級(jí)培養(yǎng)計(jì)劃新增大數(shù)據(jù)科學(xué)創(chuàng)新實(shí)踐課組,課程如下:
基于以上應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)基礎(chǔ)、核心課程及創(chuàng)新模塊融于大數(shù)據(jù)科學(xué)以外還需要在數(shù)學(xué)基礎(chǔ)理論課程中添加大數(shù)據(jù)科學(xué)所需的矩陣論、離散數(shù)學(xué)和科學(xué)計(jì)算方面的基礎(chǔ)知識(shí)。
經(jīng)過我們專業(yè)的老師們深入研究和實(shí)踐,大數(shù)據(jù)科學(xué)融于課堂教學(xué)是可行的,未來我們將努力拓展專業(yè)方向,把應(yīng)用統(tǒng)計(jì)學(xué)發(fā)展成為能夠讓學(xué)生成為大數(shù)據(jù)時(shí)代社會(huì)所需要的高級(jí)技能創(chuàng)新人才,完成培養(yǎng)模式轉(zhuǎn)型。
參考文獻(xiàn):
[1]雷俊麗,張良均.大數(shù)據(jù)數(shù)學(xué)基礎(chǔ)[M].人民郵電出版社,2019.3
[2]中科普開.大數(shù)據(jù)技術(shù)基礎(chǔ)[M].清華大學(xué)出版社,2016.6
作者簡介:
柏宏斌(1970.03-)男,漢族,四川南充,碩士,黨員,副教授,主要從事數(shù)據(jù)分析與處理研究。
四川輕化工大學(xué)教學(xué)改革項(xiàng)目編號(hào):JG-1802