999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據專業課程教學改革探索

2021-11-28 01:27:51戴培山范敏
電腦知識與技術 2021年30期

戴培山 范敏

摘要:R語言數據分析編程課程是數據科學與大數據技術專業的重要專業課程,大數據專業及其相關課程建設尚處于探索階段。以《R語言數據分析編程》為例分析了大數據專業教學中存在的問題。并針對存在的問題,提出了相應的解決方案,包括建立完善的課程教學資源,突出實踐環節在人才培養中的重要作用,利用競賽提高學有余力同學的數據分析能力和綜合素質。

關鍵詞:大數據專業課程;課程教學資源;實踐環節;數據分析競賽

中圖分類號:TP311? ? ? ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)30-0191-03

開放科學(資源服務)標識碼(OSID):

Exploration on Teaching Reform of Big Data Major—Data Analysis Programming With R

DAI Pei-shan1, FAN Min2*

(1. School of Computer Science and Engineering, Central South University, Changsha 410083, China; 2. School of Social Development and Management, Hunan Womens University, Changsha 410083, China)

Abstract: The course of data analysis programming with R is an important professional course for data science and big data technology major, and the construction of big data major and its related courses is still in the exploratory stage. This paper takes the course of data analysis programming with R as an example to analyze the existing problems in the teaching of big data major. In view of the existing problems, this paper puts forward the corresponding solutions, including the establishment of perfect teaching resources, highlighting the important role of practice in personnel training, and using the competition to improve the data analysis ability and comprehensive quality of the students who are willing to learn.

Key words: big data professional course; course teaching resources; practice link; data analysis competition

隨著數據獲取技術的飛速發展,數據處理在國民經濟和生產生活中起著越來越重要的作用。應運而生的數據科學與大數據技術專業旨在培養具有大數據思維、運用大數據思維及分析應用技術的高層次大數據人才[1-2]。中南大學是全國第一批開設數據科學與大數據技術專業的高校。該專業從2016年獲批以來,教育教學和人才培養還處于探索階段,對該專業相關課程的教育教學改革具有重要的意義。數據分析知識與技能是該專業的基本知識和能力要求,《R語言數據分析編程》課程是數據分析知識與技能訓練的重要載體。據我們所知,我校《R語言數據分析編程》課程是全國唯一將R語言與數據分析編程結合起來的一門課程。該課程教學體系的建立需要不斷進行探索和實踐。數據分析技能的培養需要在實踐中培養,實踐環節和授課環節具有同等重要的作用。因此,探討了《R語言數據分析編程》課程的教學實踐新方法。

1 國內外研究現狀

R是一個優秀的數據分析和制圖的軟件環境。R語言在國際和國內的發展現狀差異非常大,國際上R語言已然是專業數據分析領域的標準,但在國內R語言的應用領域還比較小眾[3-7]。造成這種情況的原因是多方面,這與版權意識,語言障礙,國際交流,知識普及等都有關。國外在R語言方面有大量的教學視頻和教學書籍可供使用。經典書籍有《R語言實戰》,《R語言編程藝術》,《數據挖掘與R語言》和《機器學習:實用案例解析》等。Coursera等慕課系統中也有許多R相關的在線課程。而國內高水平的教材和教學資源非常少,代表性的有薛毅的《統計建模與R軟件》和《R語言實用教程》,其他R語言數據分析的視頻主要源于收費不菲的線上或線下培訓班。

2 教學方法的改革

從國內外R語言教學的發展現狀來看主要存在兩大問題:

(1)大多數的R語言課程以介紹R語言語法結構為主,與R語言的強大數據分析功能特點脫節。由于該課程開設在大二和大三年級,在學R語言類課程之前會學習C語言,C++和Java等編程語言課程,因此會造成學生在學R語言編程知識時興趣缺乏。

(2)R語言教學以上課講授為主,實踐環節薄弱。從數據科學與大數據技術專業角度來看《R語言數據分析編程》應該是理論與實踐緊密結合的一門課程。新知識和新技術的飛速發展,導致各個專業課程越來越多,一個結果是各門課程的課時大幅壓縮。導致在課程教學中由于課時的限制,實踐環節往往被壓縮甚至忽略。R語言的學習曲線是比較陡峭的,入門難。僅憑課堂講授很難融會貫通的將其應用于數據分析與處理。

針對以上的問題,采取了如下教學改革措施:

1)制作了完整的《R語言數據分析編程》課程教學課件,填補了該課程教學課件的空白。教學課件章節明確,層次清晰。數據科學與大數據技術專業的核心技能是數據分析技能。根據這一專業特點,在教學課件制作過程中始終將R語言語法知識與實際的數據處理問題緊密相連,做到理論與實踐相結合。制作課件內容包括基本的數據集建立管理和圖形繪制,還包括統計分析技術介紹,以及數據分析中常用的機器學習算法。

2)制作了針對各個章節內容的源代碼資源。R語言集成開發環境RStudio有一個非常好的功能就是在代碼區域,只要按一個按鈕代碼就可以自動執行一條語句,光標選中一個語句片段后,就可以直接運行該語句片段。這種功能非常適合課堂演示代碼的運行過程。針對每一個章節的數據處理實例,制作各章節教學內容的源代碼資源,供教學演示和學生課下實踐使用。

3)在課程教學過程中,緊密結合大數據與數據科學專業的特點,始終圍繞數據分析這個核心任務,將R語言的語法結構知識與數據分析案例相結合,增加教學案例。首先,將數據分析的各個環節按照先后次序進行模塊化分析,將數據處理的整個過程分為數據采集和創建,數據集管理,數據的分析和數據可視化四個環節。教學過程緊扣數據處理的四個環節展開,教學過程中知識的講授和數據處理的演示操作穿插進行,促進學生理論與實踐的結合。

這里以R語言進行基本的數據可視化為例來說明案例教學的實施過程。之所以選擇數據可視化(圖形的繪制)為例是因為在數據分析和處理的過程中一圖勝千言,而R語言具有非常強大的繪圖和數據可視化功能。在介紹本部分的內容的時候,首先,介紹R語言中四種圖形系統,分別介紹他們的發展歷史,優缺點。使同學們對于R語言數據可視化有一個宏觀的了解。然后,聚焦到基礎圖形的繪制,對圖形的繪制離不開數據,要有一個使用的數據集,數據集的選取也要遵循:1)數據集要滿足展示數據可視化知識的數據特性;2)數據集不能太大,容易獲取;3)學生對數據集的信息比較熟悉。滿足這樣的基本條件才能使學習將主要的精力集中在數據可視化的方法上。這里選取R語言自帶的數據集mtcars。該數據是從1974年美國汽車趨勢雜志中提取的,包括燃油消耗和32輛汽車(1973-74型)的汽車設計和性能的11個指標。本次實驗用的指標是:車身重量(wt)與油耗(mpg)。接下,來給同學們展示一幅包含本章節課程主要知識點的數據可視化的結果圖片,啟發同學們根據圖片分析在數據可視化中包含的基本元素,主要有:點和線,坐標軸,題注,文本,圖例和數學公式等。這些元素又有線條特征和顏色等參數。在分析完數據可視化的基本元素后,需要了解一下數據的結構和內容??梢栽赗Studio平臺運行以下代碼進行數據結構和內容的查看,以及繪制帶連線的散點圖。然而,這樣繪制出來的線條是雜亂的,并不是我們預期的結果。接下來就可以引導學生思考出現這種情況的原因。

問題出在哪里?因為圖中的第一個點可能并不在wt軸的最左邊,如果第二個點的wt軸比第一個點的值大,那么就會出現線條由左往右畫的情況,造成線條交叉。解決的辦法是將mtcars數據框按照wt的值從小到大重新排序。代碼如下:

mymtcars<-mtcars[order(mtcars[,6]),]

plot(mymtcars$wt, mymtcars$mpg, type="b")

后面再以以上的繪圖為基礎,進一步擴展。可以改變線條和點的類型和顏色,這樣的代碼在課堂上直接演示并實施觀看運行結果,可以提高學生學習的興趣,避免課程講授模式與C語言,C++和Java等編程語言課程類似的教學模式造成的學生學習興趣缺乏。改變上圖繪制的折線顏色為彩虹色。首先,設置彩虹色的顏色數目為n= 6,調用rainbow(n)函數生成彩虹色。在繪制圖像時,col=mycolors參數引入剛生成的彩虹色。其他設置不變(其線條類型為點線,寬度為默認寬度的5倍,點的符號為空心六邊形,大小為默認符號大小的2倍)。

為提高學生的學習參與度,在授課的過程中要求學生分小組重復老師上課講解示例的代碼,加深體會。另外,在授課過程中還會穿插課堂測驗,了解學生學習效果。在本章節的授課過程中,課堂測驗的題目主要設計在圖形上數學公式的顯示和圖形的組合函數layout()函數的用法。主要原因是這兩個知識點比較抽象,通過實例和課堂測驗的雙重刺激加深學生對這兩個知識點的理解,學會靈活運用。

4)建立實踐教學云平臺,使學生在學習了理論知識后,可以在實踐平臺上及時運用自己所學的知識解決數據分析問題,提高知識的掌握和運用。在線實驗云平臺解決了實驗環境的限制,可以不用固定時間地點。實現實驗批改自動化,可以實時反饋實驗結果,存檔查詢方便,批改結果客觀,減少教師重復勞動。構建的云平臺實踐教學系統對每一章節都設計了大量緊扣教學內容代碼實踐題目,題目做完后,系統會根據學生提交結果自動批改。

例如聚類分析這一章中對于生成的二維坐標數據和鳶尾花數據集分別進行了層次聚類和K-means聚類的實踐教學。在生成二維坐標進行聚類中,利用引導和提示語句讓學生逐步完成聚類的整個過程。這里僅以生成數據為例做一下說明。

生成數據點:這里生成12個二維點, 這12個點中前4個的距離較近,中間四個的聚類較近,最后4個的聚類較近. 并繪制出這12個點在二維平面的分布圖。

在mycluster.R腳本里追加以下代碼:

1.(? ? )#生成數據點

2. (? )#設置圖像邊緣距離

3.(? ?)#數據點的x軸由正態分布產生12個隨機數,前四個數的均值為1,

#接下來四個數的均值為2,最后四個數的均值為3,方差都為0.2

4.(? ? ? )? #數據點的y軸由正態分布產生12個隨機數,前四個數的均值為1,

#接下來四個數的均值為2,最后四個數的均值為1,方差都為0.2

5.(? ? ? )#繪制x與y關系的散點圖

6.(? ? ?)#給個點加上標號

檢測條件: 檢測在RStudio控制臺是否有如下代碼的輸入:

1.( set.seed(1234)? );2.(par(mar = c(2, 2, 2, 2))? ?);3.(x <- rnorm(12, mean = rep(1:3, each = 4), sd = 0.2)? ?);4.(y <- rnorm(12, mean = rep(c(1, 2, 1), each = 4), sd = 0.2)? ?):5.(? plot(x, y, col = "blue", pch = 19, cex = 2)? );6.(? text(x + 0.05, y + 0.05, labels = as.character(1:12))? )

5)精心設計課程實驗。本課程有兩個課程實驗。其中之一為基于R語言機器學習算法的鳶尾花數據分析。實驗對鳶尾花數據各個特征的相關性進行分析,接下來實驗幾種常用的機器學習算法對該數據進行分類的效果,最后選出分類效果較好的方法。通過該實驗使學生理解觀察和分析數據的過程,學會使用常見的機器學習方法(如線性判別分析(LDA),分類和回歸樹(CART),k-最近鄰居(kNN),帶有線性內核的支持向量機(SVM),隨機森林(RF)和人工神經網絡)進行鳶尾花數據的分類,并評判分類效果。

6) 對學有余力的同學,以競賽帶動學生創新精神。國內外已經有一些著名的數據分析競賽平臺,參與其中的競賽可以極大的提高學生學時的積極性和主動性。國外著名的平臺有Kaggle(https://www.kaggle.com/),阿里的天池大數據科研平臺,數據城堡(DataCastle大數據競賽平臺)等。

大數據專業是新興專業,在專業的發展過程中,需要不斷地進行探索,鑒于該專業直接面向國民生產生活,學生專業技能的培養需要通過大量的數據處理訓練完成。通過以上教學改革措施的實施,突出了課程實踐環節的重要性,利用線上實驗項目解決課時限制與實踐環節需要加強之間的矛盾。因材施教,利用競賽提高學有余力同學的數據分析能力和綜合素質。

參考文獻:

[1] 周黎鳴,林英豪,李征,等.新工科背景下大數據專業課程建設[J].計算機時代,2021(1):102-105.

[2] 王元卓,隋京言.應用型大數據人才培養[J].高等工程教育研究,2021(1):44-49.

[3] 陽紅英.案例教學在《數據挖掘與R語言》課程教學中實踐與思考[J].中國多媒體與網絡教學學報(上旬刊),2020(8):106-107.

[4] 商豪.淺議本科教學中R語言的教學模式[J].理科愛好者(教育教學),2018(12):23,49.

[5] 柯朝甫.醫學本科生R語言教學初探[J].教育現代化,2018,5(48):233-234,245.

[6] 巴音達拉.淺談R語言在高等學校教學當中的重要性[J].教育教學論壇,2018(7):252-253.

[7] 郭念國.大數據時代R語言模擬在概率統計課程教學中的應用[J].河南教育(高教),2017(12):80-81.

【通聯編輯:唐一東】

主站蜘蛛池模板: 久久无码av三级| 亚洲一区二区黄色| 性视频一区| 72种姿势欧美久久久大黄蕉| 91色在线观看| 国产人碰人摸人爱免费视频| 天天综合网色| 98精品全国免费观看视频| 一级毛片网| 国内精品小视频在线| 久久77777| 99视频精品在线观看| 国产男女免费视频| 老熟妇喷水一区二区三区| 亚洲成人网在线观看| 67194成是人免费无码| 欧美全免费aaaaaa特黄在线| 亚洲精品无码久久毛片波多野吉| аv天堂最新中文在线| 97se亚洲| 伊人久久福利中文字幕| 精品福利国产| www亚洲天堂| 一本色道久久88| 久久这里只精品国产99热8| 亚洲第一成年网| 欧美日韩国产系列在线观看| 亚洲成a人在线观看| 国产一区二区色淫影院| 中文字幕永久视频| 亚洲国产精品日韩欧美一区| 国产精品蜜臀| 国产精品久久久精品三级| 男女性色大片免费网站| 亚洲AV成人一区二区三区AV| 中文精品久久久久国产网址 | 亚洲国产精品一区二区第一页免 | 国内精品伊人久久久久7777人| 先锋资源久久| 欧美日韩综合网| 国产不卡国语在线| 永久免费av网站可以直接看的| 亚洲无码视频一区二区三区 | 国产精品香蕉在线观看不卡| 五月天天天色| 色婷婷成人| 亚洲精品欧美日本中文字幕| 日本三级欧美三级| 日韩精品一区二区深田咏美| 亚洲一级色| 国产精品护士| 亚洲第一综合天堂另类专| 中文毛片无遮挡播放免费| 中日无码在线观看| 伊人久综合| 亚洲香蕉在线| 国产麻豆va精品视频| 国产欧美高清| 激情国产精品一区| 色噜噜在线观看| 亚洲性网站| 亚洲国产精品日韩欧美一区| 色AV色 综合网站| 91口爆吞精国产对白第三集| 国产免费羞羞视频| 国产成人精品无码一区二| 婷五月综合| 日韩二区三区无| 日本精品视频| 亚州AV秘 一区二区三区| 久久公开视频| 高清无码一本到东京热| 国产永久在线观看| 欧美激情网址| 欧美天堂在线| 亚洲伊人久久精品影院| 青草视频免费在线观看| 亚洲天堂区| 四虎影视国产精品| 国产成人综合日韩精品无码不卡| 亚洲男人天堂久久| 国产人人射|