楊慧
摘 要:在大數(shù)據(jù)時(shí)代背景下,各行各業(yè)都逐漸呈現(xiàn)出數(shù)據(jù)資本的現(xiàn)狀。但是,如何更好地處理大數(shù)據(jù)、應(yīng)用大數(shù)據(jù)卻成為世界范圍內(nèi)的共同難題,而作為與大數(shù)據(jù)最為緊密的領(lǐng)跑者——計(jì)算機(jī)專業(yè)被賦予眾望。故本研究從計(jì)算機(jī)專業(yè)的教學(xué)體系建設(shè)為契點(diǎn),希望從課程群、教學(xué)方法、教學(xué)模型等角度出發(fā),為高校的計(jì)算機(jī)專業(yè)在大數(shù)據(jù)處理方向的建設(shè)提供相關(guān)實(shí)證依據(jù)。
關(guān)鍵詞:計(jì)算機(jī)專業(yè) 大數(shù)據(jù)處理方向 教學(xué)體系 完善
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)12(c)-0038-02
在互聯(lián)網(wǎng)以及計(jì)算機(jī)科學(xué)快速發(fā)展的今天,每個(gè)行業(yè)都逐漸重視數(shù)據(jù)的觀測(cè)與分析,因?yàn)檫@些數(shù)據(jù)在一定程度上可以預(yù)測(cè)未該行業(yè)的走向,其中最為常見(jiàn)的就是我們?nèi)粘I钪杏玫降母黝愔荒苘浖鼈優(yōu)槭裁茨軌蛑牢覀儌€(gè)人的喜好呢?其很大程度上取決于后臺(tái)大數(shù)據(jù)的支持,我們?cè)谀硞€(gè)時(shí)刻瀏覽的網(wǎng)站及頻率均會(huì)產(chǎn)生記錄,累積到一定程度就會(huì)對(duì)我們的行為趨勢(shì)產(chǎn)生一定的了解。因此大數(shù)據(jù)處理一般包括數(shù)據(jù)收集、數(shù)據(jù)記錄、數(shù)據(jù)儲(chǔ)存、數(shù)據(jù)處理、產(chǎn)生導(dǎo)向結(jié)果等幾個(gè)方面。但是對(duì)于計(jì)算機(jī)專業(yè)的大數(shù)據(jù)處理方向的學(xué)生以及高校而言,如何建設(shè)教學(xué)體系才能培養(yǎng)出符合時(shí)代要求的數(shù)據(jù)分析師成為當(dāng)下最迫切解決的問(wèn)題。
1 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)概念
對(duì)于大數(shù)據(jù)的概念,目前世界范圍內(nèi)也沒(méi)有統(tǒng)一的定義,但是早在2008年《Science》雜志將大數(shù)據(jù)定義為“代表著人類認(rèn)知過(guò)程的進(jìn)步,數(shù)據(jù)集的規(guī)模是無(wú)法在可容忍的時(shí)間內(nèi)用目前的技術(shù)、方法和理論去獲取、管理、處理的數(shù)據(jù)。從以上的定義中不難看出大數(shù)據(jù)的內(nèi)容范圍非常之廣,并且對(duì)該數(shù)據(jù)的處理是一臺(tái)計(jì)算機(jī)所不能解決的,它的數(shù)據(jù)類型以及處理方式均遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)的范疇。
1.2 大數(shù)據(jù)應(yīng)用現(xiàn)狀
查閱文獻(xiàn)發(fā)現(xiàn)在美國(guó)針對(duì)醫(yī)療方面采取的大數(shù)據(jù)分析結(jié)果為整個(gè)行業(yè)增值3000億元的價(jià)值,并且他們將大數(shù)據(jù)這一新興技術(shù)產(chǎn)業(yè)廣泛應(yīng)用于空間站、航空航天、道路檢測(cè)等領(lǐng)域,其產(chǎn)生的價(jià)值是不可估量的。而在我國(guó),隨著近些年互聯(lián)網(wǎng)產(chǎn)業(yè)逐漸與大眾相接軌,大數(shù)據(jù)處理以及收集的必要性逐漸被重視,國(guó)內(nèi)已有的研究有針對(duì)消費(fèi)行業(yè)的,也有環(huán)境質(zhì)量監(jiān)測(cè)的,更值得一提的是,很多高校都逐漸開(kāi)設(shè)大數(shù)據(jù)收集與處理技術(shù)等具有針對(duì)性的專業(yè),這說(shuō)明我國(guó)的大數(shù)據(jù)處理技術(shù)已經(jīng)做好漸入佳境的準(zhǔn)備。
1.3 大數(shù)據(jù)處理技術(shù)
在大數(shù)據(jù)處理方面,具體分為以下幾個(gè)方面:(1)數(shù)據(jù)收集,在該領(lǐng)域,有WEKA、RapidMiner、Dryad、Pregel技術(shù),WEKA是開(kāi)源的集合大量承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,RapidMiner 可實(shí)現(xiàn)Excel、Access、Oracle等數(shù)據(jù)庫(kù)的訪問(wèn)。(2)數(shù)據(jù)儲(chǔ)存:Google 較早開(kāi)發(fā)了GFS,隨后基于Spanner 服務(wù)器的F1(fault tolerant distributed RDBMS)新型數(shù)據(jù)庫(kù)。微軟自行開(kāi)發(fā)的分布式計(jì)算平臺(tái)Cosmos,主要包括存儲(chǔ)系統(tǒng)、執(zhí)行環(huán)境、SCOPE(structured computations optimized for parallel execution),能夠存存儲(chǔ)和分析大數(shù)據(jù)集。
2 教學(xué)體系建設(shè)目標(biāo)以及思路
2.1 建設(shè)目標(biāo)
在我國(guó)當(dāng)前階段,雖然大數(shù)據(jù)的收集領(lǐng)域有很多,但是由于是一個(gè)新興的產(chǎn)業(yè),傳統(tǒng)的數(shù)據(jù)分析師已經(jīng)不能應(yīng)對(duì)當(dāng)下數(shù)據(jù)的處理要求,但是大數(shù)據(jù)的應(yīng)用領(lǐng)域之廣以及創(chuàng)新視角的變化又是非常快的。所以,筆者認(rèn)為在大數(shù)據(jù)時(shí)代背景下的數(shù)據(jù)處理分析人員不僅要能夠具備良好的善于收集、分析數(shù)據(jù)的能力,而且更為重要的是要具備將這些大數(shù)據(jù)背后的分析結(jié)果能夠很好的應(yīng)用到相應(yīng)的領(lǐng)域并使其差生最大價(jià)值。
2.2 建設(shè)思路
由于各行各業(yè)均有大數(shù)據(jù)的存在,并且每個(gè)領(lǐng)域的數(shù)據(jù)分析利用視角也均會(huì)產(chǎn)生較大的差異,因此換句話說(shuō)大數(shù)據(jù)分析這一行業(yè)是“魚(yú)龍混雜”的現(xiàn)象。但是作為培養(yǎng)大數(shù)據(jù)處理分析人員的高校或者組織單位,一定要有“追本溯源”的教學(xué)思路,所以無(wú)論在什么領(lǐng)域,都應(yīng)該教會(huì)學(xué)生會(huì)應(yīng)用最為基礎(chǔ)的數(shù)據(jù)分析技術(shù),并且要能夠培養(yǎng)學(xué)生善于具體問(wèn)題具體分析的敏銳度,能夠?qū)?shù)據(jù)應(yīng)用的大趨勢(shì)把握不會(huì)出錯(cuò)。因此,高校在培養(yǎng)學(xué)生的過(guò)程中,應(yīng)該注重計(jì)算機(jī)編程、數(shù)學(xué)、統(tǒng)計(jì)等方向的基礎(chǔ)類課程,在這一階段之后就是結(jié)合當(dāng)下的各個(gè)領(lǐng)域,讓學(xué)生們熟知在教育、生物科技、消費(fèi)等基礎(chǔ)領(lǐng)域視角的數(shù)據(jù)具體價(jià)值,以便在實(shí)際應(yīng)用的時(shí)候能夠有自己的思路。
3 教學(xué)體系建設(shè)內(nèi)容
3.1 基礎(chǔ)課程
對(duì)于計(jì)算機(jī)專業(yè)的學(xué)生來(lái)說(shuō),基礎(chǔ)類的課程無(wú)疑有數(shù)學(xué)課程和計(jì)算機(jī)課程等兩個(gè)主要方面。對(duì)于前者而言,其課程主要涉及到高等數(shù)學(xué)、數(shù)理統(tǒng)計(jì)、離散數(shù)學(xué)、概率論等基礎(chǔ)課程。因?yàn)樵趯?duì)大數(shù)據(jù)進(jìn)行挖取的過(guò)程中很多時(shí)候都會(huì)用到微積分、線性模型等數(shù)學(xué)知識(shí)。而對(duì)于后者而言,包括C語(yǔ)言、C++以及JAVA語(yǔ)言等,程序設(shè)計(jì)課程作為計(jì)算機(jī)專業(yè)的基礎(chǔ)課程,讓學(xué)生掌握解決問(wèn)題的算法和算法實(shí)現(xiàn)的具體過(guò)程是該類課程的主要目標(biāo)。
3.2 大數(shù)據(jù)方向課程
一般情況下大數(shù)據(jù)的處理有如下幾方面:(1)數(shù)據(jù)收集,在采集數(shù)據(jù)的過(guò)程中,當(dāng)下比較成熟的方法有爬蟲(chóng)、ETL工具等,需要分析人員將數(shù)據(jù)拔下來(lái)后能夠進(jìn)行相應(yīng)的分類處理。(2)數(shù)據(jù)儲(chǔ)存:在對(duì)大數(shù)據(jù)進(jìn)行儲(chǔ)存的過(guò)程中,比較常用的就是分布式存儲(chǔ),這樣做的好處就是能夠?yàn)楹罄m(xù)的分析任務(wù)節(jié)省很多的時(shí)間與精力。(3)數(shù)據(jù)分析與建模:因?yàn)橹挥写罅康臄?shù)據(jù)在收集之后才會(huì)產(chǎn)生價(jià)值,并且才會(huì)在一定程度提高準(zhǔn)確的趨向性。
3.3 大數(shù)據(jù)方向?qū)嵺`課程
每個(gè)專業(yè)都會(huì)面臨一個(gè)共通難題,就是理論與實(shí)踐的有效結(jié)合,因此對(duì)于數(shù)據(jù)分析這種實(shí)踐性特別強(qiáng)的專業(yè),更應(yīng)該提高學(xué)生的實(shí)踐能力,因此,在教學(xué)的硬件設(shè)施方面,高校應(yīng)該及時(shí)的為學(xué)生提供有效的實(shí)踐練習(xí)的實(shí)驗(yàn)室或者具體的數(shù)據(jù)分析處理實(shí)踐基地。
3.4 教學(xué)策略與方法
與其他的專業(yè)相比,大數(shù)據(jù)處理方向的計(jì)算機(jī)可能相對(duì)比較枯燥,所以在如何做到“寓教于樂(lè)”,則需要教育者和相關(guān)部門(mén)進(jìn)行相關(guān)思考。在筆者的調(diào)研和分析之后,學(xué)生都是存在很強(qiáng)的競(jìng)爭(zhēng)意識(shí),所以高校可以聯(lián)合有相同需求的高校定期舉行職業(yè)技能大賽等活動(dòng),可以在一定程度上激發(fā)學(xué)生自主學(xué)習(xí)和創(chuàng)造的能力,也能夠培養(yǎng)學(xué)生在團(tuán)隊(duì)活動(dòng)中的責(zé)任與擔(dān)當(dāng)。
此外,教學(xué)還應(yīng)當(dāng)與學(xué)生的實(shí)踐相掛鉤,可以采取學(xué)分制的方法,要求學(xué)生在每學(xué)年、甚至每學(xué)期都得具有一定的數(shù)據(jù)分析實(shí)踐,這樣可以督促學(xué)生及時(shí)的將自己學(xué)習(xí)的理論知識(shí)用到實(shí)際當(dāng)中,真正意義上做到學(xué)以致用。
4 結(jié)語(yǔ)
在大數(shù)據(jù)極速發(fā)展的今天,對(duì)計(jì)算機(jī)專業(yè)的數(shù)據(jù)處理學(xué)習(xí)者既提出了較高的挑戰(zhàn),但與此同時(shí)更多的是給予他們機(jī)遇,一個(gè)脫胎換骨、不斷完善自己的過(guò)程;希望本文所提出的教學(xué)體系建設(shè)能夠?yàn)檫@個(gè)蛻變的過(guò)程貢獻(xiàn)其力量。更希望計(jì)算機(jī)專業(yè)的教育者更能夠在自己的實(shí)踐道路上及時(shí)對(duì)該內(nèi)容做出有效調(diào)整。
參考文獻(xiàn)
[1] 趙曉娟.大數(shù)據(jù)時(shí)代計(jì)算機(jī)專業(yè)實(shí)驗(yàn)教學(xué)改革研究[J]. 電腦迷,2017(6):169.
[2] 李鴻健.大數(shù)據(jù)時(shí)代計(jì)算機(jī)專業(yè)實(shí)驗(yàn)教學(xué)改革研究[J]. 現(xiàn)代計(jì)算機(jī),2013(13):29-31.
[3] 謝志明.基于CDIO的云計(jì)算與大數(shù)據(jù)課程體系建設(shè)[J]. 計(jì)算機(jī)教育,2017(1):47-52.