李政忙 歐陽勝
摘 要:互聯網將數據師專業效用發揮到最大的領域,因互聯網自身具有的信息顯示及存儲獨特性能夠非常有效的為數據師起到輔助作用。而今,互聯網行業已經逐漸覆蓋了許多產業,這也就使得數據師的培養更加緊急和重要。但是觀察現有的數據分析教育成果會發現,因教學方案上的部分欠缺使得成果的質量非常的有限。那么為了盡快實現教學改革,本文就以《數據處理技術與SPSS》這門課程作為主體,簡單分析數據時代下的教學改革。
關鍵詞:大數據時代;數據處理技術;教學改革
中圖分類號:G642 文獻標識碼:A 文章編號:2095-7866 (2017) 04-056-05
引言
隨著互聯網技術的普遍發展,大數據也被廣泛應用起來,通過用SPSS軟件對這些數據進行相關性分析,利用SPSS軟件輸出的數據結果來分析這些數據之間的關系,并且用于解決實際問題。因此,如何利用“大數據”處理技術和SPSS實驗課程相結合,以激發學生對數據處理與分析技術的興趣,是我們在教學過程中不得不思考的問題。
一、大數據時代下數據分析的特點
(一)數據不會拓展分析
就整合數據表面看來,數據本身是一連串的數字或字母的組合體,它只是起到一個記錄的作用,而想要發揮數字整合作用,就要依賴于有一定依據的計算過程所得出的結果。換句話說就是如果沒有途徑對數據進行一些作用力,那么數據本身就沒有任何的拓展效用。雖然事實是這樣,但數據的完整性對拓建計算的結果正確與否有著決定性的作用。計算是數學思維的立體展現,那么同理思維的運作也需要建立在事實可靠的前提下才能夠運行思考流程[1]。當進行數據的區間抽查工作時一旦選取的區間內數據存在嚴重的誤差或數據斷層時,系統得出的結果就也一定存在著改變根本規律的偏差。
(二)數據分析過程復雜
就計算過程而言,數據的處理過程會消耗掉許多不必要的時間和精力。這里的“不必要”指的就是那些需要重復標出用同種計算方法頻繁運算的數據組合,那么在數據分析的發展過程中,這種矛盾心理已經被現代化的計算設備所解決。人們可以經過計算機的高頻運算來代替人腦,但也不能完全依賴數據,當涉及到非常重要的核心運算時還是要用人力再進行確認。當數據的運算層數也有一定與現實交接的復雜性時,也需要工作團隊將其進行分類整合,以便更好的進行分析工作。
(三)大數據內容空間跨度大
數據可以包含的信息種類非常多,數據的最大便利作用就是將事件的延伸情況比如地點坐標,發生時間,標注信息以及其他作用條件等具體內容都可以用數字或字母的形式存于大數據整體之中。而這些數據之間的關系又會跨越很大的思想維度,所以當我們想要為這些數據中的信息在同一平面或立體層面上顯現出來時,也會非常的有難度。
(四)大數據的核心是預測
數據中各種數據的來源大多都屬于該行業所涉及的各種過往行動資料等,例如經濟交易等平臺大數據的組成就基本上是同行業過往交易記錄或顧客給出的不同物件的購買反饋等。對這些數據進行整合分析后工作人員就能夠得知哪種產品的購入可以減少哪種商品需要增產和推廣等。這是屬于團隊經營的數據分析進程。數據還能夠供給個人戶主進行故事行情的分析和各企業金融報表的推算等。當然這幾種分析的結果都要建立在數據已被立體化的情況下[2]。
(五)大數據傾向的思維模式與人們的固有思維模式存在差異
在以往的數據思考模式中,人們似乎更加相信人群的思想傾向,總是會忽略到發展所帶來的思想上的顛覆性影響。現實表明,只有建立在充分了解基礎上的行動才是正確的價值觀走向。再加上大數據時代的來臨,人們查閱實際數據的手段也更加簡單清晰,這就推動了人們思想及行為方式的改變。這種思想改變帶來的便利因素就是人們不再執著于對事物關聯的具體變動進行分析,而是以數據探測到的未來階段內會達到的穩妥成果作為行動的根本。
二、大數據時代下數據處理技術與SPSS實驗課程教學中存在的問題
(一)缺乏實際經驗
數據處理技術從某種角度來看算是一種需要長期對技術進行更新和學習的科目,許多教師會意識不到這一點,只將教學限于課本和自身的教學經驗中。很少去參加正規組織舉辦的相關專業知識研討會或其他有專業人士參與的數據分析活動等。疏于練習的結果就是會被當代大數據的發展速度給淘汰。對學生而言,數據分析是建立在現代科技基礎上的,如果教師的觀念和經驗沒有得到及時更新,就會影響學生對大數據分析的手段和空間定義的看法。學生學習數據分析是為了提升未來的工作效率,其主要的服務對象是企業或事業單位。但許多教授級別的教師往往都是從本科開始連續讀書一直到獲取教授資格都沒有進行過過多的實際工作,缺少具體的實戰經驗,所以在這方面看來教師的教學還是存在很大的程度限制。
(二)實驗內容與社會應用內容存在偏差
一般來講學校所重點培養的數據分析手段及方法都十分偏向于理論和書面上的計算方法等步驟。教學過程也無非就是教師給出定義并講解,給出案例分析講解等固定的講授模式。例如對數據的整合排列、數據之間差異及值之間的關系、樣本均數變量測量、變量與定量關系、抽象集合分類以及變量中找出聯系等具體內容。基于這些內容我們將其與上文中提到的數據分析的重點相對比,對比結果顯示教師在對這些內容進行講解訓練時往往與數據分析的實際應用存在明顯差異。最明顯的就是在變量與定量的關系分析中,大數據分析所提倡的質量方法是將同一區間內的數據在立體平面中統一顯示和分析,而教學中對數據預測卻是一帶而過。
(三)存放數據的配置容量不達標
數據不存放于任何實際環境中的器物或紙張之中,而是通過科技手段存放于虛擬的數據容器之中。數據存儲容器雖然有著非常高端的壓縮技術,能夠將大量數據縮放整合,但無論技術有多高超,存儲設備也會有著最高限額,超出或異常接近這個限額就會影響設備的使用效果[3]。并且一旦數據出現嚴重損壞,及時通過技術手段能夠將其尋回,被尋回的數據也只能是總數據量的一部分。并且根本無法預測被損失的數據書否屬于數據群中的重要組成部分。
(四)學生軟件對軟件用途有誤解
學生沒有意識到算法統計工具只能夠作為學習進程中的輔助類別而存在,導致在教師下達任務后,過分的依賴統計軟件中的自動預測算法。并且在需要用到SPSS進行更加有難度的數據分析計算時,學生又沒有了創新思維,只能依照固定的操作順序詳解來進行操作,一整套流程結束后什么都沒能掌握。并且部分教師在下發任務時錯誤的只將培養重點放在小范圍軟件作用熟悉中,直接把已處理的數據作為練習素材發給學生,就錯過了另一種聯系學生操作技巧的方法。
(五)學生在操作軟件時抓不住重點
數據分析的操作進程其實非常的抽象,再加上學生的當下思維會忽略事件的多樣性,具體來講就是學生可能會在過程中對有難度的階段花上大量的時間和精力,當出現結果后,就會因精力限制而失去對結果的審核能力。這其實就是學習過程中非常常見的無法抓住重點的情況。這種散亂的思考不僅對軟件的操作學習有影響,同時學生在學習理論知識時是否真正的弄懂了教師所言之意也非常值得深究。過分依賴擁有直接算法技能的軟件也會使學生失去基礎的計算能力,就正如如果長時間利用電腦或手機等設備打字,人們就會出現提筆忘字的現象一樣。所以學生必須以自我運算技能為主要培養目標,避免思維能力及理解能力出現退化現象。
三、大數據時代下數據處理技術與SPSS實驗課程教學的改革
(一)盡量尋找具有代表性的大數據
鑒于現如今的企業發展速度過于迅速的整體情況,也為了學生未來的發展就業可選擇的角度更大這兩方面來考慮,教師在進行數據分析教學活動時,應與時代保持統一進程,尋找國家現有的超大型運營企業或經營狀況非常優秀的近期數據進行分析。也可通過企業的經營類別,例如進出口貿易,國內物流貿易或虛擬流量貿易等多種不同的經營方式的數據來進行多角度的分析計算。
(二)提升實驗內容的針對性
教師要引導學生將研究方向更加針對在未來的應用上,結合之前對大企業數據運作的流程來調整課程內容和課時安排,要保證理論扎實也要訓練學生對數據分析技巧實際應用的能力。大型企業所涉及到的過往數據庫非常龐大,如果只是一項一項對其整合就非常浪費時間,教師就可根據大企業在整合數據分析上的需求來增加面向主成分的分析訓練;或考慮到企業運行效率問題而加大對利用樣本數值的檢驗方法訓練等。
(三)提高數據分析的軟件和硬件配置
大數據分析首先要有較高的硬件配置,尤其是內存的容量要足夠大,要能夠容納海量數據,即至少要在1000個TB以上。其次,要有較新版本的SPSS軟件,版本越高,其功能越多,使用越方便,越符合大數據分析的需要。目前較新的SPSS軟件版本已達到22.0,而且是商業版的居多,即IBM SPSS 22.0。IBM CEO Samuel Palmisano曾表示IBM正在將新一代數據分析作為公司的研發重點,IBM在此項目上投資了1億美元。IBM實驗室的研究遠遠超出了海量數據的范圍,并已經著手大數據的分析研究[4]。
(四)提高學生搜集數據的能力
教師一定要注意的是,想要培養學生的主觀學習興趣就一定不能在案例和數據的采集上循規蹈矩。要多方面的鍛煉學生的綜合能力。書可以少看,但文獻不能不看,現在互聯網中資料下載的渠道非常多,教師完全可以放手讓學生自主去找尋合適的渠道進行相關文獻的下載,在整個過程中鍛煉學生辨別信息的能力。網上的下載渠道雖然寬廣但難免在形式上會有局限性,對此教師也可為阩提供相關專業技能的競賽,讓學生從抽象的數據行業中也能感受到競爭帶來的興趣。
(五)教習要將理論與實驗結合
課堂要將理論與實踐緊密結合,避免課堂所講內容與具體實驗時間相隔過長導致學生基本功練習不扎實。同時也要將不同的數據處理方法應用在不同的實踐當中。當進行對企業數據統一規整環節時要對學生反復強調在分析過程中,要注意在進行計算時,要將現有數據與規定的同一標準進行對比,避免出現原則性錯誤。當軟件使用時,教師要通過語言進行指導,要讓學生對一級菜單中的分級菜單留下深刻印象,避免學生在私下作業時過于依賴書本輔助。
五、結語
當我們把數據分析教學中所有的問題以不同的空間角度羅列出后,我們就可以根據內容和教學手法上的欠缺進行一些思考。大數據時代是人類對企業經營發展的效率現狀不滿足所催生的產物,而教學方案的改革也是因為人們對現有的教育成果不滿足而引起的。由此可見人們的需求對社會進展有多大的作用。我們應該將這種對社會現有狀況的不滿足保持下來,通過這種情緒所帶來的客觀效益,維持社會的高效發展。
參考文獻
[1] 趙慧琴,劉金山.基于大數據時代的《數據處理技術與SPSS》實驗課程的教學改革與探討[J].電子世界,2016(21):30-31.
[2] 戴剛,蔡春麗.大數據背景下經管類實驗教學研究與探索[J].考試周刊, 2016(102):159-159.
[3] 周民,王建業,楊超峰.大數據背景下數據庫技術類課程體系及教學模式改革研究與實踐[J].電腦知識與技術,2015,11(19):154-155.
[4] 金超.淺議大數據時代的統計課程設置及教學改革[J].科技經濟市場,2015(04):234-235.