陳植元
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2016)03-0235-02
1.引言
隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注,成為學術界和業界所共同關注的熱點和焦點。對許多企業來講,對大數據的收集、儲存、分析、提供和利用的能力和程度是衡信息獲取和利用能力的關鍵指標,是促進企業在激烈競爭中取勝的最重要的能力之一。企業要在激烈的同行競爭中立于不敗之地的關鍵要素之一就是要具備良好的大數據處理能力。而作為大學生,要在莘莘學子中脫穎而出的必備技能之一就是良好的數據處理能力。因此,在就業形勢嚴峻的當今社會,擁有良好的數據分析能力能為大學生在求職過程中增加取勝的籌碼。
2.數據處理方法和工具
數據科學是一門橫跨網絡科學、信息科學、經濟學等多個領域的交叉學科,大數據時代的到來讓人們對這門學科的重視程度和熱情空前高漲。數據科學分析工具主要有以下幾點發展趨勢:(1)大數據集分析;(2)優秀的可視化能力;(3)數據分析以分布式為主。
2.1可視化分析
大數據時代的到來,為各行各業利用數據進行預判、分析、優化都起到了至關重要的作用。大數據的使用人群也不再局限于大數據分析專家,普通用戶也逐漸意識到大數據的重要性并嘗試利用大數據挖掘對自己有用的信息。但是以上兩種群體對于大數據最基本的要求就是可視化分析,一方面是因為可視化分析能夠直觀的呈現出大數據的特點,另一方面就是可視化分析的結果能夠非常容易地被使用者接受,尤其是對普通用戶群體來說,可視化分析呈現的結果就好比看圖說話一樣簡單明了。
2.2數據挖掘算法
不同與傳統的普查和抽樣等調查方法取得一手數據及通過非調查手段獲的二手數據,大數據在數據搜集方式上主要是通過在線互聯網數據庫獲得的二手數據。在數據分析上,大數據分析方法也與傳統數據分析有所不同,傳統統計學方法采取的是對樣本數據的有目的的建模,而大數據分析技術則是通過與計算平臺對大數據進行挖掘。
2.3語義搜索引擎
語義搜索引擎是語義網時代的搜索引擎,是語義技術最直接的應用,它從詞語所表達的語義層次上來認識和處理用戶的檢索請求。具體地說,語義搜索引擎就是通過對網絡中的資源對象進行語義上的標注,以及對用戶的查詢表達進行語義處理,使得自然語言具備語義上的邏輯關系,并且能夠在網絡環境下進行廣泛高效的語義推理,從而更加準確、全面的實現用戶的檢索。
3.在校生需要掌握的數據處理能力
3.1客觀數據的有效獲取能力
客觀數據是指在研究任務中具有客觀性的數據,包括符合自然狀態的原始數據和完整反映自然屬性的見解數據, 數據的有效獲取是在研究范圍內,全面、完整、系統和及時低獲取研究所需的數據。有效地獲取數據的能力恰恰是當前高校學生最缺乏的能力,學術上的輕視、教學上的疏忽加上學生的主觀帶惰性造成了大學生數據獲取能力嚴重缺失。在各大高校中,普遍彌漫著重思辯輕實證、親議論遠數據的學術氛圍。在傳統教學方式中,教師往往不太注重甚至忽視對數據處理能力和學生實證研究能力的培養,教師在教學和示范中對數據的輕視導致學生在數據獲取和處理分析方面的怠慢和主觀惰性,因此在很多高校中都可以看到學生脫離數據進行研究的現象。
3.2研究數據的合理處理能力
對于一些項目團隊來講,他們的任務是通過數據分析運用專業技術解決課題,要想響應社會需求,高校學生應該具備以下基本能力:
(1)系統的數學與統計學知識。脫離數學進行數據分析是不切實際的,在進行數據分析時往往不可避免要使用適當的理論模型,而只有具備了一定的數學與統計學理論知識才能正確理解這些模型。
(2)完整的數據庫理論知識。在任何情況下,數據的搜集都是數據分析流程中的基礎步驟,大數據分析工作者必須具備從互聯網上搜集數據的能力,因此,大數據分析工作者要具備對數據庫尤其是大數據運用的秉性數據庫的設計和部署知識,并且能夠靈活應對環境的變化對實踐中的數據搜集方法和途徑進行改良。
(3)對研究領域背景知識的掌握。大數據的分析不僅是對數據進行簡單的處理而得出結論,而是要求數據分析者充分理解每個數據表示的含義,清楚地認識到自己的工作內容,只有在這個前提下,他才會對特定的某些數據產生敏感,意識到數據反映的信息。
3.3數據處理結果的正確解釋能力
數據分析的目的是將隱藏在一大批看起來雜亂無章的數據信息集中、萃取和提煉出來,以找出所研究對象的內在規律。數據分析可幫助人們做出正確判斷,以便采取適當的行動。對在高校學生數據處理結果正確解釋能力的培養需要從以下幾個方面入手:
(1)提升學生的專業知識與研究能力。精深的專業知識和扎實的專業研究能力是正確解釋數據處理結果的根本保障。數據分析工作者能夠依托精深的專業知識和研究能力,正確把握研究范圍內的問題性質,查明數據分析結果的因果性、相關性和類聚性,有效避免落入假因果的陷阱。
(2)加強數據處理能力的培養。獲得正確的數據分析結果的前提是具備良好的數據處理能力,包括對數據處理工具的熟練使用能力、對數據處理工具使用情景和約束條件的正確判斷和豐富靈活的數據處理技巧。
(3)加強科學方法論素養。作為一名數據分析工作者,科學研究方法論素養是其提升和發揮自身專業技能和研究能力的必要思想基礎。在數據處理過程中,要遵循辯證實證的科學研究方法論,正確選擇數據處理工具和解釋數據處理結果。
4.高校教育改革
4.1課程體系改革
數據的處理需要依托深厚的數學功底,首先在課程體系上要特別重視基礎數學學科的課程設置。當前在理工類專業中都會開設高等數學,數理統計,線性代數,計量經濟學等基礎學科,理工類專業的學生數學功底相對較為扎實。但文科專業或偏文科專業往往都忽視這些數學類的基礎學科,少有文科專業會給學生開設這類課程,導致學生數學基礎知識匱乏,何談處理數據。
4.2教學方法改革
要提高學生的數據處理能力,必須鼓勵對現有的教學方法進行適當的改革。在傳統教學中,通常是教師講解,學生聆聽,課堂上缺乏師生間的互動。這種教學方法不利于學生對知識的吸收,新的教學方法應當鼓勵學生積極思考,在課堂上踴躍提出自己的觀點和見解甚至提出自己的質疑,只有這樣學生才會深入了解這些理論并把它變成自己的東西。
4.3教材改革建設
要切實貫徹以上的教學改革思想,必須要有高水平的教材作為基礎。教材建設是整個教學內容的基礎環節,沒有高水平的教材很多理論教學和實踐教學都很難達到預期的目標。在大多數高校的教學中,很少會有學校自己開發的教材,這樣存在一個嚴重的弊端就是學生手中的教材和老師的教學大綱脫節,教材不適應教師的教學計劃,學生也很難將教學大綱與課本聯系起來。
因此,提高學生的數據處理能力重要的一個環節就是積極開發適合本院校學生和教師的教材。新的教材旨在提高該專業學生的數據綜合分析能力,教材的內容要突破傳統的教材模式,以培養學生的綜合素質作為最終的目標。此外,傳統的教材過于單調,在教學過程中可以配合多媒體教案,豐富教學形式,提高學生的學習興趣。
參考文獻:
[1]周渝,唯奕.大數據———企業運營中的新資本[J].信息與電腦,2012,(11):19-21
[2]李奕.大數據應用方式:從數據服務、信息服務到知識服務[N].中國計算機報,2012-07-09,(24)
[3]Big Data:A Revolution That Will Transform How We Live, Work, and Think
[4]范金城.數據分析[M]. 2版. 北京: 科學出版社, 2010:3endprint