左飛 方宏彬
【摘要】本文通過闡述大數據時代統計人才的不足,對大數據時代下統計學教育方面提出幾點改變,旨在相關人員能夠主動進行與時俱進的充實、調整及變革。
【關鍵詞】大數據時代 統計學 不足 改變
引言——置身于大數據時代
眾所周知,因為互聯網技術的井噴式發展,我們進入了一個IT時代,而隨著QQ、微博、微信、朋友圈等社交網絡的漸漸成熟,以及移動帶寬的提速,云計算、移動APP的豐富(如淘寶,美團,滴滴等),產生海量的多源異構的龐大數據流,數據量呈現爆炸式的增長,我們很快迎來了大數據時代。每個人的生活中都充滿了結構化和非結構化的數據,數據量的爆發式增長和硬件存儲技術的發展讓大量數據成為了潛力無窮的財富,大數據分析隨之日益成為人們社會經濟生活進行預測和決策的重要手段,大數據分析能力也已成為現代社會高端人才應當具備的基本技能之一,各行各業的人都開始說自己在搞大數據。
一、大數據時代統計學的不足
如今,計算機科學,信息技術,應用數學,計算數學,運籌學,電子工程,連政治領域都聲稱自己在做大數據。可又似乎唯獨聽不到統計的聲音。大數據以數據為主體,而統計是關于數據的科學,所以統計對大數據的生命力和應用價值有著至關重要的作用。然而近代統計學雖已經發展了上百年,但是大數據時代的到來依然暴露出了統計學已有方法的缺陷。第一,數據類型,以前數據是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合。而現在我們見到的圖、文、聲、像等信息都可以成為分析的數據。第二,過去我們是出現了問題才收集數據,然后建立合適的統計模型來揭示觀測到的數據。大數據時代則不同,當前的人類技術能力可以處理海量的數據,要做的就是從泥沙俱下的大數據中提煉出有價值的知識和信息,這些有價值的知識和信息顯然是非預期的,而統計學中大多選取樣本、用一些統計方法隨機抽取樣本來預測整體,可能會丟失某些有用的信息。所以現階段,無論對于個人還是企業亦或是國家,誰占領大數據時代的制高點,誰就贏得主動和先機。大數據方面的研究在美國、日本等發達國家已經上升為國家戰略,中國目前的很多追蹤調查項目都存在耗時過長的問題,中國的城鎮化、智慧城市建設、政府簡政放權、推進監管等都面臨諸多統計上的挑戰和需求,多元數據來源的整合,海量數據存儲、數據挖掘、圖像視頻智能分析等都是對統計的新要求,這對統計學和統計學家是嚴峻的挑戰。統計學家應該欣然歡迎大數據時代的到來,把它看作是統計學本身的一個大變革,通過對復雜數據開展深入系統的創新性研究,產生新的統計思想、新的統計工具,形成新的統計理論,從而推動其他重要領域和科學前沿取得突破。
二、大數據背景下統計學人才的培養
2014年11月,美國統計學會發布了統計學本科專業指導性教學綱要,這是在大數據背景下對2000年首次發布的指導性教學綱要進行的一次全面修訂和更新,主要強調了四個方面的內容:
①數據科學日益重要,統計專業人才不僅需要扎實的數學和統計基礎,還要有強大的統計計算和編程能力,可以熟練使用專業統計軟件和數據庫;②真實數據是統計專業教育的重要組成部分;③更加多樣化的統計模型和方法;④通過語言、圖表和動畫等用戶易于理解的方式表達數據分析結論的能力。可見作為當今世界第一強國的美國,都在跟隨世界潮流,努力的與時俱進,進行創新學習,我們更得快馬加鞭,對以往的教育制度進行去粗留精,我個人覺得得從3個方面進行根本的改變:
第一,教育對象,對于老師,當前普通高校統計學教師的來源主要有兩種,第一種多數是屬于偏向經濟學的經濟統計專業出身,強調社會實踐性的經濟學思維,他們的統計學的理論基礎不夠扎實,對于一些較復雜的統計分析方法不太熟悉。另一種則是屬于概率論數理統計專業出身,更多的注重理科思維的邏輯性和數量關系的推理推導。數理統計學專業教師的概率統計的理論基礎扎實,但大多數又比較缺乏經濟、金融等方面的知識。為適應大數據時代的發展需要和培養高素質的統計學專業人才,應用型地方高校統計學專業教師必須與時俱進,不斷更新、補充知識,完善知識結構。在目前階段,普通高校應用統計學專業可建立統計學專業教師團隊,優勢互補,形成1+1>2,能有效緩解當前師資力量中知識結構的缺陷。對于學生,如今社會對數據分析師的計算機技能、編程技能、大數據挖掘和統計建模技能、業務技能都提出了很高的要求。一個大數據分析人才需要是交叉學科型人才,除了要掌握統計學科的統計建模、數據挖掘等技能外,還需具備計算機學科及應用領域的相關知識背景。目前我國應用統計的交叉學科發展比較弱,各學科大多追求獨立性的最大化,這種狀況不利于大數據統計應用的科學發展,所以這需要政企產學研等多部門協同培養。
第二,教育內容,當前學校開設的統計學專業教育內容主要為統計學原理、多元統計分析、概率論與數理統計、時間序列分析,運籌學、抽樣調查、數據挖掘以及相關的統計應用課程,還是以結構化數據為主要處理對象,而對非結構化和半結構化數據的分析和工具的使用則涉及不是很廣。但是今時不同往日,大數據時代的到來,現今統計學課程及內容已不能滿足從事非結構型和半結構型的大數據研究和商業應用對人才培養的需要,統計專業教育必須審時度勢,以社會上對統計人才的實際需求為中心,不斷豐富原有的課程內容,增開、補開新的課程,才能保證教育內容跟上大數據時代前進的腳步。把偏理論性的專業課程的課時適當減少,避免交叉重復,增加應用性較強的專業課程的課時,增加計算機方面課程的課時。另外,加強計算機方面的課程設置除了設置傳統的數據庫基礎、C++外,還應設置跟商業應用強相關的數據庫開發與設計、Python編程語言、數據可視化技術、數據倉庫、數據結構與算法設計等與大數據相關的專業選修課程。
第三,教育模式,當前統計學教育模式主要以灌輸學生知識,培養政府、企事業單位需要的統計工作人才為重要內容和主要目標,以課堂教育為核心,以教師講授為主導,重理論體系,輕實際應用,重方法內容介紹,輕實際分析能力培養,重理論闡述、公式推導和模型構建,輕專業技能、適應能力和商業意識的培養,且教育手段單一,教育方式傳統,教育團隊的協作意識較差。培養出的學生大多數只擅長于進行公式推導、公式運算和數學模型分析,知識結構以數理知識為主,在經濟學、管理學、計算機科學方面的知識相對不足,導致研究和觀察視野狹窄,解決實際問題的能力不夠。大數據時代雖然仍要求統計工作人員具有數據處理和分析所需的基本素質與技能,但更看重于其從海量數據中把握市場機遇,挖掘商業價值,為其所在的企業創造利潤的潛在能力、探索欲望和創新精神,故現今統計學專業的人才培養模式是與大數據時代所需要之復合型數據分析人才不相適應的。必須得加強實踐教學環節,學生基礎薄弱,更應該強調學生的實際案例分析能力。另外,長城非一人之力完成,需要增加統計學生團隊合作意識和資源共享。實踐教學環節以提高學生的實踐能力為目的,鼓勵學生大膽提出問題,質疑結論,合理安排組織企業實習、企業案例分析、分組討論、社會調查、數據收集、統計建模、相關分析、結果論證、創新創業等實踐性教學環節,同時盡可能的創造機會讓學生去擁有大數據分析業務的企業或者公司去調查研究,實習,以適應大數據的時代要求。
三、結束語
大數據時代,信息技術的快速更新、飛速發展,盡管對統計學的固定探究方式和價值觀念帶來一定的沖擊,但長遠來看更多的是帶來機遇。這是因為環境的改變和嚴峻性,統計學要不愿意被淘汰,就必須實事求是,與時俱進,跟上時代發展的步伐,進行改革和發展以及創新。統計人員必須具備職業敏銳性,始終保持終身學習的優良傳統,不斷得學習、理解和革新新技能。唯有這樣,才能在大數據的環境下生存與發展。endprint