丁毅濤 任水利
摘?要:本文旨在對應用統計學專業中數理統計課程的現狀進行分析,針對目前該課程教學過程中存在的問題,通過引入Python軟件對各主要知識點內容進行實現,并從教師隊伍、實踐教學和過程化考核等方面給出課程改革的幾點探索,以提高學生學習興趣、加深學生對知識內涵的理解、培養學生實踐和解決實際問題的能力,更高質量地落實應用型人才的培養。
關鍵詞:數理統計;應用統計學;Python程序設計語言;人才培養
隨著科技的快速發展,數理統計在自然科學、工程技術、管理科學及人文社會科學中得到越來越廣泛應用。對于該課程傳統的重理論輕應用的教學模式已不能適應時代的發展和社會對人才的需求。應用型人才的培養已成為新時代人才培養的風向標,結合大數據時代現狀的發展需要,培養數理統計分析處理方面的人才更是大勢所趨。數理統計作為數學的一個分支,其以概率論為基礎,研究大量隨機現象的統計規律性,由于計算機的廣泛應用使得數理統計在理論研究和應用已滲透到許多科學領域,并已成為科學研究不可缺少的工具[1]。但是,當前數理統計課程教學過程中與計算機技術的結合卻存在嚴重的問題。為了提高教學效果、培養學生動手操作能力,將當前主流計算機語言用于在應用層面揭示各數理統計知識點的內涵,并使得學生能夠熟練使用計算工具處理具體的數理統計問題,進而對該課程的教學改革進行探索,以實現應用型人才的全面培養是當前該課程面對的首要問題。
一、數理統計課程現狀分析
本文以應用統計學專業為例,結合多年教學經驗對數理統計課程、教學現狀、課程工具以及存在的問題進行簡單介紹分析。
(一)數理統計課程簡介
數理統計課程作為應用統計學專業的學科基礎與專業核心課程是多元統計分析、貝葉斯統計、非參數統計和數據挖掘技術與應用等課程的基礎。應用統計學專業旨在培養人格健全、統計學基礎知識與基本方法理論扎實、數據處理實踐能力強、勇于創新,能在工程、經濟、管理、商務等領域從事數據采集、清洗、整理等實際工作,解決數據挖掘與分析中涉及的復雜統計方法問題的高素質應用型人才。而該課程是在概率論的基礎上對于統計知識的深入詳細講解,主要涉及統計量與抽樣分布、點估計、區間估計、假設檢驗和分布的檢驗等內容。該課程主要是為了使學生了解并掌握數理統計學的基本思想、理論和方法,初步學會在實際工作中實現對數據的處理與分析。
(二)數理統計課程現狀
該課程是數據統計分析的基礎,大多數高校的相關專業針對學生數據統計分析知識的傳授和能力的培養主要通過概率論與數理統計這一門課來實現基礎內容的講解,而將概率論(48學時)和數理統計(48學時)分別單獨課設主要在統計學相關專業居多。不論是從課程的單獨開設,還是課時的安排都足以體現出該課程對于統計學專業學生的重要性。但是在高校的教學過程中發現,學生對該課程重要性的認識不足,僅把該課程看作是一般的公共類數學課,對自己的要求只是考試通過的層面,并沒有把該課程當成統計專業的重要基礎課程,也并未意識到該課程的內容會高頻率的出現在后續的專業課中,從而很大程度上影響了學生的學習熱情和積極性。另外,由于該課程內容抽象,且包含了大量的復雜理論,使得教學難度較大,并且學生的數學基礎較差,理解能力也存在差異,從而加大了學生的學習難度。并且,大多數該課程的教學只是對理論知識進行講解,雖然也有很多人意識到需要將計算機軟件實現和應用環節的教學相關結合,但是在實際教學過程中并未真正落實。依然給學生留下了枯燥乏味的印象,使得學生無法直觀形象的理解知識點的本質內容和應用場景,也不利于應用型人才的培養。
(三)課程工具使用情況
雖然當今國內眾多高校在教學過程中逐漸意識到,理論性較強的專業基礎課的重要性,并且想要實現快速計算、良好的可視化和教學效果,必須將其與實際應用背景以及較好的計算工具相結合,以提高學生學習興趣的同時,使得學生深刻理解知識點的應用場景和具體操作。但是,對于數理統計相關知識的教學較多的仍然在使用SPSS、Mathematica、MATLAB和R等傳統統計工具和分析軟件[25],也有部分教師考慮到Python軟件的簡潔清晰,功能強大且容易上手,可視化功能強大等優勢,將其用于教學活動作為計算工具[6],但是其重點卻在概率論部分。
二、Python在課程教學過程中的作用
在應用統計學人才培養方案中,Python程序設計語言是在數理統計課程之前課設的計算機語言課程,并已成為應用統計學專業所需的主流語言軟件,該軟件工具廣泛應用于統計分析、數據挖掘、機器學習和大數據可視化等專業方向課程內容的實現,在應用統計學專業人才培養過程中起著重要的作用。并且將數理統計課程與Python和應用統計學專業方向課程有效接軌,培養學生的學習熱情、激發學生的學習興趣,使學生能更好地理解數理統計知識并能熟練使用Python實現相關統計問題,從而保證人才培養過程的延續性。
(一)Python語言的特點
Python程序設計語言作為數據統計分析的流行語言,其在數據挖掘和機器學習等數據統計分處理方面有著很好的優勢,其主要特點有:
(1)Python是一門跨平臺、開源、免費的解釋型高級動態編程語言,是一種通用編程語言;
(2)Python語言語法簡潔清晰,功能強大且易學,最重要的是擁有大量的幾乎支持所有領域應用開發的成熟擴展庫;
(3)Python語言除了可以解釋執行以外,還支持命令式編程和函數式編程兩種方式,完全支持面向對象程序設計;
(4)Python功能強大,可以實現C、C++和Matlab等多種不同語言的程序融合到一起實現無縫拼接,更好地發揮不同語言和工具的優勢,以滿足不同應用場景的需求。
鑒于Python程序設計語言的各種優勢,已廣泛應用于統計分析、科學計算可視化、人工智能、機器學習、數據爬取與大數據處理等多個專業和領域。