李忠 李姍姍
摘要:為實現本科生和研究生階段的不同教學目標,本文從數據挖掘課程的大綱編排、內容安排、課程體系、理論教學、實踐教學和重點難點等多個方面做了分析和比較,指出本科階段教學具有知識碎片化的特點,而研究生階段更注重對知識進行系統性應用。只有了解了不同教學階段的差異,采取針對性、差異性教學方法,才能提高教學質量和效果,達到教學目的。
關鍵詞:數據挖掘;本科階段;研究生階段;課程體系;實踐教學
數據挖掘技術起源于20世紀80年代末,是計算機科學和統計學的交叉學科,涉及統計學、模式識別、高性能計算、知數據庫技術等若干學科知識,在勘探技術、生物制藥、金融領域等獲得普遍應用,取得了若干有益成果,其經濟效益和社會效益顯著。因此,國內外高校的IT相關專業、金融保險專業、統計分析等專業引入了數據挖掘課程,從本科生到研究生階段都有開設,培養了若干高層次專業人才。但是,本科生和研究生兩個階段的數據挖掘課程無論在教學大綱、授課內容方面,還是在授課方式、實踐教學方面,都存在較大差異。筆者根據多年的教學實踐,對數據挖掘課程在兩個階段教學的異同點進行梳理和分析,拋磚引玉,期望與同行共同提高教學質量。
一、教學目標異同分析
在本科階段,數據挖掘課程的性質是專業選修課,主要講授數據挖掘概念、分類、聚類、關聯分析等基本知識,要求學生具有數據預處理、數據分析、各種挖掘算法的應用等基本能力,培養學生利用數據挖掘方法解決實際問題,為以后從事相關專業奠定基礎。在研究生階段,數據挖掘課程更偏重于培養學生理解和掌握各種數據挖掘算法,熟練運用數據挖掘技術解決遇到的科學問題和工程問題,并能夠進行算法優化。
二、教學內容異同分析
1.基本內容體系
根據本科階段具體教學情況,數據挖掘課程內容體系如表1所示。
在研究生階段,增加了大數據技術及機器學習兩部分內容,以提高研究生的科研能力和工程實踐能力。
2.教學重點
在本科階段,根據章節不同教學重點各異,教學重點以滿足實際應用為主導,讓學生了解相關理論知識。如分類內容重點介紹決策樹、Bayes、K-近鄰等方法,聚類分析重點介紹基本概念、無監督學習方法、K-均值算法等,關聯分析重點介紹相關概念、Apriori算法等。文本挖掘重點介紹相關概念、切詞分詞、字典方法等。這些理論容易理解,應用方便實現。但在研究生階段,就要考慮算法優化問題了,如基于信息熵的決策樹如何改進以提高計算效率等。當然研究生階段實踐應用也更加深入,要求學生要理解大部分算法甚至實現這些算法,如人工神經網絡、支持向量機、FP-Tree算法等。
3.教學難點
在本科階段,主要圍繞教學重點找出教學的難點。如在預處理一章中,重點是數據清理、數據集成、數據變換和數據歸約,而難點就是維度歸約、數據清洗了;分類部分的難點是C4.5算法、Bayes最小誤差等;聚類的難點在于無監督學習算法、相似性定義以及各種距離概念;關聯分析的難點在于頻繁項查找、Apriori定理等內容。在研究生階段,難點主要是對一些不確定分析方法的理解和應用方面,如BP網絡、SOM網、支持向量機等,尤其是在算法優化、實現方面,難度較大。
三、教學方法異同分析
大學階段和研究生階段的教學方法和學習方法是完全不同的。在本科階段,大部分課程的教學模式是課堂理論+實驗室實踐+課外復習,而且理論課時、實驗課時比例十分明確,這也是傳統的教學方法。但是在研究生階段,同樣的一門課,由于目標、內容、要求等方面的差異,教學方法變化很大,通常是教師帶領研究生快速地將相關理論內容學一遍,然后布置作業由學生個人或者分組合作完成。在完成過程中,教師深度參與討論,與研究生一起研究算法、流程、結果分析等,從而對現有的算法進行改進和優化,提高計算效率及結果的精度。很顯然,這種教學方法更能培養學生的創新性思維,更有利于對學生創新能力和動手能力的培養。
近年來,國務院和教育部先后出臺了若干指導性文件,以促進大學實踐教學體系的改革。以數據挖掘為例,在大學階段,以前是理論教學48學時+實踐教學16課時,目前已經調整為理論和實踐各占一半學時。盡管如此,大學階段的實踐教學也有明確的教學計劃,如表2所示。
在研究生階段,實踐教學和理論教學在課時分配上不再明顯,一般是理論之后完成一個設計性的項目,甚至是實際的科研項目或者工程項目,更強調整體性和系統性,更注重對研究生分析問題、解決問題能力的培養。
現代信息處理技術的應用已經普及,數據挖掘作為一門課程已經進入高校課堂,從本科階段到研究生階段均有開設。但是在這兩個階段,數據挖掘課程的教學目標、教學內容、實踐教學、教學方法、重點難點等方面都存在較大差異。本科階段傾向于學生知識的學習和實踐能力的提高,追求數據挖掘各種算法的了解和“會用”,很難系統地解決問題。而研究生階段更注重對學生知識掌握和分析問題、解決問題能力的培養,更強調系統性、整體性地解決科研活動和工程應用中遇到的實際問題。因此,只有充分認識到這兩個階段的教學差異才能更好地進行針對性、差異性教學,提高教學質量和效果,達到教學目的。
參考文獻:
李忠,李姍姍.應用型本科院校IT專業數據挖掘課程建設[J].計算機時代,2014(11).
注:本文系防災科技學院研究生課程建設與改革項目(項目編號:YJG2015004)和防災科技學院教學研究與教學改革項目(項目編號:JT201504)資助。endprint