馬秀莉,武麗芬,晉珺
(晉中學院 數學系,山西晉中 030619)
“十二五”以來,我國大數據技術與產業得到了快速的發展[1],因此,對高校人才培養提出了更高的要求[2]。“十三五”規劃綱要提出:“要把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。”為滿足大數據發展對相關專業人才的需求,教育部于2016 年在本科教育中增設了數據科學與大數據技術專業。晉中學院主動開設此專業,2016 年,該校數據科學與大數據技術專業獲準招生,啟動大數據技術的本科專業人才培養。然而,由于該專業是新興專業,其課程設置及人才培養沒有經驗可以參考,要想推動數據科學與大數據技術專業的發展,培養大數據應用型人才,還需在教學實踐中不斷探索合理的課程體系設置[3]。
數據科學與大數據技術專業具有典型的跨學科特性。作為交叉型學科,其相關課程涉及數學、統計學、計算機技術、經濟管理等多學科內容。面對大數據行業發展的機遇和挑戰,晉中學院數學系根據該專業的發展實際,不斷探索該專業課程體系設置以及應用型人才培養組織結構,以期滿足社會日益增長的大數據應用型人才需求。
晉中學院數學系的基礎專業為應用數學,其培養目標是讓學生在掌握數學基本理論的基礎上具備實踐應用的能力。數據科學與大數據技術專業的本質是應用數學、計算機科學與技術等多種學科理論知識和應用技術的交叉和延伸,即在掌握數學理論的基礎上通過計算機技術進行應用。為此,在應用型人才培養過程中,依靠數學系的基礎設置,大數據專業方向具有非常大的優勢。如何科學合理地利用這個優勢,將大數據相關理論和技術有機融入應用數學的教學體系,是有效推動數據科學與大數據技術專業發展需要思考的關鍵問題。
數據科學與大數據技術專業是多學科交叉融合的復合型專業。因此,構建完善的多學科交叉課程體系,必然需要教師綜合分析和考慮各學科之間的關聯性以及專業學科的特點,制定科學合理的課程體系。當前的課程設置盡管門類眾多,但并未真正實現學科的交叉和融合[4]。如何進一步實現專業教學結構的調整和優化,實現資源共享,依然是需要解決的關鍵問題。經過近年來的實踐與探討,將該專業課程設置存在的問題歸為以下兩個方面:
在專業課程設置上,數據科學與大數據技術是參照《普通高等學校本科專業目錄和專業介紹》設置的。與應用數學專業相比,數據科學與大數據技術專業在學習數學分析、高等代數、解析幾何等數學課程的基礎上增加了Java 程序設計、數據結構、R 語言、Python基礎、數字圖像處理、統計學、機器學習、金融學、智能控制等應用型課程。課程教學任務由數學系、計算機系以及經濟系教師共同承擔。由于數據科學與大數據技術專業是新開設的專業,沒有可參照的完善的課程體系,學院在專業必修課程與專業選修課程中選擇了一些必要的課程以及一些熱門的課程,構成了該專業的課程體系。然而,在課程教學中發現,該專業的課程體系設置缺乏一定的系統性,課程之間存在知識重復或關聯性低的問題。通過對晉中學院2018 級數據科學與大數據技術專業學生的課程考試成績進行分析[5-6],發現數學分析、高等代數與數據結構、Python基礎、機器學習具有一定的相關性,與教學實踐相符,因為計算機編程中涉及大量的算法,要求具備扎實的數學基礎。Java 程序設計、數據結構與后續課程的相關性較強,說明將Java 程序設計和數據結構作為專業基礎課的前置課程是合理的。R 語言和Python 基礎課程體現出高度的相關性,同作為流行的編程語言,這兩種語言具有相似的語法規則,但卻有不同的應用特點。然而,在教學計劃中,這兩門課程均以講授基本的語法為主,忽略了實踐應用的不同特點。大數據技術與數字圖像處理這兩門課程也與其他課程的相關性較低,因為大數據技術主要介紹大數據的應用場景,數字圖像處理主要處理數字圖像,與后續課程聯系不是特別緊密。另外,該專業還開設了金融學課程,作為大數據科學應用的主要場景,金融學的開設符合社會的需求。然而,在金融學課程的教學中,并未與數學基礎課程相聯系,也未與應用型課程相聯系,使金融學課程成了課程體系中的一門“孤立”的課程。
該校設置的數據科學與大數據技術專業課程體系,在大學前三個學期主要以數學基礎課程為主,第四學期開始加入與計算機相關的應用型課程。然而,在應用型課程的教學時仍以理論知識的講授為主,缺乏配套的實踐設計環節。在專業選修課的課程設置上,有R 語言、Python 數據分析等課程,并配有一定的上機實驗課時,但在具體的教學實施過程中發現,課程實踐環節遠沒有達到教學要求。學生僅能在課堂上了解相關內容的簡單應用示例,教師沒有足夠的課時增加具體問題情景,讓學生利用課堂學到的方法解決實際問題。因此,實踐課程未能達到實際效果,學生也缺乏學習的積極性。通過對該專業的高年級學生進行考查,發現學生的數學基礎知識弱于應用數學專業的學生,同時,計算機操作能力又弱于計算機專業的學生,使得此專業沒有凸顯專業特色,缺乏就業競爭力。
基于晉中學院數據科學與大數據技術專業的教學實施過程與結果,對該專業的課程設置提出以下幾點建議:
數據科學與大數據技術專業涵蓋的知識面廣、涉及課程多,為此,在課程設置時需要教師考慮課程間的關聯性和整合性,將各學科知識有效融合。該專業強調扎實的數學能力,在課程的設置中加大了數學相關課程的教學比例,增加了數學建模、數學算法等課程,目的是為后續專業課程的學習奠定堅實的數學基礎。然而,為了使基礎課程與專業課程更好地銜接,應在基礎課程的教學中,補充相應數學算法的具體應用場景,使學生能深入理解數學課程如何應用于專業領域,激發學生的學習興趣。在設置大數據導論課程時,可同步加入基礎課程的知識與專業課程的知識,保證知識點之間的銜接性。在專業課程的設置中,一方面,可以通過增加選修課程比例實現多學科知識的整合和利用,構建多元化學習體系,學生能夠根據興趣設計合理的學習規劃,適應社會不同行業的專業要求。另一方面,在提高學生知識儲備量的同時,要有選擇地開設課程,避免知識重復。例如,對于常用的大數據編程語言Java、C 語言、R 語言、Python 語言,Java 與Python 適用范圍更廣;在眾多的數據庫MySQL、Oracle、SQLServer中,MySQL 不僅免費開源,而且提供的接口支持多種語言連接操作,在整個課程體系中銜接性更好。總之,多學科交叉融合并不是簡單的疊加,需要基于社會經濟和技術發展的要求,探討如何通過多學科之間的多向交流和相互滲透,更加有效促進多學科的共同發展和新知識的產生[7]。
數據科學與大數據技術是典型的交叉應用型學科,以教科書為基礎的課堂講授方式并不完全適用于大數據專業人才的培養。為此,應重視實踐課程的設置,讓學生在實踐中鞏固知識,獲取解決實際問題的能力[8-10]。目前該專業的教學安排,僅在Matlab、R語言、Python 語言課程中設置了實踐課時,且僅占總課時的1/4。按照國家標準,專業課程的實踐課時應為64 學時以上,實踐課時遠沒有達到國家標準。基于社會對大數據專業學生程序設計能力的要求,應該在C 語言、數據結構、Java 程序設計、Python 語言、數字圖像處理等計算機相關專業課程的課時計劃中縮減理論課時,增加實踐課時比例。此外,除了計算機相關的專業課程,部分數學基礎課程也應該以理論與實踐結合的方式進行教學。如概論統計、數學建模是大數據專業的重要基礎課程,其內容框架應用性強。對于此類應用型數學基礎課程,建議在課堂的講授中弱化方法的具體推導過程,著重強調數學方法在實踐中的應用,通過增加實驗課的實用性,提高學生的專業學習興趣。
數據科學與大數據技術專業雖然是數學、統計學與計算機科學的交叉學科,但在實踐教學的課程設置上應該明確區分,使其凸顯專業特征。與傳統計算機科學專業相比,數據科學與大數據技術專業更加強調數據采集、存儲、處理、可視化的數據分析能力,對于場景的要求更高,需要有大量的數據和算力進行支撐。因此,在實踐課程的設置上,應該結合學校特點,對接產業需求,通過建立相應的大數據實訓平臺、人工智能實訓平臺、金融數據分析實驗室等,讓學生接觸真實的數據源,通過真實的企業案例培養學生對數據進行動態分析和診斷評價的能力[11-12]。
隨著數字經濟的快速發展,數據、物質、能源已成為人類生存發展的三大基礎資源。隨著對數據的收集、分析和應用相關需求的急速增長,社會對掌握數據分析、數據挖掘、數據可視化、風控與安全等技術的大數據人才的需求不斷增加。為此,高校需要改變數據科學與大數據技術專業課程設置,構建典型性、多樣性、多維度的課程體系,以滿足新時代發展對大數據人才的要求[13]。此外,數據科學與大數據技術專業的實驗課程對教學設施的要求越來越高,需要相關部門加大資金投入力度,為高校開展前沿科學研究提供支撐[14]。