999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于“教賽協同”的數據挖掘課程教學改革研究

2024-04-09 09:44:37呂瓊帥楊雨鞏躍洪褚龍現高敬禮
高教學刊 2024年10期
關鍵詞:課程內容數據挖掘教學改革

呂瓊帥 楊雨 鞏躍洪 褚龍現 高敬禮

摘? 要:數據挖掘課程是大數據和人工智能方向重要的核心課程,主要培養學生在數據驅動的范式下結合問題場景和社會需求,具備利用數據挖掘方法和技術分析、解決實際問題的能力。針對數據挖掘課程教學過程中存在的“痛點”問題,以培養工程型創新性人才為導向,從課程內容體系、學科競賽體系和課程隊伍體系三個維度,探索并構建基于“教賽協同”的數據挖掘課程教學改革的策略和方法,為地方高等院校大數據和人工智能相關專業的發展提供思路。

關鍵詞:教學改革;教賽協同;數據挖掘;課程內容;競賽體系;課程隊伍

中圖分類號:G642? ? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2024)10-0136-04

Abstract: Data Mining is an important core course in the direction of big data and artificial intelligence, and this course mainly trains students to combine problem scenarios and social needs under the data-driven paradigm, and have the ability to use data mining methods and techniques to analyze and solve practical problems. In response to the "pain points" in the teaching process of data mining courses, to cultivate innovative talents with engineering skills, this article explores and constructs strategies and methods for teaching reform of data mining courses based on "teaching and competition collaboration" from three dimensions: curriculum content system, discipline competition system, and curriculum team system. This provides ideas for the development of big data and artificial intelligence-related majors in local universities.

Keywords: teaching reform; teaching and competition collaboration; data mining; course content; competition system; course team

2023年3月22日,由中國高等教育學會競賽評估與管理體系研究專家工作組發布的《2022全國普通高校大學生競賽分析報告》[1]中,與數據挖掘相關的比賽達到了將近20項,約占總比賽數量的25%。與其他學科競賽相比,數據挖掘相關的學科競賽對知識的廣度和深度的要求更為具體,更加側重新問題、新技術和新應用的引入,培養和塑造工程創新型人才導向的育人特征更加突出。為使教學與競賽相輔相成,在制定數據挖掘課程的大綱時,可以對照學科競賽涉及的知識分布歸納總結出該課程的培養目標與課程要求,使課程大綱與工程教育認證的目標更加契合,能夠對畢業要求進行較好的支撐;反過來,也可以將課程內容與知識點延伸到競賽的題目中,進一步加深學生對所學知識的理解和應用。因此,基于“教賽協同”的數據挖掘課程的教學改革探索與實踐對于推動實踐育人工作的深入,培養具有數據思維的應用型人才具有重要的意義。

一? 教學現狀

數據挖掘課程是一門多學科交叉課程,不僅涉及概率統計、數值優化、機器學習等理論較強的知識,也涉及數據采集、數據預處理、構建模型和模型評價等實踐較強的技術,具有非常強的實用性,在醫療、教育、金融、氣象和軍工等多個領域均有實際應用[2]。考慮到數據挖掘課程的特點以及與其他學科的交叉融合,課題組通過實踐教學與文獻調研[3-6],歸納總結了數據挖掘課程教學過程中存在的主要問題。

(一)? 課程內容涉及廣、理論深

完整的數據挖掘課程內容應涉及到數據獲取、分析和建模等各個環節,可細分為數據質量分析、數據特征工程、數據清洗、數據規約、數據集成、挖掘建模、模型優化和模型發布等。此外,在這些內容中,尤其是挖掘建模部分涉及到的分類模型、預測模型、聚類模型、關聯規則模型和時序模型等又涉及到較深的數學理論知識。這些因素不但增加了教學的難度,也容易使學生產生畏難的情緒。

(二)? 實驗數據量少,數據簡單

數據是數據挖掘課程實驗的關鍵。當前,數據挖掘課程主要采用的數據都是公共的數據資源,例如:加州大學歐文分校開放的UCI(University Of California, Irvine)。公共的數據資源一般數據量較小,而且是比較“干凈”的數據,稍作處理后就可以直接導入模型中進行分析。這樣獲取的數據直接省去了數據探索、數據預處理等環節涉及到的技術與方法,無法讓學生了解到數據挖掘的完整過程,會讓學生誤以為學習數據挖掘就是在學習模型的使用。殊不知,構建模型之前的一系列數據處理工作要占到整個工作量的60%[2]。

(三)? 教材內容過于同質化,且文字表述不易理解

數據挖掘課程的教材種類繁多,有外文翻譯過來的教材,也有國內學者自己編寫的教材。整體上內容過于同質化,有些翻譯的教材文字表述生澀難懂,邏輯性欠佳。而且一些教材對原理的介紹過于偏重,缺少具有針對性的實例,使學生讀起來云里霧里,不知所云。這導致學生逐漸失去了閱讀教材的興趣,也無法通過課下自學逐漸理清數據挖掘的整個知識脈絡。

(四)? 課程考核形式單一,缺少過程監督

試卷、期末大作業和課程設計是主要的課程考核形式。試卷側重于考察概念性的知識,缺少對學生解決問題能力的考察;期末大作業和課程設計雖然可以較為全面地反映學生對知識的掌握情況,但過程的監控和指導不易操作。此外,這些課程考核結果都帶有任課老師一定的主觀判斷,缺少第三方較為客觀的評價。

上述問題既是課題組在以往講授數據挖掘課程的教學過程中遇到的突出問題,也是文獻調研過程中提到具有共性的問題。針對這些問題,在工程教育專業認證的背景下,課題組進行了基于“教賽協同”的數據挖掘課程教學改革探索。

二? “教賽協同”的數據挖掘課程改革與探索

結合教學過程中的經歷與感悟,將具體的教學改革與實施方案進行了總結,主要分為“教賽協同”的課程內容體系構建,“教賽協同”的學科競賽體系構建和“教賽協同”的課程團隊體系構建。

(一)? “教賽協同”的課程內容體系構建

“教賽協同”的數據挖掘課程教學體系的構建側重于“教”,并以競賽為導向進行教學實踐。這里的“教”主要針對緩解數據挖掘課程內容涉及廣,理論深和教材內容理論多、案例少的問題。由于與數據挖掘相關的競賽題目多出自于大型的互聯網公司及著名的科研機構,在很大程度上可以反映當前大數據方向應用的熱點和研究方向[7]。課程團隊在對中國人工智能大賽、阿里巴巴天池大數據競賽、百度飛槳和Kaggle等大數據競賽進行調研的基礎上,構建出適用于本專業方向的競賽池,并以此為切入點,依據應用方向和研究熱點構建數據挖掘的課程內容,如圖1所示。

在以競賽為導向開展教學實踐時,教師從競賽池中選取具有代表性的題目,將競賽的真實案例拆解為不同的知識模塊,通過教學環節的有效聯動將各個知識點無縫地串聯起來。課程團隊在現有數據挖掘課程教學大綱的基礎上,依據側重點不同將數據挖掘任務的過程分為四個模塊,見表1。下面以Kaggle競賽中共享單車需求預測為例,從數據探索、數據預處理、挖掘建模和模型優化與評價四個部分歸納梳理教學內容的安排與設計。

在城鎮化進程中,為解決共享單車的供需失衡問題,Kaggle平臺中的Bike sharing demand競賽提供了10 886組數據,每組數據包含datetime,season,holiday等12個特征,最終目標是預測未來特定時間和地點共享單車的需求量。按照知識模塊的劃分,從數據探索、數據預處理、挖掘建模和模型優化與評價四個方面簡要介紹教學內容設計的思路。

1? 數據探索

這個階段的主要工作是驗證數據質量、數據可視化和特征工程,通過對數據集的結構和規律進行分析,從而形成較為全面的數據質量報告。數據質量分析[8]主要是檢查數據中是否存在“臟”數據,即:異常值,缺失值,特殊符號等;數據可視化是數據規律及分布的一種更直觀的呈現形式;特征工程獲取數據的統計特征及屬性間的相關性,直接影響到模型的性能。教師引導學生通過數據質量分析判斷數據集是否滿足模型構建的需求,選擇合適的可視化工具了解數據規律及分布,熟悉特征工程的方法選取數據集中的關鍵屬性。以共享單車需求預測為例,將count屬性中不符合3?滓原則的點標記為離群點進行刪除,以消除后面對統計推斷和模型構建的干擾,通過相關性分析,可以得到氣溫、風速和濕度與組車數量的關系。

2? 數據預處理

這個階段的主要任務是經過數據清洗、數據集成和屬性規約等相關工作后讓數據更好地適配特定挖掘模型及算法。教師指導學生通過數據清洗,篩選掉與挖掘任務無關的數據,噪聲數據和重復數據,根據問題場景利用數據集成將分散在不同數據源或屬性中的數據經過轉換、提煉后集成在一起,并選用合適的數據規約方法構造出較小且具有代表性的數據以縮減后續挖掘所需的時間,降低存儲成本。在共享單車需求預測的問題中,通過對datetime屬性的變化與提煉,獲取到“年”“月”“日”“小時”等更易處理的細粒度的信息,更有益于后續模型對單車需求時間規律的分析。

3? 模型構建

通過數據探索與預處理,獲取到了可以直接建模的數據,依據不同的問題場景和數據形式,可以選擇分類、預測、聚類、關聯和時序等模型。就共享單車需求問題來講,該問題是一個回歸預測問題,常用的方法包括支持向量機回歸模型、隨機森林、XGBoost和GBDT等。教師可以引導學生結合前期處理過的數據,嘗試用多種不同模型對數據進行挖掘,在此過程中講解模型參數的作用及設置技巧,以幫助學生積累更多的模型選用經驗。

4? 模型優化與評價

模型的優化是學生在掌握了不同模型的優缺點之后,教師啟發學生從提升模型性能與泛化能力的角度對現有的解決方案進行改進與升級。結合單車共享需求預測問題,可以引導學生從參數調優,優化策略的角度考慮模型改進方案。為了評價改進后方案的優劣,學生可以從模型預測的準確率方面與基礎模型進行對比。此外,也可以將模型或結果提交到競賽網站上進行評分和排名,通過參與競賽社區的討論,可以發現更多優秀的模型改進策略與技巧,既增強了靈活運用知識的能力,也拓展了與數據挖掘課程內容相關的前沿知識。

上述教學內容構建的方式,一方面,可以依托競賽提供的真實數據進行教學內容的設計,以期通過真實的案例,實現知識點或模塊的重組。同時,可以將競賽中用到的新技術整合到教學內容中,使教學內容一直緊跟技術前沿。另一方面,可以依托競賽的敏捷性和持續性,鞏固教學內容和拓展新的教學案例,將課堂教學內容和實驗內容與競賽內容進行有機銜接。因此,以競賽為導向的數據挖掘課程教學體系的構建,可以在一定程度上解決數據挖掘課程內容涉及廣,理論深和教材內容理論多、案例少的問題。

(二)? “教賽協同”的學科競賽體系構建

“教賽協同”的數據挖掘競賽體系的構建側重于賽,并以教學為依托實現以教代培、以教促賽。為了緩解數據挖掘課程實驗數據量少,數據簡單和課程考核形式單一,缺少過程監督的問題,競賽體系的構建既可以擴充課程實驗案例,又可以實現對學生的過程監督。競賽體系的構建以競賽池為基礎從教學的角度分為基礎部分和強化部分,如圖2所示。

基礎部分包含招募成員、競賽流程、基礎競賽題目和文獻查閱方法等內容,作用是推廣競賽、引導學生入門、招募成員和激發學生興趣。學生可以根據個人志趣和能力,針對遇到的問題以組為單位構建團隊、查閱資料、檢索文獻,形成規范性的文檔總結,初步積累競賽經驗。同時,為保證學生參與競賽的可持續性,不但要注意團隊成員能力分配上的布局,以避免打擊學生參與競賽的積極性,而且還要使團隊成員年級構成上呈現階梯分布,以防止老隊員退役后出現斷層現象。此外,以團隊為主按照學期制定合理的任務目標,可以加速數據挖掘技術在團隊成員中傳承。

強化部分主要通過教師對競賽題目的逆向拆解來幫助學生理解數據挖掘課程中涉及到的特征工程和構建模型算法,作用是教師將問題的解決方案拆解為知識模塊以方便學生理清知識脈絡。通過強化部分的培訓,可以使學生接觸到不同應用場景的真實數據與案例,讓學生感受到數據挖掘的各個關節的知識點是如何在具體問題中應用的,教師可以根據學生設計的解決方案、競賽排名和完成題目的數量實現對學生的過程監督。教師還要緊跟學術前沿[9],加強與企業間的溝通與合作,并將最新的技術與方案整合到強化部分的培訓中,以最大限度地完善與更新培訓內容。

總之,“教賽協同”的課程競賽體系構建不但有助于學生了解數據挖掘過程中的各個環節、應用前沿和研究熱點,還可以驗證現有解決方案的優劣并激發學生對方法進行改進、創新的熱情。

(三)? “教賽協同”的課程團隊體系構建

“教賽協同”的數據挖掘課程團隊體系構建(圖3),一方面,以比賽為契機,增強教師隊伍的教育教學能力,打造結構化、層次化的數據挖掘教學團隊;另一方面,以比賽為抓手,鍛煉學生隊伍,培養數據思維,增強學生團隊的協作能力、團隊榮譽感和歸屬感。

在課程體系和競賽體系的框架下,首先,綜合考慮職稱、學歷及競賽經驗等因素,組織與數據挖掘課程相關的教師,構建數據挖掘課程的教學團隊,一方面,教學團隊應幫助學生降低競賽內容的高階性,幫助學生梳理競賽的知識要點,提升解決復雜應用場景問題的能力;另一方面,還應讓學生感受到數據挖掘課程內容所具有的挑戰性,對于一些重要的知識點讓學生“跳一跳”“蹦一蹦”才能夠得著[10]。其次,通過組織團隊活動、營造良好的團隊文化和獎懲機制,調動學生及團隊的積極性。在團隊活動中,賦予學生自主權,采用學生組織討論,教師積極參與的模式,讓學生自行設定相關知識模塊選題的組會。通過學生查閱和收集與數據挖掘前沿技術發展相關的技術報告和視頻,可以幫助學生團隊形成創新、團結、實干、共享的團隊文化。同時,制定合理的獎懲機制,打通課程考核與競賽成績的置換通道,為學生團隊的發展提供制度保障。最后,鼓勵教師團隊與學生團隊之間的資源共享和互促共進。利用教師團隊學識優勢與技術優勢,將課程資源和競賽資源充分與學生共享,并組織學生團隊協助教師團隊將競賽資源轉化為數據挖掘課程的教學資源和教學場景。利用學生團隊的創新優勢與組織優勢,啟發學生將已掌握的知識遷移到更多的與數據挖掘應用相關的應用場景中,通過教師的點撥和參與,既可以提升學生團隊的自主創新意識,也激發了教師團隊的教學熱情。

通過“教賽協同”的數據挖掘課程團隊體系的構建,可以有效推進課程教學改革的進度,保證教學改革的效果,提升創新型工程人才的培養質量。

三? 結束語

秉承工程教育認證的培養目標,踐行創新型工程人才的教學理念,實施“教賽協同”的數據挖掘課程教學改革,進行以競賽為導向的教學實踐,并以教學為依托實現以教代培、以教促賽,同時以競賽為契機,鍛造優秀的數據挖掘課程教學團隊。通過“教賽協同”的數據挖掘課程教學改革的實施,本課程團隊已初步完成了教學模塊及內容的重構,教學案例及資源的積累和教學團隊的整合。學生參與競賽的熱情高漲,部分學生及團隊已獲得多項競賽榮譽,申請了軟件著作權,撰寫了大數據相關的論文準備發表。當然,隨著數據挖掘技術的更新迭代及應用場景的不斷復雜化,培養高素質的創新型工程應用人才需要長期堅持不懈的探索與實踐,以培養出更多適合社會需求的應用技術型人才。

參考文獻:

[1] 《2022全國普通高校大學生競賽分析報告》發布[EB/OL]. (2023-03-21).https://cahe.edu.cn/site/content/16010.html.

[2] 杜欣然,楊厚群,符發.學科競賽驅動的數據挖掘人才培養模式探索[J].計算機教育,2022(4):201-206.

[3] 劉波,蔡燕斯,鐘少丹.大數據背景下數據挖掘課程實踐教學的探索[J].高教學刊,2019(18):124-125,128.

[4] 姚力,朱龍飛,崔晨.大數據時代數據科學課程建設與人才培養的探索[J].計算機時代,2018(11):87-90,93.

[5] 丁毅濤.大數據時代下的數據挖掘課程改革探索[J].科技風,2021(27):27-29.

[6] 康雁,林英,朱燕萍,等.基于SE-CDIO的數據挖掘課程教學改革[J].云南大學學報(自然科學版),2020,42(S1):54-57.

[7] 大數據系統軟件國家工程實驗室,和鯨科技.數據競賽白皮書·上篇[EB/OL].(2020-01-16).https://blog.heywhale.com/shu-ju-jin g-sai/.

[8] 張良均,譚立云,劉名軍,等.Python數據分析與挖掘實戰[M].北京:機械工業出版社,2019.

[9] 趙旭俊,蔡江輝,馬洋,等.大數據科研成果支撐教學研究——以《數據挖掘與智能決策》為例[J].高教學刊,2020(27):93-96.

[10] 吳巖.建設中國“金課”[J].中國大學教學,2018(12):4-9.

猜你喜歡
課程內容數據挖掘教學改革
基于“課程內容六要素”的繪本文本解讀路徑探析
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
基于人才培養的技工學校德育實效性研究
成才之路(2016年25期)2016-10-08 09:51:08
現代信息技術在高職數學教學改革中的應用研究
科技視界(2016年20期)2016-09-29 12:59:03
以職業技能競賽為導向的高職單片機實踐教學改革研究
科技視界(2016年20期)2016-09-29 11:20:38
微課時代高等數學教學改革的實踐與探索
科技視界(2016年20期)2016-09-29 11:16:19
一種基于Hadoop的大數據挖掘云服務及應用
學前教育專業體育課程內容的構建
依標明辨 巧用萃取——談如何將文本內容萃取成課程內容
語文知識(2015年9期)2015-02-28 22:01:41
主站蜘蛛池模板: 99这里只有精品免费视频| 国产精品妖精视频| 国产裸舞福利在线视频合集| 国产精品亚洲欧美日韩久久| 国产人成乱码视频免费观看| 亚洲成人一区二区三区| 亚洲另类国产欧美一区二区| 国产精品网址你懂的| 中文字幕永久在线看| 亚洲无码高清免费视频亚洲| 亚洲精品无码不卡在线播放| 亚洲天堂视频在线观看免费| 国产精品天干天干在线观看| 欧美精品H在线播放| 亚洲91精品视频| 激情国产精品一区| 亚洲天堂2014| 91精品免费高清在线| 国产鲁鲁视频在线观看| 久久综合九色综合97婷婷| 久久久久九九精品影院| 亚洲精品va| 曰AV在线无码| 丰满的少妇人妻无码区| 992Tv视频国产精品| 久久综合色天堂av| 国产无码精品在线| 中文字幕在线看| 国禁国产you女视频网站| 网久久综合| 亚洲日韩国产精品综合在线观看| 国产三级毛片| 九九久久99精品| 国产拍在线| 欧美成人综合视频| 欧美综合中文字幕久久| 欧美日韩第三页| 日本福利视频网站| 免费av一区二区三区在线| 欧美视频在线不卡| 国产极品美女在线播放| 欧美午夜理伦三级在线观看| 99er精品视频| 99热免费在线| 欧美一区二区三区不卡免费| 3D动漫精品啪啪一区二区下载| 色综合综合网| 国内精品免费| 国产地址二永久伊甸园| 乱人伦中文视频在线观看免费| 99视频免费观看| 伊人AV天堂| 女人天堂av免费| 色综合天天综合| 中文字幕亚洲乱码熟女1区2区| 国产精品成| 国产一级片网址| 成人免费午间影院在线观看| 日韩av电影一区二区三区四区 | 久青草国产高清在线视频| 亚洲精品免费网站| AV老司机AV天堂| 女人爽到高潮免费视频大全| 久久特级毛片| 中文字幕色站| 无码网站免费观看| 亚洲人成电影在线播放| 成人在线欧美| 日本a∨在线观看| 伊人久久久久久久| 亚洲人成网站在线播放2019| 色有码无码视频| 国产一区二区三区免费观看| 一本一本大道香蕉久在线播放| 丁香五月亚洲综合在线| 成人va亚洲va欧美天堂| 91精品综合| 免费看一级毛片波多结衣| 欧美亚洲网| 久久精品免费国产大片| 亚洲欧美在线综合图区| 色婷婷久久|