999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Python語言的數據挖掘課程的建設與研究

2021-05-24 06:32:35楊軍張岳劉燕峰
科技風 2021年14期
關鍵詞:課程建設數據挖掘

楊軍 張岳 劉燕峰

摘?要:目前Python語言作為時下最流行的編程語言之一,在數據科學領域應用十分廣泛,簡單易學、功能強大,為學生的使用提供了方便。結合云大物移智時代的時代背景和計算機學科的專業特點,針對數據挖掘課程存在的一些問題,在使用Python語言的基礎上,對數據挖掘課程的建設進行相關研究。該文章主要從教學大綱、教學環節和考核方面進行闡述,課程建設旨在更好的培養學生使用數據挖掘方法分析和解決問題的能力,更好地培養云大物移智時代所需的數據科學人才。

關鍵詞:數據挖掘;Python語言;課程建設

中圖分類號:G642.4

The?construction?and?research?of?data?mining?course?based?on?Python

Yang?Jun?Zhang?Yue?Liu?Yanfeng

Shandong?Youth?University?Of?Political?Science?ShandongJinan?250000

Abstract:At?present,Python?as?one?of?the?most?popular?programming?languages,is?widely?used?in?the?field?of?data?science.It?is?simple?to?learn?and?powerful,which?provides?convenience?for?students?to?use.Combined?with?the?background?of?cloud?computing,big?data,Internet?of?Things,mobile?Internet,artificial?intelligence?and?the?professional?characteristics?of?computer?science,In?view?of?some?problems?existing?in?the?course?of?data?mining,the?construction?of?the?course?of?data?mining?is?studied?by?introducing?Python.This?article?mainly?elaborates?from?the?teaching?syllabus,teaching?links?and?assessment?aspects.The?course?construction?aims?to?better?cultivate?students'?ability?to?use?data?mining?methods?to?analyze?and?solve?problems,and?better?cultivate?data?talents?needed?in?the?era?of?big?data.

Keywords:DM;Python;curricula?construction

1?Python語言簡介

Python是一種解釋型、面向對象、動態數據類型的高級程序設計語言,自誕生以來,Python在處理系統管理任務、數據挖掘以及Web編程等方面有著廣泛的應用。因為Python的簡潔、易讀以及可擴展性,使用Python做科學計算的案例越來增多。眾多開源的科學計算軟件包都提供了Python的調用接口,同時,Python還擁有很多科學計算擴展庫,為Python提供了快速數組處理、數值運算以及繪圖功能。因此Python及其眾多的擴展庫所構成的開發環境十分適合工程技術、處理實驗數據、制作圖表,甚至開發科學計算應用程序[1]。

選擇Python作為數據挖掘課程的實踐語言有以下4個優點:(1)Python是免費的自由軟件,不需要支付任何費用,可以更方便的獲取源代碼;(2)Python具有良好的跨平臺性,一般情況下,在Windows上編寫的Python程序可以輕易地運行在Linux上,這一特點對于學生鞏固Linux系統的使用也提供了實踐機會[2];(3)Python語言功能強大,借助擴展模塊可以輕松的完成,在教學過程中可以通過Python語言實現各種數據挖掘算法;(4)Python語言清晰優雅,其語法簡單,格式清晰、易寫、易讀[3]。這個特點可以使不同計算機編程水平的學生在短期內學會使用Python語言進行數據挖掘的實戰操作,方便開展課程實踐教學。

2?教學大綱設置

數據挖掘課程是一門建立在高等數學、機器學習、統計學、數據庫、人工智能等學科的綜合性課程。根據學生的培養目標,通過本課程的學習讓學生理解數據挖掘的基本概念、基本原理、基本方法和應用基礎,熟悉基本工具的使用,理解數據挖掘算法的基本原理,為進一步深入學習智能數據分析研究打好基礎。在課程中將理論教學內容與實驗教學內容相結合,采用傳統與特色教育相結合,如話題教學、翻轉教學等教學方面[4],通過構建數據挖掘的課程體系來設置教學大綱。

將數據挖掘的教學大綱設置為基礎和進階兩個部分,其中基礎部分包括數據挖掘導論、數據預處理、數據倉庫與聯機分析處理(OLAP)等內容,進階部分包括分類、回歸、聚類、關聯規則、文本與Web挖掘、數據挖掘的可視化等內容,進階部分主要是對基礎部分進行進一步的拓展,學習關于預測性和描述性的各種挖掘算法。一般來說,在本科階段數據挖掘課程的教學總學時為32~64個學時,而該課程的特點是需要理論與實驗相結合,可以將理論與實驗的課時進行相應比例的分配,并按照學習內容進行知識點同步。同時安排4~6個學時來講解Python語言的基礎知識,讓學生了解和掌握Python語言在數據挖掘中的基本應用,通過演示部分數據挖掘的經典案例來讓學生了解其主要應用領域及當前的研究熱點。在充分調動學生學習興趣的前提下,適當通過增加課下學習時間來彌補課內學時的不足,需要教師充分利用網絡資源搜集相關數據挖掘的資料,并對其進行分類整合后發給學生,提高學生的課后學習效果[5]。具體理論教學大綱設計和實驗教學大綱設計的內容,如表1和表2所示。

3?課程教學過程的設計

下面以數據挖掘中常用的分類算法中的樸素貝葉斯分類為例,介紹如何利用Python語言開展數據挖掘的教學。

樸素貝葉斯分類(NBC)是基于貝葉斯定理和特征條件獨立假設的分類算法,通俗地講樸素貝葉斯分類器可以看作:對于給定的待分類項,求解在該分類項出現的條件下,各個類別出現的概率。根據各個類別出現的概率,哪個最大,就將其劃歸為那個類別。

首先,介紹一下貝葉斯的定理,因為不同的學生可能數學基礎不同,先通過介紹貝葉斯定理,來復習一下相關的數學知識,知道其基本公式的表達。貝葉斯定理條件概率定義為:表示事件B已經發生的前提下,事件A發生的概率,稱為事件B發生下事件A的條件概率。其基本求解公式為:P(A|B)=P(AB)/P(B)。

通過對比,告訴學生們貝葉斯定理之所以有用,是因為與大家的生活息息相關:可以很容易直接得出P(A|B),P(B|A)則很難直接得出,但大家往往更關心P(B|A),貝葉斯定理打通了從P(A|B)獲得P(B|A)的道路。貝葉斯定理為:P(B|A)=P(A|B)P(B)/P(A)。

通過介紹貝葉斯定理,為學生引入樸素貝葉斯分類,NBC屬于貝葉斯分類的一種,其與貝葉斯分類相比,后者需要花很大的時間和空間復雜度去計算類條件概率。NBC的思想基礎:對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個最大,就認為此待分類項屬于哪個類別。樸素貝葉斯分類的正式定義為:

①設x={a1,a2,…,am},為一個待分類項,而每個a為x的一個特征屬性;

②有類別集合C={y1,y2,…,yn};

③計算P(y1|x),P(y2|x),…,P(yn|x);

④如果P(yk|x)=max{P(y1|x),P(y2|x),…,P(yn|x)},則xyk。

接下來,再來看一下樸素貝葉斯分類的三個階段,通過了解分類階段讓學生從宏觀上掌握樸素貝葉斯的應用流程。(1)對于準備工作階段:本階段的輸入是所有待分類數據,輸出是特征屬性和訓練樣本。本階段是整個樸素貝葉斯分類中唯一需要人工完成的階段,其質量好壞決定整個過程,分類器的質量很大程度上由特征屬性、特征屬性劃分及訓練樣本質量決定;(2)分類器訓練階段:本階段輸入是特征屬性和訓練樣本,輸出是分類器,該階段是機械性階段,可以由程序自動計算完成;(3)應用階段:其輸入是分類器和待分類項,輸出是待分類項與類別的映射關系,本階段也是機械性階段,由程序完成。

在最初的教學過程中,會出現學生對算法理論的學習提不起興趣的現象,但當提到某個實際案例時,特別是大家身邊的案例,學生的興趣會瞬間增強,所以要引入實際案例來提高學生興趣,使更好的理解這個算法[6]。下面介紹樸素貝葉斯分類算法的Python實現過程。

假定給出了如表3所示的訓練樣本數據,其目的是根據給定的天氣數據判定是否去打網球(PlayTennis),當給出一個新的實例,如{Outlook=Sunny,Temp=Cool,Humidity=High,Windy=Strong}時,則預測的目標概念PlayTennis的目標值是Yes還是No。

對未知樣本進行分類,如max(P(x|C)P(C))=P(X|C=n)P(C=n),則說明未知樣本屬于第n類,其中:

①P(C=i)=Si/S,Si是類Ci中的訓練樣本數,S是訓練樣本總數;

②P(X|C=i)的計算開銷比較大,因為會涉及很多屬性變量,這可以做“屬性值互相條件獨立”的假定,即屬性件不存在依賴關系。

具體Python的示例程序,課程中會結合目前所使用的實驗平臺,在此不再依依列出。

4?課程考核方案的設計

課程考核方案的設計必須能客觀反映出學生對數據挖掘基本原理和算法應用的掌握程度,考核從兩個方面進行,第一是理論測驗,主要考查學生對數據挖掘的基本概念和算法理解的能力,以紙質試卷的形式進行測試,并結合平時的課后作業、單元測試及課堂表現等來綜合打分。第二是實驗測試,主要考查學生對Python語言應用和數據挖掘算法應用的能力,以上機的方式進行測試,并結合平時的上機實驗報告、實驗單元測試及課堂表現等情況來綜合打分。當然,這種考核方案還需不斷摸索改進,而目的就是為了讓學生更好地掌握以Python語言為基礎的數據挖掘技術,在云大物移智的大環境下,為研究更深入的智能數據分析研究打好基礎。

參考文獻:

[1]李克清,時允田.機器學習及應用[M].北京:人民郵電出版社,2019.

[2]劉凌霞,郝寧波,吳海濤.21天學通Python[M].北京:電子工業出版社,2018.

[3]嵩天,禮欣,黃天羽.Python語言程序設計基礎[M].北京:高等教育出版社,2017.

[4]白楊.應用型本科“數據挖掘”課程的構建研究[J].無線互聯科技,2018(5):9596.

[5]渠暢.基于R語言的大數據挖掘課程建設研究[J].無線互聯科技,2018(4):9193.

[6]李婷,張繼周.大數據環境下本科生數據挖掘課程建設研究[J].教育現代化,2017(40):230232.

基金項目:1.山東青年政治學院2019年度校級教學改革研究項目[1+X數據采集職業技能等級證書制度試點的建設(JGWT201913)];2.山東青年政治學院教學成果獎培育項目[以大數據競賽為依托的大數據相關專業“三融三促”人才培養模式研究與實踐(19CGPY03)]

作者簡介:楊軍(1989—?),男,山東濟南人,碩士,助教,主要研究方向為大數據技術、數據挖掘與分析;張岳,碩士,講師;劉燕峰,碩士,講師。

猜你喜歡
課程建設數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
高職機械類專業“CAD圖形設計”課程建設
中國市場(2016年36期)2016-10-19 05:00:13
《海圖學》課程的建設與實踐
科技視界(2016年21期)2016-10-17 18:25:28
“誤差理論與數據處理”課程建設的實踐與思考
科技視界(2016年21期)2016-10-17 18:17:51
基于卓越計劃的金屬結構材料課程實踐化改革與建設
大學教育(2016年9期)2016-10-09 08:49:28
資源、生態與環境學科群體系下普通地質學課程建設思考
大學教育(2016年9期)2016-10-09 08:36:39
中高職一體化課程體系建設的探索與實踐
成才之路(2016年25期)2016-10-08 10:20:01
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 亚洲中文久久精品无玛| 国产黄网永久免费| 国产永久在线观看| 亚洲最新网址| 欧洲极品无码一区二区三区| AV在线天堂进入| 手机永久AV在线播放| 四虎在线高清无码| 女人爽到高潮免费视频大全| 国产精品一区二区无码免费看片| 国禁国产you女视频网站| 国产乱子伦视频三区| 色综合手机在线| 欧美亚洲欧美区| 成人一级黄色毛片| 狠狠色噜噜狠狠狠狠奇米777 | 欧美日韩国产综合视频在线观看| 日韩黄色大片免费看| 久久综合国产乱子免费| 日韩国产综合精选| 大乳丰满人妻中文字幕日本| 亚洲乱码视频| 91在线一9|永久视频在线| 午夜福利视频一区| 欧美国产另类| 精品欧美日韩国产日漫一区不卡| 亚洲婷婷丁香| 久草国产在线观看| 国模私拍一区二区| 欧洲高清无码在线| 麻豆AV网站免费进入| 99国产在线视频| 亚洲天堂网2014| 日本一区二区三区精品国产| 欧美在线导航| 国产精品9| AV片亚洲国产男人的天堂| 亚洲—日韩aV在线| 波多野结衣视频网站| 2020国产在线视精品在| 四虎国产精品永久一区| 99精品久久精品| 一区二区午夜| 亚洲伊人久久精品影院| 亚洲二区视频| 青青青草国产| 欧美19综合中文字幕| 全部免费特黄特色大片视频| 亚洲欧洲自拍拍偷午夜色| 亚洲成人精品久久| 中文字幕1区2区| 欧美色亚洲| 亚洲视频四区| 国产 在线视频无码| 99re免费视频| 欧洲精品视频在线观看| 天堂亚洲网| 青青极品在线| 91福利在线看| 亚洲第一黄色网址| 中文毛片无遮挡播放免费| 国内熟女少妇一线天| 在线欧美日韩| 黄色在线不卡| 国产视频a| 91精品国产自产在线观看| 国内a级毛片| 国产第八页| 成人av手机在线观看| 免费看的一级毛片| 国产麻豆va精品视频| 青青草国产在线视频| 久操中文在线| 亚洲精品大秀视频| 五月天综合婷婷| 国产乱人乱偷精品视频a人人澡| 波多野结衣视频一区二区| 欧美午夜久久| 欧洲av毛片| 国产精品lululu在线观看| 国产成本人片免费a∨短片| 日本亚洲国产一区二区三区|