999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術及其應用

2016-05-14 08:44:07楊筱平徐馳
電子技術與軟件工程 2016年6期
關鍵詞:數據挖掘大數據教育

楊筱平 徐馳

摘 要數據挖掘技術作為一項數據分析工具,已經在多個行業領域得到廣泛應用,極大的促進了各領域的生產效率和管理效率。本文主要對數據挖掘技術的相關理論概念進行了簡要介紹,然后以學生成績分析為例,對該項技術的應用進行分析,希望能對教育管理者和教學人員提供一定參考。

【關鍵詞】數據挖掘 大數據 教育 學生成績

1 數據挖掘技術基礎理論分析

1.1 涵義分析

數據挖掘是集合人工智能、數據庫、機器學、統計學、數學等多個學科的一門交叉性學科,該學科不僅能為商業性企業提供決策依據,解決發展困境,還能為管理者優化管理方案提供參考。數據挖掘技術就是對數據信息進行提取、處理、分析和轉化,以期從海量、雜亂的數據信息中發現隱藏的規律,從而為企業或用戶制定科學的決策提供參考。

1.2 數據挖掘實施流程

數據挖掘過程是根據數據特征建立模型,然后通過科學檢驗,發現模型和數據之間規模的一系列活動,具體來說就是確定分析對象,對數據進行預處理,選擇合適的數據分析方法進行數據處理,將分析結果進行可視化展現等,以下將對各個環節進行詳細分析。

1.2.1 數據準備

從操作上來說,數據準備階段主要執行的操作時數據選取、數據清洗和數據轉化三相工作,具體來說就是選擇數據源,確定數據挖掘處理的對象,根據實際需求從海量數據中選擇所需要處理的數據內容,生成目標數據;目標數據多為原始數據,可能會存在數據不全、數據污染等異常情況。為確保數據挖掘效果,需要對目標數據進行清洗,就是通過一系列操作補全殘缺數據、消除不合理數據,使其轉為凈化數據待用。

1.2.2 數據挖掘

這一階段的工作主要是根據數據特征設定數據集合屬性,將不參與算法的字段進行處理,然后將其他參與算法的字段看作一個新的數據集合;數據集合屬性設定完畢后,需要根據數據挖掘的目的和業務需求選擇合適的算法。

1.2.3 結果可視化呈現

數據分析處理結束后產生的結果不利于用戶直接使用,需要將其進行轉化,然后通過可視化手段將其進行展現,為用戶決策或管理工作改進提供參考。

1.3 關鍵技術介紹

數據挖掘技術雖是一項新興的數據處理技術,但其發展速度十分迅猛,至今已經形成了決策樹、神經網絡、統計學習、聚類分析、關聯規則等多項數據挖掘技術,極大的滿足了用戶的需求。

1.3.1 決策樹算法

決策樹算法是分類和預測的常用技術之一,可用于深入分析分類問題,使用時,決策樹能夠利用預測理論對多個變量中進行分析,從而預測處任一變量的發展趨勢和變化關系;除此以外,還能對變量發展趨勢進行雙向預測,既能進行正向預測,也能進行反向預測,因此具有方便靈活的優勢。

1.3.2 神經網絡算法

神經網絡是將計算機技術與現代神經生物學結合的產物,該技術是通過模擬人腦信息處理機制,對數值數據進行處理,并在處理過程中表現出一種思維、學習和記憶能力。神經網絡有多種分類方式,若按照互聯結構分,可分為以下四種,如圖1所示。由結構示意圖可知,神經網絡能對大規模數據進行處理,且容錯能力強,具有很好的自組織和自適應能力,在解決非線性復雜問題方面具有較高的優勢。

1.3.3 統計學習

統計學習是一種預測方法,該法是對數據進行深入分析,找出不能通過的規律,然后對所發現的規律進一步研究和分析,并結合實際情況對數據發展趨勢進行預測。由此可見,統計學習能對人類無法確認的事務進行預測,這對了解進一步了解世界,探索未知事物具有重要意義。

1.3.4 聚類分析法

聚類分析作為一種非參數分析方法,可對樣本分組中多為數據點間的差異及關聯進行分析,使用該法時,無需對數據進行總體假設,也不需要受數理依據等原則的限制,只需要通過數據搜集、數據轉換兩個步驟,就能完成聚類分析的全過程。聚類分析能對數據的分布情況進行分析,還能對數據分布的局勢進行快捷分析,準確識別出密集和系數區域;另外,聚類分析對單類的數據同樣具有超強的分析能力,可對每個類的數據進行深入分析,發現其特征,找出變量和類之間的內在關聯性。基于聚類分析原理基礎上的方法很多,如層次法、密度分析法和網絡法就是最常用的聚類分析方法。

1.3.5 關聯規則法

關聯規則的主要優勢是能對數據與數據之間的依賴關系進行準確描述,該技術能對給定事物數據庫進行深入分析,尋找各數據和項目之間的內在聯系,然后將所有符合支持度和置信度的,符合一定標準的關聯規則進行羅列。關聯規則算法的典型代表是FP-Tree算法,經過實驗證明,該算法在處理數據關系方面具有十分強大的優勢。

2 數據挖掘技術的應用

近年來,數據挖掘技術得到了飛躍式發展,其應用領域也涉及到商業零售、電信數據分析、金融數據分析、生物醫學分析、教育管理分析等多個領域。隨著各行各業信息化建設的不斷完善,大量的信息數據為數據挖掘技術的應用提供了基礎和保障。本文將以教學為例,利用數據挖掘技術對學生學習成績進行深入分析。

2.1 數據挖掘在教育教學中應用的可行性分析

數據驅動學校,分析變革教育的大數據時代已經帶來,利用數據挖掘技術對教育領域的相關數據進行分析,探索教育變量之間的關系,為教育教學的科學決策提供有力支撐,已經成為教育發展的趨勢之一。大數據時代的到來,將掀起人類教與學的又一次變革。對此,美國國家教育部于2012年就已經發布了《通過教育數據挖掘和學習分析促進教與學》的報告。報告中,列舉了大數據教育應用的案例、領域、應用中所面臨的困難以及應采取的態度和對策等。

計算機技術和互聯網技術在我國起步較晚,但發展迅速,尤其是近幾年“互聯網+”時代的到來,極大的促進了各行各業的發展。互聯網的發展同樣會促進學校信息化的建設,加強教育教學領域的大數據研究和應用分析,具有重要的實踐意義。教育學者在信息技術和網絡技術的影響下,逐漸加大了對數據挖掘技術的研究力度,通過一系列研究,就“國家和地方應在技術層面、管理體制、法律制度上加大對大數據研究和應用力度,按照發展現狀及未來規劃,整合現有資源,發揮后勁優勢,真正推動我國教育教學工作的改革進程。大數據給各個行業的發展帶來的變革和挑戰是前所未有的,就教育行業而言,教師的教學行為、學生的學習活動、教學管理工作、科學研究等數據都能為學校領導者制定決策提供依據,數據挖掘技術在教育教學領域具有廣泛應用價值。

2.2 數據挖掘技術對學生成績的分析

在教學領域,學習分析是其中最為重要的組成部分。學習分析就是收集與學習者有關的信息數據,然后構建數據模型,從中發現數據中隱含的規律;還可利用該技術對學習者的行為表現進行分析,根據學生表現制定合適的學習計劃,提高學生的學習效率;總之,學習分析是涉及到社會學、心理學、計算機科學和信息技術等多種學科的一種理論方法,是利用海量數據的收集、分析、處理,發現影響學習者學校結果的因素,評價學生學習情況,根據分析反饋結果,對教學內容、教學計劃和教學方式進行調整和改進,以此推進教學和學習的整體效率。

2.3 數據挖掘技術應用過程

2.3.1 數據選取

數據是數據挖掘的基礎,也是整個數據挖掘流程中耗費時間和精力最多的環節,大概占整個數據挖掘項目的60%-80%。在這一環節中,若數據類型沒有完成轉換,則數據類型與模型中的算法匹配度就會受到影響;數據中存在的噪聲過多或不完整度過高,就會影響模型的準確性,由此可見,數據選取工作具有十分重要的地位,應對其引起足夠的重視。數據質量越高,越有利于實現挖掘目標,分析出來后所得出的規律結論更可靠。

2.3.2 數據挖掘過程

學生成績數據可通過學校教學平臺獲取,其挖掘過程如下:

(1)數據準備階段。首先,先數據導入操作,選擇類型為Excel表格后,執行查詢操作。然后,對數據進行清理。將原始數據中異常數據、噪聲數據或不合理數據進行清除;對不完整數據進行字段補償,待數據符合數據挖掘要求后,將其導入數據庫。最后,數據轉換。將以百分制記錄的原始數據分為1-10個檔次的成績備用。

(2)數據挖掘階段。本文選擇決策樹為算法,對學生成績進行數據挖掘。首先定義成績字段及其含義,可見表1所示。

本文以《C語言程序設計》、《Java應用》、《計算機網絡》和《操作系統》四門課程學生成績為研究對象,根據研究目的構建決策樹,對目標數據進行計算,然后將處理結果通過轉化形成可視化知識。

(3)數據可視化呈現及解釋。將分析結果進行轉化后,形成如圖2和圖3的關系圖。

以上四門課程中,《C語言程序設計》成績較好時,《操作系統》對《計算機網絡》的影響較大;而《C語言程序設計》學習成績一般時(90分以下),《Java應用》對《計算機網絡》的影響較大。針對以上分析結果,可對教學管理提出如下建議:《C語言程序設計》這門課程較為重要,應該適當增加課時,盡量保證每周可開設六個學時,而且要確保每周都有實踐課,提高學生動手操作的能力;《操作系統》這門課對其他課程的影響不大,可相應減少課時;網站開發是以《Java應用》課程為基礎的,而且該學科也是學習其他編程語言的基礎,應該適當增加總課時數和實踐活動;《C語言程序設計》與《Java應用》課程可以結合在一起上,學完《C語言程序設計》課程后就可繼續學習《Java應用》,不需等到下一新學期再上。

3 結語

數據挖掘技術在分析海量數據,尋找數據內隱含規律方面具有明顯優勢,通過數據挖掘分析,能為使用者科學決策,減少失誤提供技術保障;該技術的應用還能促進教學工作的有效性,提升教學質量,促進學生學習成績的進步。

參考文獻

[1]崔廣風.數據挖掘中的統計方法及其應用研究[D].四川:西南石油大學,2014.

[2]黃雯.數據挖掘算法及其應用研究[D].南京:南京郵電大學,2013.

[3]吳澤曦.數據挖掘技術及其在車輛監控系統中的應用[D].北京:北京郵電大學,2015.

作者單位

天水師范學院電子信息與電氣工程學院 甘肅省天水市 741001

猜你喜歡
數據挖掘大數據教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
探討人工智能與數據挖掘發展趨勢
教育有道——關于閩派教育的一點思考
辦好人民滿意的首都教育
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 曰AV在线无码| 国产精品久久自在自线观看| 亚洲天堂.com| 国产内射在线观看| 亚洲欧洲日韩久久狠狠爱| 国产人人射| 国产精品一区二区在线播放| 亚洲三级电影在线播放| 精品国产免费观看一区| 一区二区三区四区精品视频| 日本午夜视频在线观看| 性欧美在线| 暴力调教一区二区三区| 欧美成人在线免费| 久久午夜影院| 欧美成人aⅴ| 996免费视频国产在线播放| 思思热精品在线8| 91在线播放国产| 欧美a级在线| 在线a网站| 免费在线a视频| 国产亚洲精品自在线| 亚洲精品桃花岛av在线| 波多野结衣视频一区二区| 国产va欧美va在线观看| 国产毛片一区| 亚洲中久无码永久在线观看软件| 好吊日免费视频| 国产欧美性爱网| 毛片免费观看视频| 久久综合色视频| 国产微拍一区| 999在线免费视频| 国产高潮视频在线观看| 国产成人亚洲精品色欲AV| 日韩久草视频| 国产女人18毛片水真多1| 日本一区二区三区精品AⅤ| 婷婷综合色| 亚洲A∨无码精品午夜在线观看| 伊人婷婷色香五月综合缴缴情| 日韩专区欧美| 国产成人区在线观看视频| A级毛片高清免费视频就| 国产屁屁影院| 爽爽影院十八禁在线观看| AV色爱天堂网| 亚洲人成高清| 毛片最新网址| 精品国产美女福到在线直播| 国产精品第一区在线观看| 亚洲国产清纯| 亚洲天堂视频在线观看| 国产97色在线| 婷婷成人综合| 婷婷中文在线| 91欧美在线| 久久伊人久久亚洲综合| 国产美女人喷水在线观看| 区国产精品搜索视频| 麻豆精品在线| 国产成人亚洲综合A∨在线播放| 国产va免费精品观看| 亚洲系列无码专区偷窥无码| 日韩色图区| 熟妇丰满人妻av无码区| 欧洲亚洲欧美国产日本高清| 亚洲美女久久| 免费看美女自慰的网站| 亚洲av中文无码乱人伦在线r| 91精品免费久久久| 国产乱肥老妇精品视频| 国产99视频在线| 九色视频在线免费观看| 成人日韩精品| 亚洲欧美日韩天堂| 国产欧美日韩在线一区| 伊人久久久大香线蕉综合直播| 国产永久无码观看在线| 亚洲第一国产综合| 人妻丰满熟妇αv无码|