999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用Clementine對高校機房管理系統(tǒng)進(jìn)行數(shù)據(jù)挖掘

2018-08-11 01:14:50
關(guān)鍵詞:數(shù)據(jù)挖掘

許 青

(安徽工業(yè)大學(xué) 工商學(xué)院,安徽 馬鞍山 243002)

1 引言

如今計算機的發(fā)展已經(jīng)進(jìn)入了一個嶄新的時代,各單位對計算機技術(shù)的要求也越來越高,現(xiàn)在幾乎所有的工作崗位都要求工作人員具有一定的計算機基礎(chǔ)知識和應(yīng)用能力.為了能和社會接軌,各大高校紛紛開設(shè)了大量的計算機課程,相對的高校中機房的任務(wù)就越來越重,高校中的機房已成為現(xiàn)代化的教學(xué)場所,有些專業(yè)課教師直接在機房上課,同通過讓學(xué)生邊學(xué)邊練的方式,使他們能夠更好地掌握知識.除此之外有些高校也會空出大量時間給學(xué)生業(yè)余上機,特別是大型考試前期,如:省二級計算機等級考試或會計電算化考試等,每天都會有大批的學(xué)生要到機房進(jìn)行練習(xí),這時就會出現(xiàn)機器不夠用,時間分配不合理,機房的資源不能得到合理的應(yīng)用等.為了解決以上的種種問題,可以把數(shù)據(jù)挖掘引用到機房管理系統(tǒng)中,對其中的相關(guān)數(shù)據(jù)進(jìn)行分析,從中挖掘出重要的有用的信息,為機房工作人員的管理提供一個重要的依據(jù),避免學(xué)生上機時出現(xiàn)沖突,提高機房管理人員的工作效率.

2 數(shù)據(jù)挖掘的概念

2.1 數(shù)據(jù)挖掘的定義

近些年隨著人工智能和數(shù)據(jù)庫技術(shù)的發(fā)展出現(xiàn)了一門新興技術(shù)——數(shù)據(jù)挖掘,它所涉及的領(lǐng)域很廣,不僅用于大學(xué)里的研究,在商業(yè)研究中也被廣泛應(yīng)用.不同領(lǐng)域的人針對數(shù)據(jù)挖掘給出了不同的定義,最為廣泛接受的定義是:數(shù)據(jù)挖掘(data mining,DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識發(fā)現(xiàn)的過程.

數(shù)據(jù)挖掘的概念可分為廣義上的概念和狹義上的概念.廣義上,數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)集中,挖掘出隱藏起來的、人們事先不知道的、有用的知識的過程.狹義上,數(shù)據(jù)挖掘是從特定的某些數(shù)據(jù)集合中提取人們所需知識的過程.綜上所述,我們也可以簡單理解為數(shù)據(jù)挖掘就是從海量數(shù)據(jù)中挖掘一些潛在的有用的信息.

2.2 數(shù)據(jù)挖掘的功能及相關(guān)算法的介紹

數(shù)據(jù)挖掘綜合了各個學(xué)科技術(shù),有很多的功能,其中主要功能有以下幾種.

2.2.1 分類與預(yù)測

分類和預(yù)測是兩種數(shù)據(jù)分析形式,分類可以用來預(yù)測數(shù)據(jù)對象的類標(biāo)號,然而在某些應(yīng)用中人們可能希望預(yù)測某些遺漏的數(shù)據(jù)值而不是類標(biāo)號.當(dāng)被預(yù)測的是數(shù)據(jù)值時通常稱之為預(yù)測.一般通過如下方法來區(qū)分分類和預(yù)測:分類方法用于預(yù)測數(shù)據(jù)對象的離散類別,而預(yù)測方法則常被用于預(yù)測數(shù)據(jù)對象的連續(xù)取值.

2.2.2 關(guān)聯(lián)規(guī)則

在介紹關(guān)聯(lián)規(guī)則之前,先看一個定義-頻繁模式.頻繁模式就是頻繁出現(xiàn)在數(shù)據(jù)集中的模式,它可分為頻繁項集、頻繁子序列和頻繁子結(jié)構(gòu)三種類型.關(guān)聯(lián)規(guī)則是在頻繁模式的基礎(chǔ)上實現(xiàn)的,是數(shù)據(jù)挖掘中最活躍的研究方法之一,是由R.Agrawal等人于1993年提出的,它反映了一個事物與其他事物之間的相互依存性和關(guān)聯(lián)性,兩個或多個相互關(guān)聯(lián)的事物,其中一個可以通過其他事物預(yù)測到.關(guān)聯(lián)規(guī)則挖掘最經(jīng)典的一個例子是“購物籃”分析,該分析是數(shù)據(jù)挖掘技術(shù)在零售業(yè)中比較有效的一種方法.

2.2.3 聚類分析

“物以類聚,人以群分”意思就是把相似的事物放在一起,把相似的人歸為一類.在數(shù)據(jù)挖掘中,我們常常也會將性質(zhì)相似的事物放在一起研究,但事物還需要我們根據(jù)一些已知的性質(zhì)來對其進(jìn)行分類.聚類分析就是把數(shù)據(jù)庫中的所有數(shù)據(jù)按不同的特征分成一些群組,其目的是把群組與群組之間顯著地區(qū)分開來,而使得同一個群組之間的數(shù)據(jù)具有更高的相似度.

2.2.4 偏差的檢測

除以上幾種外,數(shù)據(jù)挖掘還有一項重要功能就是對偏差進(jìn)行檢測.所謂偏差是指數(shù)據(jù)庫中的異常數(shù)據(jù)或記錄,其可以表述某種潛在的知識,如反常的分類實例、某種規(guī)則的特例、實際觀測結(jié)果與預(yù)測模型其值的偏差等等.檢測偏差的基本方法是尋找實測結(jié)果與預(yù)測或參照值之間有意義的差別.例如:在銀行的100萬筆交易中有500例的欺詐行為,銀行為了穩(wěn)健經(jīng)營,就要發(fā)現(xiàn)這500例的內(nèi)在因素,減小以后經(jīng)營的風(fēng)險.

3 機房管理系統(tǒng)的數(shù)據(jù)挖掘

3.1 數(shù)據(jù)挖掘工具的介紹

在確定了數(shù)據(jù)挖掘的主體任務(wù),并經(jīng)過以上的數(shù)據(jù)準(zhǔn)備工作后,便可以開始進(jìn)行數(shù)據(jù)挖掘.數(shù)據(jù)挖掘本身只是一個過程,我們?nèi)绻M玫阶罱K的結(jié)果,必須利用有關(guān)的工具來實現(xiàn),也就是數(shù)據(jù)挖掘工具.

根據(jù)數(shù)據(jù)挖掘的使用范圍把數(shù)據(jù)挖掘工具分為兩類:專用型數(shù)據(jù)挖掘工具和通用型數(shù)據(jù)挖掘工具.專用型數(shù)據(jù)挖掘工具只限于特定的領(lǐng)域,對于每個領(lǐng)域來說,都可以開發(fā)它們自己專有的數(shù)據(jù)挖掘工具.它的針對性比較強,而且每個專用型數(shù)據(jù)挖掘工具只能被用在相應(yīng)的一種應(yīng)用中;通用型數(shù)據(jù)挖掘工具則沒有對具體領(lǐng)域提出特別要求,它所采用的都是普遍的數(shù)據(jù)挖掘算法,處理的也都是一些常見的數(shù)據(jù)類型,因此它的適用性比較強,可以用來做多種模式的挖掘,用戶的可選項也比較多,每個用戶都可以來選擇適合自己需求的挖掘工具.根據(jù)多方分析,本課題選用的是SPSS/Clementine軟件.它是一個數(shù)據(jù)挖掘工作平臺,具有可視化操作界面,對于熟悉Windows操作的人來說,易學(xué)易用,比較適合于初學(xué)者實現(xiàn)對數(shù)據(jù)的挖掘.

3.2 SPSS/Clementine工具介紹

3.2.1 SPSS/Clementine

SPSS的前身是英國ISL(Integral Solutions Limited)公司開發(fā)的一款數(shù)據(jù)挖掘工具產(chǎn)品,1998年被SPSS公司收購后經(jīng)過重新整合和開發(fā),如今已經(jīng)成為一款被廣泛使用的統(tǒng)計軟件.該軟件利用了計算機系統(tǒng)的運算能力和圖形展示能力,將方法、應(yīng)用與工具緊密地結(jié)合在一起,是解決數(shù)據(jù)挖掘的理想工具.它擁有豐富的數(shù)據(jù)挖掘算法,支持與數(shù)據(jù)庫之間的數(shù)據(jù)和模型交換,同時也綜合了一些比較有效的數(shù)學(xué)統(tǒng)計分析方法,成為內(nèi)容最全面,功能最強大、使用最方便的一款數(shù)據(jù)挖掘工具.

3.2.2 Clementine的數(shù)據(jù)流建立過程

數(shù)據(jù)挖掘一般要經(jīng)過數(shù)據(jù)收集、數(shù)據(jù)準(zhǔn)備、建立模型等環(huán)節(jié),Clementine很形象的將這些環(huán)節(jié)用若干個節(jié)點表示出來,將挖掘過程看作是各個節(jié)點間的流動,并通過一個圖形化的“數(shù)據(jù)流”直觀地表示整個數(shù)據(jù)挖掘的過程.所以Clementine的目的就是要建立數(shù)據(jù)流,即根據(jù)數(shù)據(jù)挖掘的實際需求選擇節(jié)點,然后連接節(jié)點建立數(shù)據(jù)流,之后通過不斷修改和調(diào)整流中節(jié)點的參數(shù),執(zhí)行數(shù)據(jù)流,進(jìn)而完成整個數(shù)據(jù)挖掘過程.創(chuàng)建數(shù)據(jù)流的過程如圖1所示:

3.3 K-Means聚類的具體實現(xiàn)

3.3.1 K-Means算法

本課題中選用的是K-Means聚類分析.自MacQueen于1967年提出了K-Means聚類算法,到目前為止,這種算法在許多實踐應(yīng)用中獲取了很好的效果,它已成為科學(xué)和工業(yè)應(yīng)用中較流行的聚類算法.K-Means是一個簡單有效的統(tǒng)計聚類技術(shù),能夠?qū)σ呀?jīng)知道對象數(shù)目的數(shù)據(jù)來進(jìn)行分類,然后收斂聚類,因此聚類分析(K-Means)算法是在現(xiàn)實運用中比較高效的聚類方法.

K-Means算法采用的是“劃分”方式實現(xiàn)聚類.所謂劃分是指,首先將樣本空間隨意劃分為若干個簇,然后將所有樣本點分配到與一定距離親近的簇中,形成初始的聚類結(jié)果[21].在這樣的設(shè)計思路下,它的算法具體過程如下:

第一步:從n個數(shù)據(jù)對象中隨機抽取k個對象作為初始聚類的中心(一般把聚類對象的均值稱作中心點),由這個中心代表這個聚類.k值的選擇是個難題,通常根據(jù)實際需求來確定,用戶需選擇若干個k值實驗.指定聚類數(shù)目后還需要指定初始類中心點,初始類中心點的指定方法有3種:第一種可以采用經(jīng)驗選擇法,也就是根據(jù)以往的大量經(jīng)驗大致上了解樣本應(yīng)聚成幾類以及如何聚類,然后選擇每個類中具有代表性的點作為初始類中心點;第二種方法是隨機選擇法,隨機指定一些樣本點作為初始類中心點;最后一種方法是最小最大法,首先選擇兩個相距最遠(yuǎn)的樣本作為初始類中心點,然后選擇一個與前兩個初始中心點的距離最大的樣本作為第三個中心點,后面依次按照這種方法選擇其他的中心點.

第二步:計算每個數(shù)據(jù)對象到k個聚類中心的相似度(距離),然后根據(jù)它們與這些聚類中心的相似度,分別將它們分派到最近的類中,形成k個類.

第三步:計算每個所獲新聚類的聚類中心.根據(jù)所有數(shù)據(jù)對象的均值來計算出新的聚類點,其中k的個數(shù)始終不變.

第四步:不斷重復(fù)對新的中心點的計算,直到準(zhǔn)則函數(shù)式收斂.

3.3.2 K-Means在Clementine中的具體實現(xiàn)

第一步:建立數(shù)據(jù)源.導(dǎo)入表格中數(shù)據(jù),然后過濾多余的字段.

第二步:數(shù)據(jù)準(zhǔn)備:Clementine的K-Means聚類中要求聚類變量必須為數(shù)值型,并且要采用劃分原理進(jìn)行聚類,結(jié)合前面我們分析的變量的數(shù)據(jù)類型以及變量的聲明,首先把字段time的類型設(shè)置為集合,其他字段為默認(rèn)設(shè)置;然后time的檢查類型設(shè)置為強制,其他字段設(shè)置為無,最后字段ID與Member_No不參與建模,設(shè)置它們的方向為無,其他字段均為輸入.

第三步:建立模型.選擇Clementine的建模方式為K-Means節(jié)點,設(shè)置“聚類數(shù)”為4類,在流管理窗口的模型選項卡下自動生成一個K-Means模型,然后把該模型與類型節(jié)點連接起來即可,最終建立的數(shù)據(jù)流模型如圖2所示:

圖2 數(shù)據(jù)流模型

第四步:評估模型.經(jīng)過前三個步驟的執(zhí)行,本課題中研究內(nèi)容的聚類結(jié)果如圖3所示.結(jié)果中顯示樣本被聚成4簇,分別包含的樣本數(shù)為19.0,13.0,17.0,18.0,其中聚類-1中包含278條記錄,聚類-2中包含26條記錄,聚類-3中有190條記錄,聚類-4中包含的最多,有682條記錄.

圖3 聚類結(jié)果

3.4 結(jié)果分析與知識同化

結(jié)果分析就是通過之前的數(shù)據(jù)挖掘工作進(jìn)一步明確本課題的主體目標(biāo),并對挖掘出的信息深度分析.把最終分析所得的結(jié)果帶入和集成到現(xiàn)實應(yīng)用中去,便實現(xiàn)了知識的同化.本課題以某高校機房的數(shù)據(jù)為數(shù)據(jù)源,以2015年10月1日到10月31日學(xué)生業(yè)余上機一千多條數(shù)據(jù)為依據(jù),利用SPSS Clementine工具在K-Means算法的基礎(chǔ)上對這些數(shù)據(jù)進(jìn)行挖掘.

4 總結(jié)與展望

本課題從數(shù)據(jù)挖掘的現(xiàn)狀出發(fā),簡單地介紹數(shù)據(jù)挖掘技術(shù)的一些相關(guān)概念.以筆者單位機房為背景,按照數(shù)據(jù)挖掘的步驟對數(shù)據(jù)進(jìn)行預(yù)處理,對數(shù)據(jù)挖掘中的聚類分析的K-Means算法進(jìn)行深入研究,分析了數(shù)據(jù)挖掘的工具,對本課題中使用的Clementine工具進(jìn)行了詳細(xì)的研究,最后利用Clementine中的K-Means對機房管理系統(tǒng)中的數(shù)據(jù)進(jìn)行挖掘,得出并分析結(jié)果.

數(shù)據(jù)挖掘在機房管理中的應(yīng)用非常廣,這里由于時間和能力的限制,只是對每一天中的time進(jìn)行挖掘,在現(xiàn)實中本單位還分多種情況,比如每一年的每個月學(xué)生上機情況有所不同,另外每周中周六和周日上機的學(xué)生又會多些,這些都沒有在本課題中實現(xiàn),另外,除了本課題中使用的聚類算法外,數(shù)據(jù)挖掘中還有很多算法都可以在機房管理中應(yīng)用,如我們可以利用決策樹算法,通過平時機器運行時間來分類判斷哪些機器需要檢修,減少機房維護(hù)人員工作量.也可以利用分析預(yù)測,通過學(xué)生平時上實驗課時交作業(yè)的情況,來預(yù)測他們最終考試通過率等,這一系列的知識都值得我們后期去進(jìn)行發(fā)現(xiàn)和研究.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費中的應(yīng)用淺析
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
主站蜘蛛池模板: 自拍偷拍欧美日韩| 欧美日韩在线国产| 色噜噜综合网| 久久久久青草大香线综合精品| 久久精品这里只有国产中文精品 | 午夜电影在线观看国产1区| 久久夜色精品国产嚕嚕亚洲av| 色噜噜狠狠色综合网图区| 久久99这里精品8国产| 狂欢视频在线观看不卡| 男人天堂亚洲天堂| 天堂在线亚洲| 91精品福利自产拍在线观看| 色屁屁一区二区三区视频国产| A级毛片无码久久精品免费| 永久在线播放| 免费在线国产一区二区三区精品| 久久综合伊人 六十路| 精品乱码久久久久久久| 国产第二十一页| 美女扒开下面流白浆在线试听| 欧美一道本| 97国产精品视频自在拍| 亚洲视频欧美不卡| 天天色天天操综合网| 美女免费精品高清毛片在线视| 日本妇乱子伦视频| 亚洲成在线观看| 欧美特级AAAAAA视频免费观看| 午夜国产精品视频| 国产福利影院在线观看| 国产毛片基地| 99中文字幕亚洲一区二区| 亚洲一级毛片在线观播放| 国产无人区一区二区三区| 久久综合九色综合97婷婷| 无码'专区第一页| 成人另类稀缺在线观看| 最近最新中文字幕免费的一页| 国产一区二区免费播放| 国产九九精品视频| 国产男女免费完整版视频| 夜色爽爽影院18禁妓女影院| 国产黄网永久免费| 欧洲成人免费视频| 免费看a级毛片| 国产主播在线一区| 国产人人射| 国内精品视频区在线2021| 日本人又色又爽的视频| 国产经典免费播放视频| 亚洲高清无码精品| 欧美.成人.综合在线| 国产免费久久精品99re不卡| 色欲综合久久中文字幕网| 成人av专区精品无码国产 | 久久黄色免费电影| 素人激情视频福利| 666精品国产精品亚洲| 欧美亚洲网| 女人18毛片一级毛片在线 | 伊人色在线视频| 国产又黄又硬又粗| 亚洲精品波多野结衣| 婷婷五月在线| 中文字幕无线码一区| 亚洲精品午夜天堂网页| 国产高潮视频在线观看| 久久精品国产精品青草app| 性做久久久久久久免费看| 久久精品国产亚洲AV忘忧草18| 欧美亚洲香蕉| 色久综合在线| 国产区免费精品视频| 尤物午夜福利视频| 亚洲精品第一页不卡| 男女男精品视频| 国产在线无码一区二区三区| 亚洲国产成人自拍| 欧美在线中文字幕| 欧美亚洲激情| 岛国精品一区免费视频在线观看|