999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術(shù)在互聯(lián)網(wǎng)時代的應(yīng)用探究

2015-02-11 02:01:42劉光金
科技資訊 2014年29期
關(guān)鍵詞:應(yīng)用

劉光金

摘 要:該文針對數(shù)據(jù)挖掘技術(shù)在互聯(lián)網(wǎng)時代的應(yīng)用一題進行了深入的研究,其中包括數(shù)據(jù)挖掘技術(shù)的概念介紹、數(shù)據(jù)挖掘技術(shù)的基本分析方法以及數(shù)據(jù)挖掘技術(shù)對于數(shù)據(jù)的預(yù)處理方式等,以期能夠?qū)Ω魑煌蕩硪恍┚哂袇⒖夹缘囊庖姟?/p>

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 互聯(lián)網(wǎng)時代 應(yīng)用

中圖分類號:TP274 文獻標識碼:A 文章編號:1672-3791(2014)10(b)-0002-01

如今,互聯(lián)網(wǎng)的發(fā)展速度之快是我們無法預(yù)計的,用戶能夠通過互聯(lián)網(wǎng)來搜索到一切想要了解的信息,將“秀才不出門便知天下事”這句古語的核心意義發(fā)揮的淋漓盡致。但由于Web缺少一定的智能性,以至于用戶只能夠依靠導航來對信息進行篩選,這樣一來就會讓搜索結(jié)果的準確性以及針對性大大降低。而伴隨著數(shù)據(jù)挖掘技術(shù)的加入,讓網(wǎng)站對系統(tǒng)性能和用戶喜好的分析能力大大增加,從而有效地提高了用戶的使用滿意度。

1 基本概念介紹

數(shù)據(jù)挖掘的出現(xiàn)時間為20世紀的80年代,它作為一門剛剛興起的學科來說還尚未得到人們的廣泛認可和使用。如果從技術(shù)的層面對其進行分析,數(shù)據(jù)挖掘所針對的是一些較為復雜且無規(guī)律的數(shù)據(jù)群體;而從商業(yè)的角度來說,數(shù)據(jù)挖掘所指的則是在偌大的數(shù)據(jù)庫中精準的將一些有規(guī)律的信息進行轉(zhuǎn)換和分析,并在其中將一些對商業(yè)決策有幫助的信息提取出來。

2 數(shù)據(jù)挖掘技術(shù)的基本分析方法

數(shù)據(jù)挖掘工作中最為重要的一個環(huán)節(jié)就是對數(shù)據(jù)進行分析,只有選擇一些科學且有效的計算方式才能夠?qū)?shù)據(jù)的挖掘工作正確的完成。其中,目前較為常用的分析方法有三種,即聚類分析法、分類和預(yù)測法以及關(guān)聯(lián)分析法,下面筆者就對其分別進行詳細的介紹。

2.1 聚類分析

聚類分析的主要工作就是將物理對象與抽象對象的整合進行分類,并同時對由相同或者相似的對象所組成的分類進行更加深入的分析,而聚類分析的最終目的就是使用詳細的方法來將數(shù)據(jù)進行有效的分類。古語說的不錯,“物以類聚,人以群分”,聚類分析法正是通過對事物之間的規(guī)律進行分析,從而能夠?qū)Ω鱾€領(lǐng)域進行智能化學習。

聚類分析可以被分成兩種方式,即硬聚類和模糊聚類。其中,硬聚類所代表的是將分析對象劃分到最為相近的類別當中,而模糊聚類則是通過取值范圍的大小來對分析對象進行劃分,并且一個對象有可能出現(xiàn)多個類別。

2.2 分類和預(yù)測

分類是對無排序規(guī)律的標號進行分類,而預(yù)測則是將連續(xù)值的函數(shù)模型進行預(yù)測。其中,分類對于數(shù)據(jù)挖掘技術(shù)來說是非常重要的一個基礎(chǔ),通過分類能夠?qū)?shù)據(jù)集的特性正確的表現(xiàn)出來,從而將各個類別的屬性進行相對應(yīng)的劃分。如今比較常見的計算方法為決策樹、粗糙集、貝葉斯、遺傳算法等等。

而預(yù)測則是在已知分類情況的基礎(chǔ)之上將未來的發(fā)展規(guī)律進行預(yù)測,目前較為常用的方式有時間序列、回歸分析以及局勢外推等等。

2.3 關(guān)聯(lián)分析

相信大家都了解蝴蝶效應(yīng),在自然界中發(fā)生的任何一次微小的變動都極有可能連帶出另一個事件的發(fā)生,而關(guān)聯(lián)分析則是遵循這個規(guī)律所完成的。事物同事物之間是具有一定的依賴性和關(guān)聯(lián)性的,基于此種情況,我們就有機會對其中的規(guī)律性進行有效的預(yù)測。

舉例說明,曾經(jīng)知名度非常高的購物籃事件就是通過此種關(guān)聯(lián)分析法來進行完成的。其中,通過對顧客購物籃中物品的管理規(guī)律進行分析,從而將顧客的購買特點和購買習慣進行初步的掌握,最后根據(jù)這些數(shù)據(jù)再將日常的營銷方案和營銷策略制定出來。實踐證明,此種關(guān)聯(lián)分析法是非常有效果的。

3 數(shù)據(jù)的預(yù)處理

數(shù)據(jù)的預(yù)處理所指的是對網(wǎng)絡(luò)日志中的相關(guān)數(shù)據(jù)進行二次加工,在加工的過程當中需要對數(shù)據(jù)的原始性進行有效的保存。其中的挖掘算法所代表的是將數(shù)據(jù)的結(jié)構(gòu)以及規(guī)則有效的選取出來。其中具體的系統(tǒng)結(jié)構(gòu)如下:web日志—— 數(shù)據(jù)預(yù)處理—— 確定挖掘算法—— 數(shù)據(jù)挖掘—— 模式。

對日志進行數(shù)據(jù)挖掘之前需要對相關(guān)的數(shù)據(jù)進行優(yōu)先處理,其中包括數(shù)據(jù)的增加和減少、用戶的識別工作、會話內(nèi)容的識別工作以及路徑的補充工作等等。

3.1 數(shù)據(jù)的縮減

首先來了解一下Web日志常見的數(shù)據(jù)格式:用戶的訪問日期和訪問時間、IP地址、方法、指定頁面的URL、字節(jié)數(shù)量、網(wǎng)頁狀態(tài)、代理頁面的URL等等。由于Web的日志挖掘工作僅僅針對用戶的行為模式較為關(guān)注,對一些沒有顯示請求的界面就非常容易被忽略。例如帶有后綴名為jpg、jpeg、gif等。在此基礎(chǔ)之上在對余下的篩選記錄中將相關(guān)的項進行選取和挖掘。

3.2 用戶識別

在用戶的系統(tǒng)中通常都會設(shè)置防火墻,所以在Web日志中所產(chǎn)生的記錄極有可能是不真實的。這就會使用戶識別工作變得異常的復雜和繁瑣,使用啟發(fā)式規(guī)則則能夠讓用戶的識別工作有效的完成。

規(guī)則一:假設(shè)用戶的IP相同,如果代理瀏覽器的操作系統(tǒng)出現(xiàn)了變化,則代表其屬于不同的用戶。

規(guī)則二:假設(shè)用戶的IP相同,如果當下的鏈接頁面同已經(jīng)瀏覽過的鏈接頁面沒有任何的關(guān)系,則代表用戶是不同的。

3.3 會話識別

會話識別的最終目的是可以將用戶的訪問記錄進行劃分,從而形成多個單獨的會話,并以此來作為不同的用戶單位。其中,如果歷經(jīng)時間超過了事先的限定范圍,則會默認認為一個新的會話已經(jīng)開始。

3.4 路徑補充

如果想要達到減少網(wǎng)絡(luò)傳輸量的目的,目前大部分的瀏覽器都會采取對剛剛訪問的頁面進行緩存的做法。其中,如果用戶在頁面中給出了返回指令,系統(tǒng)將會顯示出緩存頁面。由于Web的服務(wù)器無法對用戶的訪問頁面有效的進行確定,對PostLOG表中的refer進行檢查將能夠完成對頁面的確定工作。

如果用戶的訪問歷史中包含了多個當前頁面的鏈接,將優(yōu)先選擇請求時間最接近的的頁面。

4 結(jié)語

互聯(lián)網(wǎng)已經(jīng)逐漸的在人們的生活中占據(jù)了主導的地位,為了能夠讓用戶有更好的體驗感受,相關(guān)的技術(shù)部門應(yīng)該對用戶的行為進行更準確的理解和掌握。伴隨著數(shù)據(jù)管理工作的不斷優(yōu)化,以及相關(guān)檢索技術(shù)的不斷進步,數(shù)據(jù)挖掘技術(shù)將在未來擁有著更為廣大的發(fā)展舞臺,讓其能夠更好地為互聯(lián)網(wǎng)、為用戶提供服務(wù)。

參考文獻

[1] 胡天狀.數(shù)據(jù)挖掘技術(shù)在教育決策支持系統(tǒng)中的應(yīng)用[D].杭州:浙江師范大學,2002.

[2] 丁守哲.基于云計算的建筑設(shè)計行業(yè)信息系統(tǒng)開發(fā)模式與實現(xiàn)技術(shù)研究[D].合肥:合肥工業(yè)大學,2012.

[3] 劉華婷,郭仁祥,姜浩.關(guān)聯(lián)規(guī)則挖掘Apriori算法的研究與改進[J].計算機應(yīng)用與軟件,2009(1):146-149.

猜你喜歡
應(yīng)用
配網(wǎng)自動化技術(shù)的應(yīng)用探討
科技視界(2016年21期)2016-10-17 19:54:47
帶壓堵漏技術(shù)在檢修中的應(yīng)用
科技視界(2016年21期)2016-10-17 19:54:05
行列式的性質(zhì)及若干應(yīng)用
科技視界(2016年21期)2016-10-17 18:46:46
癌癥擴散和治療研究中的微分方程模型
科技視界(2016年21期)2016-10-17 18:37:58
紅外線測溫儀在汽車診斷中的應(yīng)用
科技視界(2016年21期)2016-10-17 18:28:05
多媒體技術(shù)在小學語文教學中的應(yīng)用研究
考試周刊(2016年76期)2016-10-09 08:45:44
微課的翻轉(zhuǎn)課堂在英語教學中的應(yīng)用研究
大學教育(2016年9期)2016-10-09 08:28:55
分析膜技術(shù)及其在電廠水處理中的應(yīng)用
科技視界(2016年20期)2016-09-29 14:22:00
GM(1,1)白化微分優(yōu)化方程預(yù)測模型建模過程應(yīng)用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學應(yīng)用分析
科技視界(2016年20期)2016-09-29 11:47:01
主站蜘蛛池模板: 国产欧美精品专区一区二区| 青青草久久伊人| 99re在线观看视频| 久久青草热| 国产欧美日韩另类| 精品成人一区二区三区电影| 国产精品成人免费综合| 日韩中文字幕亚洲无线码| 91亚洲影院| 蜜臀AV在线播放| 无码人中文字幕| 欧美日韩在线国产| 欧美性爱精品一区二区三区 | 国产精品欧美亚洲韩国日本不卡| 青草视频网站在线观看| 性欧美久久| 日本日韩欧美| 国产成人精品一区二区| 亚洲人在线| 精品第一国产综合精品Aⅴ| 国产精品专区第1页| 日本a级免费| 暴力调教一区二区三区| 狠狠色成人综合首页| 被公侵犯人妻少妇一区二区三区| 亚洲人人视频| 亚洲大尺码专区影院| 中文字幕啪啪| vvvv98国产成人综合青青| 欧美日韩北条麻妃一区二区| 久久久久免费看成人影片 | 国产一级二级在线观看| 亚洲成综合人影院在院播放| 看av免费毛片手机播放| 亚洲人成网址| 国产精品无码作爱| 18禁不卡免费网站| 中文字幕免费播放| 69综合网| 亚洲精品无码久久毛片波多野吉| 亚洲精品中文字幕无乱码| 色老头综合网| 亚洲最大情网站在线观看| 日韩美一区二区| 欧美综合成人| 久久久久亚洲精品成人网| 日本一区高清| 国产精品美乳| 黄色网站在线观看无码| 国产尹人香蕉综合在线电影| 中文字幕永久在线观看| 老司机aⅴ在线精品导航| 日韩在线观看网站| 国产乱人伦AV在线A| 91色爱欧美精品www| 成人综合在线观看| 日韩精品亚洲人旧成在线| 亚洲日本中文综合在线| 日韩中文无码av超清| 婷婷色中文| AV在线麻免费观看网站| 色欲不卡无码一区二区| 亚洲欧美日韩久久精品| 久久久久中文字幕精品视频| 国产毛片一区| 九九视频免费在线观看| 2021国产v亚洲v天堂无码| 午夜精品久久久久久久无码软件| a毛片免费观看| 久久综合婷婷| 亚洲精品视频在线观看视频| 四虎成人免费毛片| 一本大道无码日韩精品影视| 成年女人18毛片毛片免费| 99热这里只有精品2| 国产成人亚洲精品蜜芽影院| 国产91导航| 亚洲第一视频免费在线| 国产免费久久精品99re丫丫一| 日本a∨在线观看| 亚洲系列无码专区偷窥无码| 免费AV在线播放观看18禁强制|