999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Web數據挖掘系統的設計及關鍵技術研究

2019-07-14 00:06:56
探索科學(學術版) 2019年12期
關鍵詞:頁面數據挖掘數據庫

西南科技大學 四川 綿陽 621000

在Web上有著大量的信息,當前數據挖掘領域所面臨的新問題就是如何從非格式化的數據信息中挖掘出有用的信息,與數據庫中所存在的信息不同,Web上的數據信息,沒有統一的格式,因為他無法向數據庫一樣,有著規范的結構,另外,對于數據對象的處理,Web挖掘技術與傳統數據挖掘技術之間也完全不同,一些異質的非結構化信息是傳統數據挖掘技術的死角,但自從Web挖掘技術應用以后,大量的Web信息資源,不再能夠用數據模型來表示,因為這些數據大部分是非結構化,或者是半結構化,因此,必須以很多個數據倉庫挖掘技術來進行Web的數據挖掘,顯然,這挑戰性是非常強的。

一、Web挖掘的概念

眾所周知,Web挖掘是數據挖掘的過程,在這個挖掘過程中主要針對的內容是Web頁面內容,用戶訪問信息,用戶注冊信息以及電子商務交易信息等等,在數據挖掘方法下,Web挖掘能夠獲取到很多有用的知識,借助Web挖掘技術,人們可以對站點設計進行改進,確保個性化服務能夠得到有效提供。因此一般情況下加等不利弊挖掘分為三種,分別是內容挖掘使用挖掘以及結構挖掘。

1.1 Web內容挖掘 所以Web內容挖掘指的就是對Web頁面的內容進行挖掘,Web頁面內容中包括以音頻數據,圖像數據或文本數據為主的非結構化的數據,另外還包括這些數據相融合的多媒體數據等。

文本挖掘是Web挖掘的基礎,因此,在內容挖掘上,這種方式也占據主導地位,通常情況下,平面文本挖掘功能和方法與之相類似,相對于數據庫中的結構化數據來說,Web文檔的結構是比較有限的,甚至有的Web文檔根本沒有結構,這些是文本信息資源的主要特征,現有的很多數據挖掘技術之所以無法在文本上進行預處理,都與這些文本信息源的特征有關,為了成為文檔,中間的表現形式可以在挖掘過程中抽取其特征,并采用結構化的形式進行保存。以文本特征表示為基礎,對特征子集進行提取,文檔特征在子集算法上一般會選取一個評價函數,針對特征進行獨立的評估,這樣確保每一個特征都會有一個屬于自己的評估分,按照評估分的大小進行排序,選擇預訂數目最佳的特征,作為最終的結果,當Web文本實現結構化以后,Web上的大量文檔內容都可以進行總結分類,這一系列的挖掘工作都能夠得以實現。

1.2 Web結構挖掘 對web頁面內部或者是之間的結構進行挖掘的基本思想,指的就是Web結構挖掘,Web,結構挖掘實際上,可以將其看做一個有相圖,W頁面是它的頂點,有相圖的編制的就是頁面間的超鏈接,結合圖論,對Web的拓樸結構進行分析,Web,結構的基本算法是hs,它有兩部分構成,分別是構造紙圖和迭代計算,Web結構挖掘以一個網頁的歸類為基礎,展開不同頁面關聯度與像素信息的獲取。

總的來看,Web文本挖掘與Web結構挖掘的局限性還是比較大的,前者對于頁面的拓撲結構信息沒有進行充分的考慮,后者對于Web,數據挖掘的文本信息沒有得到充分考慮,因此,在使用過程中,Web文本挖掘和Web結構挖掘進行結合,可謂是最好的使用方法,兩者結合對于Web頁面能夠實現更好的評價。

1.3 Web日志挖掘 從Web訪問日志中發現到用戶的訪問模式,從而對用戶的測覽行為進行預測,就是Web的日志玩具,雖然Web屬于一個比較龐大的信息,但是每一個Web服務器中,訪問日志都得以保留,而且Web服務器中的日志結構非常完,你要用戶訪問Web戰,間頁面用戶的相關信息都能夠在日志中有所記錄,因此,Web日志挖掘主要是挖掘Web用戶訪問時的痕跡。

二、基于數據挖掘的Web挖掘系統

2.1 Web挖掘系統的邏輯架構 以數據挖掘為基礎的Web挖掘系統模型為Web挖掘提供了一個良好的集成環境,這環境中,整個挖掘系統的整體性能得到有效提高,Web挖掘系統原型Web MS的三個邏輯層次。數據獲取層的主要功能是對半結構化的Web數據進行模型抽取和調換,并用結構化的數據來表示,最終抽取和轉換的結果,利用結果建立起多層次的Web數據庫,采用預籌里的手段,對Web服務器的日志數據進行處理,這樣Web日志數據庫就形成了。在數據存儲層多層Web數據庫,以及Web日志數據庫都被稱作Web信息庫。

2.2 Web MS原型 Web MS是Web,數據挖掘系統的原型,WebMS的基本挖掘功能多面性更強,使Web內容挖掘和使用挖掘在整個系統中得得到集成,在Web MS中多種挖掘算法都實現了嵌入,并且與系統中的其他模塊之間實現了緊密配合,結合Web挖掘方法庫調用方法以及接口規范,使Web挖掘能夠共同完成。

在整個系統內部中各個模塊之間的功能是相對獨立的,他們在使用過程中又產生了一定的協同配合,用戶的需求下,數據采集對Web資源進行搜索,在相關處理器過濾器的處理下,形成數據存儲形式,挖掘綜合器并能夠對這些數據進行使用,結合挖掘要求,挖掘綜合器可以在方法庫中選擇恰當的方法對其進行挖掘,并輸出挖掘結果,用戶根據結果,來判定是否結束任務,如果用戶滿意,那么任務就會隨時截止,如果用戶不滿意,則會對挖掘要求進行調整,從而進行新的挖掘,可以在系統維護過程中實現新挖掘方法的加入,這樣系統并能夠實現升級。

總結

Web挖掘可謂是當今最熱門的研究領域,而且伴隨著信息技術的不斷發展,這么個領域的應用前景非常廣闊,無論是在技術上,還是在工具上Web挖掘都具有無限的潛力,因此,在Web的挖掘上還應該更深入。

猜你喜歡
頁面數據挖掘數據庫
大狗熊在睡覺
刷新生活的頁面
保健醫苑(2022年1期)2022-08-30 08:39:14
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 热99re99首页精品亚洲五月天| 国产精品欧美激情| 91久久偷偷做嫩草影院免费看| 国产精品一区不卡| 久久国产亚洲偷自| 国内精品91| 白浆免费视频国产精品视频| 亚洲色无码专线精品观看| 91系列在线观看| 久久黄色一级视频| аⅴ资源中文在线天堂| 91在线无码精品秘九色APP| 国产综合日韩另类一区二区| 成年A级毛片| 中文字幕在线一区二区在线| 51国产偷自视频区视频手机观看| 亚洲欧美另类日本| 婷婷丁香色| 在线高清亚洲精品二区| 又大又硬又爽免费视频| 婷婷丁香在线观看| 亚洲国产精品成人久久综合影院| 免费视频在线2021入口| 2020精品极品国产色在线观看| 久久精品视频亚洲| 四虎AV麻豆| 网友自拍视频精品区| 国产日韩欧美在线视频免费观看| 试看120秒男女啪啪免费| 一区二区无码在线视频| 成年人国产网站| 91福利一区二区三区| 浮力影院国产第一页| 欧美第九页| 日本在线视频免费| 日本亚洲最大的色成网站www| 免费观看亚洲人成网站| 熟妇丰满人妻| 一本一道波多野结衣av黑人在线| 九色免费视频| 丁香五月婷婷激情基地| 嫩草国产在线| 首页亚洲国产丝袜长腿综合| 亚洲精品动漫| 五月天天天色| 91精品国产无线乱码在线| 99久久精品免费看国产免费软件| 免费人成又黄又爽的视频网站| 国产在线一二三区| 无码av免费不卡在线观看| 亚洲精品成人片在线播放| 欧美福利在线观看| 少妇被粗大的猛烈进出免费视频| 亚洲欧美成人网| 高潮毛片免费观看| 久久网欧美| 福利姬国产精品一区在线| 日韩小视频在线播放| 国产成人一区| 毛片最新网址| 五月天久久婷婷| 这里只有精品国产| 亚洲成网777777国产精品| 国产在线一区视频| 欧美亚洲一二三区| 国产高清在线观看91精品| 国产av无码日韩av无码网站| 综合网天天| 波多野结衣在线se| 久久婷婷五月综合97色| 91精品啪在线观看国产60岁| 丝袜国产一区| 毛片网站免费在线观看| 国产一级做美女做受视频| 尤物午夜福利视频| 亚洲视频四区| 国产人前露出系列视频| 国产成人精品一区二区三区| 最新国产高清在线| 国产第四页| 日韩视频福利| 亚洲中文在线看视频一区|