999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)研究進(jìn)展

2009-01-01 00:00:00程舒通徐從富

摘 要:回顧了最近幾年來國(guó)內(nèi)外在網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)領(lǐng)域的研究成果,提出了網(wǎng)站結(jié)構(gòu)優(yōu)化模型,詳細(xì)描述每一階段的主要內(nèi)容,并對(duì)主要技術(shù)算法進(jìn)行了較為全面的論述。該模型分析比較具體,對(duì)將來研究具有指導(dǎo)意義。

關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)站結(jié)構(gòu);優(yōu)化模型;關(guān)聯(lián)規(guī)則;路徑分析

中圖分類號(hào):TP393文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1001-3695(2009)06-2013-03

doi:10.3969/j.issn.1001-3695.2009.06.004

State-of-art on website structure optimization techniques

CHENG Shu-tong1,2,XU Cong-fu1

(1.College of Computer Science Technology, Zhejiang University, Hangzhou 310027, China;2.Hangzhou Poly Technique College, Hangzhou 310012, China)Abstract:This paper reviewed the resent studies in the domain and proposed a model of WSOT with description of each stage and discussion of main algorithms. The specific analysis will direct further research.

Key words:data mining;website structure;otimization model;association rules;analysis of paths

0 引言

因特網(wǎng)(Internet)已經(jīng)成為信息傳播、交流與共享的主要媒體。由于全球Web站點(diǎn)數(shù)目迅速增長(zhǎng),同時(shí)各個(gè)Web 站點(diǎn)的信息量及其復(fù)雜度也在迅速上升,一個(gè)網(wǎng)站包含成千上萬個(gè)網(wǎng)頁(yè)與超鏈接是很平常的,給用戶訪問也增加了一定的難度。用戶在面對(duì)眾多的超鏈接選擇時(shí)會(huì)產(chǎn)生一些無益于到達(dá)其興趣目標(biāo)頁(yè)面的無謂點(diǎn)擊行為。這種無謂的點(diǎn)擊行為一方面增加了Web服務(wù)器負(fù)擔(dān);另一方面也增加了網(wǎng)絡(luò)的數(shù)據(jù)流量,容易造成網(wǎng)絡(luò)阻塞,導(dǎo)致網(wǎng)絡(luò)訪問速度的下降,從而進(jìn)一步影響信息搜尋行為的效率。目前針對(duì)這類問題的主要解決辦法就是網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)。

網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)是國(guó)內(nèi)外數(shù)據(jù)挖掘研究比較新穎的領(lǐng)域,也是將來的研究熱點(diǎn)。簡(jiǎn)單地說,網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)就是通過考慮優(yōu)化網(wǎng)站信息組織的超鏈體系結(jié)構(gòu)來使所有的用戶都能以更小的訪問代價(jià)瀏覽Web站點(diǎn),更有效地獲取所需的信息。一方面可以減少Web服務(wù)器的請(qǐng)求事務(wù)次數(shù),減輕服務(wù)器負(fù)擔(dān);另一方面可以使用戶更有效地到達(dá)其訪問的目標(biāo)頁(yè)面,節(jié)省用戶訪問時(shí)間,提高用戶對(duì)站點(diǎn)的滿意度。

針對(duì)網(wǎng)站結(jié)構(gòu)優(yōu)化,不少軟件公司和研究機(jī)構(gòu)在這方面已投入了開發(fā)工作,提出了一些相應(yīng)的優(yōu)化系統(tǒng),如Web推薦系統(tǒng)和自適應(yīng)網(wǎng)站系統(tǒng)。

比較著名的Web站點(diǎn)優(yōu)化系統(tǒng)如德國(guó)柏林Humboldt大學(xué)的Web Utilization Miner、加拿大Simon Fraser大學(xué)的WebLogMiner、IBM公司的SpeedTmcer等,這些系統(tǒng)的主要數(shù)據(jù)源是Web日志,用途是為網(wǎng)站的設(shè)計(jì)者和管理者提供網(wǎng)站的使用情況分析,從而為網(wǎng)站優(yōu)化提供幫助。Web推薦系統(tǒng),也稱為個(gè)性化服務(wù)[1,2],主要原理是將與用戶行為無關(guān)的信息過濾掉,使用戶只關(guān)注那些可能感興趣的資源。文獻(xiàn)[1]實(shí)現(xiàn)了一個(gè)基于聚集模型的Web推薦系統(tǒng)。

自適應(yīng)網(wǎng)站是指能根據(jù)用戶的訪問模式自動(dòng)或半自動(dòng)地學(xué)習(xí)和調(diào)整自身組織架構(gòu)的網(wǎng)站,它使用索引頁(yè)合成技術(shù)進(jìn)行快速導(dǎo)航。索引頁(yè)(index page)包含了所有覆蓋某個(gè)特有主題頁(yè)面集的鏈接。那么,用戶從索引頁(yè)上就可以輕而易舉地獲得自己想要的信息。例如Perkowitz等人[3,4]提出Web站點(diǎn)的自適應(yīng)算法,這是一種半自動(dòng)構(gòu)造Web頁(yè)面的方法。這種頁(yè)面聚集算法可以發(fā)現(xiàn)高頻伴同出現(xiàn)的頁(yè)面,并可以產(chǎn)生由這些頁(yè)面鏈接組成的索引頁(yè)面。

網(wǎng)站結(jié)構(gòu)分析工具也得到了深入的發(fā)展,目前商業(yè)化的Web日志分析工具就多達(dá)幾十種,如IBM公司的SurfAid、BlueMartini、ECOMMINER等,多數(shù)是關(guān)于點(diǎn)擊率、傳送數(shù)據(jù)量、訪問頻度、錯(cuò)誤率等的簡(jiǎn)單統(tǒng)計(jì)。還有不少學(xué)者提出了相應(yīng)的優(yōu)化模型[5]和相關(guān)研究[6]。

雖然已有部分文獻(xiàn)論述了網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)及算法問題,但均未對(duì)網(wǎng)站結(jié)構(gòu)優(yōu)化的最新發(fā)展進(jìn)行全面、系統(tǒng)、深入的總結(jié)。事實(shí)上,作為Web挖掘的重要部分,網(wǎng)站結(jié)構(gòu)優(yōu)化具有非常重要的理論和研究?jī)r(jià)值。為此,本文在介紹網(wǎng)站結(jié)構(gòu)優(yōu)化模型的基礎(chǔ)上,重點(diǎn)對(duì)主要技術(shù)的算法進(jìn)行了論述,探討未來的主要研究方向。

1 網(wǎng)站結(jié)構(gòu)優(yōu)化模型

網(wǎng)站結(jié)構(gòu)優(yōu)化系統(tǒng)模型一般包括四個(gè)主要階段,即數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、模式發(fā)現(xiàn)和模式分析,如圖1所示。

1.1 數(shù)據(jù)采集

網(wǎng)站數(shù)據(jù)采集階段主要分為四種形式:

a)Web服務(wù)器端數(shù)據(jù)采集。主要包括從Web服務(wù)器日志中收集和從網(wǎng)絡(luò)監(jiān)視器中收集。Web服務(wù)器日志文件是執(zhí)行網(wǎng)站結(jié)構(gòu)優(yōu)化的重要數(shù)據(jù)來源,該日志文件記錄了用戶訪問站點(diǎn)的數(shù)據(jù)。每當(dāng)站點(diǎn)上的網(wǎng)頁(yè)被訪問一次,Web服務(wù)器就在日志文件中增加一條相應(yīng)的記錄。

b)客戶端的數(shù)據(jù)采集。它是建立在用戶行為源上的,可以準(zhǔn)確地捕捉用戶的行為??蛻舳说挠脩魹g覽路徑采集包括Java Applet和Java Script以及Plug-in等網(wǎng)頁(yè)跟蹤幀和修改瀏覽器等技術(shù)。

c)應(yīng)用服務(wù)器數(shù)據(jù)采集。這種數(shù)據(jù)采集方法可以利用應(yīng)用服務(wù)器上的應(yīng)用程序(如CGI程序)來記錄用戶的個(gè)人信息,同時(shí)也可以通過自定義的格式動(dòng)態(tài)記錄用戶的瀏覽信息。

d)代理服務(wù)器端數(shù)據(jù)采集。代理服務(wù)器相當(dāng)于一個(gè)在客戶端瀏覽器與Web服務(wù)器之間提供了緩存功能的中介服務(wù)器,從代理服務(wù)器可以得到從多個(gè)用戶到Web服務(wù)器的訪問記錄。1.2 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理階段包括日志預(yù)處理、數(shù)據(jù)清理、識(shí)別用戶和路徑修補(bǔ)四個(gè)模塊。日志預(yù)處理模塊包括將日志導(dǎo)入數(shù)據(jù)庫(kù)表中,數(shù)據(jù)庫(kù)表中的字段根據(jù)日志格式中的字段進(jìn)行選擇定義;數(shù)據(jù)清理從Web日志文件中過濾無關(guān)的頁(yè)面請(qǐng)求(如圖形等)以及不成功的頁(yè)面請(qǐng)求;識(shí)別用戶采用IP+agent機(jī)制實(shí)現(xiàn);路徑修補(bǔ)將因緩沖而造成日志文件中丟失用戶訪問鏈接的記錄根據(jù)站點(diǎn)結(jié)構(gòu)補(bǔ)充完整,以便后續(xù)結(jié)構(gòu)優(yōu)化模塊提供準(zhǔn)確的用戶訪問記錄。

1.3 模式發(fā)現(xiàn)

模式發(fā)現(xiàn)階段包括序列模式挖掘、關(guān)聯(lián)規(guī)則挖掘技術(shù)和聚類分類分析三部分,這三部分都是數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)。序列模式挖掘問題是由Agrawal等人[7]最先提出的:給定一個(gè)序列集,其中每個(gè)序列由項(xiàng)集構(gòu)成,然后由用戶給定最小支持度閾值,序列模式挖掘就是去發(fā)現(xiàn)所有的頻繁子序列(即這些子序列的出現(xiàn)頻率不小于給定的最小支持度閾值)。后續(xù)不斷有學(xué)者提出了基于Apriori的寬度優(yōu)先和深度優(yōu)先算法[8]。

在網(wǎng)站結(jié)構(gòu)優(yōu)化中, 關(guān)聯(lián)規(guī)則主要用于發(fā)現(xiàn)用戶之間、頁(yè)面之間以及用戶瀏覽頁(yè)面與網(wǎng)上行為之間存在的潛在關(guān)系,即挖掘出用戶在一個(gè)訪問期間(session)從服務(wù)器上訪問的頁(yè)面或文件之間的聯(lián)系。最著名的關(guān)聯(lián)規(guī)則挖掘方法是Agrawal提出的Apriori算法。采用Apriori算法可以從事務(wù)數(shù)據(jù)庫(kù)中挖掘出最大頻繁訪問項(xiàng)集,這個(gè)項(xiàng)集就是關(guān)聯(lián)規(guī)則挖掘出來的用戶訪問模式。

聚類分類規(guī)則可以挖掘某些共同的特性,該特性可以用來對(duì)新添到數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)進(jìn)行分類。在Web數(shù)據(jù)挖掘中,分類技術(shù)可以根據(jù)訪問這些用戶而得到的個(gè)人信息或共同的訪問模式得出訪問某一服務(wù)器文件的用戶特征。聚類分析用于把有相似特性的用戶、數(shù)據(jù)項(xiàng)集合到一起。

1.4 模式分析

模式分析階段包括頻繁訪問模式分析和序列模式分析兩部分。頻繁訪問模式分析給出頻繁訪問的頁(yè)面集合,展示頁(yè)面的重要程度和訪客來源分類;頁(yè)面的訪問情況、訪客百分比、停留時(shí)間、離開百分比均以圖表形式展現(xiàn)。序列模式分析任務(wù)是找到方便用戶使用的搜索合理的頁(yè)面鏈接組合。

常見的模式分析形式有:類似于SQL的查詢機(jī)制(如WebMiner系統(tǒng)以及專門為Web挖掘而定義的WebSSQL、WebLQM和Squeal等);聯(lián)機(jī)分析處理技術(shù)(OLAP);可視化技術(shù)(可視化技術(shù)主要分為基于點(diǎn)和基于序列兩類,如Pitkow等人開發(fā)的WebViz系統(tǒng),可對(duì)挖掘的訪問模式進(jìn)行可視化)。

2 網(wǎng)站結(jié)構(gòu)優(yōu)化主要技術(shù)算法研究

網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)的關(guān)鍵步驟就是路徑分析、關(guān)聯(lián)規(guī)則以及序列模式挖掘技術(shù)研究,而這三者都是基于Web日志挖掘。Web日志挖掘包括Web日志定量分析,揭示其中的關(guān)聯(lián)關(guān)系、時(shí)序關(guān)系、頁(yè)面類屬關(guān)系、客戶類屬關(guān)系以及頻繁訪問路徑、頻繁訪問頁(yè)面等,這些研究為優(yōu)化Web站點(diǎn)的拓?fù)浣Y(jié)構(gòu)提供參考。通過Web日志挖掘可以從Web訪問日志中發(fā)現(xiàn)用戶的訪問模式,預(yù)測(cè)用戶的瀏覽行為[9],并可以了解Web結(jié)構(gòu),分析系統(tǒng)性能,改進(jìn)Web站點(diǎn)的結(jié)構(gòu)及其服務(wù)質(zhì)量。

Web日志挖掘可以分為以Zaiane等人[10]為代表的基于數(shù)據(jù)立方體的方法和以Chen等人[11]為代表的基于Web事務(wù)的方法。Zaiane等人根據(jù)Web日志建立數(shù)據(jù)立方體,然后對(duì)數(shù)據(jù)立方體進(jìn)行數(shù)據(jù)挖掘和OLAP。Chen等人首先將數(shù)據(jù)挖掘技術(shù)應(yīng)用于Web服務(wù)器日志文件,以期發(fā)現(xiàn)用戶瀏覽模式,他們提出了最大前向引用序列MPR的概念,并用它將用戶會(huì)話分割成一系列的事務(wù),然后采用與關(guān)聯(lián)規(guī)則相似的方法挖掘頻繁瀏覽路徑。

2.1 路徑分析研究

在網(wǎng)站結(jié)構(gòu)優(yōu)化過程中,通過路徑分析技術(shù)可以確定網(wǎng)站的頻繁訪問路徑,即用戶對(duì)Web站點(diǎn)的訪問存在某種有序關(guān)系,這種有序關(guān)系反映的是用戶的一種訪問興趣,也就是說群體用戶的訪問興趣與他們的訪問序列有很強(qiáng)的相關(guān)性。接下來可以對(duì)頻繁訪問的路徑進(jìn)行優(yōu)化,在頻繁訪問的路徑上放重要的信息,如導(dǎo)航信息等,方便用戶使用。

在網(wǎng)站訪問路徑分析的研究中,絕大部分學(xué)者提出了聚類算法,如文獻(xiàn)[12]在對(duì)Web站點(diǎn)的訪問日志進(jìn)行事務(wù)識(shí)別后,根據(jù)群體用戶對(duì)Web站點(diǎn)的訪問順序進(jìn)行聚類,即路徑聚類,那么最終每一個(gè)聚類集就反映出該聚類集中的全體用戶具有相似的訪問興趣。

文獻(xiàn)[13]中提出了一種基于密度的遞歸算法(RDBC),該算法是基于DBSCAN——一種典型的基于密度的聚類方法的改進(jìn)算法,可以智能地、動(dòng)態(tài)地修改其密度參數(shù)。將RDBC用于Web文檔聚類,不但保留了DBSCAN高速度的優(yōu)點(diǎn),而且聚類效果優(yōu)于DBSCAN。文獻(xiàn)[14]提出了一種Web日志的高效多能挖掘算法,該算法的計(jì)算基礎(chǔ)是以Web站點(diǎn)URL為行、UserID為列建立的關(guān)聯(lián)矩陣。該算法提出對(duì)列向量進(jìn)行相似性分析可得到客戶群體,對(duì)行向量相似度量可獲得相關(guān)Web頁(yè)面,對(duì)后者再作進(jìn)一步處理還可以發(fā)現(xiàn)頻繁訪問路徑。文獻(xiàn)[15]是應(yīng)用基于頻繁項(xiàng)集的關(guān)聯(lián)規(guī)則來找到頻繁訪問路徑,以及稱做關(guān)聯(lián)規(guī)則的超圖劃分的聚類方法來進(jìn)行URL集聚類,然后通過推薦引擎進(jìn)行在線推薦。文獻(xiàn)[16]提出了結(jié)合站點(diǎn)拓?fù)浣Y(jié)構(gòu)和Web頁(yè)面內(nèi)容的頁(yè)面聚類改進(jìn)算法來提高挖掘結(jié)果的興趣性。

2.2 關(guān)聯(lián)規(guī)則研究

關(guān)聯(lián)規(guī)則挖掘技術(shù)主要用于從用戶訪問序列數(shù)據(jù)庫(kù)的序列項(xiàng)中挖掘出相關(guān)聯(lián)的規(guī)則。在Web網(wǎng)站優(yōu)化中,關(guān)聯(lián)規(guī)則挖掘就是要挖掘出用戶在一個(gè)訪問期間從服務(wù)器上訪問的頁(yè)面或文件之間的聯(lián)系。文獻(xiàn)[17]提出了一種Web文檔的關(guān)聯(lián)聚類算法,該算法首先采用向量空間模型(vector space model,VSM)表示主題,根據(jù)主題表示文檔,采用關(guān)聯(lián)規(guī)則挖掘算法發(fā)現(xiàn)主題頻集。

Nakayama等人[18]通過測(cè)量?jī)?nèi)部頁(yè)面的關(guān)聯(lián)和訪問事件以發(fā)現(xiàn)在Web站點(diǎn)設(shè)計(jì)者的期望與用戶行為之間的差異,得到一種從頁(yè)面布局特征中推出的多重頻繁頁(yè)面切換技術(shù)。

也有學(xué)者提出傳統(tǒng)的基于統(tǒng)計(jì)學(xué)的Web關(guān)聯(lián)規(guī)則挖掘算法注重對(duì)現(xiàn)有數(shù)據(jù)的分析, 不能針對(duì)Web關(guān)聯(lián)挖掘的特點(diǎn)提供有效的預(yù)測(cè)手段和優(yōu)化反饋措施。因此人們提出了新的Web關(guān)聯(lián)挖掘算法體系。

2.3 序列模式挖掘技術(shù)

在網(wǎng)站結(jié)構(gòu)優(yōu)化中,序列模式挖掘技術(shù)可以按不同的用戶訪問序列模式,把網(wǎng)頁(yè)分組,得到一個(gè)一個(gè)的興趣點(diǎn)。哪些用戶所訪問的網(wǎng)頁(yè)組比較類似(具有類似的興趣),即根據(jù)用戶行為的相似性,分類用戶行為模式。

網(wǎng)站結(jié)構(gòu)優(yōu)化的序列挖掘可以幫助研究人員預(yù)測(cè)用戶訪問行為?;谕诰虺龅男蛄心J?,如“如果計(jì)算機(jī)銷售上升的話,一個(gè)星期內(nèi)打印機(jī)的銷售也會(huì)隨之上升”或是“在線購(gòu)買商品A的用戶50%在某一段時(shí)間內(nèi)也會(huì)購(gòu)買商品B”,可以對(duì)不同的用戶組開展有針對(duì)性的廣告宣傳。

人們提出了網(wǎng)站結(jié)構(gòu)優(yōu)化的序列模式挖掘算法[19],如文獻(xiàn)[20]提出了一種基于馬爾可夫鏈的Web訪問序列挖掘算法,可以通過較少的計(jì)算量發(fā)現(xiàn)請(qǐng)求網(wǎng)頁(yè)的相關(guān)性。

2.4 其他相關(guān)算法

也有不少學(xué)者提出了其他的相關(guān)算法,如Pei等人[21]為了從Web日志中高效地挖掘用戶的訪問模式,提出Web訪問模式樹,或者稱為WAP樹。WAP樹能從海量的Web日志記錄中存儲(chǔ)高度壓縮的關(guān)鍵信息,是挖掘用戶訪問模式中比較新穎的算法。

Shahabi等人[22]提出一種基于Java-agent技術(shù)的模型,可以獲得用戶選擇鏈接和Web頁(yè)面的序列、頁(yè)面被關(guān)注的精確時(shí)間以及其中隱含的相關(guān)信息。使用Java-agent技術(shù)主要是通過知識(shí)發(fā)現(xiàn)去挖掘用戶興趣的相似度信息。

Spiliopoulou等人[23]通過對(duì)網(wǎng)站注冊(cè)用戶和未注冊(cè)用戶的瀏覽模式進(jìn)行對(duì)比,告訴人們?nèi)绾胃淖冋军c(diǎn)的拓?fù)浣Y(jié)構(gòu),幫助網(wǎng)站的瀏覽者從非客戶的狀態(tài)變成客戶狀態(tài)。

文獻(xiàn)[24]采用仿真的方法研究降低Web站點(diǎn)平均訪問代價(jià)的站點(diǎn)結(jié)構(gòu)優(yōu)化問題:將Web站點(diǎn)抽象成樹結(jié)構(gòu)模型,通過分析模型中網(wǎng)頁(yè)節(jié)點(diǎn)的出度特征與訪問頻度特征,采用仿真的方法分別模擬了Web站點(diǎn)超鏈體系結(jié)構(gòu)以及Web頁(yè)面的訪問頻度,并通過量化新增超鏈接的影響因素設(shè)計(jì)了相應(yīng)的站點(diǎn)結(jié)構(gòu)優(yōu)化方法。

3 結(jié)束語

網(wǎng)站結(jié)構(gòu)優(yōu)化作為當(dāng)前一個(gè)非常重要的研究和應(yīng)用領(lǐng)域,產(chǎn)生了許多非常有價(jià)值的研究成果。本文回顧了最近幾年來國(guó)內(nèi)外在該領(lǐng)域的研究成果,論述了網(wǎng)站結(jié)構(gòu)優(yōu)化模型及特點(diǎn),并對(duì)主要技術(shù)算法進(jìn)行了論述。未來該領(lǐng)域的研究方向是優(yōu)化算法的質(zhì)量,開發(fā)智能化的模式挖掘和分析工具,盡可能全面地集成網(wǎng)站上動(dòng)態(tài)分布的數(shù)據(jù)并實(shí)施挖掘,真正輔助人們理解挖掘出來的知識(shí),幫助人們更有效地獲取網(wǎng)站的信息。

參考文獻(xiàn):

[1]MOBASHER B,COOLEY R,SRIVASTAVA J.Automatic personalization based on Web usage mining[J].Communications of the ACM,2000,43(8):142-151.

[2]ROSSI G,SCHWABE D,GUIMARES R.Designing personalized Web applications[C]//Proc of the 10th International Conference on World Wide Web.2001:275-284.

[3]PERKOWITZ W,ETIONI O.Towards adaptive Web sites:conceptual framework and case study[J]. Artificial Intelligence,2000,118(1):245-275.

[4]PERKOWITZ W,ETIONI O.Towards adaptive Web sites:automatically synthesizing Web pages[C]//Proc of the 15th National Conference on Artificial Intelligence (AAAI).1998:727-732.

[5]LIN Wen-long,LIU Ye-zheng.A novel website structure optimization model for more effective Web navigation[C]//Proc of the 1st International Workshop on Knowledge Discovery and Data Mining.Adelaide,SA:[s.n.],2008:36-41.

[6]GLOVER E J,TISOUTSIOULIKLIS K,LAWRENCE S,et al.Using Web structure for classifying and describing Web pages[C]//Proc of the 11th International Conference on World Wide Web.2002:562-569.

[7]AGRAWAL R,SRIKANT R.Mining sequential patterns[C]//Proc ofIEEE International Conference on Data Engineering.Taipei:[s.n.],1995:3-14.

[8]BURDICK D,CALMLM M,GEHRKE J.Mafia:a maximal frequent item set algorithm for transactional databases[C]//Proc ofIEEE International Conference on Data Engineering.Heidelberg:[s.n.],2001:443-452.

[9]GAEDE V,GUNTHER O.Multidimensional access methods[J].ACM Computer Surveys,1998,30(1):170-231.

[10]ZAIANE O R,XIN Man,HAN Jia-wei.Discovering Web access patterns and trends by applying OLAP and data mining technology on Web logs[C]//Proc of Advances in Digital Libraries Conference.Washington DC:IEEE Computer Society,1998:19-29.

[11]CHEN M S,PARK J S,YU P S.Data mining for path traversal patterns in a Web environment[C]//Proc of the 16th Int’l Conference on Distributed Computing Systems.Wahington DC:IEEE Computer Society,1996:385-392.

[12]王實(shí),高文,李錦濤,等.路徑聚類:在Web站點(diǎn)中的知識(shí)發(fā)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,2001,38(4):482-486.

[13]蘇中,馬少平,楊強(qiáng),等.基于Web-log mining的Web文檔聚類[J].軟件學(xué)報(bào),2002,13(1):99-104.

[14]宋擒豹,沈鈞毅.Web日志的高效多能挖掘算法[J].計(jì)算機(jī)研究與發(fā)展,2001,38(3):328-333.

[15]MOBASHER B,COOLEY R,SRIVASTAVA J.Creating adaptive Web sites through usage-based clustering of URLs[C]//Proc ofWorkshop on Knowledge and Data Engineering Exchange.1999:19-25.

[16]楊怡玲,管旭東,尤晉元.基于頁(yè)面內(nèi)容和站點(diǎn)結(jié)構(gòu)的頁(yè)面聚類挖掘算法[J].軟件學(xué)報(bào),2002,13(3):467-469.

[17]宋擒豹,沈鈞毅.基于關(guān)聯(lián)規(guī)則的Web文檔聚類算法[J].軟件學(xué)報(bào),2002,13(3):417-423.

[18]NAKAYAMA T,KATO H,YAMANE Y.Discovering the gap between Web site designer’s expectations and users’ behaviour[J].Compu-ter Networks,2000,33(1-6):811-822.

[19]張娥,馮秋紅,宣慧玉,等.Web使用模式研究中的數(shù)據(jù)挖掘[J].計(jì)算機(jī)應(yīng)用研究,2001,18(3):80-83.

[20]楊文忠,彭曙蓉,章兢.一種Web訪問序列挖掘算法在網(wǎng)站設(shè)計(jì)中的應(yīng)用研究[J].計(jì)算機(jī)工程與科學(xué),2006,28(11):79-80.

[21]PEI Jian,HAN Jia-wei,MORTAZAVI-ASL B,et al.Mining access patterns efficiently from Web logs[C]//Proc of the 4th Pacific-Asia Conference on Knowledge Discovery and Data Mining.2000:396-407.

[22]SHAHABI C,SHAHABI A,ZARKESH M,et al.Knowledge discovery from users Web-page navigation[C]//Proc of the 7th IEEE International Workshop on Research Issues in Data Engineering.1997:20-29.

[23]SPILIOPOULOU M,PHLE C,F(xiàn)AULSTICH L C.Improving the effectiveness of a Web site with Web usage mining[C]//Proc of International Workshop on Web Usage Analysis and User Profiling.London:Springer-Verlag,1999:142-162.

[24]劉業(yè)政,林文龍,焦寧,等.Web站點(diǎn)結(jié)構(gòu)優(yōu)化仿真[J].系統(tǒng)仿真學(xué)報(bào),2007,19(20):4685-4688.

主站蜘蛛池模板: www.亚洲天堂| 五月天综合婷婷| 久久99国产综合精品女同| 亚洲中文久久精品无玛| 午夜精品一区二区蜜桃| 97国内精品久久久久不卡| av尤物免费在线观看| 国产亚洲精品97在线观看| 欧美视频二区| 丁香婷婷综合激情| 大陆国产精品视频| 精品欧美一区二区三区在线| 国产一级在线播放| 3344在线观看无码| 日韩av高清无码一区二区三区| 99久久无色码中文字幕| 免费观看三级毛片| 国产美女无遮挡免费视频网站| 国产精品尤物在线| 久久久久久久久久国产精品| 亚洲人人视频| 国产h视频在线观看视频| 久久精品无码中文字幕| 99视频全部免费| 亚洲av无码牛牛影视在线二区| 狠狠干欧美| 国产精品久久久久久久久久98| 国产9191精品免费观看| 亚洲国模精品一区| 九九视频免费在线观看| 麻豆国产原创视频在线播放| 999国内精品久久免费视频| 国产成人欧美| 伊人五月丁香综合AⅤ| 国产菊爆视频在线观看| 亚洲国产精品一区二区第一页免 | 亚洲中文字幕国产av| 91精品啪在线观看国产91九色| 97久久人人超碰国产精品| 日韩福利在线观看| 亚欧乱色视频网站大全| 免费无码网站| 欧美人人干| 97超碰精品成人国产| 91精品国产无线乱码在线| 日韩欧美亚洲国产成人综合| 亚洲日韩精品无码专区| 亚洲天堂精品视频| 欧美国产日韩在线| 日韩久久精品无码aV| 日日碰狠狠添天天爽| 国产美女91视频| 欧美日韩精品在线播放| 999精品色在线观看| 久久精品国产999大香线焦| 中文字幕无码av专区久久| 欧美日韩北条麻妃一区二区| 国产一区二区色淫影院| 毛片在线播放a| 九色91在线视频| 亚洲美女视频一区| 久久香蕉欧美精品| 国产在线精品香蕉麻豆| 国产精欧美一区二区三区| 久久女人网| 中文字幕久久亚洲一区| 2024av在线无码中文最新| 久久精品免费看一| 国产精品第| 亚洲欧洲日本在线| 亚洲国产欧美自拍| 国产区成人精品视频| av一区二区三区在线观看 | 亚洲视频四区| 男女猛烈无遮挡午夜视频| 99久久精品国产综合婷婷| 精品人妻一区二区三区蜜桃AⅤ| 人妻中文字幕无码久久一区| 亚洲一区二区日韩欧美gif| 性欧美在线| 最新精品久久精品| 九九热精品视频在线|