999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網站結構優化系統研究

2011-08-29 05:39:50程舒通
科技傳播 2011年24期
關鍵詞:優化結構用戶

程舒通

1.浙江大學計算機科學與技術學院,浙江杭州 310027

2.杭州科技職業技術學院,浙江杭州 310012

0 引言

隨著互聯網和電子商務的發展,對網站技術的開發提出了更高的要求,建設一個更合理、注重個性化和相關性的網站成為研究的熱點,很多的學者從不同角度、不同方向提出了網站結構優化技術[1-4],也開發了相應的系統或模型,但是尚未從整體上去把握網站結構優化技術。本文設計了一個較為常用的網站結構優化系統,并仔細分析每一階段的特點。

我們認為網站結構優化是指Web結構挖掘內容,其對象是網站本身的超連接,即對Web文檔的結構進行挖掘。我們利用相應的算法,發現Web文檔之間鏈接情況的有用信息,由于文檔之間的超鏈接反映了文檔之間的包含、引用或者從屬關系,因此引用文檔對被引用文檔的說明往往更客觀、更概括、更準確。

1 網站結構優化系統

本文設計的網站結構優化系統,包括4個主要階段:分別是數據采集、數據預處理、模式發現和模式分析等。

圖1 網站結構優化系統基本框架圖

1.1 數據采集

網站數據采集是網站結構優化的前期步驟,也是后續工作的基礎。簡單的說就是獲取網站的原始數據和相關信息。此階段主要分為四種形式,Web服務器端數據采集、客戶端的數據采集、應用服務器數據采集以及代理服務器端數據采集等。Web服務器段數據采集是指從Web服務器獲取原始的日志文件,這些日志文件中記錄很了多的網站信息。客戶端的數據采集主要是根據客戶對網站服務器的點擊行為,產生的IP地址、點擊時間、次數以及點擊的序列,可以從中獲取用戶對網站不同頁面的關注度的數據,從而得到相應用戶的興趣度。針對網站數據采集設計的方法和系統很多,但是最為常見的還是Web服務器端和客戶端的數據采集,如文獻[5]闡述了通用網上商店自動數據采集引擎的設計流程,提出了應用XML和關系型數據庫的解決方案,為利用已有的大量廉價以至免費的數據信息。文獻[6]提出基于用戶瀏覽行為的客戶端數據采集的方式,有效解決Web使用記錄挖掘中數據采集問題。

1.2 數據預處理

從網站中獲取的信息比較復雜,包含各種各樣的錯誤和無效信息。這些數據需要提前預處理,轉化成為適合數據挖掘的數據格式。數據預處理階段包括日志預處理、數據清理、識別用戶和路徑修補4個模塊:日志預處理模塊包括將日志文件導人到數據庫中,期間的字段根據日志格式中的字段進行選擇定義;數據清理從Web日志文件中過濾無關的頁面請求(如圖形等)以及不成功的頁面請求,在某些文獻中被定義成為數據凈化,就是指刪除一些與Web日志挖掘無關的數據;識別用戶是指從Web日志記錄中找出訪問網站的用戶,可以采用IP+Agent機制實現;路徑修補(或者稱為路徑完善)將由于緩沖而造成日志文件中丟失的重要用戶訪問鏈接記錄根據站點結構補充完整,以便后續結構優化模塊提供更為準確的用戶訪問記錄。很多的學者對Web數據的預處理做了相應的研究,如文獻[7]設計了用戶識別、訪問操作識別和路徑完善三個步驟的關鍵算法。

1.3 模式發現

模式發現階段包括序列模式挖掘、關聯規則挖掘技術和聚類分類分析三部分,這三部分都是數據挖掘領域的研究熱點。

序列模式挖掘是指挖掘相對于時間或其他模式出現頻率高的模式。該技術被廣泛地應用于各種序列數據集中,如以單詞作為文檔序列,研究在不同文檔中單詞序列的出現概率;網站點擊流數據,用于挖掘用戶的頻繁點擊模式等。

在網站結構優化中,關聯規則主要用于發現用戶之間、頁面之間以及用戶瀏覽頁面和網上行為之間存在的潛在關系,即挖掘出用戶在一個訪問期間(Session)從服務器上訪問的頁面或文件之間的聯系。

聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性,而分類也能起到相似的作用。

1.4 模式分析

模式分析是從一批數據中尋找普遍關系的過程。它逐漸成為許多學科的核心,從神經網絡到所謂句法模式識別,從統計模式識別到機器學習和數據挖掘,模式分析的應用覆蓋了從生物信息學到文檔檢索的廣泛領域。我們這里所指的模式分析階段是指網站結構優化過程中的最后一個重要步驟包括序列模式分析和頻繁訪問模式分析兩部分。

最常見的模式分析形式是像SQL那樣的知識查詢機制,另一種方法是把Web使用數據裝入數據倉庫,以便執行OLAP 操作[8]。

2 網站結構優化中主要算法研究

梳理相關文獻,不少學者和文獻都從本系統中的某一階段提出了相應的優化算法,有統計分析、人工神經算法、關聯規則、決策規則、貝葉斯分類、最近鄰分類、聚類分析、模糊集合、模糊邏輯、趨勢分析,轉折點檢測等,這些算法不外乎在我們設計的系統里面,覆蓋了每一個階段的內容,其最終目的是尋找頻繁序列,即用戶點擊流產生的頻繁路徑,在削減算法的時空占用基礎上做到高效的數據挖掘。

文獻[9]利用云計算的分布式處理和虛擬化技術的優勢,設計一種基于云計算的Hadoop 集群框架的Web 日志分析平臺,提出一種能夠在云計算環境中進行分布式處理的混合算法。

文獻[10]提出一種基于待挖掘站點首頁的用戶會話識別方法。該方法根據用戶瀏覽站點的習慣,以站點首頁作為用戶新會話開始標識,并增強了用戶會話的定義。

3 結論

網站結構優化作為當前一個非常重要的研究和應用領域,產生了許多非常有價值的研究成果。未來的研究方向是如何提高每一階段算法的時間和空間效率,降低運算的成本。本文論述了網站結構優化模型及特點,目前完成了相應的理論研究,我們接下來的工作就是針對每一個階段,對比前人的研究成果,設計出更為有效的算法。這對于開發一些目的性強的網站具有較大幫助(如電子商務網站),可以提高web用戶的服務質量,使用戶享用到滿意的個性化服務。

[1]N akayama T, Kato H, Yamane Y.Discovering the gap between Web site designers’expectations and users’behavior[J].Computer Networks, 2000, 33: 823-835.

[2]Garofalakis J, Kappos P, Mourloukos M.Web site optimization using page popularity [J].IEEE Internet Computing, 1999:22-29.

[3]Wang YW, Wang DW, Design strategy of web page for e-supermarket, Jiang Pingyu et.al, 2001 International Conference on eCommerce Engineering 2001.Xi’an: China Machine Press,2001.

[4]Kim J, Yoo B.Toward the optimal link structure of the cyber shopping mall [J].Int J.Human-Computer Studies,2000, 52: 531-551.

[5]李煜, 陸建德.通用網上商店自動數據采集引擎的設計[J].計算機應用研究,2001(11):100-103.

[6]李鵬,喬曉東,韓烽,王繼田,梁健,張寅生.基于用戶瀏覽行為的數據采集及應用[J].現代圖書情報技術,2008(11):56-59.

[7]何波,涂飛,程勇軍.Web 日志挖掘數據預處理研究[J].微電子學與計算機,2011,28(4):111-114.

[8]陳恩紅,徐涌,王煦法.Web使用挖掘:從Web數據中發現用戶使用模式[J].計算機科學,2001,28(5):85-88.

[9]程苗,陳華平.基于Hadoop的Web日志挖掘[J].計算機工程,2011,37(11):37-38.

[10]周愛武,程博,李孫長,夏松.Web日志挖掘中的會話識別方法[J].計算機工程與設計,2010,31(5):936-938.

猜你喜歡
優化結構用戶
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
論《日出》的結構
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 欧美在线网| 亚洲无码91视频| 伊人久综合| 日本www在线视频| 国产成人1024精品| 精品欧美日韩国产日漫一区不卡| 久久精品无码一区二区国产区| 国产精品吹潮在线观看中文| 视频二区国产精品职场同事| 欧美国产视频| 日韩不卡高清视频| 中文国产成人精品久久| 67194亚洲无码| 免费国产小视频在线观看| 国产精品成人一区二区不卡| 日本高清有码人妻| 国产SUV精品一区二区| 91香蕉国产亚洲一二三区| 国产男女免费视频| 免费jizz在线播放| 国产精品成人久久| 欧美成人午夜影院| 国产va在线观看| 九九久久99精品| 毛片一级在线| 国产人前露出系列视频| 国产精品嫩草影院av| 丁香五月激情图片| 国产精品自在在线午夜| 久久黄色一级片| 中文字幕亚洲综久久2021| 丰满人妻中出白浆| 欧美亚洲日韩中文| 91精品国产综合久久香蕉922 | 国产黄网站在线观看| 国产精品福利社| 免费国产高清精品一区在线| 无码AV日韩一二三区| 久久婷婷六月| 91精品伊人久久大香线蕉| 最新国产你懂的在线网址| 亚洲国产精品一区二区第一页免| 亚洲中文字幕精品| 精品国产成人高清在线| 亚卅精品无码久久毛片乌克兰| 国产精品女人呻吟在线观看| 亚洲黄色片免费看| 欧美中文字幕在线播放| 日韩国产另类| 中文字幕第1页在线播| 色播五月婷婷| 伊人色综合久久天天| 99久久成人国产精品免费| 久久精品国产精品国产一区| 无遮挡一级毛片呦女视频| 人人91人人澡人人妻人人爽| 国产三级国产精品国产普男人 | 91探花国产综合在线精品| 亚洲中文在线看视频一区| 成人国产免费| 欧美日韩精品在线播放| 免费久久一级欧美特大黄| 日韩无码黄色| 黄色片中文字幕| 久久人人妻人人爽人人卡片av| 91黄视频在线观看| 国产成人免费| 午夜日本永久乱码免费播放片| 精品成人一区二区三区电影| 久久成人国产精品免费软件| 欧美成人综合在线| 在线播放真实国产乱子伦| 国产精品人人做人人爽人人添| m男亚洲一区中文字幕| 四虎影视无码永久免费观看| 国产毛片网站| 国产精品私拍在线爆乳| 亚洲aaa视频| 日韩久草视频| 亚洲精选高清无码| 中文字幕伦视频| 亚洲欧美一区在线|