999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于中小型B2C網站的簡單Web挖掘的需求分析研究

2009-09-18 09:50:26劉秀芹
新媒體研究 2009年11期
關鍵詞:數據挖掘分類用戶

劉秀芹

[摘要]用戶訪問過的文檔和使用過的關鍵字包含用戶感興趣的信息,對這些文檔進行提取、匯總可以分析預測用戶真正的需求。提出一套適合中小型B2C網站的簡單模型,設計數據存儲結構和挖掘方法。

[關鍵詞]Web挖掘關鍵字市場需求

中圖分類號:TP3文獻標識碼:A文章編號:1671-7597(2009)0510054-01

電子商務網站作為一種新興的商務交易模式,以其成本低廉、快捷、不受時空限制等優點而受到企業的青睞。但從國內目前的發展情況看,由于資金等多方面的原因,許多中小型B2c站點還停留在簡單的形象展示和單一的商品銷售上,并沒有過多地考慮網站點擊流、用戶需求變化、商業智能等方面的內容。如何有效地分析用戶需求,從而調整網站布局和結構,以幫助用戶從站點的大量信息中快速發現他們感興趣的內容?以及如何幫助企業從網站的訪客行為中去發現了解客戶需求的變化,從而有的放矢地提供客戶所需要的服務和商品,這是目前中小型B2C網站需要面臨的一個重要課題,也是本文的主要研究目標。

一、數據來源

用戶訪問過的文檔和使用過的關鍵字包含用戶感興趣的信息,對這些文檔進行提取、匯總可以分析預測用戶真正的需求。獲取用戶需求相關數據的方法有很多種,其中隱式反饋的方法比較適合電子商務網站,因為它能夠自適應用戶興趣的變化,而且不要求用戶輸入任何信息,而是通過分析用戶訪問過的文檔和用戶的訪問痕跡,抽取出用戶感興趣的領域、以及需求的轉移。其中隱式反饋的來源有兩部分:一是用戶的訪問路徑,二是用戶使用過程中留下的關鍵字。已經有很多文獻就用戶訪問路徑進行了多方面的數據挖掘研究,所以,本文只研究用戶使用過程中留下的關鍵字,從這里面找出隱含的市場需求的狀況,進行數據挖掘的需求分析研究。用戶使用過程中留下的關鍵字是用戶消費現場第一手資料,沒有經過人為的二次加工。用它來進行分析比較貼近實際情況,誤差會較小;而且相對而言,技術簡單,比較適合中小型B2C網站。

二、存儲結構設計

其中重點工作是設計數據的存儲結構,包括以下核心結構表:

(一)分類器。為了更好地定位用戶的需求類別,縮小范圍,提高精度,特定義分類器。可以利用原有的分類信息,構造分類器。分類器就是指產品的分類信息。而分類信息中有一級分類和二級分類,以及三級分類。在數據庫部分,分類器相應的存儲在一個數據表中。每次的搜索信息都要判斷所屬的類別,所以在該表中設計了特征詞表字段。分類器是動態的,是隨著市場和產品不斷變化的,類別和特征詞表也是變化的。

(二)關鍵信息表。用戶使用的關鍵字是最關鍵的信息,也是我們必須要存儲的。所有的關鍵字都羅列在一起,就會增加數據分析的難度,甚至失去了它的價值,所以用戶在搜索的時候所提供的類別也是必須要存儲的信息。另外為了進一步進行深入的數據挖掘,要對用戶的身份或類型進行存儲或標識。用戶在不同時期需求會有相應的變化,所以還需存儲時間標記。

(三)事實表。在搜索時用戶沒有提供明確的類別信息,我們需要確定用戶需求的類別。這一部分我們可以借助于網站推薦系統的相關理論和方法。在網站推薦系統中有一個事實表。事實表記錄著用戶每次訪問網站的行為記錄,即哪位用戶在什么時候訪問了哪個頁面,在該頁面上停留了多長時間。

(四)用戶信息表。為了基于不同客戶群體進行挖掘,可引入原有的用戶信息表。

三、挖掘方法設計

(一)類別判斷。這里的類別判斷指的是關鍵字所屬類別的判斷。已知用戶的需求類別,不用進行特殊處理;用戶需求類別未知,有兩種情況存在:1,沒有用戶所需要的信息,說明沒有該關鍵字下的相關信息,這時我們將相近的關鍵字推薦給用戶,由用戶判斷,是不是使用其他的關鍵字替代;2,跟蹤用戶在相關搜索結果上的下一步操作,根據用戶在搜索結果中的瀏覽項目上的停留時間,結合一定的算法,進而判斷結果中的哪一項是用戶的需求類別。

(二)類內統計。一條信息反映某個用戶的一個需求,大量信息反映市場的整體需求。而我們所做的工作也就是將這些雜亂無章的數據進行整理、過濾和統計,以及進一步的分析,使其變成一定的有用信息。這些信息才是分析者和決策者所需要的,才能夠成為支持他們對市場或形式充分了解的依據。這里我們主要使用統計分析的方法,來多角度的分析和反映問題,為分析和決策提供數據支持。

(三)子類內分析。在分類器中,有子類和父類之分,在分類器表中用所在層字段和父類ID來標識。除了類內統計以外,我們還可以更進一步在子類上做分析,更進一步了解用戶的需求,更精確的定位分析用戶的需求狀況,以及細分市場的需求狀況。

(四)孤立點分析。如果用戶選擇模糊分類:“其他”,或者“全部”,往往這樣的搜索信息反映的是用戶的新的需求。也要對這種信息進行統計處理,把一些異常情況及時報告給系統管理員,或者市場分析人員,好讓他們結合實際情況和分析,借助于這些系統提示信息,作出進一步的處理。

(五)具體挖掘流程。重點采用統計分析方法進行挖掘。處理流程如下:首先,數據的獲取。基于關鍵字的數據挖掘的信息源的獲取渠道可以從服務器端、客戶端等幾方面進行。其次,數據預處理。得到原始數據后,經過類別判斷處理之后得到整齊的數據。再次,選擇挖掘方式,可以是類內統計、子類內統計或孤立點分析。最后,根據挖掘結果進行分析。

(六)對不同的客戶群體做進一步的挖掘分析。這其中牽涉到客戶關系管理的相關內容。客戶關系管理中的重要問題是,如何基于對客戶的了解來為客戶提供真正需要的產品以及優質的服務。通過對網站客戶群的分類,找出各個客戶群體中客戶的共同特征,以便開展有針對性的營銷活動。可以采用簡單的分類分析,具體做法是將用戶信息表和關鍵信息表聯合起來,將用戶按不同的標準進行分組,在組內進行關鍵信息的統計分析,再進一步分析不同組之間差異性,以及組內的整體需求情況。挖掘的目標是了解不同客戶群體的瀏覽行為,知道不同客戶群體的興趣以及需要所在,動態調整Web頁面,以更好地滿足客戶需求。

四、總結

本文針對當前所普遍存在的問題現狀,提出了一個適合很多中小型商務網站的簡單模型,該模型能存儲和搜索用戶的相關訪問信息,并進一步為企業下一步的營銷提供很好的分析和指導。該模型具有簡單、可操作性強、技術要求低的特點,能為廣大的中小型B2C網站提供參考和支持。

猜你喜歡
數據挖掘分類用戶
分類算一算
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产日韩欧美一区二区三区在线| 乱人伦中文视频在线观看免费| 色噜噜中文网| 国产精品刺激对白在线 | 国产日韩欧美视频| 精品久久久久久久久久久| 夜精品a一区二区三区| 国产欧美在线观看视频| 波多野结衣无码视频在线观看| 精品一区二区无码av| 亚洲国产中文精品va在线播放 | 久久综合成人| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲无码精彩视频在线观看| 午夜福利在线观看入口| 欧美在线视频a| 久久这里只有精品23| 国产精品刺激对白在线| 中文字幕在线不卡视频| 亚洲永久视频| 国产91视频免费观看| 91小视频在线观看| 一级毛片无毒不卡直接观看| 亚洲AV成人一区二区三区AV| 97国产在线观看| 亚洲无码日韩一区| 亚洲另类第一页| 国产自无码视频在线观看| 亚洲成a∧人片在线观看无码| 天堂网亚洲系列亚洲系列| 97影院午夜在线观看视频| lhav亚洲精品| 亚洲国产成人无码AV在线影院L| 欧美不卡二区| 精品国产网| 无码国内精品人妻少妇蜜桃视频| 欧美亚洲另类在线观看| 欧美亚洲日韩不卡在线在线观看| 国产高清在线精品一区二区三区 | 女人18一级毛片免费观看| 亚洲精品高清视频| 久久久精品国产亚洲AV日韩| 国产美女精品在线| 亚洲综合九九| 日韩欧美高清视频| 国内精品久久久久鸭| 日韩第九页| 日韩欧美国产另类| 欧美特黄一免在线观看| 99在线免费播放| 精品国产网站| 国产成人精品免费视频大全五级| 久久9966精品国产免费| 91极品美女高潮叫床在线观看| 亚洲高清无在码在线无弹窗| 亚洲国产天堂久久九九九| 亚洲最大情网站在线观看| 内射人妻无码色AV天堂| 极品尤物av美乳在线观看| 精品99在线观看| 国产va免费精品观看| 国产成人一二三| 成人免费视频一区二区三区| 国产精品白浆无码流出在线看| 国产亚洲精品97AA片在线播放| 欧美福利在线| 成人亚洲天堂| 天堂成人在线| 国产成人免费| 宅男噜噜噜66国产在线观看| 三级视频中文字幕| 国产高清色视频免费看的网址| 五月婷婷伊人网| 日本高清有码人妻| 久久精品无码国产一区二区三区| 老司机精品一区在线视频| 日韩精品成人网页视频在线| 综合久久五月天| 亚洲午夜国产精品无卡| 丝袜国产一区| 国产精品3p视频| 亚洲精品天堂在线观看|