999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義集成的客戶知識挖掘模型研究

2015-02-03 12:16:16蔡皎潔
現代情報 2014年11期

蔡皎潔

[摘要]本文從對多結構化客戶數據集成和預處理的成效不足、挖掘過程缺乏語義情景和上下文的支撐,從而所獲取的客戶知識模式質量不高等問題出發,提出了一種基于語義集成的客戶知識挖掘模型。該模型充分利用了本體、語義集成等方法和技術,提高對數據語義分析和處理的能力,實現智能化客戶知識挖掘過程,從而獲取高質量的客戶知識模式。

[關鍵詞]語義集成;客戶知識;知識挖掘;領域本體

[中圖分類號]TP311 [文獻標識碼]A [文章編號]1008-0821(2014)11-0039-05

網絡經濟時代以“客戶服務為中心”的經營理念表現得尤為突出,客戶不再是傳統經濟模式中企業產品的被動接受者,而是廣泛參與企業經營流程的主導者,客戶需求精確化的個性化服務,渴望企業能夠理解、關懷甚至是激發其潛在的興趣,因此從客戶數據中深度挖掘客戶興趣模式已成為企業成功開展電子商務的重要戰略思想和技術手段。然而,電子商務環境中,企業與客戶交互中所產生的數據量不斷攀升、數據結構也不斷地復雜化,常用的數據挖掘工具已不能滿足企業發現有趣的客戶興趣模式的需求,提升客戶知識挖掘流程的質量已勢在必行。本文引用領域本體技術,在異構客戶數據上重新建立一個“層”,用于對客戶數據的組織和梳理,實施基于語義的數據挖掘流程,提升所獲取的客戶知識模式的質量。

1、語義集成與客戶知識挖掘的研究綜述

上世紀90年代中期到現在,數據集成研究的焦點已從解決系統異構、結構異構逐漸發展到解決語義異構問題上。國內外有關基于本體的異構數據語義集成的研究,從策略上主要有:基于領域本體的方法和基于本體映射的方法兩種。Arens Y.等人提出SIMS系統,該系統構建了一個全局本體來描述信息資源的內容、數據模型和查詢語言等。斯丹福大學的SKC項目,通過在多個數據源上建立不同本體,然后在這些本體之上建立一個代數系統,用這個代數系統來實現各本體之間的操作,從而達到異構數據源之間的互操作。厲浩提出基于本體的數據集成框架模型,為所有的數據源建立全局本體,再為每個數據源建立局部本體,定義本體與本體、本體與數據源之間的映射。

目前,國內外有關客戶知識挖掘的研究已充分考慮到了客戶情景和客戶隱性知識的重要作用。美國加州大學ISI研究所開發的EXPECT系統。其核心思想是基于本體來輔助獲取知識,用于建立領域知識的知識獲取環境。德國Karlsruhe大學MFB研究所開發的一個建立在本體基礎上的知識管理原型系統OKMS,它側重于3個方面的研究:采用本體映射建立分布式異構本體間的集成機制;設計和開發管理本體演化的方法論;采用封裝機制將企業已有的大量知識源提升到本體級。Bloehdom等提出了OTYO框架,該框架集成了領域本體的構建和基于領域本體的文本挖掘兩大部分,當領域本體構建好之后,其中部件會對文檔進行概念分析,提取概念特征,然后在此基礎上進行相應的文本挖掘,從而發現蘊含其中的文本間、或文本中概念間的語義關系。Yufeng Li和Ning Zhong構建了一種基于本體的Web挖掘框架,它是一個包含4個部分的循環框架,分別是:數據挖掘、知識表示、知識推理和知識進化,主要是基于用戶約束和元數據實施數據挖掘,然后基于本體把那些語義模糊、重復、歧義的規則模式進行改正。

總結上述國內外研究成果可知,知識挖掘研究領域與本體技術研究領域充分結合起來,充分利用本體技術來進行知識組織,解決多個數據源之間的語義異構問題,實現語義集成,即在知識挖掘的數據預處理階段起到了公共語義描述的作用。但是,如何實現對多結構化的數據的低成本、高效率的語義集成,仍是知識挖掘領域研究的重點問題。

2、基于語義集成的客戶知識挖掘模型

按照系統論的觀點,模型是將真實系統(原型)的本質屬性,用適當的表現形式(例如文字、符號、圖表、實物、數據公式等)描述出來的結果,一般不是真實系統的本身,而是對真實系統的描述、模仿或抽象。客戶知識挖掘是一個復雜的過程,涉及了挖掘任務的復雜性、客戶數據的海量異構性、知識挖掘方法和技術多重選擇性、客戶知識模式的可理解性、重用性和共享性以及客戶知識挖掘系統的更新性等多個方面。采用模型構建的方法,可以將研究問題抽象化、簡明化,有助于我們研究的系統化、模塊化、定量化。

2.1 企業對客戶知識獲取的需求分析

電子商務環境中,隨著客戶個性化需求趨勢的增長,網絡信息技術的發展也促使企業與客戶交互渠道日益網絡化和多元化,普通的以日常客戶數據操作管理為目標的客戶關系維護策略已不再適應該環境,難以獲得良好的客戶忠誠度和滿意度,因此企業需要全面、有效、內涵表達準確的客戶知識來維系高質量的客戶關系。另外,客戶數據每日都會成幾何級數的倍數不斷上升,而且這些客戶數據結構多樣化、語義異構化,為客戶知識的有效獲取設置了多重障礙。雖然數據挖掘理念和技術的出現可從一定程度上解決該問題,但多數數據挖掘工具和數據倉庫技術等在客戶數據預處理部分,由于缺少一個領域共享概念模型的形式化規范說明體系的支持,對客戶數據語義異構的處理并不理想,這就造成了在低質量客戶數據基礎上所生成的客戶知識模式有效性降低的問題。

因此,在基于語義集成的客戶知識挖掘模型構建中,引入企業本體對異構客戶數據進行語義集成,在此基礎上實施客戶知識挖掘過程,優點有:一是由于在基于企業本體對客戶數據語義集成過程中已完成了對數據的清洗工作,因此基于語義集成的客戶知識挖掘過程可以省略該階段,進而提高了整體客戶知識挖掘過程運行的效率;二是基于企業本體語義集成處理后的客戶數據語義表達一致,并在一定概念層次上具備了語義關系,因此客戶知識挖掘的目的是運用挖掘方法和算法獲取更廣或更深概念層次數據間的語義關系,進一步澄清客戶數據所描述事物之間的本質聯系,提高所獲取的客戶知識模式的質量。

2.2 基于語義集成的客戶知識挖掘模型分析endprint

基于語義集成的客戶知識挖掘模型如圖1所示,該模型是一個循環的體系,目標是對基于企業本體的客戶數據語義集成結果上,依據客戶知識挖掘任務,運用相關知識挖掘方法和算法進一步澄清語義集成后的客戶數據中或已獲取的客戶知識模式中所描述的對象及對象關系間的本質,挖掘具有潛藏語義關系的、更符合決策者需求的客戶知識模式。其中包括了有價值客戶數據收集與語義集成模塊、異構客戶數據語義集成結果分析模塊、基于語義集成的客戶知識挖掘模塊、客戶知識處理模塊、客戶知識存儲模塊和客戶知識應用模塊六大循環模塊。各模塊的作用和模塊之間的關系介紹如下:

2.2.1 有價值客戶數據收集與語義集成模塊

該模塊是整個模型構建的核心和基礎,目的是為客戶知識挖掘過程提供實施語義異構集成后的客戶數據,以提高知識挖掘技術等對客戶數據分析、挖掘的質量,減少數據清洗工作,提高知識挖掘過程的效率。

(1)有價值客戶數據收集

有效甄別客戶價值,有利于企業更好地實施“一對一”的個性化服務策略,降低客戶數據語義集成的工作量和復雜度。本文采用從客戶和企業的雙重視角。按兩次甄別的程序展開,其主要內容如下:

①從客戶角度實施初次甄別

初次甄別主要從客戶人口統計特征、客戶需求與購買動機以及客戶購買行為3個方面展開。客戶的人口統計特征包括客戶的年齡、婚姻、職業、性別、收入、教育程度、家庭生命周期、國籍、民族、宗教、社會階層等,不同年齡、受教育程度不同的客戶在價值觀念、生活情趣、審美觀念和消費方式等方面會有很大的差異,而家庭人口和收入差異,也同樣會導致消費的觀念不同。企業在設計產品之初就決定了它的有價值客戶人口統計特征,如產品的價格、品牌價值等因素會自然帶動與其匹配的客戶的消費意識,而那些人口統計特征與企業產品營銷戰略匹配程度差異較大,但卻發生偶爾購買行為的客戶價值較低。

消費者需求是指消費者生理和心理上的匱乏狀態,即感到缺少些什么,從而想獲得它們的狀態。動機是“引起個體活動,維持已引起的活動,并促使活動朝向某一有價值進行的內在作用”。在人口統計特征類似、消費環境類似的條件下,客戶所產生購買行為的差異證明隱藏在其背后動機的強弱,而動機較弱的客戶應該在主導動機和非主導動機之外,這些客戶價值較低。

不同的客戶人口統計特征及消費動機都會產生不同的購買行為。我們可從客戶購買行為變量中簡單地對客戶進行歸類,如從企業CRM系統記錄中查詢客戶購買產品的頻次、頻次累積最高的時間長度、一次購買產品的數量、一次支付產品的價格等變量,還可通過瀏覽Web使用記錄等方式查閱客戶網購行為變量,如客戶登錄站點的方式、客戶停留某頁面的時間、客戶停留站點的時間、客戶是否有添加收藏夾、客戶是否有復制、粘貼、客戶是否有放入購物車及客戶是否有電子支付等行為變量。這些客戶行為變量都與客戶購買行為密切相關,而行為變量值較低的客戶價值就較低。

②從企業角度實施二次甄別

若僅從客戶角度來劃分客戶價值,則忽略了企業成本,二次甄別的方法主要采用考察客戶生命周期價值的高低,即從企業盈利的角度出發來研究企業從客戶身上所獲得的價值。關于客戶生命周期價值(CLV)的計算模型,這里引用Paul D.Berger和Nada I.Nasr(1998)和陳明亮(2001)定義的計算模型,公式為:

其中,在第t年客戶的凈利潤函數是P(t),客戶保持率是r,客戶生命周期時間長度為n,折現率為d。其中,客戶保持率的大小直接代表了客戶滿意度,而客戶的高滿意度產生客戶對產品的高感知價值,即從客戶角度出發的客戶讓渡價值直接相關。

由此可見,在制定有價值客戶甄別方案時,應從客戶和企業兩個角度出發,并兼顧彼此,不斷細化高、中低和無價值客戶群體,分別將相對應的客戶數據進行歸類整理,為以后客戶知識挖掘應用做好客戶數據準備。

(2)有價值客戶數據語義集成

主要對兩種比較常見的客戶關系型數據庫數據和Web文本數據,在參照領域本體全局概念體系的基礎上,實施了語義集成過程。其主要內容如下:

①參照企業本體全局概念體系構建基于語義的數據倉庫元數據,指導數據倉庫ETL過程,實現客戶關系數據庫的語義集成。即通過本體學習的方法為每個語義異構的客戶關系數據庫構建子領域本體,通過本體映射方法對這些子領域本體與企業本體的映射過程轉換生成基于語義的元數據。

②參照企業本體全局概念體系構建Web文本語義分析和標注策略,實現Web文本的語義集成。即基于企業本體的概念體系對每個Web文本進行語義分析和標注,從中學習Web文本中的概念和概念間的關系。

2.2.2 客戶數據語義集成結果分析模塊

基于企業本體對異構客戶數據語義集成的過程,即是發現客戶數據所描述事物之間語義關系的過程,因此該集成結果中包含了一定概念層次上的客戶知識模式。該模塊主要功能是針對具體的客戶知識挖掘任務,完成對異構客戶數據語義集成結果中已形成的客戶知識模式的整理、分析和獲取。主要由人工方式(如領域專家等)憑經驗從中獲取與客戶知識挖掘任務相關的、語義關系清晰的、有價值的客戶知識模式。采用的主要方法通常有概念描述、歸納總結及統計等。由人工方式對客戶數據語義集成結果中所形成的客戶知識模式進行刪選和總結,這樣做可以避免客戶知識挖掘過程的重復工作。而針對具體客戶知識挖掘任務,無法用人工方式從帶有語義標簽的客戶數據中發現的客戶知識模式,將交給基于語義集成的客戶知識挖掘模塊使用更為復雜的方法和算法來發現具有潛藏語義關系的客戶知識模式。該模塊的處理結果可直接輸入到客戶知識存儲模塊中。

2.2.3 基于語義集成的客戶知識挖掘模塊

該模塊主要功能是基于異構客戶數據語義集成基礎上,并在具體的客戶知識挖掘任務的約束下,從客戶數據語義集成結果分析模塊中,提取相關的、帶有語義標簽的客戶數據,進而選擇相關的知識挖掘方法和算法,將這些客戶數據轉換成有利于知識挖掘方法和算法實施的格式,從中挖掘潛藏的、有價值的、語義關系更符合挖掘任務需求的客戶知識模式。另外,該模塊還可以完成針對具體的客戶知識挖掘任務和決策者的要求,提取客戶知識存儲模塊中的相關客戶知識源再次進行挖掘,以發現這些客戶知識源中具有更廣或更深概念層次和關系的、潛藏的和有價值的客戶知識模式。該模塊的處理結果直接輸入到客戶知識處理模塊中,有待進一步的調整和優化。endprint

2.2.4 客戶知識處理模塊

該模塊主要功能是針對具體客戶知識挖掘任務和決策者的需求,對基于語義集成的客戶知識挖掘模塊中所輸出的初始客戶知識模式進行調整和優化,以進一步提高其質量和有效性,主要包括客戶知識模式的調整和優化兩個階段。該模塊的處理結果如果能讓決策者滿意,就直接輸入到客戶知識存儲模塊中;若結果并不能讓決策者滿意,則作為客戶數據語義和數據間語義關系的澄清結果輸入到客戶數據語義集成結果分析模塊中,針對具體的客戶知識挖掘任務再次進行新一輪的分析或挖掘,一是讓領域專家更好地發現客戶數據間的語義關系,以便發現更有價值的客戶知識模式;二是若人工手段無法完成,則進入下一輪的客戶知識挖掘過程中。

2.2.5 客戶知識存儲模塊

該模塊主要功能是存儲由客戶數據語義集成結果分析模塊中由人工方式可以直接獲取的客戶知識模式、由客戶知識處理模塊提交的已經調整和優化良好的、更加具有實用價值的客戶知識模式、以及來自于對客戶知識存儲模塊中客戶知識源的二次挖掘所生成的、具有更廣或更深概念邏輯關系的、更符合決策者需求的客戶知識模式。

2.2.6 客戶知識應用模塊

該模塊主要完成對來自于客戶知識存儲模塊中的客戶知識模式的共享、重用和創新,前提是對這些客戶知識模式要有良好的解釋。本文提出以語義網絡為載體表示本體形式化內容的方式來解釋客戶知識模式,并從客戶主觀認知的角度,對客戶知識模式中所描述的概念及概念間關系賦予興趣度權值。在這個過程中企業會利用原有客戶知識模式產生新的客戶信息或知識,那么依據企業市場營銷目標,這些有關客戶信息或知識可作為新的客戶數據來源直接輸入到有價值客戶數據收集和語義集成模塊中;另外,這些客戶信息或知識也會涉及最新企業信息中包含的概念語義和語義關系,可補充或更新企業本體,進而達到對整個基于語義集成的客戶知識挖掘模型的更新。

3、總結與展望

本文從電子商務環境中,客戶知識挖掘領域所面臨的主要問題出發:一是客戶知識挖掘過程中所面對的數據量不斷增大、數據結構日益復雜化,單靠目前市面上常用的數據挖掘工具已不能滿足企業對高質量客戶知識模式的需求;二是支撐客戶知識挖掘過程的情景及上下文中缺乏語義環境,如實施基于數據倉庫的關系型數據庫數據挖掘,E1L過程缺乏基于語義的元數據支撐;實施文本數據挖掘,在關鍵詞的抽取過程中,缺乏考慮關鍵詞之間的語義關系等,這些因素均會導致所獲取的客戶知識模式質量低下的原因。因此,本文構建了基于語義集成的客戶知識挖掘模型,利用基于領域本體的異構數據語義集成的策略和方法,融合到客戶知識挖掘過程中,在客戶數據語義標注的前提下,實施精準化的客戶知識挖掘過程,提高所獲取的客戶知識模式的質量。有關基于語義集成的客戶知識挖掘過程、異構客戶數據語義集成方法和流程、領域本體構建和學習等內容將在后期不斷做出研究。endprint

主站蜘蛛池模板: 强奷白丝美女在线观看| 精品亚洲麻豆1区2区3区| 亚洲日韩精品无码专区97| 亚洲精品国产精品乱码不卞| 国模在线视频一区二区三区| 美女无遮挡免费视频网站| 国产色图在线观看| 国产区免费精品视频| 亚洲人成影视在线观看| 欧美成人综合视频| 2018日日摸夜夜添狠狠躁| 国内精品视频| 手机在线免费不卡一区二| 欧美国产日韩在线观看| 免费在线观看av| 天天色天天操综合网| 亚洲av无码人妻| 国产超碰一区二区三区| 亚洲三级色| 欧美色综合网站| 精品国产电影久久九九| 免费看的一级毛片| 97人人模人人爽人人喊小说| 国产精欧美一区二区三区| 99久久精品免费视频| 老司机精品一区在线视频| a亚洲天堂| 成年A级毛片| AV在线天堂进入| 久久a毛片| 久久99精品久久久久久不卡| 丁香婷婷激情综合激情| 国产精品久久自在自2021| 亚洲一区波多野结衣二区三区| 精品国产污污免费网站| 8090成人午夜精品| 欧美成人免费午夜全| 国产在线观看91精品| 少妇精品在线| 女人18一级毛片免费观看| 99re在线免费视频| 日本高清成本人视频一区| 精品在线免费播放| 99免费在线观看视频| 风韵丰满熟妇啪啪区老熟熟女| 日本不卡视频在线| 福利国产在线| 国产免费网址| 中文字幕在线不卡视频| 亚洲婷婷丁香| 波多野结衣二区| 国产农村1级毛片| 日韩高清无码免费| 亚洲视频色图| 好吊日免费视频| 国产一级在线观看www色| 国产白浆一区二区三区视频在线| 69综合网| 欧美一级片在线| 97国产成人无码精品久久久| 国产激情无码一区二区三区免费| 自拍偷拍一区| 国产另类视频| 欧美在线精品怡红院| 欧美成人午夜在线全部免费| 日本午夜精品一本在线观看| 亚洲第一香蕉视频| 中字无码av在线电影| 五月激情婷婷综合| 精品91视频| 国产美女一级毛片| 亚洲欧美一区二区三区麻豆| 日本久久网站| 伊人大杳蕉中文无码| 婷婷激情亚洲| 天堂成人av| 欧美一区二区三区香蕉视| 国产午夜不卡| 国产精品福利社| 久久频这里精品99香蕉久网址| 亚洲天堂2014| 国产成人艳妇AA视频在线|