999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電子郵件動(dòng)態(tài)分類系統(tǒng)的研究與應(yīng)用

2014-09-29 03:19:42王瑛王勇
自動(dòng)化與信息工程 2014年3期
關(guān)鍵詞:分類體系信息

王瑛 王勇

(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院)

0 概述

當(dāng)前,知識(shí)和智力資產(chǎn)正在成為企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)。知識(shí)型企業(yè)中,在已知知識(shí)上創(chuàng)造新的、復(fù)雜的知識(shí)的員工正成為主要角色[1],商業(yè)決策越來越依靠日常工作中相互交流產(chǎn)生的知識(shí)[2-3]。知識(shí)管理的概念和方法被企業(yè)用來尋求應(yīng)對(duì)這種知識(shí)社會(huì)的變化[4-6]。盡管管理知識(shí)的重要性已被深入認(rèn)識(shí),但系統(tǒng)的知識(shí)管理研究是最近10來年才開始的[7]。許多技術(shù)和方法被用于結(jié)構(gòu)化知識(shí),以便有效地管理知識(shí)。例如貝葉斯網(wǎng)絡(luò)(Bayesian Networks),決策樹(Decision Trees),神經(jīng)網(wǎng)絡(luò) (Neural Networks),支持向量機(jī)(Support Vector Machines),K最近鄰方法(K-Nearest Neighbor Approach)等。一些技術(shù)方法聚焦在知識(shí)搜索領(lǐng)域,另一些方法用于知識(shí)的分類[8]。

分類體系(Taxonomy)是一種傳統(tǒng)有效的信息分類和管理方法。它包含實(shí)體(對(duì)象或者標(biāo)題)、關(guān)系、鏈接、分組、標(biāo)簽和導(dǎo)航等部件,提供信息的搜索、瀏覽、提示等功能,實(shí)現(xiàn)有效的內(nèi)容管理[9]。分類體系相比較知識(shí)庫(kù)而言,提供了一種結(jié)構(gòu)化的知識(shí)管理模式[10-11],其組成要素包括控制詞表、元數(shù)據(jù)和分類目錄。由于知識(shí)的特性,傳統(tǒng)的人工分類及管理知識(shí)的方式是一項(xiàng)高智能和耗費(fèi)時(shí)間的工作。動(dòng)態(tài)分類體系(Dynamic Taxonomy)作為一種較好地描述和分類復(fù)雜的信息和知識(shí)的工具被提出來[12],能夠有效地實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化知識(shí)的分類管理。

在企業(yè)的商業(yè)運(yùn)作中,電子郵件已成為重要的、不可或缺的交流方式,大量的企業(yè)信息和知識(shí)蘊(yùn)含在電子郵件中。本文提出采用動(dòng)態(tài)分類體系的方法,建立一個(gè)基于多智能代理架構(gòu)的電子郵件信息管理自動(dòng)分類系統(tǒng),以提升郵件自動(dòng)分類的效率,促進(jìn)企業(yè)知識(shí)的管理和分享,支持企業(yè)商業(yè)服務(wù)工作的開展。

1 體系架構(gòu)

電子郵件是當(dāng)前最重要和最廣泛應(yīng)用的通信媒介之一,許多公司已把電子郵件作為企業(yè)商業(yè)運(yùn)作的重要智力資產(chǎn)。基于WEB的郵件服務(wù)系統(tǒng)提供一種集中式的郵件信息管理模式。基于多智能代理架構(gòu)的電子郵件信息管理自動(dòng)分類系統(tǒng)(multi-agent email dynamic taxonomy system,MEDTS),包括4層結(jié)構(gòu),如圖1所示。

1) 郵件代理子系統(tǒng)(email agent system,EAS)是MEDTS的基礎(chǔ)子系統(tǒng),負(fù)責(zé)電子郵件信息的發(fā)送和接收。同時(shí),EAS負(fù)責(zé)將接收到的電子郵件信息分解為結(jié)構(gòu)化信息,并存入到郵件數(shù)據(jù)庫(kù)(mail database,EDB),以便電子郵件信息能夠更方便地被管理和使用。需要說明的是,EAS自身并不是一個(gè)電子郵件服務(wù)器,它通過兩個(gè)電子郵件代理程序與第三方的電子郵件服務(wù)器連接。電子郵件發(fā)送代理程序(Sending Agent)負(fù)責(zé)通過連接SMTP服務(wù)器發(fā)送電子郵件,接收代理程序(Receiving Agent)則通過POP3服務(wù)器從互聯(lián)網(wǎng)接收電子郵件。MEDTS建立了一個(gè)可伸縮的、較靈活的體系結(jié)構(gòu),支持在互聯(lián)網(wǎng)和內(nèi)聯(lián)網(wǎng)中發(fā)送和接收電子郵件。

圖1 基于多智能代理架構(gòu)的電子郵件信息管理自動(dòng)分類系統(tǒng)體系架構(gòu)

2) 動(dòng)態(tài)分類子系統(tǒng)(dynamic taxonomy system,DTS)負(fù)責(zé)將電子郵件中的信息和知識(shí)結(jié)構(gòu)化,并構(gòu)建分類體系,形成知識(shí)庫(kù)。郵件中的實(shí)體對(duì)象、關(guān)系、鏈接、分組、標(biāo)簽和導(dǎo)航由 DTS識(shí)別和抽取,并被保存在知識(shí)分類數(shù)據(jù)庫(kù)(knowledge taxonomies &inventory,KTI)。DTS提供搜索、瀏覽、提醒和內(nèi)容管理等功能,以便員工能快速、可視化地發(fā)現(xiàn)有用信息和知識(shí)。MEDTS系統(tǒng)提供3種動(dòng)態(tài)分類模式增強(qiáng)對(duì)知識(shí)的分類、整理和檢索等管理能力。

3) 知識(shí)審計(jì)子系統(tǒng)(knowledge audit system,KAS)提供對(duì)企業(yè)智力資產(chǎn)的審計(jì)服務(wù)功能,通過挖掘分析KTI中實(shí)體間的關(guān)系,可以定位關(guān)鍵人物和社交網(wǎng)絡(luò),搜索和分享知識(shí)工作的解決方案。智力資產(chǎn)的評(píng)估和評(píng)價(jià)作為企業(yè)管理決策的主要任務(wù)之一,有助于企業(yè)高層對(duì)其智力資產(chǎn)的全面掌握,支持企業(yè)的商業(yè)運(yùn)作。

4) 知識(shí)工作流規(guī)劃子系統(tǒng)(knowledge workflow planning system,KWPS)構(gòu)造一個(gè)處理知識(shí)工作的多代理服務(wù)架構(gòu),幫助員工在知識(shí)工作中可以動(dòng)態(tài)搜索相關(guān)的信息和知識(shí),高效地找到所需的專業(yè)知識(shí)。KWPS 能夠規(guī)劃一個(gè)知識(shí)工作流,并根據(jù)具體需要和目標(biāo),配置相應(yīng)的知識(shí)資源。

上述4個(gè)子系統(tǒng)構(gòu)成了MEDTS的4個(gè)層次。基于WEB的EAS是基礎(chǔ)層;DTS是負(fù)責(zé)將采集的電子郵件構(gòu)建為一個(gè)動(dòng)態(tài)分類體系,并保存在知識(shí)庫(kù)中;KAS分析和審計(jì)基于電子郵件的智力資產(chǎn),評(píng)價(jià)知識(shí)的價(jià)值;審計(jì)的結(jié)果作為KWPS的運(yùn)作依據(jù)。

2 動(dòng)態(tài)分類模式

一般認(rèn)為,動(dòng)態(tài)分類體系是使用戶可以瀏覽所有可能的信息分類目錄的一種工具,包括觀察、交叉聯(lián)系、混合和匹配目錄,例如,郵件信息可被標(biāo)簽和分配到多個(gè)目錄項(xiàng)中。借助分類體系,用戶可以運(yùn)用其獨(dú)特的邏輯,自由地創(chuàng)造和組織其知識(shí)空間[11]。在MEDTS系統(tǒng)中,設(shè)計(jì)3種動(dòng)態(tài)分類模式:基于用戶定義的分類模式、基于搜索關(guān)鍵字的分類模式和基于多代理機(jī)制的動(dòng)態(tài)分類體系模式。前2種模式主要聚焦在如何邏輯地分類大量的信息;第3種模式則通過運(yùn)用人工智能的文本挖掘和分析技術(shù),動(dòng)態(tài)辨識(shí)和生成新的分類體系。

2.1 基于用戶定義的動(dòng)態(tài)分類模式

在信息系統(tǒng)中,用戶訪問管理是一項(xiàng)重要功能。根據(jù)用戶的角色、職位、部門和其他身份認(rèn)證,允許合法的訪問或禁止非法的訪問是主要的應(yīng)用形式。用戶對(duì)信息訪問的分類視角應(yīng)根據(jù)其角色的不同而不同。

圖2給出了企業(yè)中3種不同角色的分類視角,包括員工視角、經(jīng)理視角和CEO視角。經(jīng)理負(fù)責(zé)管理員工,在其分類體系中包含員工的目錄項(xiàng);同樣,CEO的分類體系中也包括了部門的目錄項(xiàng)。

圖2 (a) 員工視角

圖2 3種不同視角的分類體系

動(dòng)態(tài)分類體系根據(jù)用戶登錄身份構(gòu)建個(gè)性化目錄,電子郵件信息被自動(dòng)分類到相應(yīng)的目錄項(xiàng)中。這種分類模式針對(duì)每個(gè)用戶提供了一個(gè)與之關(guān)聯(lián)的有效的分類體系,無(wú)用的信息被屏蔽。

2.2 基于搜索關(guān)鍵字的動(dòng)態(tài)分類模式

基于搜索關(guān)鍵字的動(dòng)態(tài)分類模式是通過對(duì)輸入關(guān)鍵字的理解自動(dòng)地生成分類體系。系統(tǒng)建立關(guān)鍵字的語(yǔ)義關(guān)聯(lián)模型,根據(jù)對(duì)關(guān)鍵字的語(yǔ)義分析,調(diào)用相關(guān)分類體系,形成語(yǔ)義關(guān)聯(lián)的分類架構(gòu),以滿足用戶信息分類檢索的一般性習(xí)慣。例如,搜索關(guān)鍵字“詢價(jià)”意味著用戶想得到與市場(chǎng)相關(guān)的信息,“市場(chǎng)”目錄被用來分類搜索結(jié)果。類似的,產(chǎn)品的“白皮書”可能意味著用戶想得到產(chǎn)品的技術(shù)信息。圖3提供了市場(chǎng)和技術(shù)2種簡(jiǎn)單的分類體系。

圖3 2種分類體系示例

這種分類模式是一個(gè)由用戶行為驅(qū)動(dòng)的動(dòng)態(tài)和不斷演繹的分類體系,是一種根據(jù)搜索關(guān)鍵字可以邏輯地組織信息和提供合適的分類目錄的模式。它不同于通常的搜索引擎的搜索功能,主要包含著大量的搜索結(jié)果的列表,沒有信息組織的邏輯結(jié)構(gòu)。當(dāng)搜索關(guān)鍵字被輸入,系統(tǒng)會(huì)從控制單詞的列表中返回其含義,推斷用戶的意圖,確定相關(guān)領(lǐng)域,構(gòu)建檢索結(jié)果目錄。

2.3 基于多代理機(jī)制的動(dòng)態(tài)分類體系模式

考慮到信息和知識(shí)的不斷增長(zhǎng),新概念、術(shù)語(yǔ)和知識(shí)在不斷產(chǎn)生,動(dòng)態(tài)分類體系應(yīng)具備持續(xù)改進(jìn)和演繹的能力。本文采用人工智能技術(shù),設(shè)計(jì)了一種基于多代理機(jī)制的動(dòng)態(tài)分類體系模式。

代理(Agent)提供了需要處理大型和復(fù)雜問題的抽象,具有自治能力。多代理即建立了多個(gè)代理的協(xié)同工作機(jī)制,智能系統(tǒng)通常采用多代理機(jī)制協(xié)助用戶處理復(fù)雜的協(xié)同工作。在MEDTS系統(tǒng)中,幾個(gè)代理被設(shè)計(jì)成動(dòng)態(tài)分類體系,如圖4所示。它們鏈接在一起構(gòu)成一個(gè)增強(qiáng)系統(tǒng)自學(xué)習(xí)能力的學(xué)習(xí)環(huán)。系統(tǒng)采用了文本挖掘和基于案例推理的技術(shù)。

1) 抽取代理(Extracting Agent)負(fù)責(zé)從電子郵件中抽取關(guān)鍵字,采用詞法分析技術(shù),建立控制詞表和詞組數(shù)據(jù)庫(kù);

2) 合并代理(Merging Agent)負(fù)責(zé)將從電子郵件中抽取的關(guān)鍵字合并成關(guān)鍵字隊(duì)列;

3) 統(tǒng)計(jì)代理(Statistics Agent)根據(jù)從Merging Agent獲得的關(guān)鍵字列表,建立一個(gè)關(guān)鍵字的使用頻率表;

4) 文字挖掘代理(Word Mining Agent)根據(jù)關(guān)鍵字使用頻率在一個(gè)語(yǔ)義空間中挖掘單詞或術(shù)語(yǔ)之間的關(guān)系,推斷一個(gè)新的分類體系;

5) CBR代理(CBR Agent)基于案例庫(kù)中舊的分類體系,進(jìn)行歸納推理,構(gòu)成新的分類體系,并提交給用戶;

6) 人機(jī)交互代理(Human-Machine Interface Agent)建立人機(jī)交互,由用戶確定產(chǎn)生一個(gè)新的分類體系;

7) CBR存儲(chǔ)代理(CBR Storing Agent)負(fù)責(zé)存儲(chǔ)新的分類體系模式,并保存到案例庫(kù)中。

3 文本分類算法

在MEDTS系統(tǒng)中,文本分類算法是關(guān)鍵技術(shù)。本系統(tǒng)建立訓(xùn)練學(xué)習(xí)機(jī)制,構(gòu)建分類體系的每個(gè)目錄項(xiàng)的特征向量,通過詞法分析與特征提取,構(gòu)建電子郵件的特征向量,再采用文本相似度計(jì)算,以此判定電子郵件的分類目錄項(xiàng)。

定義1:電子郵件的特征向量為w

w =

其中,wn為詞表中第n個(gè)詞的權(quán)重;n為詞表中詞組的總數(shù)量。

定義2:wi權(quán)重為p

p =P/W

其中,P為第i個(gè)詞在郵件中出現(xiàn)的次數(shù);W為郵件中所包含的詞表中所有詞的出現(xiàn)次數(shù)的總和。

圖4 基于多代理機(jī)制的DTS工作模式

分類體系中每個(gè)目錄項(xiàng)的特征向量由訓(xùn)練集中所屬電子郵件的特征值整合而成,即對(duì)包含的所有電子郵件的特征向量做簡(jiǎn)單的平均計(jì)算而成。

定義3:分類目錄項(xiàng)的特征向量為s

其中,wij為詞表中第i個(gè)詞在分類目錄項(xiàng)所包含的所有郵件中第j篇郵件的特征向量的權(quán)重;m為該分類目錄項(xiàng)中所包含郵件的總數(shù)量。

本文采用歐式距離為相似度計(jì)算算法。

定義4:分類相似度為μ

其中,wi為電子郵件的特征向量的第i個(gè)分量值;si為分類目錄項(xiàng)的特征向量的第i個(gè)分量值。

通過限定一定的閥值,依據(jù)相似度計(jì)算結(jié)果,可判定電子郵件是否屬于某個(gè)特定的分類目錄項(xiàng)。本系統(tǒng)選擇的閥值為0.7。

4 案例分析

本文研發(fā)的MEDTS系統(tǒng)已在一家總部設(shè)于香港的電子有限公司運(yùn)行。該公司主要經(jīng)營(yíng)電子元器件,為客戶提供電子元器件的整體解決方案。公司大量的信息和知識(shí)來源于員工與供應(yīng)商之間電子郵件的交流和溝通。傳統(tǒng)方式是:每個(gè)員工的電子郵件都封閉在其專有的賬戶內(nèi),員工內(nèi)部的信息交流也依靠簡(jiǎn)單的郵件轉(zhuǎn)發(fā)實(shí)現(xiàn),造成了信息冗余;成功的解決方案未能得到及時(shí)分享和應(yīng)用,已有的郵件轉(zhuǎn)發(fā)模式不能有效地管理不斷增長(zhǎng)的大量電子郵件信息,不利于企業(yè)知識(shí)的檢索和應(yīng)用。

MEDTS系統(tǒng)是一個(gè)基于WEB模式的應(yīng)用系統(tǒng),可以嵌入傳統(tǒng)的電子郵件系統(tǒng),MEDTS系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖5所示。它從電子郵件服務(wù)器接收郵件并存儲(chǔ)到一個(gè)單一中心的動(dòng)態(tài)分類體系中。員工通過個(gè)人電腦上的瀏覽器可瀏覽完整的動(dòng)態(tài)分類體系。通過集中式的信息管理模式,可以方便地對(duì)全公司的電子郵件信息進(jìn)行檢索,也能有效地支持信息的分享應(yīng)用。同時(shí),提供發(fā)送電子郵件的功能,使員工可僅僅使用MEDTS系統(tǒng)執(zhí)行基于電子郵件的知識(shí)工作。

圖5 MEDTS系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)

圖6給出根據(jù)用戶角色提供的個(gè)人分類目錄的界面;圖7為輸入搜索關(guān)鍵字界面;圖8為根據(jù)輸入的搜索關(guān)鍵字關(guān)聯(lián)的領(lǐng)域形成的搜索結(jié)果界面;圖9為基于多代理機(jī)制的動(dòng)態(tài)分類體系系統(tǒng)界面。

目前,該公司所有員工可以在MEDTS系統(tǒng)中發(fā)送和接收電子郵件,所有郵件信息被保存在一個(gè)中央數(shù)據(jù)庫(kù)中,通過安全授權(quán)機(jī)制,可以便捷地瀏覽所有郵件信息和解決方案知識(shí),方便實(shí)現(xiàn)信息的共享與學(xué)習(xí),有效地支持企業(yè)的商業(yè)運(yùn)營(yíng)工作。

圖6 電子郵件瀏覽界面

圖7 關(guān)鍵字搜索界面

圖8 搜索結(jié)果顯示界面

圖9 動(dòng)態(tài)分類體系界面

5 結(jié)論

動(dòng)態(tài)分類體系正在成為知識(shí)管理的有效方法。基于動(dòng)態(tài)分類體系的3種模式為知識(shí)工作者提供了良好的信息和知識(shí)組織管理工具。MEDTS系統(tǒng)提供了基于電子郵件的知識(shí)工作支持,使知識(shí)工作者可以方便地從電子郵件的分類體系邏輯中瀏覽和學(xué)習(xí)有用的信息,構(gòu)成知識(shí)協(xié)同工作的基礎(chǔ)。今后,3種動(dòng)態(tài)分類體系模式需要更深入的研究和開發(fā)智能功能,知識(shí)審計(jì)和知識(shí)工作流支持系統(tǒng)也將被深入研發(fā)。

[1] Drucker P F. The age of social transformation[J]. The Atlantic Monthly, 1994,274(5):53-80.

[2] Drucker P F. Managing in turbulent times[M]. London:Heinemann, 1980.

[3] Fred Nickols. Shift to knowledge work yearbook of knowledge management [M]. Butterworth-Heinemann, 2000.

[4] Sheila Corrall. Are we in the knowledge management business[J]. Adriad, 18. URL: http://www.ariadne.ac.uk/ issue18/knowledge-mgt / (available: Dec., 1998).

[5] Yogesh Malhora. Knowledge management for the new world of business[J]. Journal for Quality & Participation special issue on Learning and Information Management, 1998, 21(4):58-60.

[6] Prusak L. Where did knowledge management[J]. IBM Systems Journal, 2001, 40(4):1002-1007.

[7] Karl M Wiig. Knowledge Management: Where did it come from and where will It go[J]. Expert Systems With Applications, 1997,13(1) :1-14.

[8] Sebastiani F. Machine learning in automated text categorization.Technical[R]. ACM Computing Surveys, March 2002, 34(1):1-47.

[9] Steve Blake. Lecture note on taxonomies masterclass[M].Arkgroup, 2002.

[10] Susan Conway, Char Sligar. Unlocking Knowledge Assets[R].Microsoft Press, 2002.

[11] Scott Spangler, Jeffrey Kreulen. Interactive methods for taxonomy editing and validation[C]. The Proceedings of CIKM’02, URL: http://www.almaden.ibm.com/software/km/eClassifier/cikm2002.pdf, 2002.

[12] Sacco G. Dynamic taxonomies: a model for large information base[J]. IEEE Transaction On Knowledge & Data Engineering, 2000(12):68-479.

猜你喜歡
分類體系信息
分類算一算
構(gòu)建體系,舉一反三
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會(huì)信息
“曲線運(yùn)動(dòng)”知識(shí)體系和方法指導(dǎo)
“三位一體”德育教育體系評(píng)說
“三位一體”建體系 長(zhǎng)治久安防哮喘
健康之家(2009年5期)2009-05-26 06:47:08
主站蜘蛛池模板: 麻豆国产精品| 91美女在线| 99一级毛片| 都市激情亚洲综合久久| 国产精品第一区在线观看| 国产欧美日韩另类| 欧美一区日韩一区中文字幕页| 国产亚洲欧美在线人成aaaa| 婷婷综合在线观看丁香| 日韩国产亚洲一区二区在线观看| 亚洲热线99精品视频| 五月婷婷综合网| 国产一区二区免费播放| 国产精品福利一区二区久久| 一级毛片不卡片免费观看| 久久伊人色| 国产欧美一区二区三区视频在线观看| 亚洲天堂视频网| 欧美午夜小视频| 国产精品七七在线播放| 日韩美毛片| 性欧美久久| 午夜精品国产自在| 青草国产在线视频| 国产亚洲精品yxsp| 日韩精品无码免费一区二区三区| 亚洲视频三级| 日韩欧美亚洲国产成人综合| 国产一区二区三区在线观看视频 | 亚洲精品第五页| 欧美性猛交xxxx乱大交极品| 中文字幕乱码二三区免费| 亚洲综合激情另类专区| 色一情一乱一伦一区二区三区小说| 中文无码精品A∨在线观看不卡 | 农村乱人伦一区二区| 国产成熟女人性满足视频| 漂亮人妻被中出中文字幕久久| 欧美国产精品拍自| 亚洲区第一页| 日本精品一在线观看视频| 国产精品成人免费综合| 亚洲人成影院午夜网站| 青青国产视频| 91国内外精品自在线播放| 精品视频在线观看你懂的一区| 亚洲人成网址| 亚洲视频a| 91精品啪在线观看国产60岁| 免费网站成人亚洲| 国产精品亚洲日韩AⅤ在线观看| 亚洲第一成人在线| 一区二区三区四区精品视频| 亚洲伊人电影| 亚洲男人天堂2020| 无码日韩人妻精品久久蜜桃| 国产成人高清精品免费5388| 国产精品视频系列专区| 精品国产欧美精品v| 亚洲天堂免费在线视频| 2018日日摸夜夜添狠狠躁| 狼友视频一区二区三区| 日韩专区欧美| 国产免费久久精品99re不卡| 综合色区亚洲熟妇在线| 伊人久综合| 欧美不卡在线视频| 成人午夜久久| 又黄又湿又爽的视频| 欧美激情视频一区| 久久一本日韩精品中文字幕屁孩| 国产欧美高清| 日韩av无码精品专区| 特级aaaaaaaaa毛片免费视频| 亚洲伊人天堂| 国产精品深爱在线| 日韩小视频在线播放| 国产亚洲精| 欧美伦理一区| av天堂最新版在线| 91亚瑟视频| 日韩在线播放欧美字幕|