999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

WEB頁(yè)面文本挖掘的價(jià)值與未來探究

2008-12-31 00:00:00曹麗君劉西印楊燕萍
商場(chǎng)現(xiàn)代化 2008年9期

[摘要] 本文介紹了文本挖掘的研究狀況,分析了文本挖掘的基本概念和技術(shù),總結(jié)了文本挖掘的過程,特征的建立、特征集的縮減、常用算法、模式的提取與評(píng)價(jià)等,展望了文本挖掘的未來研究問題和方向。

[關(guān)鍵詞] 文本挖掘 文本特征 詞頻矩

一、引言

隨著Internet 應(yīng)用的普及,Web已經(jīng)發(fā)展成為擁有10億頁(yè)面的分布式信息空間,而且這個(gè)數(shù)字仍以每半年翻一番的速度增長(zhǎng)。在這些海量數(shù)據(jù)當(dāng)中,大部分信息是非結(jié)構(gòu)化的或是半結(jié)構(gòu)化的,蘊(yùn)含著巨大潛在價(jià)值的知識(shí)。人們迫切需要能夠從Web上快速、有效地發(fā)現(xiàn)這些有價(jià)值的知識(shí)。Web上信息多樣性決定了Web知識(shí)發(fā)現(xiàn)的多樣性。按照處理對(duì)象的不同,可以將Web知識(shí)發(fā)現(xiàn)分為兩大類:內(nèi)容發(fā)現(xiàn)和結(jié)構(gòu)發(fā)現(xiàn)。

二、文本挖掘的過程

文本挖掘?qū)ο笸ǔJ且唤MHTML 或是XML格式的文檔集。文本挖掘的一般處理過程如圖1所示。

1.文本特征

主站蜘蛛池模板: 99久久国产综合精品女同| 午夜啪啪网| 亚洲成人在线免费观看| 天天综合网亚洲网站| 婷婷99视频精品全部在线观看| 国产成人亚洲综合A∨在线播放| 国产一区二区网站| 天堂中文在线资源| 97视频精品全国在线观看| 亚洲青涩在线| 亚洲精品亚洲人成在线| 亚洲日本中文字幕乱码中文| 成人无码区免费视频网站蜜臀| 久久这里只有精品2| 无码内射在线| 日本人妻丰满熟妇区| 在线观看国产网址你懂的| 四虎影视永久在线精品| 毛片免费在线视频| www.精品国产| 福利姬国产精品一区在线| 国产人碰人摸人爱免费视频| 亚洲人成色在线观看| 国产经典在线观看一区| 亚洲色精品国产一区二区三区| 一级毛片基地| 欧美天天干| 国产成人高清亚洲一区久久| 欧美亚洲国产日韩电影在线| 18禁影院亚洲专区| 熟女视频91| 无码福利视频| 好吊色妇女免费视频免费| 国产97视频在线观看| 国产成人综合欧美精品久久| 亚洲精品波多野结衣| 18禁高潮出水呻吟娇喘蜜芽| 亚洲福利片无码最新在线播放| av免费在线观看美女叉开腿| 国产亚洲欧美在线专区| 91精品视频在线播放| 国产成人综合日韩精品无码不卡| 黄片在线永久| 欧美三級片黃色三級片黃色1| 国产综合精品一区二区| 朝桐光一区二区| 国产麻豆福利av在线播放| 97精品国产高清久久久久蜜芽| 99草精品视频| 亚洲视频三级| 国产免费高清无需播放器| 99热这里只有精品5| 人妻精品久久无码区| 毛片卡一卡二| 人妻丰满熟妇av五码区| 欧美一级高清片欧美国产欧美| 久久精品无码中文字幕| 好吊妞欧美视频免费| 国产日韩精品欧美一区灰| 欧美日本在线一区二区三区| 91原创视频在线| 亚洲Av综合日韩精品久久久| 国产99在线| 久久综合九色综合97婷婷| 欧美成人A视频| 免费看黄片一区二区三区| 欧美精品二区| 国产97色在线| 国产黄色免费看| 日韩天堂在线观看| 97色伦色在线综合视频| 欧美一级夜夜爽| 国产91熟女高潮一区二区| 蜜桃视频一区| 久久国产精品国产自线拍| 国产99在线观看| 久久综合AV免费观看| 亚洲全网成人资源在线观看| 特级精品毛片免费观看| 亚洲一级毛片免费看| 国产精品妖精视频| 国产午夜一级毛片|