999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Web信息挖掘的商業(yè)分析系統(tǒng)設(shè)計(jì)研究

2021-01-27 12:02:13朱育頡浙江工商大學(xué)
消費(fèi)導(dǎo)刊 2020年5期
關(guān)鍵詞:信息系統(tǒng)

朱育頡 浙江工商大學(xué)

前言:將Web中商業(yè)信息加以挖掘并提取分析可以利用Web信息技術(shù)引導(dǎo)企業(yè)和商業(yè)高效率的運(yùn)行;將最新式的web信息服務(wù)引入管理部門以及政府,實(shí)現(xiàn)高質(zhì)量的監(jiān)管。因此,可以結(jié)合Web信息挖掘技術(shù),利用非結(jié)構(gòu)化的特征和網(wǎng)上信息的發(fā)布,結(jié)合信息塊多主題的分割技術(shù),構(gòu)建基于Web信息挖掘的商業(yè)分析系統(tǒng)。

一、非結(jié)構(gòu)化Web信息提取

雖然Web具有豐富的信息資源,但是這些信息一般使用在用戶的瀏覽過程。其中包含著許多HTML標(biāo)記,此標(biāo)記不可以代表網(wǎng)頁信息的實(shí)際含義,只可以用作瀏覽器的顯示解釋。同時(shí),網(wǎng)頁格式也與以往的文本文檔具有較大的不同,其中也許包含圖片、框架、表格各種形式的內(nèi)容,將機(jī)器理解復(fù)雜化。若想實(shí)現(xiàn)非結(jié)構(gòu)化的存在信息,需要對這些內(nèi)容進(jìn)行提取。關(guān)于Web的信息提取方案主要有三種:全自動方法、半自動方法、人工方法。具體內(nèi)容如下:包裝器的歸納方式提取、基于HTML結(jié)構(gòu)信息的提取、基于ontology的提取、依據(jù)自然語言進(jìn)行信息的提取、基于Web信息查詢的提取[1]。例如,其中最常見的應(yīng)用技術(shù)是利用Wrapper包裝器針對HTML等形式的網(wǎng)頁信息進(jìn)行提取。其中,Wrapper(包裝器)實(shí)際上是軟件構(gòu)件。一個(gè)包裝器對應(yīng)單一數(shù)據(jù)源的一種頁面,主要負(fù)責(zé)將查詢請求與數(shù)據(jù)從一種形式轉(zhuǎn)變?yōu)榱硪环N形式。在Web開發(fā)環(huán)境下,包裝器的工作主要是提取隱含在HTML中的信息,將其轉(zhuǎn)化成可以進(jìn)行下一步處理的數(shù)據(jù)結(jié)構(gòu)存儲數(shù)據(jù)。

在提取信息時(shí)主要有兩個(gè)步驟:其一,篩掉網(wǎng)頁上沒有的信息數(shù)據(jù)。因?yàn)榫W(wǎng)頁的框架格式是固定的,因此其中的文本信息是孤立的。DOM(文檔對象模型)會與網(wǎng)頁信息之間形成對應(yīng)的頁面模板信息。其二,詞頻統(tǒng)計(jì)工作。在數(shù)據(jù)表單工作中,表單格式可以標(biāo)識專業(yè)域名的詞典業(yè)務(wù)信息記錄。其中,具體的信息分離工作有如下步驟:循環(huán)反復(fù)讀取頁面信息、讀取表格和標(biāo)題、提取圖片與段落信息、建立新式提取模板[2]。通過一系列的信息塊分離,可以幫助系統(tǒng)構(gòu)建HTML信息塊樹,實(shí)現(xiàn)信息分離的效果。

二、信息塊分割和信息抽取

提取的信息塊目前是分離的狀態(tài),需要將商業(yè)信息本身的混合性與復(fù)雜性融合在內(nèi)。一般同一個(gè)信息塊中富含著多種主題的信息。例如,在測試五種攝像手機(jī)時(shí),信息中包含著五種手機(jī)的詳細(xì)信息。本課題可以引入主題分割的信息提取算法獲得網(wǎng)頁中各種信息塊的商業(yè)含義。具體的操作內(nèi)容如下:其一,需要利用通用切分詞表對文本信息塊中的中文進(jìn)行分詞操作。其二,通過商業(yè)范圍中實(shí)體名字典的引導(dǎo),詳細(xì)統(tǒng)計(jì)各個(gè)信息塊中關(guān)鍵詞條的頻率。公式為:Wf=Wst+∑Waf,其中,Wst是詞條在信息塊中的出現(xiàn)頻率;Waf是商業(yè)實(shí)體名的字典中該詞條的同義詞出現(xiàn)頻率。其三,按照詞條頻率統(tǒng)計(jì)句子的權(quán)重,公式為:S=∑Wf。其四,依據(jù)權(quán)重求出最大的主題句子,用字母S表示。其中,S>N/5,N是句子的總量。將信息塊可以分為S個(gè)主題,在將S主題相關(guān)的信息進(jìn)行合并。其五,對分離之后再進(jìn)行合并的各個(gè)主題信息塊按照實(shí)體名字典中例如商品、類別、廠商的一些詞條,得到相應(yīng)的商業(yè)信息,如商品名、價(jià)格、型號、所屬企業(yè)等。接著提取出信息塊中的商業(yè)信息,將其存到的信息庫中。其六,未出現(xiàn)在商業(yè)實(shí)體名詞字典中的高頻詞條,需要分析其與同信息塊的實(shí)體名之間的關(guān)聯(lián),最后加入到商業(yè)實(shí)體名的字典中。其七,判定塊內(nèi)的URL地址的具體信息是否為之前分析的Web內(nèi)容。如果是,需要將其添加到URL的地址列表中。

三、信息評價(jià)

可以采取評價(jià)機(jī)制進(jìn)一步保障提交結(jié)果的真實(shí)性與可靠性。此系統(tǒng)通過使用信息反饋以及先驗(yàn)知識對信息進(jìn)行評估,科學(xué)分析出獲取商業(yè)信息的正確方式。可以在專家或者技術(shù)人員的支持下構(gòu)建評價(jià)機(jī)制,評價(jià)系統(tǒng)的重點(diǎn)是圍繞信息的準(zhǔn)確性和權(quán)威性。此外,還需要對信息的準(zhǔn)確性與權(quán)威性進(jìn)一步分級和評價(jià),需要實(shí)現(xiàn)以下幾方面:其一,信息加權(quán),經(jīng)過篩選之后的信息可以按照信用評級進(jìn)行加權(quán)。比如信息倉庫中具有關(guān)鍵詞時(shí)但是表述內(nèi)容不全面時(shí),可以利用信息的加權(quán)大小判斷可靠性。其二,信息篩選過程需要去掉與領(lǐng)域需求不相關(guān)的信息。

四、信息提交

系統(tǒng)需要提取的信息面很大。不過對于特殊用戶,只需要查看小范圍的視圖即可??梢允褂肂/S形式,這樣一來用戶就可以輕松的訪問系統(tǒng)中利用Java編程語言系統(tǒng)提供的服務(wù),后臺數(shù)據(jù)庫可以選擇SQL Serve。通過Jsp系統(tǒng)可以進(jìn)行用戶的調(diào)度,在系統(tǒng)中可以留置企業(yè)接口B也就是智能/業(yè)務(wù)信息系統(tǒng),方便將系統(tǒng)的結(jié)果通過接口傳遞到企業(yè)的BI系統(tǒng)內(nèi)部,可以將CABWIM系統(tǒng)內(nèi)部的實(shí)際結(jié)果利用接口調(diào)用的形式傳遞到企業(yè)的BI系統(tǒng)中。

結(jié)論:因此,在建立Web信息挖掘商業(yè)信息系統(tǒng)時(shí),需要結(jié)合數(shù)據(jù)的異構(gòu)信息塊分割特性,通過商業(yè)實(shí)體名稱代碼分類提取商業(yè)信息。通過潛在的信息商業(yè)價(jià)值,達(dá)到實(shí)用性的應(yīng)用效果,可以對企業(yè)的科學(xué)管理起到高效的指導(dǎo)作用。不過,系統(tǒng)需要結(jié)合需求進(jìn)行進(jìn)一步的改進(jìn),例如信息源和命名系統(tǒng)均是研究的重點(diǎn)。

猜你喜歡
信息系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統(tǒng)
半沸制皂系統(tǒng)(下)
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 激情成人综合网| 欧美精品在线观看视频| 国产免费看久久久| 国产精品免费p区| 国产亚洲视频免费播放| 一本久道久综合久久鬼色| 国产成人精品一区二区秒拍1o| 久久中文字幕2021精品| 国产成人午夜福利免费无码r| 日韩毛片免费观看| 成人毛片免费观看| 老司机精品99在线播放| 国产永久在线视频| www亚洲天堂| 亚洲婷婷六月| 91系列在线观看| 国产精品毛片一区| 国产亚洲欧美另类一区二区| 天天摸夜夜操| 精品无码国产一区二区三区AV| 色成人综合| 国产成人啪视频一区二区三区| 国产精品xxx| 亚洲成肉网| 成人日韩欧美| 国产综合亚洲欧洲区精品无码| 一级在线毛片| 亚洲国产精品人久久电影| 久久精品aⅴ无码中文字幕 | 亚洲视频二| 国产免费自拍视频| 久久亚洲AⅤ无码精品午夜麻豆| 青青青国产在线播放| 91无码网站| 国产一区在线观看无码| 精品无码人妻一区二区| 亚洲精品在线影院| 国产精品熟女亚洲AV麻豆| 欧美中文字幕在线播放| 欧美成人二区| 国产小视频网站| 91精品啪在线观看国产91| 亚洲天堂精品在线观看| 91精品视频在线播放| 日本不卡在线视频| 午夜欧美在线| 99久久精品国产麻豆婷婷| 日本午夜影院| 亚洲系列无码专区偷窥无码| 日本三级欧美三级| 亚洲娇小与黑人巨大交| 久精品色妇丰满人妻| 日韩色图区| 亚洲国产中文欧美在线人成大黄瓜| 99re在线免费视频| 老司机午夜精品网站在线观看| 久久久久国产精品嫩草影院| 国产美女丝袜高潮| 欧美一道本| 亚洲婷婷丁香| 欧美成人亚洲综合精品欧美激情| 日本久久网站| 国产主播喷水| 久久精品aⅴ无码中文字幕| 久久中文无码精品| 免费看的一级毛片| 欧美成人一区午夜福利在线| 精品夜恋影院亚洲欧洲| 青青操视频免费观看| 激情网址在线观看| 国产亚洲精品无码专| 国产国语一级毛片在线视频| 全部免费毛片免费播放| 亚洲无码精品在线播放| 一级爱做片免费观看久久| 亚洲床戏一区| 亚洲欧美天堂网| 久久77777| 免费jizz在线播放| 国产在线欧美| 国产一区二区人大臿蕉香蕉| 99无码熟妇丰满人妻啪啪|