陸麗婷



摘要:基于商品搜索的智能分詞系統(tǒng)就是將商品名稱通過智能分詞系統(tǒng)分成若干有用的詞語(yǔ)來匹配用戶搜索時(shí)輸入的詞語(yǔ),同時(shí),根據(jù)分詞結(jié)果可以將同類商品進(jìn)行分類統(tǒng)計(jì),分析了系統(tǒng)的架構(gòu),對(duì)系統(tǒng)進(jìn)行了模塊設(shè)計(jì)、功能流程的分析以及數(shù)據(jù)庫(kù)的設(shè)計(jì)。
關(guān)鍵詞:商品搜索;智能分詞;系統(tǒng)設(shè)計(jì);分詞集群;匹配
中圖分類號(hào):TP311.56? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)23-0049-02
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Design of Intelligent Word Segmentation Based on Commodity Search
LU Li-ting
(Wuxi City Vocational and Technical College of Things Engineering,Wuxi 214153,China)
Abstract: Intelligent word segmentation system based on commodity search is to divide commodity names into several useful words to match the words entered by users in search. At the same time, according to the results of word segmentation, similar commodities can be classified and counted, the system structure is analyzed. The module design, function flow analysis and database design of the system are carried out.
Key words: Commodity Search; Intelligent Word Segmentation; system design; Segmentation Cluster; matching
1 智能分詞系統(tǒng)構(gòu)建的意義
人類社會(huì)進(jìn)入了21世紀(jì),以天貓、淘寶、京東為首的電商平臺(tái)使人們足不出戶,便可以在網(wǎng)絡(luò)上購(gòu)買到各種各樣的商品。網(wǎng)絡(luò)購(gòu)物在帶來方便的同時(shí),因?yàn)樯唐返亩鄻踊藗冊(cè)诰W(wǎng)絡(luò)上購(gòu)買商品時(shí),常常眼花繚亂,在海量的信息中,找到自己需要的商品,需要消耗不少精力。各個(gè)電商平臺(tái),物品種類繁多,如何提高用戶的購(gòu)物體驗(yàn),也是電商們不斷追求的目標(biāo)。
智能分詞系統(tǒng),可以通過將海量的商品進(jìn)行分類,同時(shí)找出有用的關(guān)鍵分詞,從而更好地匹配用戶的搜索,使用戶在海量搜索中解放出來,能給用戶帶來更好的購(gòu)物體驗(yàn)。同時(shí),智能分詞系統(tǒng)還可以引申到別的行業(yè),只要有智能分詞和聚合的需要,該系統(tǒng)都能發(fā)揮不小的作用。
2 系統(tǒng)分析
本系統(tǒng)主要為Web開發(fā)框架包含前后兩端部分的內(nèi)容。前端采用視圖解析技術(shù),支持JSP解析,并以jQuery Mobile開發(fā)及對(duì)UI控件進(jìn)行調(diào)整。后端部分則采用SpringMVC + MyBatis的輕量級(jí)框架,采用控制層、服務(wù)層以及dao層的三層架構(gòu)實(shí)現(xiàn),并且在此系統(tǒng)中最主要的一個(gè)控件便是XSearch控件,又叫搜索服務(wù)組件引擎,目的是提供非依賴性的大數(shù)據(jù)內(nèi)容查找內(nèi)容。該引擎可以獨(dú)立與其他任何形式的java工程進(jìn)行組合使用,利用該引擎與商品信息相結(jié)合使用。它可以通過識(shí)別解析自定義的實(shí)體類,將該自定類所有屬性值都進(jìn)行索引。全匹配分詞及智能分詞就是利用Xsearch中的全文檢索功能,針對(duì)各索引字段的指定關(guān)鍵字的綜合性排名檢索,類似于淘寶、京東里用戶輸入想要產(chǎn)品的一個(gè)關(guān)鍵字,并排列出一系列的相關(guān)聯(lián)的商品信息,使整個(gè)功能都能夠關(guān)聯(lián)起來,使用起來更加方便。只要用戶輸入關(guān)鍵詞,系統(tǒng)則會(huì)智能匹配到含有關(guān)鍵詞的一些相關(guān)產(chǎn)品,其功能很廣泛。這給商家在對(duì)大量的訂單貨量中減輕了負(fù)擔(dān),該系統(tǒng)適用于各個(gè)行業(yè),滿足于各個(gè)平臺(tái)、各個(gè)企業(yè),所以在經(jīng)濟(jì)上具有完全的可行性。
3 系統(tǒng)設(shè)計(jì)
3.1 系統(tǒng)總架構(gòu)圖
本項(xiàng)目采用Web服務(wù)器Tomcat7.0進(jìn)行開發(fā)與調(diào)試,配置好服務(wù)器,可以利用它響應(yīng)頁(yè)面的訪問請(qǐng)求,為HTML頁(yè)面服務(wù),也可以運(yùn)行JSP頁(yè)面和Servlet,并且Tomcat和IIS服務(wù)器一樣,它們都具有處理頁(yè)面的功能,具體見圖1所示。
3.2 模塊設(shè)計(jì)
1)用戶登錄:通過用戶名和密碼登錄系統(tǒng);
2)商品列表:分頁(yè)顯示商品名稱、商品類別;
3)智能分詞:根據(jù)商品名稱,系統(tǒng)智能分解出各種分詞;
4)自定義分詞:系統(tǒng)除了能根據(jù)商品列表中的商品名稱進(jìn)行分詞外,還可以自定義分詞來匹配商品名稱;
5)分詞匹配結(jié)果:用戶在分詞頁(yè)面選擇相關(guān)分詞,點(diǎn)擊匹配后可以看到分詞匹配結(jié)果;
6)分詞結(jié)果圖表展示:根據(jù)分詞匹配結(jié)果,用圖表方式展示;
7)導(dǎo)出功能:通過EXCEL導(dǎo)出商品列表;
8)商品分類展示結(jié)果:將已經(jīng)匹配的商品按照類別展示每種類別的匹配情況。
3.3 功能流程分析
用戶需要輸入正確的用戶名和密碼進(jìn)行系統(tǒng)登錄,登錄成功后進(jìn)入商品信息頁(yè)面,顯示商品名稱、商品類別,根據(jù)商品名稱,系統(tǒng)可智能分解出各種分詞,選擇相關(guān)分詞可查看分詞匹配結(jié)果,同時(shí),在智能分詞頁(yè)面可自定義分詞進(jìn)行搜索,搜索結(jié)果會(huì)把輸入的分詞排在第一位。在分詞匹配頁(yè)面,根據(jù)分詞匹配結(jié)果,用圖表方式展示出來,也可進(jìn)一步通過EXCEL導(dǎo)出商品列表,如果不導(dǎo)出,也可將已經(jīng)匹配的商品按照類別展示匹配情況。具體流程見圖2所示。
3.4 系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)
本系統(tǒng)需要有后臺(tái)數(shù)據(jù)庫(kù)的支撐,在MySQL中進(jìn)行表創(chuàng)建,本系統(tǒng)的數(shù)據(jù)庫(kù)共有五個(gè)表,分別為:
1)用戶信息表t_user,該表主要記錄用戶登錄的信息,包括用戶ID(添加字段)、用戶名、密碼。
2)自定義分詞表t_xmfc,該表主要記錄自定義分詞名稱,包括分詞編號(hào)、分詞名稱。
3)商品列表t_xmxxb,此表主要為了記錄商品列表,包括商品編碼、商品名稱、商品類別。
4)分詞集群信息表t_qxx,此表是為了保存分詞集群信息,就是用戶在選擇智能分詞或者是自定義分詞時(shí)所選擇的商品分詞,會(huì)全都記錄在數(shù)據(jù)庫(kù)該表中,包括群編號(hào)、分詞、時(shí)間、備注。
5)商品與分詞關(guān)聯(lián)信息表t_xmqgx,此表是為了保存商品與分詞關(guān)聯(lián)關(guān)系的,利用此表形成它們之間的一個(gè)聯(lián)系,包括商品編碼、群編號(hào)。
4 總結(jié)
基于商品搜索的智能分詞系統(tǒng)的設(shè)計(jì)通過將商品進(jìn)行分類,找出關(guān)鍵分詞來匹配用戶的搜索,極大地方便了用戶對(duì)商品的查找,同時(shí)也大大提高了搜索的速度和效率,也為接下來進(jìn)一步的系統(tǒng)開發(fā)和實(shí)現(xiàn)打下了基礎(chǔ)。
參考文獻(xiàn):
[1] 王穎. 基于互聯(lián)網(wǎng)+的鄉(xiāng)村智慧旅游系統(tǒng)設(shè)計(jì)[J]. 電子技術(shù)與軟件工程, 2019(13).
[2] 路桂明. 基于物聯(lián)網(wǎng)技術(shù)的實(shí)訓(xùn)室管理系統(tǒng)設(shè)計(jì)[J]. 南通職業(yè)大學(xué)學(xué)報(bào), 2019(2).
[3] 蔡朝鵬. 基于Java EE的物流管理系統(tǒng)設(shè)計(jì)[J]. 科技創(chuàng)新與應(yīng)用, 2019(19).
[4] 欒悅. 基于Android平臺(tái)的高等數(shù)學(xué)自主學(xué)習(xí)系統(tǒng)設(shè)計(jì)[J]. 科技風(fēng), 2019(18).
[5] 楊義濤. 基于微型電腦智能小車的自動(dòng)駕駛系統(tǒng)設(shè)計(jì)[J]. 通訊世界, 2019(6).
【通聯(lián)編輯:謝媛媛】