999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

校園智能化信息檢索系統的設計與實現

2016-12-12 09:55:20鄭昕欣劉明銘
中文信息 2016年10期
關鍵詞:信息檢索智能化校園

鄭昕欣+劉明銘

摘 要: 本文通過對不同用戶的需求、信息獲取途徑的深入了解以及對智能化信息檢索進行了可行性分析后,對其作了需求分析、功能模塊劃分、數據庫的設計、算法設計以及界面設計,選定在校大學生作為適用群體,完成了校園信息智能化檢索系統的開發。它可以應用于校園、企業、網站等諸多實體,因此具有一定的使用價值。

關鍵詞:智能化 信息檢索 校園 檢索系統

中圖分類號:TP3 文獻標識碼:A 文章編號:1003-9082(2016)10-0016-01

一、引言

本文以在校大學生為服務對象,針對上述信息服務系統的不足,設計研發了針對大學生的智能化信息檢索系統,實現了根據對用戶自身特性、用戶需求和漢語言自身特點等多方面的綜合考量進行有針對性地信息推送這一功能。通過使用本系統,可以提高在校大學生獲取信息的便利度和快捷度,同時也方便了大學生之間的交流和溝通。

二、系統分析

1.系統總體目標

在用戶方面,本系統致力于帶來便捷的用戶體驗、簡潔大方的用戶接口;在管理員方面,本系統致力于實現簡便的后期維護,如要對功能模塊方面作修改,則無需進行整個系統的重新架構。

2.技術可行性分析

本系統是一個典型的數據庫應用程序?,F有的數據庫應用程序開發技術已非常成熟,利用現有技術完全可以實現預定的功能。Java語言簡單、功能強大并容易掌握。而MySQL是一個非常優秀的中型數據庫管理軟件,使用方便,性能穩定。故采用Java+MySQL技術完全能夠實現本系統的開發。

三、系統設計

1.功能模塊描述

1.1登錄模塊

將用戶輸入的用戶名和密碼帶入數據庫,在數據庫中進行匹配,驗證賬號和密碼,

1.2主頁面模塊

在此模塊中列舉本系統所包含的所有子功能模塊以及一些推薦信息。

1.3近期活動模塊

發布內容來自學校社團等活動主辦方,并根據實時情況更改發布內容。

1.4生活服務模塊

學生成功登錄后,可以自行發布信息,該信息經過排版發布于子功能模塊中,并可被其他登陸用戶看到。

1.5自助查詢模塊

用戶成功登錄后,可以根據需要發起搜索,后臺服務器根據搜索記錄進行智能匹配,并在子功能模塊中反饋給用戶。

四、信息檢索關鍵技術及系統實現

1.基于網絡爬蟲的網頁信息提取

本系統采用Java和MySQL數據庫聯動的方式,在每一次抽取新的URL時,通過Jsoup類庫解析出document實例對象,在此實例對象中抽取需要的元素(如文章內容等),同時將URL和該網頁的標題加入數據庫,形成標題與URL一一對應的表結構。

由于互聯網上的信息總是實時更新的,存儲在數據庫中作為信息儲備的所有信息也必須配合互聯網得到時效性,實現實時更新。本系統通過調用Mycrawler類中的refresh方法來實現定時更新,利用多線程來監督更新并計時。

2.提取信息的分詞實現

在分詞部分,核心要點是 1.詞典樹的構建 2.中文詞匯的匹配,即對一句話中詞語切割的位置。為此,本系統采用了IKAnalyzer分詞技術。IKAnalyzer是一個開源的,基于java語言開發的輕量級的中文分詞工具包。

在詞語的匹配過程當中,IK中默認用到三個子分詞器,分別是LetterSegmenter(字母分詞器),CN_QuantifierSegment(量詞分詞器),CJKSegmenter(中日韓分詞器)。分詞會先后經過這三個分詞器,首先要對輸入的字符串進行處理,將字符串轉換為char型進行匹配輸入字符串以char的形式進行匹配,一個char如果能取到hitList,那么會鎖定hitList,循環到第二個char,如果能在hitList里與上一個char匹配成詞,則保存當前的newLexeme,并加入到輸出結果集。isEnd()判斷是否結束,如果是,則context.currCursor偏移1位,繼續取詞。以此類推,直到整個字符串遍歷完畢。

3.智能化方法及實現

隨著計算機技術的不斷發展,智能化以其良好的用戶體驗一躍成為今后軟件設計的一個必然趨勢。本系統的智能化主要體現在:根據同義詞、近義詞詞庫,實現同義詞匹配搜索。即,根據用戶輸入的關鍵字,通過同義詞匹配,將與用戶搜索內容詞義相近的搜索結果按照其不同的匹配度降序排列,同樣也反饋給用戶。

在獲取了用戶的搜索指令之后,本系統對關鍵詞進行同義詞查詢,使用戶搜索內容得到一定擴充。同義詞部分在Lucene4.6中通過SynonymFilterFactory實現查詢。

Lucene是Apache軟件基金會Jakarta項目組的一個子項目,是一個開放源代碼的全文搜索引擎工具包,但它不是一個完整的全文搜索引擎,而是一個全文搜索引擎架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。

本系統首先通過新建Hashmap儲存相關版本信息和同義詞詞典信息,并載入相關內容。而后將已提取到的多個關鍵詞進行stream化以供索引。最后借助SynonymFilterFactory類,根據同義詞詞庫,以自然語言中的意群作為標準,實現同義詞查詢。

五、總結與展望

本系統從用戶的角度出發,發現了現代信息社會特定群體獲取信息時存在的一些弊端,并根據這些弊端提出了一種更優的實現方法,該方法不同于當今較通用的智能匹配,同時兼顧了用戶群體和自然語言特征兩個方面,將用戶需求進一步細分,仿真方法證明了該方法在數據量很大的情況下依然有效。

參考文獻

[1](美)西爾伯沙茨(Silberschatz.A.)等著.數據庫系統概念:Database System Concepts[M].楊冬青,李紅燕,唐世渭等譯.原書第六版.北京:機械工業出版社,2012年:41-42.

[2]李剛.瘋狂Java講義(精粹)[M].第二版.北京:電子工業出版社,2014,236-242.

猜你喜歡
信息檢索智能化校園
智能化戰爭多維透視
軍事文摘(2022年19期)2022-10-18 02:41:14
印刷智能化,下一站……
印刷工業(2020年4期)2020-10-27 02:45:52
基于“物聯網+”的智能化站所初探
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經網絡的個性化信息檢索模型研究
開心校園
石油石化演進智能化
能源(2015年8期)2015-05-26 09:15:56
爆笑校園
主站蜘蛛池模板: 亚洲人在线| 亚洲成人在线网| 国产呦视频免费视频在线观看 | 免费看一级毛片波多结衣| 免费久久一级欧美特大黄| AV无码无在线观看免费| 精品国产自在在线在线观看| 欧美日韩一区二区在线免费观看| 亚洲香蕉伊综合在人在线| 98精品全国免费观看视频| 久久国产V一级毛多内射| 1级黄色毛片| 亚洲成在人线av品善网好看| 五月天综合婷婷| 国产在线观看人成激情视频| 色网在线视频| 亚洲欧洲国产成人综合不卡| 中文无码精品a∨在线观看| 久久久亚洲国产美女国产盗摄| 久久亚洲欧美综合| 国产91麻豆免费观看| 国产高清国内精品福利| 韩国v欧美v亚洲v日本v| 国产成人精彩在线视频50| 九九九久久国产精品| 国产女人18毛片水真多1| 99er这里只有精品| 国产不卡网| 日本午夜影院| 亚洲天堂久久新| 亚洲最黄视频| 亚洲码在线中文在线观看| 日本91在线| 国产人成午夜免费看| 久久久91人妻无码精品蜜桃HD| 一本大道无码高清| 日韩少妇激情一区二区| 欧美亚洲日韩中文| 精品在线免费播放| 爽爽影院十八禁在线观看| 国产精品播放| 亚洲成人网在线播放| 中文字幕在线看视频一区二区三区| 手机在线国产精品| 欧美成人免费一区在线播放| 在线看片中文字幕| 久久久久88色偷偷| 99国产在线视频| 国产网友愉拍精品视频| 国产在线观看一区精品| 有专无码视频| 色综合天天综合| 国产91九色在线播放| 青青青国产在线播放| 超清无码熟妇人妻AV在线绿巨人| 伊人久久大香线蕉aⅴ色| 成人在线亚洲| 波多野结衣无码中文字幕在线观看一区二区 | 免费人欧美成又黄又爽的视频| 亚洲成人黄色在线| 91久久国产综合精品女同我| 国产欧美中文字幕| 国产成人1024精品| 久久精品丝袜高跟鞋| 色妞www精品视频一级下载| 毛片最新网址| 2020最新国产精品视频| 日韩国产高清无码| 欧美天天干| 在线国产毛片手机小视频 | 老色鬼久久亚洲AV综合| 亚洲资源站av无码网址| 欧美成人午夜视频| 国产成人精品男人的天堂| 无码精油按摩潮喷在线播放| 在线观看国产小视频| 成人免费午间影院在线观看| 青青国产视频| 无码综合天天久久综合网| 日韩色图在线观看| 高清不卡毛片| 国产麻豆精品在线观看|