999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

校園智能化信息檢索系統的設計與實現

2016-12-12 09:55:20鄭昕欣劉明銘
中文信息 2016年10期
關鍵詞:信息檢索智能化校園

鄭昕欣+劉明銘

摘 要: 本文通過對不同用戶的需求、信息獲取途徑的深入了解以及對智能化信息檢索進行了可行性分析后,對其作了需求分析、功能模塊劃分、數據庫的設計、算法設計以及界面設計,選定在校大學生作為適用群體,完成了校園信息智能化檢索系統的開發。它可以應用于校園、企業、網站等諸多實體,因此具有一定的使用價值。

關鍵詞:智能化 信息檢索 校園 檢索系統

中圖分類號:TP3 文獻標識碼:A 文章編號:1003-9082(2016)10-0016-01

一、引言

本文以在校大學生為服務對象,針對上述信息服務系統的不足,設計研發了針對大學生的智能化信息檢索系統,實現了根據對用戶自身特性、用戶需求和漢語言自身特點等多方面的綜合考量進行有針對性地信息推送這一功能。通過使用本系統,可以提高在校大學生獲取信息的便利度和快捷度,同時也方便了大學生之間的交流和溝通。

二、系統分析

1.系統總體目標

在用戶方面,本系統致力于帶來便捷的用戶體驗、簡潔大方的用戶接口;在管理員方面,本系統致力于實現簡便的后期維護,如要對功能模塊方面作修改,則無需進行整個系統的重新架構。

2.技術可行性分析

本系統是一個典型的數據庫應用程序?,F有的數據庫應用程序開發技術已非常成熟,利用現有技術完全可以實現預定的功能。Java語言簡單、功能強大并容易掌握。而MySQL是一個非常優秀的中型數據庫管理軟件,使用方便,性能穩定。故采用Java+MySQL技術完全能夠實現本系統的開發。

三、系統設計

1.功能模塊描述

1.1登錄模塊

將用戶輸入的用戶名和密碼帶入數據庫,在數據庫中進行匹配,驗證賬號和密碼,

1.2主頁面模塊

在此模塊中列舉本系統所包含的所有子功能模塊以及一些推薦信息。

1.3近期活動模塊

發布內容來自學校社團等活動主辦方,并根據實時情況更改發布內容。

1.4生活服務模塊

學生成功登錄后,可以自行發布信息,該信息經過排版發布于子功能模塊中,并可被其他登陸用戶看到。

1.5自助查詢模塊

用戶成功登錄后,可以根據需要發起搜索,后臺服務器根據搜索記錄進行智能匹配,并在子功能模塊中反饋給用戶。

四、信息檢索關鍵技術及系統實現

1.基于網絡爬蟲的網頁信息提取

本系統采用Java和MySQL數據庫聯動的方式,在每一次抽取新的URL時,通過Jsoup類庫解析出document實例對象,在此實例對象中抽取需要的元素(如文章內容等),同時將URL和該網頁的標題加入數據庫,形成標題與URL一一對應的表結構。

由于互聯網上的信息總是實時更新的,存儲在數據庫中作為信息儲備的所有信息也必須配合互聯網得到時效性,實現實時更新。本系統通過調用Mycrawler類中的refresh方法來實現定時更新,利用多線程來監督更新并計時。

2.提取信息的分詞實現

在分詞部分,核心要點是 1.詞典樹的構建 2.中文詞匯的匹配,即對一句話中詞語切割的位置。為此,本系統采用了IKAnalyzer分詞技術。IKAnalyzer是一個開源的,基于java語言開發的輕量級的中文分詞工具包。

在詞語的匹配過程當中,IK中默認用到三個子分詞器,分別是LetterSegmenter(字母分詞器),CN_QuantifierSegment(量詞分詞器),CJKSegmenter(中日韓分詞器)。分詞會先后經過這三個分詞器,首先要對輸入的字符串進行處理,將字符串轉換為char型進行匹配輸入字符串以char的形式進行匹配,一個char如果能取到hitList,那么會鎖定hitList,循環到第二個char,如果能在hitList里與上一個char匹配成詞,則保存當前的newLexeme,并加入到輸出結果集。isEnd()判斷是否結束,如果是,則context.currCursor偏移1位,繼續取詞。以此類推,直到整個字符串遍歷完畢。

3.智能化方法及實現

隨著計算機技術的不斷發展,智能化以其良好的用戶體驗一躍成為今后軟件設計的一個必然趨勢。本系統的智能化主要體現在:根據同義詞、近義詞詞庫,實現同義詞匹配搜索。即,根據用戶輸入的關鍵字,通過同義詞匹配,將與用戶搜索內容詞義相近的搜索結果按照其不同的匹配度降序排列,同樣也反饋給用戶。

在獲取了用戶的搜索指令之后,本系統對關鍵詞進行同義詞查詢,使用戶搜索內容得到一定擴充。同義詞部分在Lucene4.6中通過SynonymFilterFactory實現查詢。

Lucene是Apache軟件基金會Jakarta項目組的一個子項目,是一個開放源代碼的全文搜索引擎工具包,但它不是一個完整的全文搜索引擎,而是一個全文搜索引擎架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。

本系統首先通過新建Hashmap儲存相關版本信息和同義詞詞典信息,并載入相關內容。而后將已提取到的多個關鍵詞進行stream化以供索引。最后借助SynonymFilterFactory類,根據同義詞詞庫,以自然語言中的意群作為標準,實現同義詞查詢。

五、總結與展望

本系統從用戶的角度出發,發現了現代信息社會特定群體獲取信息時存在的一些弊端,并根據這些弊端提出了一種更優的實現方法,該方法不同于當今較通用的智能匹配,同時兼顧了用戶群體和自然語言特征兩個方面,將用戶需求進一步細分,仿真方法證明了該方法在數據量很大的情況下依然有效。

參考文獻

[1](美)西爾伯沙茨(Silberschatz.A.)等著.數據庫系統概念:Database System Concepts[M].楊冬青,李紅燕,唐世渭等譯.原書第六版.北京:機械工業出版社,2012年:41-42.

[2]李剛.瘋狂Java講義(精粹)[M].第二版.北京:電子工業出版社,2014,236-242.

猜你喜歡
信息檢索智能化校園
智能化戰爭多維透視
軍事文摘(2022年19期)2022-10-18 02:41:14
印刷智能化,下一站……
印刷工業(2020年4期)2020-10-27 02:45:52
基于“物聯網+”的智能化站所初探
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經網絡的個性化信息檢索模型研究
開心校園
石油石化演進智能化
能源(2015年8期)2015-05-26 09:15:56
爆笑校園
主站蜘蛛池模板: 国产美女在线观看| 国产真实乱人视频| 国产视频大全| 国产屁屁影院| 精品欧美日韩国产日漫一区不卡| 国产网站在线看| 91免费精品国偷自产在线在线| 色妺妺在线视频喷水| 欧美啪啪网| 999国产精品| 欧美一级99在线观看国产| 日本AⅤ精品一区二区三区日| 2024av在线无码中文最新| 国产精品私拍99pans大尺度| 久青草国产高清在线视频| 九色国产在线| 97影院午夜在线观看视频| 欧美怡红院视频一区二区三区| 欧美日韩专区| 在线视频亚洲色图| 免费一级毛片在线观看| 久久综合亚洲色一区二区三区| 欧美第一页在线| 扒开粉嫩的小缝隙喷白浆视频| 欧美中日韩在线| 亚洲一区二区日韩欧美gif| 日韩AV无码免费一二三区| 中字无码av在线电影| 无码电影在线观看| 黄色网站在线观看无码| 欧美日韩中文字幕二区三区| 国产爽歪歪免费视频在线观看 | 国产成人在线无码免费视频| 黄色福利在线| 日本久久网站| 手机在线国产精品| 波多野结衣一区二区三视频| 国产免费观看av大片的网站| 日韩小视频在线观看| 日本一区二区三区精品视频| 欧美无遮挡国产欧美另类| 中文字幕久久亚洲一区| 国产午夜福利亚洲第一| 日本欧美成人免费| 亚洲手机在线| 国产微拍一区二区三区四区| 国产小视频在线高清播放| 四虎永久免费地址| 国产一区成人| 九色在线观看视频| 97视频免费在线观看| 9久久伊人精品综合| 妇女自拍偷自拍亚洲精品| 婷婷五月在线| 国产交换配偶在线视频| 成人在线不卡视频| 中文国产成人久久精品小说| 日本精品影院| 国产成人亚洲无码淙合青草| 亚洲精品中文字幕无乱码| 亚洲欧美不卡| 999在线免费视频| 国产人前露出系列视频| 精品国产91爱| 国产三级国产精品国产普男人 | 久久99精品国产麻豆宅宅| 91蝌蚪视频在线观看| 亚洲A∨无码精品午夜在线观看| 2021国产精品自拍| 成人综合久久综合| 国产杨幂丝袜av在线播放| 欧美亚洲一区二区三区导航| 免费观看三级毛片| 国产精品白浆在线播放| 欧美一区二区三区不卡免费| 欧美日韩精品在线播放| 国产综合精品日本亚洲777| 久久不卡国产精品无码| 毛片网站在线看| 色老二精品视频在线观看| 免费在线不卡视频| 九色综合视频网|