999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于公安業(yè)務的全文檢索系統(tǒng)的設(shè)計與實現(xiàn)

2016-03-05 00:37:53郭松青何鵬
無線互聯(lián)科技 2015年20期

郭松青 何鵬

摘要:隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)和通信技術(shù)的發(fā)展和應用,公安信息化也得到了突飛猛進的發(fā)展。近年來,各地公安機關(guān)建設(shè)了大量的服務各警種的信息化系統(tǒng),隨著公安信息化系統(tǒng)的廣泛引用,數(shù)據(jù)量以幾何級開始增長。如何在龐大的數(shù)據(jù)中快速、精確地檢索數(shù)據(jù),已經(jīng)成為公安信息化發(fā)展的重點,建立基于公安業(yè)務的全文檢索系統(tǒng)能夠有效地滿足這個需求。文章首先對全文檢索技術(shù)進行簡要的介紹,對業(yè)務需求進行了深入分析,重點進行了全文檢索系統(tǒng)的數(shù)據(jù)分析和功能模塊設(shè)計。

關(guān)鍵詞:全文檢索;公安信息化;公安業(yè)務

全文檢索是現(xiàn)代信息檢索技術(shù)的一個非常重要的分支,它是處理非結(jié)構(gòu)化數(shù)據(jù)的強大工具,也是搜索引擎的核心技術(shù)之一。全文檢索是以文本數(shù)據(jù)為主要處理對象,根據(jù)數(shù)據(jù)資料的內(nèi)容而不是外在特征實現(xiàn)的信息檢索手段。全文檢索就是指計算機索引程序通過掃描文章中的每一個詞,對每一個詞建立索引,當用戶查詢時,檢索程序就根據(jù)事先建立好的索引進行查找,并將查找的結(jié)果反饋給用戶的檢索方式。這個過程類似于通過字典中的檢索字表查字的過程。

1 關(guān)鍵技術(shù)

建立一個全文檢索系統(tǒng),首先要將源文檔轉(zhuǎn)化為能夠進行文本查找的全文數(shù)據(jù)庫,包括全文的分割處理以及檢索標識的提取,這稱為全文本的前處理工作。眾所周知,英文是以詞為單位的,單詞之間以空格作為自然分界符,而中文是字的序列,詞之間沒有間隔標記,使得詞的界定缺乏自然標準。而“詞”又是自然語言處理的一個基本單位,是最小的能夠獨立活動的有意義的語言成分。顯而易見,自動識別詞的邊界,將書面漢字序列切分成正確的詞串的中文分詞問題無疑是實現(xiàn)中文信息處理的首要問題。

2 全文檢索系統(tǒng)設(shè)計

2.1 業(yè)務需求分析

全文檢索系統(tǒng)依附于具體的公安業(yè)務系統(tǒng),全文檢索數(shù)據(jù)庫與業(yè)務數(shù)據(jù)庫進行數(shù)據(jù)對接,同步更新。

目前來說,系統(tǒng)的索引范圍按照對象的物理分布不同分為2類:第1類是業(yè)務數(shù)據(jù)庫中存在的相關(guān)數(shù)據(jù)記錄內(nèi)容。第2類是系統(tǒng)上傳的各類文檔附件,包括WORD,EXCEL,PDF,TXT等格式的文檔。

全文檢索系統(tǒng)實現(xiàn)對現(xiàn)有業(yè)務要素高效、準確、全面的查詢分析,主要包括幾部分:(1)實現(xiàn)對全部業(yè)務關(guān)注數(shù)據(jù)的文本抽取、信息聚集、主題描述,能通過關(guān)鍵詞檢索到相關(guān)聯(lián)的主題信息。如通過人名可以查詢到與之相關(guān)的人員基礎(chǔ)庫信息、關(guān)聯(lián)的情報信息、關(guān)聯(lián)的人員相關(guān)附件。(2)建立相關(guān)業(yè)務要素主題庫,主題庫包含業(yè)務要素對應的業(yè)務系統(tǒng)內(nèi)部所有關(guān)聯(lián)信息;搭建全文檢索環(huán)境,提供對主題庫的索引建立、排序等。(3)建立合理的結(jié)果排名權(quán)值模型,為用戶提供精準的數(shù)據(jù)探查,提供對業(yè)務系統(tǒng)內(nèi)部所有信息的全文檢索,在業(yè)務系統(tǒng)中快速查找與關(guān)鍵詞相關(guān)信息項。

2.2 數(shù)據(jù)庫設(shè)計

全文檢索數(shù)據(jù)表為Search_Content,主要包括以下幾個字段。

ID:數(shù)據(jù)表的主鍵,唯一標識該實體。

CONTENT:人員或者情報信息的全項信息,包括人員或者情報信息的所有關(guān)聯(lián)信息,以及人員或者情報信息相關(guān)的附件文檔內(nèi)容。

OBJNAME:檢索結(jié)果的分類,包括人員、情報信息、人員附件、情報信息附件等幾項內(nèi)容,對檢索出的結(jié)果進行分類展示。

BASEID:關(guān)聯(lián)的業(yè)務數(shù)據(jù)庫中的人員表、情報信息表的主鍵。

BASETABLE:關(guān)聯(lián)的業(yè)務數(shù)據(jù)庫表名,包括人員表名、情報信息表名、相關(guān)附件文檔表名等。

KEYWORDS:關(guān)鍵字的權(quán)值,為搜索結(jié)果的排名時使用。

3 全文檢索功能的實現(xiàn)

全文檢索系統(tǒng)覆蓋足夠全面的數(shù)據(jù)范圍,提供高效快速的全文、智能檢索和多樣化的查詢和檢索手段,使用戶能快速在海量的匯集數(shù)據(jù)中找到相關(guān)信息,并進行一定的統(tǒng)計、監(jiān)控、分析等應用。

3.1 信息抽取

為實現(xiàn)全文檢索,提高整體的響應速度,系統(tǒng)應采取預先建立全文索引的方式。原則上,數(shù)據(jù)庫表的所有字段都建立索引,做到索引信息與數(shù)據(jù)庫信息完全匹配。系統(tǒng)應具備多數(shù)據(jù)源的混合抽取能力,并能針對各種不同業(yè)務數(shù)據(jù)源進行不同方式的掃描處理。

3.2 精確查詢

采用搜索引擎的架構(gòu),面向數(shù)據(jù)采用預先抽取數(shù)據(jù)建立全文檢索以及字段獨立索引,系統(tǒng)的精確查詢是基于索引的,它繼承了搜索引擎高效、穩(wěn)定性能的同時,用戶的精確查

主站蜘蛛池模板: 香蕉99国内自产自拍视频| 狠狠色婷婷丁香综合久久韩国| 波多野结衣中文字幕一区二区| 亚洲天堂免费在线视频| 日韩美毛片| 国产精品短篇二区| 精品一区二区三区四区五区| 亚洲男女天堂| 亚洲天堂日韩在线| 亚洲自偷自拍另类小说| 国产美女一级毛片| 情侣午夜国产在线一区无码| 欧美日韩中文国产va另类| 日本不卡在线播放| 色综合久久综合网| 成人福利一区二区视频在线| 久久久久88色偷偷| 全裸无码专区| 在线永久免费观看的毛片| 成人午夜天| 综合亚洲网| 欧美成人一级| 久久久久久尹人网香蕉 | 色播五月婷婷| 青青青国产精品国产精品美女| 国产精品一区二区在线播放| 亚洲午夜福利精品无码不卡 | 91久久国产综合精品女同我| 亚洲天堂免费在线视频| 国产精品夜夜嗨视频免费视频 | 大香伊人久久| 国产在线自在拍91精品黑人| 在线不卡免费视频| 国产亚洲男人的天堂在线观看| 美女视频黄频a免费高清不卡| 在线观看国产网址你懂的| 国产精品亚洲片在线va| 高清久久精品亚洲日韩Av| 91黄视频在线观看| 日韩在线1| 久久国产高清视频| 999国内精品久久免费视频| 青青操国产视频| 中文成人在线视频| 丰满的熟女一区二区三区l| 激情爆乳一区二区| 国产一区二区免费播放| 亚洲精品免费网站| 久久精品国产精品青草app| 国产欧美在线观看一区| 亚洲一级毛片在线观| 欧美成人午夜在线全部免费| 成人一区在线| 色亚洲成人| 女人一级毛片| 欧美日韩午夜视频在线观看| 亚洲日韩精品综合在线一区二区 | 国产亚洲精品自在久久不卡| 欧美三级日韩三级| 国产亚洲男人的天堂在线观看| 国产午夜在线观看视频| 爆乳熟妇一区二区三区| 91色在线视频| 狠狠色狠狠色综合久久第一次| 亚洲中文字幕av无码区| 亚洲欧洲综合| 91亚洲视频下载| 看国产毛片| 欧美成人怡春院在线激情| 精品国产Ⅴ无码大片在线观看81| 18禁黄无遮挡网站| 国产人人射| 在线网站18禁| 色噜噜狠狠色综合网图区| 91成人精品视频| 国产高清在线精品一区二区三区| 亚洲国产精品不卡在线| 国产亚洲一区二区三区在线| 色有码无码视频| 中文字幕人妻av一区二区| 久久一日本道色综合久久| 中文字幕自拍偷拍|