999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

通用企業(yè)文檔管理檢索系統(tǒng)研究

2016-06-30 19:32:45楊柯張道平
關(guān)鍵詞:引擎用戶系統(tǒng)

楊柯 張道平

摘 要:用于溝通和記錄的文檔對(duì)于企業(yè)是非常重要的,但是企業(yè)在進(jìn)行文檔管理的過程中,經(jīng)常會(huì)碰到以下的問題:文檔數(shù)量多管理困難、分布零散查找緩慢、文檔安全無法保障、文檔無法有效協(xié)作共享。如何有效的管理和高效的利用已有的文檔已經(jīng)成為一個(gè)亟待解決的問題。文章動(dòng)手打造一套企業(yè)內(nèi)部的文檔全文檢索系統(tǒng),來解決以上問題。

關(guān)鍵詞:企業(yè)內(nèi)部;全文檢索

中圖分類號(hào):TP315 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8937(2016)15-0078-02

通用企業(yè)文檔管理檢索系統(tǒng)其核心是對(duì)文檔的管理和檢索,將零散大量的文檔像構(gòu)建圖書館一樣分門別類的整合到管理系統(tǒng)中,通過對(duì)文檔建立的索引來快速高效的查找文檔。以此打破傳統(tǒng)文檔在協(xié)作與分享時(shí)存在的壁壘,讓文檔間的溝通和記錄更加自由、實(shí)時(shí)、安全和高效。

1 系統(tǒng)功能描述

文檔的有效管理是實(shí)現(xiàn)文檔高效檢索的前提,一個(gè)功能完善的文檔管理系統(tǒng)在企業(yè)內(nèi)部就相當(dāng)于一個(gè)小型的文檔云服務(wù)。

文檔管理系統(tǒng)的基本功能的就是文檔的存儲(chǔ)、下載和預(yù)覽,企業(yè)內(nèi)部通過文檔管理系統(tǒng)的唯一入口將零散的文檔傳遞到文檔存儲(chǔ)服務(wù)器來存儲(chǔ),在用戶需要時(shí)為用戶提供文檔預(yù)覽和副本的下載功能。

出于安全考慮,在文檔上傳到文檔存儲(chǔ)服務(wù)器時(shí),系統(tǒng)會(huì)對(duì)每個(gè)文檔做MD5的校驗(yàn)并為用戶提供原始校驗(yàn)值以便用戶在下載文檔后確定文檔的完整性。同時(shí)MD5信息也會(huì)用于文檔管理系統(tǒng)判定用戶上傳的文檔在管理系統(tǒng)中是否重復(fù),防止大量存儲(chǔ)重復(fù)的文檔。

在多部門多層級(jí)的企業(yè)內(nèi)部,文檔權(quán)限管理功能確保用戶在使用文檔管理系統(tǒng)時(shí)只能檢索、預(yù)覽和下載與當(dāng)前用戶所具有權(quán)限匹配的文檔,這樣能夠有效保證文檔內(nèi)容的安全,防止機(jī)密信息的泄露。不同角色和用戶也成為了文檔的一個(gè)重要屬性,在檢索過程中能夠根據(jù)不同角色或用戶來篩選文檔。

文檔在不斷的使用過程中會(huì)持續(xù)的進(jìn)行迭代,傳統(tǒng)的文檔版本管理僅僅局限于在文檔內(nèi)容中添加文檔版本管理表來進(jìn)行管理,但文檔前后做出的修改難以詳實(shí)記錄。在通用企業(yè)文檔管理檢索系統(tǒng)中通過對(duì)文檔的版本管理讓文檔的迭代操作更具有實(shí)用性。

那么如何進(jìn)行文檔的檢索呢?文檔屬于非結(jié)構(gòu)化數(shù)據(jù)(全文數(shù)據(jù)),不能像結(jié)構(gòu)化數(shù)據(jù)那樣簡(jiǎn)單的存儲(chǔ)在數(shù)據(jù)庫中進(jìn)行查詢,一般的檢索系統(tǒng)只是根據(jù)文檔的標(biāo)題和一些屬性來搜索與結(jié)果相關(guān)的文檔,而真正高效的檢索文檔就要求不能只根據(jù)文檔標(biāo)題進(jìn)行檢索,而是需要得到文檔的內(nèi)部信息通過全文檢索(Full-text Search)技術(shù)來檢索文檔。

全文檢索是指計(jì)算機(jī)索引程序通過掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一個(gè)索引,指明該詞在文檔中出現(xiàn)的次數(shù)和位置,當(dāng)用戶檢索時(shí),檢索程序就根據(jù)事先建立的索引進(jìn)行查找,并將查找的結(jié)果反饋給用戶的檢索方式。這個(gè)過程類似于通過字典中的檢索字表查字的過程。

通俗的考慮,通過字典的偏旁部首表查找一個(gè)生字總會(huì)比盲目的翻看整本字典要快。

為了更快的實(shí)現(xiàn)文檔檢索系統(tǒng)我們選用成熟的開源全文檢索引擎——Lucene全文檢索引擎。Lucene是Apache軟件基金會(huì)的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,它是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。

也就是說,Lucene只是一個(gè)發(fā)動(dòng)機(jī),而要讓文檔檢索系統(tǒng)“跑起來”還需要我們?yōu)槠浯蛟炱渌考?/p>

在建立索引的過程中首先要將源文檔轉(zhuǎn)換為文本信息,然后對(duì)文本信息進(jìn)行具有語義化的分詞后提供給Lucene存儲(chǔ)為能夠進(jìn)行文本查找的全文檢索庫。

這樣我們?cè)偻ㄟ^Lucene進(jìn)行檢索時(shí),Lucene就能根據(jù)詞出現(xiàn)的頻率以及相關(guān)度來提供給我們與結(jié)果最匹配的文檔信息。這里就不在詳細(xì)描述Lucene檢索信息的原理。

2 系統(tǒng)架構(gòu)設(shè)計(jì)

文檔管理檢索系統(tǒng)的功能設(shè)計(jì)的體現(xiàn),如圖1所示。圖中包含了一些提高用戶體驗(yàn)的模塊,比如文檔評(píng)分、評(píng)論模塊用來收集用戶對(duì)文檔的滿意度,文檔操作日志模塊用于記錄文檔發(fā)生任何變化的相關(guān)信息。

這個(gè)產(chǎn)品架構(gòu)功能簡(jiǎn)潔,業(yè)務(wù)劃分明確,方便后續(xù)的產(chǎn)品迭代。

在系統(tǒng)的架構(gòu)設(shè)計(jì)方面,為達(dá)到用戶靈活多變的檢索需求,系統(tǒng)要充分考慮數(shù)據(jù)的合理組織,各類數(shù)據(jù)方便、有效的輸入,相關(guān)信息的鏈接和處理,檢索功能的設(shè)計(jì),以及信息的提供類型和方式。

我們根據(jù)系統(tǒng)要實(shí)現(xiàn)的功能和最終目標(biāo),設(shè)計(jì)出全文檢索系統(tǒng)結(jié)構(gòu),整個(gè)系統(tǒng)分為五部分:檢索/管理系統(tǒng)、業(yè)務(wù)接口、索引服務(wù)、文檔服務(wù)和文檔預(yù)覽服務(wù)。

在系統(tǒng)設(shè)計(jì)上為了提高系統(tǒng)的可重用性和降低系統(tǒng)耦合度,系統(tǒng)整體采用面向服務(wù)的體系結(jié)構(gòu),完全獨(dú)立的開發(fā)部署文檔服務(wù)接口、索引接口并遵循Restful設(shè)計(jì)原則以便兼容其他系統(tǒng)。如圖2所示。

3 系統(tǒng)展示

前期功能很簡(jiǎn)單,但隨著需求的增加我們可以將文檔服務(wù)打造成一個(gè)獨(dú)立的“文檔云服務(wù)”—能夠?qū)悠髽I(yè)其他系統(tǒng)并提供相應(yīng)的文檔管理服務(wù)。

文檔檢索方面我們需要在系統(tǒng)的使用中不斷優(yōu)化Lucene全文檢索引擎的分詞與檢索功能,增加文檔的相關(guān)屬性以便縮小檢索范圍檢索結(jié)果更精確。如圖3所示。

4 結(jié) 語

本文研究的重點(diǎn)是如何有效的管理和高效的利用已有的文檔,通過構(gòu)建通用企業(yè)文檔管理檢索系統(tǒng)使企業(yè)內(nèi)部成員可以輕松地打破文檔交流的壁壘。在全文檢索技術(shù)的幫助下更加精準(zhǔn)的鎖定所需的文檔讓企業(yè)內(nèi)部的文檔在分享中更具有價(jià)值。

參考文獻(xiàn):

[1] 張儉恭,陳定權(quán).漢字全文檢索系統(tǒng)的關(guān)鍵技術(shù)與實(shí)現(xiàn)[J].現(xiàn)代圖書情 報(bào)技術(shù),2001,(2).

[2] 嚴(yán)威,趙政.開發(fā)中文搜索引擎漢語處理的關(guān)鍵技術(shù)[J].計(jì)算機(jī)工程,

1999,(25).

猜你喜歡
引擎用戶系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
藍(lán)谷: “涉藍(lán)”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
基于Cocos2d引擎的PuzzleGame開發(fā)
主站蜘蛛池模板: 午夜毛片免费观看视频 | 又黄又爽视频好爽视频| 噜噜噜综合亚洲| 色视频国产| 九九这里只有精品视频| 精品欧美日韩国产日漫一区不卡| 国产大片喷水在线在线视频| 日本午夜网站| 国产乱子伦精品视频| 国产免费网址| 中文字幕亚洲乱码熟女1区2区| 亚洲欧洲日韩国产综合在线二区| 亚洲综合第一区| 欧美成人一级| 国产a网站| 激情乱人伦| 欧美国产三级| 无码不卡的中文字幕视频| 国产欧美在线视频免费| 国产一区二区三区精品欧美日韩| 99久久精彩视频| 久久综合五月婷婷| 国产二级毛片| 亚欧乱色视频网站大全| 久久窝窝国产精品午夜看片| 成年片色大黄全免费网站久久| 人人91人人澡人人妻人人爽| 露脸真实国语乱在线观看| 免费全部高H视频无码无遮掩| 午夜久久影院| 美女扒开下面流白浆在线试听| 亚洲综合香蕉| 国产久操视频| 素人激情视频福利| 欧美一级高清片久久99| 亚洲天堂在线免费| 欧美久久网| 农村乱人伦一区二区| 亚洲区第一页| 97色婷婷成人综合在线观看| a欧美在线| 在线观看av永久| 天堂av高清一区二区三区| 久久毛片免费基地| 丁香六月综合网| 国产白浆一区二区三区视频在线| 中文字幕 日韩 欧美| 香蕉在线视频网站| 首页亚洲国产丝袜长腿综合| 91在线激情在线观看| 狠狠操夜夜爽| 伊人激情综合网| 99热这里只有精品久久免费| 国产91色在线| 黄色一级视频欧美| 国产精品尤物在线| 久久先锋资源| 亚洲无码精彩视频在线观看| 中文字幕波多野不卡一区| 午夜国产不卡在线观看视频| 毛片视频网| 亚洲精品国产成人7777| 98精品全国免费观看视频| 美女视频黄频a免费高清不卡| 久久永久免费人妻精品| 欧美午夜在线视频| 欧美有码在线观看| 99视频精品在线观看| 国产在线一区视频| 国产三区二区| 蜜臀AV在线播放| 中文字幕 日韩 欧美| 欧美亚洲欧美| 国产黄色免费看| 在线视频亚洲色图| 欧美日韩一区二区在线播放 | 亚洲69视频| 无套av在线| 99热这里只有精品免费国产| 91视频青青草| 日日拍夜夜嗷嗷叫国产| 啪啪免费视频一区二区|