999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識庫的企業文檔智能服務模式探究

2021-09-28 11:56:09劉慧琳劉敬儀黃健
北京檔案 2021年9期
關鍵詞:智能技術

劉慧琳 劉敬儀 黃健

摘要:企業文檔資源不斷豐富,對企業檔案部門的工作提出了新的挑戰,然而,目前的傳統文檔利用方式較為簡單,文檔中蘊含的知識資源無法給企業的發展帶來實際效益。基于此,文章提出基于知識庫的企業文檔智能服務模式,通過知識庫實現從文獻傳遞到知識服務的轉型,為企業檔案部門進行知識服務提供幫助。具體步驟包括原始文件到知識單元的轉化、知識單元關聯形成知識圖譜、知識圖譜應用實現知識問答,以及最終不同形式的文檔智能服務。

關鍵詞:智能服務 智能技術 知識服務 知識庫 企業文檔

Abstract: The continuous enrichment of corpo? rate document resources poses new challenges to the work of corporate archives departments. Howev? er, the current use of traditional documents is rela? tively simple, and the knowledge resources con? tained in the documents cannot bring actual benefits to the development of the enterprise. Based on this, the article proposes a knowledge- based enterprise document intelligent service model. Through the knowledge base, the transformation from document delivery to knowledge service is realized, which helps the enterprise archives department to carry out knowledge service.The specific steps include: the conversion of original documents to knowledge units, the association of knowledge units to form a knowledgegraph,theapplicationofknowledge graphs to implement knowledge questions and an? swers, and different forms of document intelligent services.

Keywords: Intelligent service; Intelligent technol? ogy; Knowledge service; Knowledge base; Enterprise document

文檔是企業知識的重要體現,結構化與非結構化的各類企業文檔量不斷攀升,大量的數據給企業文檔管理工作帶來新挑戰,同時技術在企業文檔管理中的運用也帶來了新機遇。傳統的企業文檔服務無法滿足用戶日益增長的知識需求,如何用技術改善文檔利用現狀、滿足用戶知識需求成為企業文檔管理工作的重要問題,知識庫為此提供了解決方案。

知識庫以各類檔案資源為對象,細化文檔粒度,實現知識關聯,進行內容可視化,借助計算機技術完成檔案知識獲取、知識表示及知識應用等實際任務,提供面向用戶的檔案知識服務。檔案部門構建檔案知識庫為檔案用戶提供檔案知識服務不僅有助于深化對檔案信息資源的開發與利用,而且是檔案部門實現自身轉型、獲得社會地位和影響力的必然選擇和趨勢[1]。為了幫助企業檔案部門更好地完成工作發揮作用,文章提出一種基于知識庫的企業文檔智能服務模式。

一、研究內容:企業文檔智能服務

企業文檔是對企業文件、檔案的統稱,它是企業生產、經營活動的真實歷史記錄,凝聚著企業管理、專業研究、業務狀況等各方面的經驗。相較于傳統企業、事業單位中的一般文檔管理,目前中國的核電企業中文檔管理工作的地位更加重要與突出[2],因此選取核電行業部分企業的公司文檔作為樣本進行分析,得出表1所示企業文檔的主要類型。

企業文檔智能服務不僅是企業文檔部門的關注點,也是圖情檔領域學者的研究內容之一。有學者認為知識服務模式是由眾多要素綜合而成的[3];張淑雅、杜恩龍[4]提出知識檢索平臺、知識學習平臺、知識問答平臺以及知識訂閱平臺四種模式的知識服務;鄭慧萍[5]、李超[6]提出參考咨詢服務、網絡型服務、集成化服務、個性化服務以及用戶自助服務的知識服務模式。針對文檔而言,裘麗[7]認為后保管時代的檔案知識服務模式應有用戶自助服務、個性化定制服務以及個人數字檔案館等。關于文檔知識服務的研究,較早見于政府文件,例如,劉宇[8]分別從以政府為主導和以龍頭企業為主導的方向介紹了知識服務的模式;牛力、王為久[9]等提出面向政府決策的檔案知識服務旨在充分發掘出檔案的價值,為政府決策提供全面支持。

信息技術的飛速發展、管理階段的不斷更新、檔案人員的自身訴求[10]為文檔管理與服務模式帶來新的思考與可能。新的技術能夠解析文檔資源中的語義知識并可視化知識之間的關聯關系,打破以往企業文檔服務的粗粒度組織模式,實現以知識為導向的企業文檔智能服務。根據文獻調研和企業生產活動中的實踐,發現信息時代下企業文檔服務的需求表現出多元化與個性化、全面性和有效性等特點,結合需求特點和知識服務的思想,本文認為企業文檔智能服務是以智能技術為中介、企業文檔為基礎,向用戶提供知識的一種高級服務,與單純梳理及論證知識服務的概念不同,本研究重在探討一種以知識庫為核心、依靠智能技術提供知識服務的方式方法。

二、模式框架:以知識庫為核心的企業文檔智能服務

企業文檔智能服務是企業文化適應知識經濟發展的需求而產生的,是企業文化管理和核心技術管理縱深發展的結果,是伴隨著企業對資源認識的不斷深化、智能技術的不斷推廣以及企業自身管理能力的不斷提高而發展起來的。

(一)知識庫:從文獻傳遞到知識服務

傳統的文檔服務常采用文獻傳遞等方式,這種方式以物理文件的粒度為單元進行查找,查詢結果限制在個體文檔層面,只能提供文獻級別的服務,很難反饋資源之間的關聯。然而,用戶真正需求通常是分散在不同文獻中的知識片段,文獻傳遞造成知識孤島等問題,用戶獲取的知識內容不夠深入,文檔蘊含的知識價值發揮不完全。知識庫運用科學的方法對不同來源、不同層次、不同結構、不同內容的知識進行綜合和集成,使單一知識、零散知識、新舊知識、顯性知識和隱性知識經過整合形成新的知識體系。知識庫不再是簡單的文獻存儲數據庫,而是深入文獻內容的知識單元、知識關聯等的集合,是從文獻傳遞到知識服務的重要支撐。信息時代下檔案等文化富集性資源需要進行知識服務的轉型,來更好地勝任輔助決策的智庫角色。以知識庫為核心的新型檔案服務平臺建設與發展比以往任何時刻都更為重要[11],其構建需要以技術、管理和內容為重點支撐,這要求檔案管理主體必須根據信息資源的知識屬性特征[12],應用各種手段對其進行編研。針對企業文檔構建知識庫的實質是對企業文檔知識進行管理,將“文檔庫”提升為“知識庫”,可以從信息集聚地提升為知識集聚地,最終使文檔的內容轉變為一種知識資產,使企業的核心文檔在收集、加工、存儲、傳遞和應用的流轉過程中不斷增值。

(二)模式框架:知識發現、組織、可視與服務

依托知識庫,企業文檔對于計算機不再是一串串沒有意義的字符,而是互聯互通、有重點、可理解的數據網。企業文檔智能服務能夠借助從數字技術到智能技術的一系列技術手段,完成知識發現、知識組織、知識可視、知識服務等工作,實現從物理文件到電子文件,再到知識單元和知識圖譜,最后成為面向用戶的知識問答的系列轉型,具體如圖1所示。

具體而言,諸如文件掃描、構建信息系統等簡單的數字技術在很多大型企業中已經得到非常成熟的應用,在此基礎上加入OCR、NLP、對象檢測、關系抽取等初步智能技術,可以將傳統的物理文件轉化為計算機存儲格式的、能夠直接在數字環境中加工處理的、帶有關鍵詞標識的電子文件,這一過程可以稱之為“知識發現”的過程。知識發現主要是讓計算機發現并存儲文件的關鍵知識,但此時的數據只是被OCR識別的文件,或被NLP標記后的關鍵詞,或被對象檢測出的目標圖片等,這些離散的數據點如何關聯還有待進一步加工,需要借助諸如知識聚合、相似度計算、關聯數據等知識組織方面的智能技術。知識組織后電子文件就不再是離散存儲的一個個單獨文檔,而是相互關聯的知識單元,經過可視化技術可以呈現為知識圖譜或其他形式的圖表。知識圖譜的效果可以為我們提供有益參考,但這種參考更多是數據分析方面,最終還需要轉化為面向用戶的文檔智能服務。文檔智能服務的實現需要考慮不同的應用場景、不同的用戶需求,以及不同的問題種類,面對不同情況有針對性地采取不同的知識服務方式。

技術手段的運用是決定企業文檔智能服務與傳統的參考咨詢服務及信息檢索服務不同的最關鍵要素。在知識發現與知識組織階段,用命名實體識別、人臉識別對文字、圖片進行標注,其速度、準確性、全面性相比過去的人工標注都能獲得提升;用知識圖譜、圖數據庫對數據信息進行存儲和可視,其規范程度、關聯程度等都有一定程度的進步;用更加智能的問答、推薦等方式呈現文檔知識,其友好性、共享性大大加強。

總體而言,從物理文件到電子文件的基礎轉換,再到知識單元和知識圖譜的關鍵過程,最后呈現多樣化的預期效果這一方式方法,共同構成了企業文檔智能服務的核心框架,其中涉及眾多集成在知識庫中的數字技術和智能技術。

三、模式內容:原始文件到知識庫的知識單元

技術環境變遷直接導致了檔案管理對象及其管理空間的變化,有學者[13]認為至少可以分三類技術環境,即傳統的模擬技術環境、基于數字信號的數字技術環境和以數據驅動為核心特征的數據環境(新技術環境),分別簡稱為模擬態、數字態和數據態檔案對象管理空間。新技術環境下,信息的處理由相對冗余和龐雜的文件粒度開始降維到更容易解析和處理的知識單元粒度,越來越多的智能技術廣泛應用到知識服務中并發揮起重要作用來。

(一)企業文檔內容的知識發現

以企業文檔為研究對象的知識發現主要用到的智能技術包括實體識別、對象檢測、關系抽取等。企業文檔中的實體不同于傳統檔案中的命名實體,諸如人名、地名等,對于企業業務而言也非主要數據,而部門、崗位、業務、產品等專有名詞則是企業生產活動中更關心的問題。對象檢測是指利用圖像處理與模式識別等方法,檢測出目標對象并標定其位置。企業的大量知識內容凝聚在各類文檔的圖表中,且圖表在很多情況下比文字更易被用戶關注,因此借助對象檢測的方式把企業文檔中以“.pdf”“.tiff”“.jpg”“.jpeg”等形式存在的圖表知識專門“挖”出來能夠補充和完善企業文檔知識庫。關系抽取是指抽取實體間語義關系的任務,實體間的關系可被形式化描述為關系三元組,從無結構的自然語言文本中抽取出格式統一的關系數據有助于讓計算機快速處理大規模文本數據,提高處理效率。通過抽取實體之間語義關系,建立廣泛的信息關聯,有助于建立領域知識圖譜,通過挖掘和分析語義關系,能夠進一步理解和匹配用戶的查詢意圖,從而為用戶提供更精準的搜索服務。

(二)智能技術推動的知識組織

智能技術推動了以本體、語義網與知識圖譜為代表的新型知識組織方式,這種組織方式以結構化形式將現實世界的事物及關系予以表示并存儲,再通過結合實體識別、關系解析等信息自動理解過程,實現知識關聯推理,預測可能存在的隱性知識或未來趨勢。知識圖譜在本質上就是一種語義網絡(Semantic network)的知識庫,即一種基于圖的數據結構,這種組織方式對于用戶的搜索請求不再局限于傳統的關鍵詞檢索,而是通過分析用戶的查詢意圖對問題進行理解,在知識圖譜上推理、匹配和查詢以獲取更加簡潔而準確的答案。利用語義網和知識圖譜技術可以實現文檔知識的細粒度挖掘,從篇章級文檔數據內容轉變為三元組知識單元級知識內涵,通過各種關聯關系形成企業智慧大腦。

(三)智能化的知識可視及服務

可視化分析是一種高效的數據分析方法,可以清晰直觀、用戶友好地展現文本特征規律,是知識服務當中重要的技術設施之一,基于可視化技術分析文本背后蘊藏的隱性知識,發現個體單元、文獻單元或知識單元之間的相關性,能夠拓寬文本分析的深度和廣度。知識服務順應時代要求向自動化轉變,積極利用機器學習技術可以提高文本分類、實體消歧、關鍵詞標引、主體演化分析、用戶情感分析等各環節的工作效率和質量。早期學者們多采用基于規則的工程化方法,現在多將規則和機器學習結合起來,通過機器學習挖掘海量數據的顯隱性特征,利用專業知識規則改進機器學習模型、輔助數據預處理或后驗矯正。深度學習技術近兩年也取得了巨大的進步,模型的強大特征和語義理解能力為知識服務帶來新的變革與成效,促進了學科知識服務、知識分享與學術交流。

四、模式效用:面向不同需求的文檔智能服務

知識分為隱性知識和顯性知識[14],用戶能夠進行明確提問的屬于顯性知識需求,還有沒有形成具體問題、甚至用戶本身還沒有意識到問題,但存在并且用戶也有偏好去尋求答案的需求屬于隱性知識需求。企業智能文檔服務不僅優化對于顯性知識需求的滿足程度,也能進一步發現和匹配用戶的隱性知識需求,從多方面提升服務質量,改善用戶體驗。

(一)面向顯性知識需求的智能服務

顯性知識需求可以由檢索反饋或智能問答等智能服務方式進行滿足。常用的搜索服務是基于字符匹配,而基于知識庫的高級檢索服務模式是通過對用戶問題的關鍵詞進行選取,將用戶的檢索詞上升到基于實體和關系的檢索上,找到對應實體或概念,利用知識單元之間的概念層次結構展開分析和知識推理的操作,搜索出滿足客戶需求的知識內容。例如,用戶輸入發電機,可以根據系統知識庫中存儲的企業文檔反饋出發電機氫氣冷卻系統、柴油發電機工藝水系統、汽輪發電機等內容,相較傳統的字符匹配,在語義上具有更好的全面性。

此外近年來有很多智能問答式產品的成功引起了大家對于問答技術應用的關注,例如,亞馬遜率先推出智能語音音響,用戶可以在任何空間和時間與智能硬件進行對話,基于底層知識庫回答用戶在開放領域和封閉領域的問題。企業智能問答服務可以借鑒這些已有通用問答系統的技術基礎,再結合企業具體的業務場景,捕捉一些特有的關鍵詞,從而創新文檔知識服務模式,優化企業文檔知識服務內容。

(二)面向隱性知識需求的智能服務

隱性知識需求可以通過個性化服務、專業化定制、智能化導航等智能服務方式進行滿足。個性化服務致力于理解用戶背景和用戶興趣,構建向用戶進行精準推薦所需要的知識庫,幫助其篩選信息、發現可用知識,從而提高用戶從海量信息中獲取有用知識的效率。根據用戶信息可以構建用戶畫像,用戶信息一般包括用戶的基礎信息,如年齡、地域、職業、學歷、偏好等,以及用戶產出的行為數據,如瀏覽、收藏、評論等。抽取這些信息再進行數據融合,可以準確定位用戶特征,發現用戶潛在需求。個性化推薦能加強文檔知識被接受的概率,有利于企業文檔價值的發揮和體現,還可以解決部分用戶沒有表達出來的潛在需求,緩解一些用戶在系統使用上的學習負擔。

專業化定制可以關聯文檔中一些存在隱性關系的知識資源,例如當企業用戶的知識需求不是單份固定的文檔,而是關于業務解決方案、業務活動經驗等相關知識的合集時,借助知識庫可以將知識內容整合分析,有效集成企業文檔中的知識資源,使物理分散的知識內容整合在一起,從而得出戰略性知識。借助知識地圖的直觀呈現,可將企業文檔中蘊含的相關知識資源的分布位置全部呈現,用戶可以快速遍歷相關內容,從一個節點跳轉到另一個節點進行瀏覽和知識獲取,同時獲取多個維度的知識內容。

智能化導航是結合知識庫和用戶畫像動態更新導航系統的知識服務方式。信息時代,數據呈現爆炸式增長的態勢,廣泛的數據來源、多樣的數據形式、高速的數據產生速度在為知識服務提供便利的同時也帶來了新的挑戰,建設能夠支撐大體量信息存儲分析的智能化知識導航系統,對知識資源進行科學合理分類是提供高效知識服務的基礎。搭建可以智能導航的搜索引擎,呈現量身定做的導航欄,可以更好地展示各類特色資源。

五、結語

以基于知識庫的企業文檔智能服務模式研究為目的,本文首先對企業文檔服務的現狀進行了調研,其次借鑒知識庫、知識圖譜方面的理論和模型提出了企業文檔智能服務的核心框架。具體分析模式內容和模式效用后,研究認為基于知識庫從企業原始文件到知識單元、再到知識圖譜、知識問答的組織模式能夠較好地發現和利用企業文檔中蘊含的知識,基于知識圖譜完成的知識問答能夠提高用戶主導和企業文檔持有方主導的不同知識服務效果。整體模式的應用能夠提高企業文檔的管理水平,進一步落實企業文檔工作對智能技術的應用和推廣,推動企業文檔的智能服務進程。

*本文系國家檔案局科技項目“核電文檔AI中臺建設研究”(項目編號:2020-X-044)的研究成果之一。

注釋及參考文獻:

[1]張斌,郝琦,魏扣.基于檔案知識庫的檔案知識服務研究[J].檔案學通訊,2016(3):51-58.

[2]韓季紅.核電文檔管理的地位與特點研究[J].北京檔案,2010(5):33-34.

[3]古志文,陳春,吳新年.支撐企業技術創新的知識服務模式研究:知識服務與信息服務融合發展的視角[J].科技進步與對策,2014,31(7):131-135.

[4]張淑雅,杜恩龍.關于出版企業知識服務模式的思考[J].出版廣角,2017(14):13-15.

[5]鄭慧萍.數字檔案館知識服務模式探究[J].蘭臺內外,2009(2):19.

[6]李超,徐震.檔案知識服務研究[J].山東檔案,2009(1):23-25.

[7]裘麗.后保管時代下構建檔案知識服務模式探索[J].云南檔案,2015(9):52-55.

[8]劉曉妮,劉宇.產業集群內知識服務模式研究[J].情報理論與實踐,2013,36(1):25-28.

[9]牛力,王為久,黃蕊,等.面向政府決策的檔案知識庫構建研究[J].檔案學通訊,2015(4):56-60.

[10]郝琦,魏扣.檔案內容管理及其對現代檔案工作的啟示[J].北京檔案,2016(5):17-20.

[11]牛力,高晨翔,韓小汀.模式與機制:知識工程視點下的檔案知識服務研究[J].檔案學研究,2021(2):96-103.

[12]田兵兵.從知識管理出發創新檔案信息資源管理策略[J].北京檔案,2021(5):36-38.

[13]錢毅.技術變遷環境下檔案對象管理空間演化初探[J].檔案學通訊,2018(2):10-14.

[14] NONAKA I.A Dynamic Theory of Organization? al Knowledge Creation[J]. Organization Science, 1994,5(1):14-37.

作者單位:1.中國人民大學信息資源管理學院2.福建福清核電有限公司信息文檔處

猜你喜歡
智能技術
智能技術在搜索引擎中的應用
智能配網故障快速定位方法研究
一次設備智能化技術在智能變電站的探討
電氣自動化控制中的人工智能技術探究
青春歲月(2016年22期)2016-12-23 16:16:56
智能技術在電子工程自動化控制中的應用
探討智能技術在電力系統自動化中的應用價值
電氣工程及其自動化的智能化技術應用
試論電氣工程自動化中智能技術的應用
可穿戴設備與人的融合
智能技術在電力系統自動化中的應用
企業導報(2015年11期)2015-07-01 08:54:13
主站蜘蛛池模板: 欧美成人一区午夜福利在线| 色香蕉影院| 东京热高清无码精品| 国产h视频在线观看视频| 亚洲中文制服丝袜欧美精品| 一级毛片高清| 午夜视频免费试看| 69综合网| 欧美中文字幕在线视频| 在线观看欧美精品二区| 无码中文字幕精品推荐| 免费高清a毛片| 欧美亚洲欧美| 国产成人亚洲综合A∨在线播放| 激情六月丁香婷婷| 区国产精品搜索视频| 三上悠亚精品二区在线观看| 免费无码AV片在线观看中文| 国产精品青青| 色悠久久综合| 欧美性久久久久| 久久综合丝袜长腿丝袜| 试看120秒男女啪啪免费| 亚洲国产av无码综合原创国产| 久久精品aⅴ无码中文字幕| 一区二区无码在线视频| 国产一区在线视频观看| 青青青视频蜜桃一区二区| 国产午夜精品一区二区三| 国产精品无码翘臀在线看纯欲| 欧美另类图片视频无弹跳第一页| 一边摸一边做爽的视频17国产| 国产99免费视频| 国产va欧美va在线观看| 亚洲综合在线网| 国产视频你懂得| 国产成人AV综合久久| 操操操综合网| 久久久久久久97| 欧美日韩一区二区在线播放| 精品国产美女福到在线不卡f| 亚洲成人免费看| 国产手机在线观看| 亚洲天堂区| 美女一级毛片无遮挡内谢| 在线a视频免费观看| 亚洲国产中文综合专区在| 男女猛烈无遮挡午夜视频| 欧美亚洲国产一区| 九九热这里只有国产精品| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲欧美精品在线| 手机在线国产精品| 美女高潮全身流白浆福利区| 99re在线视频观看| 欧美中文字幕一区| 久久国产精品麻豆系列| 免费观看无遮挡www的小视频| 又爽又大又光又色的午夜视频| yy6080理论大片一级久久| 欧美在线导航| 亚洲男人的天堂久久香蕉网 | 国产成熟女人性满足视频| 国产男人的天堂| 国产小视频a在线观看| 欧美成人怡春院在线激情| 国产一区二区三区免费| 国产欧美日韩va另类在线播放| 欧美狠狠干| 亚洲成人精品| 中文字幕2区| 久久精品人人做人人| 亚洲人成网7777777国产| 黄色在线网| 中文字幕精品一区二区三区视频| 久久国产精品77777| 福利在线不卡一区| 欧美亚洲另类在线观看| 国产视频入口| 国产成人精品优优av| 色婷婷在线影院| 香蕉eeww99国产在线观看|