999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的干部人事檔案知識化服務研究

2021-12-03 11:27:17周娟娟李澤鋒劉竟一
檔案管理 2021年6期

周娟娟 李澤鋒 劉竟一

摘 ?要:本文提出運用語義分析、知識圖譜等新技術(shù),增強數(shù)據(jù)關(guān)聯(lián),提高干部人事檔案服務質(zhì)量,以促進干部人事檔案知識化服務研究發(fā)展。以構(gòu)建符合干部人事檔案特征的知識圖譜來精準識別干部,為領(lǐng)導班子配備和選用提供科學依據(jù)。

關(guān)鍵詞:干部人事檔案;知識圖譜;語義分析;知識關(guān)聯(lián);知識服務

Abstract: Proposed the use of new technologies such as semantic analysis and knowledge graphs to enhance data association and improve cadres the service quality of personnel archive to promote the research and development of cadre personnel archive knowledge service. Construct a knowledge map that meets the characteristics of cadre personnel files, accurately identify cadres as a prerequisite for motivating and selecting cadres, and at the same time provide a scientific basis for the deployment and selection of the leadership team.

Keywords: Cadre personnel archives; Knowledge graph; Semantic analysis; Knowledge association; Knowledge service

1 整體概況

知識圖譜構(gòu)建總體可分為模式層和數(shù)據(jù)層,模式層構(gòu)建是定義干部檔案知識圖譜所包含的實體類型及類的屬性、實體類之間的語義關(guān)系等。然后,數(shù)據(jù)層是根據(jù)構(gòu)建的干部檔案知識圖譜模式,匹配檔案特征數(shù)據(jù),用語義技術(shù)進行命名實體識別和語義關(guān)系抽取;通過實體消歧、實體篩選等過程進行知識融合,最后根據(jù)干部檔案構(gòu)建知識圖譜情況選取合適的知識儲存方式,完成對知識的管理和檢索。

2 數(shù)據(jù)獲取

干部人事檔案數(shù)據(jù)獲取的主要來源,一類是紙質(zhì)檔案數(shù)字化加工后的數(shù)據(jù);另一類是干部學習經(jīng)歷、工作中直接產(chǎn)生的反映個人能力或經(jīng)歷等的電子數(shù)據(jù)。

本文將干部個人檔案基本元數(shù)據(jù)劃分為三大模塊,其中包括人員元數(shù)據(jù)、來源元數(shù)據(jù)和支持類信息元數(shù)據(jù)。人員履歷中涉及的主要元數(shù)據(jù)要素有姓名、出生年月、政治面貌、最高學歷、學位、職務、職位、個人成果及參與活動情況等信息,作為反映干部個人工作經(jīng)歷和生活以及家庭關(guān)系等重要元數(shù)據(jù)集。

3 知識獲取

本文將采用基于規(guī)則的檔案實體識別方法[1]和實體詞性關(guān)系抽取法。從干部人事檔案的內(nèi)容信息中抽取實體、關(guān)系和屬性,進行語義揭示和知識組織,為干部選拔、提拔工作提供決策服務,增強系統(tǒng)功能同時拓展瀏覽的檢索方式。做出以下方法實體抽取與關(guān)系關(guān)聯(lián),搭建干部人事檔案知識圖譜。[2]

3.1 實體識別。在進行關(guān)系抽取之前,將命名實體抽象成命名實體的詞性,用實體的詞性來替代實體本身。將數(shù)據(jù)進行詞性替換預處理之后,再用深度學習方法對關(guān)系屬性特征進行學習,最后完成實體關(guān)系的抽取。兩種方法的結(jié)合,將自動化構(gòu)建模板,同時加強人工審核,作為補充模板可用性。抽取實體構(gòu)成可按主題類型進行劃分,采取與干部人事檔案分類標準相趨同的元數(shù)據(jù)集方案,分為履歷材料、自傳材料、考核材料、學歷學位材料、政審材料、黨團材料、獎懲材料和工資材料等十大類進行實體與詞性標注。

本文重點以第一大類履歷材料為例進行知識圖譜構(gòu)建,借助某中層干部履歷材料中出現(xiàn)的信息,包括年度、獎項和主題等內(nèi)容。某干部某年、某年N次入選為某市優(yōu)秀教師,某年入選某市“培養(yǎng)跨世紀理論人才百人工程”,某年入選教育部“跨世紀優(yōu)秀人才培養(yǎng)計劃”,某年獲某院頒發(fā)的政府特殊津貼。經(jīng)過統(tǒng)計按照“×年”“入選”“×××”順序模式進行編排。

按詞性劃分,規(guī)定詞性標準。其中,n代表名詞,c代表連詞,v代表動詞,a代表形容詞,tn代表時間名詞等。因此,為<時間名詞-行為動詞-專有名詞>結(jié)構(gòu),分別用<-tn>、<-v>、<-zn>等進行表示。以此為標準建立詞性規(guī)則,類推其他類型的何時何地獲得何獎勵、成果和技能等內(nèi)容的實體詞性,抽取實體特征數(shù)據(jù),將實體映射到存放在數(shù)據(jù)庫表字段中,減少實體識別過程效率低下等問題。

3.2 關(guān)系抽取。有了實體詞性,接下來需要基于依存句法分析的檔案關(guān)系抽取。依存句法分析的檔案關(guān)系抽取是通過在語料進行分詞、詞性標注預處理之后提取出語料句法關(guān)系,基于句法關(guān)系對實體之間的關(guān)聯(lián)關(guān)系特征進行學習的過程。句法結(jié)構(gòu)關(guān)系包括核心(KEB)、主謂關(guān)系(SBV)、定語結(jié)構(gòu)(ATT)、動賓關(guān)系(VOB)、并列關(guān)系(COO)等,如表1所示。

經(jīng)過對語料的依存句法分析發(fā)現(xiàn),若沒有并列關(guān)系,則句子應該包含核心(KEB)、主謂關(guān)系(SBV)、動賓關(guān)系(VOB)三種關(guān)系才能有效地進行關(guān)系抽取。

通過將句子的成分映射到知識圖譜三元組中,從而實現(xiàn)關(guān)系的抽取。利用OCR掃描技術(shù)獲得文本內(nèi)容,分析句子成分,如,“某干部 曾任 某大學 副校長一職”例子中,屬于“某干部”(人員實體)和“職位”(職位實體)之間的關(guān)系。

句子“某干部 曾任 某大學 副校長”,名詞短語識別結(jié)果為“某大學 副校長”,句子結(jié)構(gòu)類型屬于〈主語,核心動詞,賓語名詞短語+賓語名詞〉,語義依存關(guān)系如圖1所示,抽取的關(guān)系為〈某干部,(曾)任,[某大學]副校長〉。

在圖1中,帶有方向的弧線代表依賴順序,表示箭頭終點詞語依賴箭頭起點詞語;弧線上的標簽文字代表依賴類型,矩形塊表示變化識別的結(jié)果。依存句法分析的結(jié)果中指明了每一個詞組的依存類型與其前序依存對象,可以從這些分析結(jié)果中提取出實體關(guān)系的特征數(shù)據(jù)。

通過識別數(shù)據(jù)預處理示例可以看出,原文經(jīng)過預處理手段進行分詞和詞性標注的格式,對該部分內(nèi)容進行實體識別。在干部人事檔案十大類別中,尤其是第一大類履歷類,包含了干部個人基本信息、工作經(jīng)驗以及獲得成果和家庭情況等重要內(nèi)容信息,按照實體抽取規(guī)則和模板進行關(guān)系識別抽取,為本體構(gòu)建與知識表示打基礎(chǔ),盡可能地描述實體與實體之間關(guān)系,最后進行知識融合和消歧,構(gòu)建知識圖譜,更清晰形象地呈現(xiàn)干部履歷材料的特征信息,為干部提拔和審核提供參考建議。

3.3 屬性抽取。屬性抽取一般是較為基礎(chǔ)的屬性信息,根據(jù)對履歷類實際數(shù)據(jù)需求,從各類型元數(shù)據(jù)集類型中,抽取用戶所需要的信息,如“何時”即什么時間點,“何地”即發(fā)生在什么地點,“事件”即發(fā)生了什么事兒,“獎勵”即什么獎勵類型。如,市級、省級或國家級類型的科技類、教育類等情況。通過屬性抽取可以更準確地對抽取實體進行揭示。

干部人事檔案知識圖譜中實體屬性抽取,總的來說,可分為兩種,其中,第一種是實體所對應的概念所具有的屬性,只需要抽取其屬性值即可;第二種是沒有所屬的屬性,完全依賴實體屬性抽取,需要抽取其屬性和屬性值。針對第一種情況,模式層中的關(guān)系也是包括對屬性間屬性關(guān)系抽取,即屬性與屬性值范圍的界定等信息;因此,在數(shù)據(jù)層中可以復用模式層部分數(shù)據(jù)概念與值域。

4 知識圖譜構(gòu)建

4.1 構(gòu)建流程。RDFS 在 RDF 的基礎(chǔ)上定義了一些功能標簽,增加 RDF 的語義約束,提高語義信息能力。構(gòu)建檔案學領(lǐng)域本體,[3]為不同知識庫與系統(tǒng)之間的數(shù)據(jù)與知識利用提供接口,增加知識的復用。

將不同結(jié)構(gòu)的檔案數(shù)據(jù)劃分為類XML、表單、文檔和術(shù)語的語義轉(zhuǎn)換,[4]檔案數(shù)據(jù)關(guān)聯(lián)有助于彌補傳統(tǒng)知識組織方式的不足,通過語義匹配和本體構(gòu)建,可以將檔案轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù),整體構(gòu)建流程如圖2所示。

4.2 知識關(guān)聯(lián)。選用某干部的個人履歷材料,由于干部檔案性質(zhì)的特殊,僅作為研究一個切入點進行探究。將抽取實體的關(guān)系進行梳理,整體關(guān)系描述如表2所示,包含某干部個人基本信息和工作信息以及成果等方面的數(shù)據(jù)。

分別為工作單位、性別、年齡、學歷學位、職稱、曾任職務和個人成果等實體之間的關(guān)聯(lián)關(guān)系。進一步加快干部知識圖譜的構(gòu)建,用圖譜形式清晰展現(xiàn)出個人特征信息。

將某干部個人特征信息用知識圖譜形式展現(xiàn),在檔案數(shù)據(jù)化管理中,有助于檔案數(shù)據(jù)之間關(guān)聯(lián)和語義重組等相關(guān)元數(shù)據(jù)管理,作者所屬單位、年齡、性別、工作、學術(shù)成果、獎勵榮譽等數(shù)據(jù),利用規(guī)則和詞性進行關(guān)系分析和抽取,構(gòu)建出“某干部個人履歷知識圖譜圖”,如圖3所示。

由于工作需要和管理模式的轉(zhuǎn)變,促使干部檔案數(shù)據(jù)以一種新的形式呈現(xiàn),即知識的呈現(xiàn)。通過語義關(guān)系揭示事物與實體之間的關(guān)系屬性,最終系統(tǒng)清晰地對檔案數(shù)據(jù)進行呈現(xiàn),更好地輔助決策者的利用。

5 知識融合

知識融合包含模式層和數(shù)據(jù)層,模式層階段構(gòu)建要注意概念、概念上下位和概念屬性的統(tǒng)一,避免屬性概念歧義,保證實體對齊,概念表征同一個真實對象,由此,方便實體包含的信息進行融合和聚類;數(shù)據(jù)層是針對不同來源數(shù)據(jù)進行實體對齊與消歧,出現(xiàn)多個實體表征統(tǒng)一對象,則需這些實體之間構(gòu)建對齊關(guān)系。除不同數(shù)據(jù)源造成的檔案資源中實體間相互沖突或者實體指向不明等問題。不同的數(shù)據(jù)源對所描述的知識方式各不相同,生成知識圖譜元素也不同,描述不一致會致使數(shù)據(jù)冗余,檢索效率降低。因此,有必要將多個不同來源且等價的知識圖譜/本體/屬性等元素進行合并。知識推理主要指對知識進行語義的拓展和一致性的檢驗過程。在構(gòu)建中,按照規(guī)定約束規(guī)則對知識進行拓展,延伸知識意義。然而,拓展出的知識可能會產(chǎn)生與原有知識相矛盾的情況,此時,需要一致性檢驗,利用推理檢驗看是否與知識庫中知識存在矛盾。數(shù)據(jù)語義化表達提供檢索、分類、聚類與智能推薦。經(jīng)過深度語義化的數(shù)據(jù)才可以支持上層語義功能。另外,盡可能地減少人工干預,降低人為因素的控制。在知識庫中,通過知識推理對查詢服務做補足。

參考文獻:

[1]胡夢君.基于規(guī)則的蒙古文人物屬性抽取研究[D].內(nèi)蒙古大學,2018.

[2]劉嶠,李楊,段宏,等.知識圖譜構(gòu)建技術(shù)綜述[J].計算機研究與發(fā)展,2016,53(03):582-600.

[3]王應解,呂元智,聶璐.檔案學領(lǐng)域本體的構(gòu)建初探[J].檔案學研究,2015(06):19-25.

[4]郭學敏,Ryan Shaw.基于關(guān)聯(lián)數(shù)據(jù)的檔案語義轉(zhuǎn)換實踐分析[J].檔案學通訊,2019(05):50-57.

(作者單位:鄭州航空工業(yè)管理學院信息管理學院 來稿日期:2021-07-10)

主站蜘蛛池模板: 欧美精品啪啪| 日韩av电影一区二区三区四区 | 第一区免费在线观看| 亚洲视频一区| 波多野结衣中文字幕一区| 国产亚洲欧美日韩在线观看一区二区| 日韩美毛片| 九九久久精品国产av片囯产区| 亚洲国产日韩一区| 国产在线观看第二页| 久久国产精品电影| 亚洲第一福利视频导航| 香蕉视频在线观看www| 尤物特级无码毛片免费| 国产超碰一区二区三区| 国产精品免费电影| 欧美精品1区2区| AV熟女乱| 91成人在线免费视频| 亚洲乱码精品久久久久..| 日韩av电影一区二区三区四区| 日本一区二区三区精品国产| 在线免费a视频| 亚洲三级a| 91精品小视频| 日本成人不卡视频| 玩两个丰满老熟女久久网| 亚洲最黄视频| 无码 在线 在线| 日韩精品一区二区三区大桥未久| 国产精品55夜色66夜色| 91无码国产视频| 91区国产福利在线观看午夜| 日韩色图区| 亚洲福利视频一区二区| 在线欧美日韩国产| 亚洲天堂久久久| 国产欧美专区在线观看| 色综合综合网| 18禁影院亚洲专区| 亚洲男人的天堂久久香蕉网| 日韩无码白| 欧美一级高清免费a| 欧美 亚洲 日韩 国产| 日韩高清无码免费| 国产噜噜噜| 无码福利视频| 高潮爽到爆的喷水女主播视频| 97超级碰碰碰碰精品| 无码精油按摩潮喷在线播放 | 91人妻日韩人妻无码专区精品| 久久久四虎成人永久免费网站| 久久中文字幕2021精品| 亚洲成人在线免费观看| 97se亚洲综合不卡| 呦系列视频一区二区三区| 国产成人麻豆精品| 五月婷婷丁香综合| 性69交片免费看| 欧美中文字幕在线二区| 99久久精品免费看国产电影| 亚洲精品视频免费| 亚洲色精品国产一区二区三区| 日本成人在线不卡视频| 一本大道AV人久久综合| 中文精品久久久久国产网址| 亚洲美女高潮久久久久久久| 国产日本欧美在线观看| 先锋资源久久| 亚洲第一区欧美国产综合| 亚洲欧美另类专区| 就去吻亚洲精品国产欧美| 欧美成人综合视频| 日韩AV无码免费一二三区| 日韩免费毛片| 免费人成网站在线高清| 一级毛片免费观看不卡视频| 亚洲精品无码日韩国产不卡| 特黄日韩免费一区二区三区| 欧美日本在线播放| 婷婷久久综合九色综合88| 91系列在线观看|