999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx

一種基于大數據的政務專業人員系統的數據治理研究

2021-03-08 02:05:18
新一代信息技術 2021年15期
關鍵詞:數據處理評價分析

仲 亮

(上海市組織人事信息技術服務中心,上海 200000)

0 引言

隨著目前互聯網技術和大數據技術的飛速發展,數據處理能力也在不斷的提升,同時數據內容的治理工作也顯得越來越重要。對于大城市而言,人員量大且流動性異??焖伲詾榱吮U铣鞘械暮诵膶I人員的全方位管理,需要對專業人員數據進行分析和評估,促進人員資源供需對接與人員資源的高效配置。同時,由于人員數量龐大,人員數據信息量也很大,數據處理也會變得異常復雜,而且處理完的數據還會存在許多問題,就需要不斷改進訓練數據處理模型和加強人工數據處理工作。為了保障城市專業人員的合理規劃,系統通過對各層次人員數據的綜合統籌,實現對人員總體情況、行業分布情況、區域分布情況的動態掌握,結合經濟社會與產業發展有關要求,對人員分布的合理性、人員市場供需、行業人員缺口、區域人員缺口等進行動態分析和預計,更好地促進人員信息交換共享,促進人員資源高效配置。另外,需要對專業人員數據進行及時分析,了解相關專業人員的需求和具體情況,構建一套針對專業人員政策文件知識庫,為人員政策制定發布提供一些建議方案,保障專業人員需求得到及時解決。對于專業人員數據處理,采用神經網絡學習模式,對專業人員數據進行訓練學習,建立相關數據分析標簽庫,并對其進行縱向的時間序列的分析,并建立相關的模型對其進行合理的宏觀分析,幫助更好的進行人員管理和預測。

1 大數據政務專業人員系統總體架構

基于大數據的政務專業人員系統的數據治理在考慮到系統總體需求功能性和后期系統的拓展性、兼容性等方面,系統總體架構主要分為基礎平臺層、數據處理層、服務層和應用層?;A平

臺層主要負責底層硬件資源處理調度,移動網絡收發功能,安全信息加解密模塊、運維保障模塊、數據處理核心模塊等基礎功能模塊。數據處理層主要是分為數據處理和數據分析兩個核心模塊,數據處理主要是負責對數據進行存儲訪問等處理數據功能,數據分析主要是對原數據進行分析處理,并將處理后的數據形成報表和視圖數據。服務層主要是對外輸出數據治理能力服務接口和相關數據信息能力接口,供上層直接進行調用。應用層主要是服務于用戶的交互功能層,主要分為專業人員分類管理,專業人員政策指導,專業人員數據處理,區域專業人員分析,專業人員數據異常處理等等基本的操作。另外,為了更好地指導專業人員政策的制定,系統針對區域中的專業人員會進行宏觀的數據分析能力,對專業人員行業分類、專業人員區域分布、產業分布情況和專業人員團隊分析等方面進行數據分析處理,幫助人員政策實現分層、精準化和個性化,實現人員政策的輔助設計,為專業人員數據分析提供合理化的服務能力。具體專業人員宏觀分析示意圖,如圖1所示。

圖1 專業人員宏觀分析示意圖Fig.1 professional macro analysis

2 大數據政務專業人員系統核心技術

本項目基于大數據的政務專業人員系統,主要對管轄區域中的專業人員進行合理分析和規劃,利用大數據技術對相關專業人員信息進行采集、分析、學習,利用長短記憶神經網絡(LSTM)訓練構建出一套專業人員政策領域相關的知識圖譜,最后還需要對分析得到的數據進行分析治理。

2.1 利用LSTM構建知識圖譜

傳統的神經網絡進行訓練學習,主要流程為輸入層輸入起始學習數據,學習得到的結果作為中間隱藏層的輸入,層層往下,最終通過輸出層輸出學習的最終結果。LSTM 網絡也是基于傳統的神經網絡進行演進而來的,由于傳統的神經網絡采用遞歸進行層層學習時,對于很長的序列,在學習時可能存在梯度消失這種情況,所以為了可以在很長的序列處理中擁有更好的效果,通過增加輸入狀態來優化學習流程。LSTM 網絡內部主要有三個重要流程:(1)選擇忘記流程,即對上層傳入的輸入值,選擇忘記不重要的內容,但是對于重要的內容選擇留下。(2)選擇記憶流程,即對上層傳入的輸入值,對于重要的內容重點進行記憶,對于那些不重要的內容則少記一點。(3)輸出流程,即決定最后選擇哪些內容作為本層的內容向外輸出。LSTM 模型結構圖,如圖2所示。

圖2 LSTM模型結構圖Fig.2 LSTM model structure diagram

2.2 自動化解讀

利用機器學習技術進行非結構化文本識別解析,首先由相關領域內的專業人員對政策文本進行標注,形成原始標注文本,解讀引擎將標注文本解讀成結構化的數據,構建出一套數據樣本庫。機器學習引擎對樣本庫進行學習,訓練成“識別模型”,然后,由識別引擎基于識別模型對政策文本進行自動化識別。在模型訓練和識別引擎識別的過程中,必須有一個“領域知識庫”作為支撐,才能對標準文本進行恰當的解釋。另外為了提高訓練和識別的精度,一方面領域知識庫的知識越豐富、越精確,樣本量越大,識別的精度越高。另一方面保證樣本量充足,識別的精度也會得到提高,一般每一種標注的樣本量要達到 50個以上,才能將識別精度提高到80%以上。識別模型的構造是一個持續的過程,首先是在完全人工標注的條件下進行訓練。當識別模型具備一定識別能力后,就可以啟動機器識別。為了提高識別引擎識別的精度,極大降低識別的歧義,需要保證政策解讀的信息結構都是來自一系列的目標數據庫結構,保證數據來源,最終才能產出根據領域語義構造的一個知識圖譜。非結構化文本識別解析的技術框架圖,如圖3所示。

圖3 非結構化文本識別解析的技術框架圖Fig.3 technical framework diagram of unstructured text recognition and analysis

2.3 數據治理

由于人員信息數據來自不同系統的輸入,會造成數據信息規范不同,以中文名為例,同一個人的英文名可能存在全拼、縮寫,姓全拼名縮寫、姓在前名在后和名在前姓在后等多種情況,這樣在數據處理時,則會增加數據處理難度,提升識別難度,所以如何對采集來的數據進行準確的歸屬,保證這條信息是屬于這個人,另外對于相似信息則歸入人工處理池,等待人工進行處理。數據進行處理時,會給出一個相似閾值,當相似性達到一定閾值的,可以直接歸入同一屬主,相似性介于某一范圍的,歸入“疑似”同一屬主,交給人工做合并處理。同時,對于已經入庫的人員信息,進行相似性評價,疑似同一屬主的信息,進行提示,由人工進行合并處理,新的人員信息進入系統時,要對其進行綜合分析,然后與已有人員信息進行一一比對,形成相似性數據,對于疑似的情況,提示系統維護人員進行處理。另外,將各類數據質量不合格項予以規則化,通過規則執行引擎進行分析判斷后,給出預警信息。在涉及干部人員的數據治理中一般可以分兩個視角開展治理,一種是從干部人員、或者機構的角度出發,逐個處理;另一個是從規則特征的角度出發開展治理。數據治理示意圖,如圖4所示。

圖4 數據治理示意圖Fig.4 schematic diagram of data governance

3 大數據政務專業人員系統具體實踐

為了更好的制定專業人員相關政策,需要系統的了解專業人員的相關信息,對專業人員進行量化評價。目前主流的針對科研人員和專家采用FWCI指數方法進行綜合評價,對于金融、創業等行業也可制定類似于該方法的評價體系。主要由兩個層面制定相關體系內容。第一個層面是先對行業或領域進行劃分,針對每一個領域,研究制定能夠反映人員的知識技能水平、實際貢獻、社會影響力、發展前景等方面的綜合性指標。初期的指標不要求非常嚴格、非常準確,具備一定的區分度即可。要隨著大數據的發展、隨著在人員評價工作中的實際運用,逐步改進,因此重點是指標體系設計要具備“可維護性”,即可以根據反饋情況,便于隨時調整,并能方便地觀察改進效果。第二個層面是對行業或領域的評價指標,進行標準化,或者“歸一化”,實現對整個人員隊伍中的每一個人,都可以采用一個標準進行衡量和評價。這個問題的合理性其實和單個領域內采用單一標準實現人員評價是一個道理。針對不同人員類別提供不同的評價指標體系,類別的設置可以交叉,也可以采用專門專才定制化規則。人員評價體系和評價工具圖,如圖5所示。

圖5 人員評價體系和評價工具圖Fig.5 diagram of personnel evaluation system and evaluation tools

為了精確的對區域內專業人員進行綜合評估,需要對一個歷史的時間跨度內,對各項指標進行全面的、動態的分析,以觀察人員隊伍在各方面的變化情況,預測變化趨勢,對分析結果采用恰當的圖表形式進行體現,以便更加直觀地解釋變化所反映的規律。目的是發現問題,尋找可調控的因素,為針對性提出改進措施,提供決策依據。對于專業人員流動性而言,可以充分利用位置系統的直觀性,比如人員流動情況,既可以反映本市在全國范圍內的流動情況,也可以反映本市范圍內各地區、各行業之間的流動情況。針對專業人員流動性評估結果,制定相關專業人員政策,保證專業人員的留存率。人員流動情況圖,如圖6所示。

圖6 人員流動情況圖Fig.6 diagram of personnel flow

為了保障專業人員數據的精確性,對于大數據分析的數據結果,存在數據源異常和疑似池的數據,都需要人工進行審核,另外對于數據不存在的異常情況則需要后續進行人工補充,確保人員信息完整,便于后續管理。專業人員數據治理示意圖,如圖7所示。

圖7 專業人員數據治理示意圖Fig.7 schematic diagram of professional data governance

4 結論

經過充分的調查和對大量資料的研究,本文分析了大數據政務專業人員系統的研究背景和現狀,介紹了大數據政務專業人員系統的總體框架、關鍵技術、工作原理和設計思路,圍繞著政務專業人員系統的實際需求,完成了政務專業人員系統的實現。文章先對大數據政務專業人員系統的總體架構進行研究,詳細分析總體架構中的層級分布,分析每一層級的作用。接著討論了大數據政務專業人員系統核心技術:LSTM 網絡構建知識圖譜功能,自動化解讀非結構化文本功能,數據治理工作。最后,通過以上對大數據政務專業人員系統的核心架構的了解,分析了構建大數據政務專業人員系統的具體實踐,并且給出了相關的人員評價體系和評價工具的具體實踐思想,人員流動情況動態分析,專業人員數據異常治理具體實踐思路。最后對建設過程中出現的問題進行了總結和改進。

猜你喜歡
數據處理評價分析
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
基于Moodle的學習評價
基于POS AV610與PPP的車輛導航數據處理
保加利亞轉軌20年評價
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
主站蜘蛛池模板: 久久免费成人| 国模粉嫩小泬视频在线观看| 久久精品aⅴ无码中文字幕| 亚洲高清资源| 专干老肥熟女视频网站| 91福利片| 日韩成人在线网站| 少妇极品熟妇人妻专区视频| 欧美啪啪网| 午夜啪啪福利| 国产不卡在线看| 婷婷午夜影院| 久久婷婷综合色一区二区| 国产精品爆乳99久久| 色播五月婷婷| 草逼视频国产| 国产精品女同一区三区五区| 久久精品国产亚洲AV忘忧草18| 久草中文网| 少妇露出福利视频| 熟妇丰满人妻av无码区| 成年看免费观看视频拍拍| 亚洲欧美在线看片AI| 午夜性刺激在线观看免费| 欧美国产日韩在线| 国产无码网站在线观看| 亚洲欧美一区二区三区麻豆| 永久在线精品免费视频观看| 日韩在线2020专区| 999精品色在线观看| 国产成人做受免费视频| 99re这里只有国产中文精品国产精品 | 67194亚洲无码| 国产亚洲视频免费播放| 久久国产成人精品国产成人亚洲| 国产精品丝袜在线| 亚洲日韩精品欧美中文字幕| 中文字幕在线播放不卡| 中文字幕第1页在线播| 国产精品高清国产三级囯产AV| 日韩黄色在线| 国产精品99久久久久久董美香| 精品伊人久久久大香线蕉欧美 | 青青草原国产免费av观看| 91外围女在线观看| 第一页亚洲| 亚洲丝袜第一页| 91美女在线| 欧美激情二区三区| 东京热高清无码精品| 国产自产视频一区二区三区| 99热这里只有精品国产99| 国产网站一区二区三区| 国产精鲁鲁网在线视频| 多人乱p欧美在线观看| 波多野结衣无码视频在线观看| 在线高清亚洲精品二区| 亚洲天堂免费观看| 小说 亚洲 无码 精品| 亚洲成人在线网| 91久久偷偷做嫩草影院免费看 | 久久无码av三级| 青青操视频在线| 国产真实二区一区在线亚洲| 欧美一道本| 午夜无码一区二区三区| 91麻豆精品国产91久久久久| 欧美亚洲第一页| 激情国产精品一区| 浮力影院国产第一页| 亚洲三级影院| 国产成人高清亚洲一区久久| 在线免费不卡视频| 精品综合久久久久久97超人| 性色生活片在线观看| 色香蕉网站| 国产成人av一区二区三区| 就去吻亚洲精品国产欧美| 国产福利观看| 国产在线97| 欲色天天综合网| 朝桐光一区二区|