999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標簽分類的數據協同技術研究

2020-05-09 09:58:01邱瑞汪寧朱振華
科技創新與品牌 2020年2期

邱瑞 汪寧 朱振華

摘 ? 要:通過對標簽體系分類方法和標簽數據共享技術路線的研究,利用基礎屬性、統計分析、模型算法及大數據分析等技術,將描述研究對象的標簽數據進行提取和分類,實現了對標簽資源的分類,建立統一標簽資源目錄體系。在數據協同過程中,系統中心節點獲取各子節點查詢請求,并統一調配計算資源,最后將匯總結果返回到請求方節點,從而實現節點間的標簽數據共享,有效的推動業務數據跨地區、跨部門的共享,促進了業務模型向智能化發展。

關鍵詞:標簽;標簽目錄;數據協同

1 引言

標簽反映人或物的社會屬性、行為屬性等屬性特征。近年來,在公共安全等領域,專家用標簽進行畫像和特征分析,建立相關的應用系統,幫助用戶進行工作模式的改進和工作效率的提高。

在標簽數據分類的過程中,由于不同的分類方式產生的標簽定義也不一致,有可能造成在使用過程中導致數據難以共享、標簽易誤解等問題,造成對研究對象的錯誤預警。

在標簽資源服務系統中,對各子節點間獲取統一標簽資源目錄體系,通過分布式調度架構將查詢請求經中心節點發送至各子節點,中心節點統一協調各子節點的調配資源,將標簽查詢結果匯總后返回到請求方節點,從而實現了不同子節點間的標簽數據共享。

本文將利用屬性標注、模型算法、文本挖掘等技術,研究標簽數據的分類技術,同時研究基于標簽資源目錄的協同共享技術,實現標簽數據的協同共享。

2 標簽治理和分類

2.1 數據治理

標簽數據治理是對匯集的原始數據進行標準化、規范化的處理過程,主要包括數據匯集、數據治理、數據建庫等工作。通過對數據進行一系列的治理,形成結構化、規范化的資源庫,為標簽分類和生產提供數據基礎。

首先,通過數據采集系統采集多源異構數據,如金融數據等相關數據。之后,針對不同的數據采取數據去重、數據融合、字段標準等規范化操作。最后,構建基于標簽領域相關的資源庫,實現對各級業務數據統一規范化的管理,針對各個數據進行主題分類、標準化和規范化存儲。

2.2 數據分類

標簽分類體系的建設過程就是對數據不斷提煉和價值迭代的過程,通過構建標簽分類體系,讓數據價值清晰化、規范化,通過標簽表達數據潛在的意義、滿足當前業務的分析工作。標簽分類主要從屬性抽取、特征提煉、規律刻畫等幾個方面考慮,標簽按照數據生成的維度可以分為屬性標簽、統計標簽和算法標簽。

(1) 屬性標簽包括研究對象的所有原生屬性和派生屬性,主要為人的年齡、性別、學歷、身份信息等基礎屬性信息,基礎屬性的標簽往往和個人信息有關。

(2) 統計標簽是基于過往特定時間段內的行為、日志數據而計算出的描述個體或群體的規律性標簽,這類標簽隨著統計周期而發生變化,更新頻率較大、周期較短、標簽變化性較大。

(3) 算法標簽是根據過去特定段時間的行為狀態,預測事物未發生、或將來即將發生的行為,這種標簽是基于普通標簽、統計標簽數據,通過使用特定算法、挖掘技術計算出來的,給出預測對象的行為相符合的標簽。

3 標簽建設路線

標簽開發流程分為特征提取、標簽加工、標簽管理、標簽應用四大部分。首先,特征提取主要從基礎特征、人員特征、行為特征、社會屬性等維度來提取特征,形成基礎化標簽;在標簽加工過程中,對已經提取的基礎化標簽數據進行規則清洗、加工、建模,再經由對標簽進行ETL開發,從而得到體系化、規范化的標簽,并進入標簽市場,為下一步標簽應用做準備。

我們可以將標簽構建過程分為三個階段。第一階段是基礎標簽的建設,此階段將通過對數據資源按照一定的規則進行加工得到基礎化的標簽,用來刻畫實體的基礎特征,主要由數據治理人員參與并完成。伴隨基礎標簽的體系建立標簽構建將進入第二階段,業務人員根據行業分析經驗將對基礎標簽進行組合,從而得到符合行業的業務標簽。第三階段為數據分析人員對業務標簽進行分析,并經過對事件進行分析、研判、建模,構建符合的算法標簽,以滿足預測預警的需求。經過三大階段對標簽的構建過程,將構建符合行業規范的數據資源目錄體系,從而實現對標簽數據的分類。

4 數據協同技術的研究

標簽資源服務系統面向各級子節點開放,建設了標準化、規范化的標簽資源服務目錄,實現標簽統一發布、各級子節點共享,能夠有效支撐各級子節點業務需求,為用戶提供便捷的操作方式,減少標簽生成復雜過程。

文中數據協同技術采用的是“一主多從”架構。中心節點為主節點,統一對資源目錄進行建設、上線、下線等管理操作。各級子節點為平級子節點,共享中心節點所發布的資源目錄。各級子節點通過“申請審批”等流程,當子節點A啟動節點間標簽組合查詢時,即開始占用其請求的子節點的標簽資源,中心節點統一調配資源并在中心節點進行計算,將標簽組合查詢結果匯總后返到查詢子節點A,減少了資源的浪費,同時實現了節點間的標簽數據協同共享。

5 結束語

本文研究實現了標簽治理、分類目的,解決了如何從海量數據中發現各種數據關系與關聯規則,挖掘數據的價值問題,形成了語義化的描述。建立統一標簽資源目錄體系,通過分布式調度系統將查詢請求發送至各子節點,最后中心節點將匯總結果返回到請求方節點,從而實現了不同節點間的標簽數據共享。下一步將繼續優化算法模型,在預測類標簽生成的準確性方面進行重點研究。

參考文獻

[1]張大偉. 公安數據標簽化建設應用研究[J].警察技術,2017,(6):37-41.

[2]席巖, 張乃光, 王磊, et al. 基于大數據的用戶畫像方法研究綜述[J]. 廣播電視信息, 2017(10):39-43.

[3]王慶, 趙發珍. 基于"用戶畫像"的圖書館資源推薦模式設計與分析[J]. 現代情報, 2018(3):105-109,137

[4]丁偉,王題,劉新海等.基于大數據技術的手機用戶畫像與征信研究[J].郵電設計技術,2016(3):64-69.

責編/李曼

主站蜘蛛池模板: 国产在线观看第二页| 一本一本大道香蕉久在线播放| 欧美曰批视频免费播放免费| 97视频在线精品国自产拍| 国产福利微拍精品一区二区| 日本高清在线看免费观看| 日本免费新一区视频| 国产亚洲男人的天堂在线观看 | 成年人国产视频| 超碰免费91| 中文字幕免费视频| 国产啪在线91| 久热中文字幕在线| 中文字幕 日韩 欧美| 91欧美在线| 成人午夜精品一级毛片| 亚洲不卡无码av中文字幕| 亚洲日本韩在线观看| 青草91视频免费观看| 极品性荡少妇一区二区色欲| 日韩精品资源| 欧美成人a∨视频免费观看| 国产精品夜夜嗨视频免费视频| 亚洲精品不卡午夜精品| 成人中文字幕在线| 久久久久久久久久国产精品| 亚洲中文在线看视频一区| 国产福利小视频在线播放观看| 久久青青草原亚洲av无码| 尤物特级无码毛片免费| 亚洲中文字幕av无码区| 在线观看国产网址你懂的| 亚洲精品无码av中文字幕| 国产欧美日韩在线一区| 亚洲人成日本在线观看| 一级毛片网| 亚洲精品男人天堂| 一级香蕉人体视频| 国产免费羞羞视频| 成人在线亚洲| 成人午夜视频网站| 亚洲无码精品在线播放| 成年女人a毛片免费视频| 青青青国产精品国产精品美女| 国产高清免费午夜在线视频| 欧美亚洲综合免费精品高清在线观看 | 日韩精品视频久久| 欧美日本在线| www精品久久| 毛片免费在线视频| 午夜福利视频一区| 国产精品自在在线午夜区app| 亚洲不卡网| 久久久久88色偷偷| 毛片久久久| 中美日韩在线网免费毛片视频| 国产亚洲精品无码专| 亚洲美女视频一区| 国产69精品久久久久孕妇大杂乱| 日韩国产精品无码一区二区三区| 日韩精品成人网页视频在线| 欧美色图久久| 日韩精品亚洲一区中文字幕| 日韩人妻精品一区| 色偷偷男人的天堂亚洲av| 精品丝袜美腿国产一区| 欧美日韩成人在线观看| 亚洲免费成人网| 国产青榴视频| 九九久久99精品| 国产剧情伊人| 91小视频在线播放| 久久午夜夜伦鲁鲁片无码免费| 99久久亚洲综合精品TS| 日本午夜精品一本在线观看| 一本久道热中字伊人| 在线观看国产精美视频| h网址在线观看| 国产日韩欧美成人| 99伊人精品| 国产一区二区色淫影院| 欧美一级视频免费|