999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的數字圖書資源脫敏訪問系統設計

2021-12-23 12:24:46張小英
微型電腦應用 2021年12期
關鍵詞:資源系統

張小英

(陜西學前師范學院 圖書館,陜西 西安 710100)

0 引言

不斷發展的云計算、大數據以及人工智能技術,使通信領域的數據量呈爆炸式增長,諸如財務報告、戰略文檔等企業類業務敏感數據以及用戶姓名、身份證號等個人隱私數據均存在著較大的安全隱患[1],敏感信息安全問題日益凸顯,數據脫敏技術應運而生。數字圖書資源隨著信息技術的發展而逐漸豐富[2],圖書資源服務日益創新,對于數字圖書資源的共享程度與服務提供,該領域的敏感信息重要性一目了然。

智能化的日益深入使現代生活方式發生了翻天覆地的變化,同時也創新了信息資源等數據的獲取形式,作為計算機科學與人工智能的關鍵領域之一,國內學者將研究發現機器學習[3]在信息管理方面占據著舉足輕重的地位,其不僅賦予圖書情報系統強烈的沖擊感,而且為信息資源的聚類分析提供了技術支撐。同時,國外學者提出了定性和定量條件下的代價敏感近似屬性約簡問題。在此框架下設計了基于刪除和基于添加的代價敏感近似約簡算法[4]。由于傳統脫敏技術缺乏權限判定、敏感信息識別等過程,脫敏效果較差[5-7],因此,本文面向數字圖書資源,提出一種基于機器學習的脫敏訪問系統。在加密脫敏策略中,構建密鑰統一管理平臺,管控脫敏、加密密鑰,提升數據安全性;注冊系統源數據的業務子系統地址與端口號,保證脫敏工作時長。

1 基于機器學習的數字圖書資源脫敏訪問系統

基于機器學習技術與數字圖書資源脫敏訪問系統的應用場景,當用戶利用已有賬號完成系統登錄時,脫敏系統將優先對賬號的全部使用權限展開判定,賦予其對應的使用功能;依據需求采集結構化與非結構化數據資源后,利用脫敏子系統中的相關模塊,完成源數據劃分、預處理、敏感判定、脫敏方式選取;當脫敏任務發生改變,對于開發、檢測、遷移以及存儲等資源主要選取靜態脫敏運行模式,針對全業務統一數據中心等數據分析系統,主要以代理方式執行動態脫敏策略,最終實現數字圖書資源脫敏訪問。若無新的數據資源或者配置需求,則在脫敏訪問系統內存儲脫敏方法與脫敏任務,為后續調用與執行做準備。整體框架如圖1所示。

圖1 數字圖書資源脫敏訪問系統整體框架

1.1 數字圖書資源脫敏子系統

在數據資源脫敏子系統中,采集經過分類與預處理的源數據,展開脫敏判定及對應脫敏策略選取,該子系統的運行流程如圖2所示。

圖2 數字圖書資源脫敏子系統運行流程圖

數字圖書資源脫敏子系統中相關模塊的具體工作內容描述如下。

(1)源數據劃分模塊:為避免大量敏感數據影響識別精度,分別根據不同種數據資源的文件格式,劃分源數據為5種數據類型,分別是文本、圖片、語音、視頻以及結構化數據;或者根據不同的源業務系統,劃分源數據為規劃、建設、維修、運行等非結構化數據[8-9]。針對以上2種源數據分類形式,編寫對應執行代碼。

(2)源數據預處理模塊:通過匹配獲取的數字圖書資源數據特征,識別其中含有的敏感數據。一般情況下,采集到的樣本資源質量較差,故利用預處理模塊中的預處理、迭代聚類以及資源數據泛化3個部分,濾除冗余及無效數據資源,加快后續敏感資源識別與脫敏執行的運行速度。

輸入輸出參數與結構等,設置預處理部分的實例初始化子模塊與標記增加子模塊,實現該部分各項功能。如表1所示。

表1 預處理部分相關信息統計表

關于迭代聚類部分的距離運算子模塊、聚類中心運算子模塊、聚類細化子模塊、聚類結果的整合子模塊及其處理子模塊,與之對應的輸入輸出參數、功能以及數據結構等信息如表2所示。

表2 迭代聚類部分相關信息統計表

針對資源數據泛化部分,利用下表中的信息,完成輸入輸出參數以及數據結構等設置,泛化聚類后的數據標準標識符屬性[10]。如表3所示。

表3 資源數據泛化子模塊相關信息統計表

(3)敏感資源判定模塊:作為資源脫敏的重要前提條件,該模塊將采用不同的敏感特征提取策略,處理對應文件格式數據資源,經分類訓練樣本數據與源數據,構建敏感資源數據庫。具體流程如圖3所示。

圖3 敏感資源判定模塊運行流程圖

(4)相應脫敏方式選取:脫敏方法通常分為RP(Replacement,替換)、EC(Encryption,加密)、MK(Masking,掩蓋)、DL(Deletion,刪除)、CG(Change,轉換)以及SF(Shuffle,混淆)等[11]。將源數據的敏感資源全部替換成偽裝過的數據資源即為替換脫敏方法,偽裝數據資源通常具有不可逆性,確保圖書資源安全;在系統具備解密能力的特定場景中,采取加密脫敏模式[6];若只想公開部分敏感資源數據內容,則由掩蓋脫敏策略實現,該策略通過掩飾符號[12]來遮蓋部分敏感資源內容;刪除脫敏法就是直接把敏感資源刪掉;在確保初始數據相關統計屬性的前提下偽裝指定資源時,利用轉換脫敏法可控調整源數據;為瓦解當前資源與其他資源間的關系,采用混淆脫敏策略,隨機互換敏感資源。

關于加密脫敏模式,需在脫敏訪問系統中添加一個脫敏密鑰管理平臺,如圖4所示。

圖4 脫敏密鑰管理平臺示意圖

管理數字圖書資源的映射、計算、密鑰以及脫敏策略,調度前端訪問代理組件。對訪問網關組件實施串行部署,攔截前端數據與解析申請,識別敏感資源訪問行為,實現數據的加解密。

1.2 數字圖書資源脫敏訪問子系統

根據選取的脫敏方法與相關參數,編寫脫敏代碼,將使用場景作為脫敏策略的實現依據:針對靜態脫敏,通過一系列脫敏流程,在本地緩存脫敏結果,若目標系統對敏感資源有所需,則注冊敏感訪問系統源數據的業務子系統地址與端口號如圖5所示。發送本地存儲的脫敏資源給目標系統;針對動態脫敏,注冊敏感訪問系統源數據的業務子系統地址、端口號以及使用賬號后,傳輸脫敏代碼至代理服務器,經過代理服務器的線上資源脫敏,通過系統處理中心發送脫敏結果給目標系統,為目標系統的圖書資源申請用戶提供使用。數字圖書資源脫敏訪問子系統運行流程如圖6所示。

圖5 注冊敏感訪問系統流程圖

圖6 數字圖書資源脫敏訪問子系統運行流程

2 數字圖書資源脫敏訪問系統模擬

2.1 資源脫敏訪問系統相關配置與脫敏評估指標

本文系統運行環境的軟硬件具體參數如表4所示。

表4 資源脫敏訪問系統軟硬件參數

為驗證系統的脫敏有效性,采用信息熵、資源多樣性以及方差3種指標進行評估,各指標具體描述如下。

(1)

(2)

經過脫敏的熵值變化概率一般會降至1以下。

(2)資源多樣性Diversity指標(Diversity):該指標利用屬性值類型來反映資源內容多樣性。假設結構化數據表T(D)共有C行,資源文件T的第di列屬性值樣本共有ci類,則資源文件T多樣性DiversityT的計算式如式(3)。

(3)

(4)

(3)方差V指標(Variance):該指標主要用于衡量差分隱私脫敏前后的資源有效性損失。假定用戶感興趣屬性為結構化數據表T(D)的前m項,其對應笛卡爾積表達式如式(5)。

Dc=d1*d2*…*dm

(5)

利用下列各項表達式分別界定脫敏前后的笛卡爾積各元素統計計數,為式(6)、式(7)。

H=(h1,h2,h3,…)

(6)

(7)

由式(6)、式(7)推導出下列初始圖書資源方差計算式為式(8)。

(8)

2.2 數字圖書資源脫敏訪問系統功能分析

針對本文系統主要功能模塊展開檢測,整理得到下列系統功能檢測結果統計表如表5所示。

表5 資源脫敏訪問系統功能模塊運行結果統計表

根據資源脫敏訪問系統功能模塊運行結果可知,本文系統的主要功能模塊運行順利,且與預期結果相吻合,說明系統運行環境較為理想,降低了系統對后續敏感資源脫敏階段的干擾,提升了脫敏結果的可靠性。

2.3 數字圖書資源脫敏訪問系統脫敏效果分析

數字圖書的脫敏資源共分為基本個人資料和行為數據兩種,該實驗階段以姓名、職業、工作單位、聯系電話等用戶個人資源的敏感信息為例,分析本文系統脫敏效果。脫敏前后的用戶個人資料統計表,分別如表6、表7所示。

表6 脫敏前用戶個人資料統計表

表7 脫敏后用戶個人資料統計表

本文系統各評價指標隨目標脫敏資源數量的變化情況如圖7所示。

圖7 各評估指標曲線示意圖

結合上列圖表可以看出,由于本文系統利用脫敏子系統中的源數據劃分模塊,劃分了源數據種類,有效抑制了大量敏感數據對識別精度的影響,采用預處理模塊中的預處理、迭代聚類以及資源數據泛化3個部分,濾除了冗余及無效數據資源,使敏感資源識別與脫敏速度得以提升,系統敏感資源判定模塊通過提取資源敏感特征,完成了圖書資源敏感程度的有效判定,經選取的脫敏方式脫敏處理后,大幅優化了信息熵等評估指標,具有顯著的脫敏精度與速率優勢。

3 總結

數字化技術與互聯網技術迅猛發展,數字圖書逐漸普及。其中含有的大量敏感信息不僅隱藏著巨大的商業價值,而且還帶來了嚴峻的數據安全問題,為此,本文以機器學習為技術支持,提出一種數字圖書資源脫敏訪問系統。應依據實際應用中的用戶端訪問并發數,合理添加運行平臺帶寬、運算數據,均衡系統負載;嘗試在系統中引入個性化服務功能,將潛在的興趣圖書資源按期推送至用戶郵箱中,充分利用數字資源,為用戶提供優越的體驗感;為更有效地選取圖書資源、優化系統,需增加管理員聯系方式,大量采集反饋信息。該訪問系統為今后的信息、知識以及情報數據等脫敏訪問策略奠定了夯實的數據基礎與理論依據。

猜你喜歡
資源系統
讓有限的“資源”更有效
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
基礎教育資源展示
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
一樣的資源,不一樣的收獲
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
資源回收
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主站蜘蛛池模板: 久草热视频在线| 婷婷六月天激情| 婷婷午夜天| 福利国产在线| 一级毛片高清| 亚洲综合一区国产精品| 久久一色本道亚洲| 4虎影视国产在线观看精品| 国产精品自在自线免费观看| 国产一区成人| 久久综合色天堂av| 中国特黄美女一级视频| 亚洲中文字幕无码爆乳| 亚洲日韩日本中文在线| 蜜桃视频一区| 久久国产精品国产自线拍| 午夜爽爽视频| 在线观看欧美精品二区| 欧美19综合中文字幕| 久久美女精品| 免费无码AV片在线观看中文| 丰满少妇αⅴ无码区| AV无码一区二区三区四区| 亚洲一区二区约美女探花| 欧美在线精品怡红院 | 亚洲精品视频免费看| 日本道综合一本久久久88| 久久五月视频| 精品乱码久久久久久久| 高清不卡一区二区三区香蕉| 欧美成人在线免费| 欧美午夜在线观看| h网址在线观看| 免费毛片全部不收费的| 亚洲国产成熟视频在线多多| 欧美一区国产| 国产乱子伦精品视频| 欧美有码在线| 国产精品亚洲天堂| 亚洲大学生视频在线播放| 国产精品无码久久久久久| 精品无码一区二区三区电影| 欧美成一级| 在线免费观看AV| 国产精品jizz在线观看软件| 国产靠逼视频| 99精品视频在线观看免费播放| 一级片一区| 一区二区三区精品视频在线观看| 亚洲成年人片| 欧美日韩免费| 精品视频福利| 久久综合亚洲鲁鲁九月天| 日本国产在线| 中文字幕伦视频| 成人免费网站在线观看| 国产精品免费p区| 福利一区三区| 色偷偷一区| 中文字幕欧美日韩高清| 2021精品国产自在现线看| 中国精品自拍| 国产香蕉国产精品偷在线观看| 青青热久免费精品视频6| 喷潮白浆直流在线播放| 午夜福利无码一区二区| 992tv国产人成在线观看| 亚洲午夜国产片在线观看| 亚洲另类国产欧美一区二区| 尤物成AV人片在线观看| 99久久精品美女高潮喷水| 国产高清不卡| 国内精品久久久久久久久久影视| 亚洲av无码人妻| 国产小视频免费| 毛片网站在线播放| 国产精品成人AⅤ在线一二三四| 免费看美女自慰的网站| 亚洲va在线∨a天堂va欧美va| 国产主播一区二区三区| 久久久久免费看成人影片 | 国产国拍精品视频免费看|