999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于半監督學習的物聯網用戶識別模型分析與研究

2020-12-07 08:45:44孫靜馮鋒
物聯網技術 2020年11期
關鍵詞:物聯網

孫靜 馮鋒

摘 要:隨著物聯網技術在多個領域的大規模應用,終端用戶數量呈快速上升趨勢。在享受通信便利的同時,也有個別用戶利用物聯網特性生成大量虛假用戶,不利于行業的健康發展。針對以上現象,文中采用半監督學習的方法,通過研究相關樣本數據的特征,建立用戶識別模型,對異常用戶行為做出及時判斷,幫助相關部門、人員采取相應的措施,避免產生較大的損失,節省了大量人力物力,具有廣泛的應用前景。

關鍵詞:物聯網;用戶識別;半監督學習;識別模型;樸素貝葉斯分類;隨機森林

中圖分類號:TP391文獻標識碼:A文章編號:2095-1302(2020)11-0-03

0 引 言

伴隨著LoRa、NB-IoT、5G等物聯網通信技術的發展,我國物聯網終端用戶猛增。在日益增加的用戶數量中,若出現大量惡意的虛假用戶,則會影響物聯網平臺正常的工作運行。這些虛假用戶占用了大量資源,使物聯網平臺無法充分利用,既影響用戶的自身利益,也不利于物聯網行業的健康發展。

僅憑人力識別、用戶舉報等傳統方法監督用戶行為,具有一定的局限性和缺陷,監督及識別效果并不理想。本文對于物聯網用戶識別模型進行研究,針對不同的識別方法及分類器進行分析,幫助相關人員盡早發現用戶的異常行為,及時采取措施,避免造成更大損失。

1 物聯網平臺概述

物聯網的工作流程為傳感器收集數據,通過網絡連接向云端發送數據,進行數據處理,篩選有用的數據后再向終端用戶傳遞有用信息[1-2]。物聯網平臺主要分為服務管理器和控制中心兩部分,物聯網平臺組成如圖1所示。

物聯網卡和5G技術在未來的物聯網行業擁有絕對的優勢。現階段物聯網卡具有資費便宜、無實名制等特點,依托物聯網應用于智能服務領域,如智能家居、智能穿戴、智慧安防等[3]。在物聯網平臺上,用戶群體被分為不同的身份與類型,為不同的用戶提供不同的平臺數據視圖、權限等。

2 識別模型概述

用戶識別實質上是根據用戶的特征數據對其進行分類的過程,將異常數據與正常數據拆分開來。用戶數據中既有少量的已確定虛假用戶的信息,也有占大部分的正常用戶。基于以上特征,本文建立了基于未標記樣本以及正樣本的半監督學習模型[4-5],用于識別物聯網用戶的類型。

解決這類問題主要有兩種方法。第一種方法是直接在正樣本中進行訓練,訓練出的分類器可以判別測試數據是否屬于訓練樣本類別。但實際情況是,現實數據遠比實驗復雜,且模型只會輸出“是”或“不是”兩種結果,容易出現被認定為“不是”的樣本并不屬于正樣本相對的另一類,出現誤判的情況。

第二種方法是將其分為兩步,將分類與預測分開。第一步是根據已標注的樣本,在大量未標注樣本中通過訓練找出可靠的負樣本集;第二步是通過迭代訓練得到一個分類器進行用戶識別工作。識別模型工作流程如圖2所示。

3 用戶數據處理

在處理關于用戶的原始數據時,首先進行數據核查,通過計算數據的均值、期望值、中位數、方差等了解原始數據的大致分布。根據用戶識別業務的需求遍歷所有重要字段,所需數據字段見表1~表4所列。轉換部分數據類型,便于后續處理,并利用上文得到的統計數據進行空值填充。將處理好的數據進行打標簽操作后隨機排序,分為訓練集和測試集,再將測試集中的一小部分數據分離出可靠的正樣本,用于訓練分類器。

4 模型選擇與搭建

4.1 兩步法

在本文所研究的兩步法模型中,第一步使用的模型為樸素貝葉斯分類器,其優勢在于算法數學模型穩定、學習簡單,分類效果較理想[6-7]。該分類器所需參數很少,對于缺失的數據不太敏感,比較符合實際數據情況,可解釋性強。理論上來說,相較于其他模型,它的誤差率最小。

貝葉斯基本公式為:

假設數據的每個樣本有m維特征向量,描述其m個屬性的值,即A={x1, x2, ..., xm}。數據類別可分為n類,即n={y1, y2, ..., yn}。給定未知樣本集X,使用樸素貝葉斯分類方法將樣本按類別n={y1, y2, ..., yn}分開。

代入貝葉斯理論,可得給定的某用戶A屬于某分類yn的概率為:

對于給定用戶A屬于某一分類yn的概率,可由A在每個給定的分類yn的概率得出,需要計算每個分類用戶A在其中的概率。即

假設集合T為正樣本集合,集合U為未標記樣本集合。模型訓練過程如下:

(1)將集合T、U中的樣本類別標記為1、0;

(2)分別使用數據集T和U進行訓練,得到理想的分類器;

(3)使用上述分類器將未標記樣本進行分類。

第二步使用的模型為隨機森林算法。“森林”由多個決策樹組成,采用隨機有放回的選擇模式訓練數據模型,引入隨機屬性選擇,通過組合模型來提升學習效果[8]。“森林”中的每一棵樹都會根據自己分類選擇進行“投票”,最終的結果是“票數”最多的屬性。其計算公式如下:

式中:H(x)表示隨機森林分類模型最終結果;hi(x)表示每棵決策樹的單獨分類結果;Y表示需要分類的對象。通過投票策略將得票數最多的分類結果進行輸出[9]。

模型搭建需要根據數據進行特征選擇,本文主要針對一周之內的操作行為、流量、短信等信息進行統計。對數據首先進行數據清洗預處理,過濾掉某些異常的數據,并根據后期的需求對關鍵字段進行處理。根據其用戶ID找到對應的

SIM ID,并關聯其操作記錄表、流量表、信息表。物聯網卡的流量監控為重要指標,根據時間記錄對最近七天的短信使用量和數據流量使用量求和。對操作行為表進行預處理,根據操作時間及SIM ID對最近七天的操作次數求和。將七天的數據以第一天為基準進行內關聯,最終得到每一張卡在七天中的操作行為、短信、流量的情況。對于已標注的虛假用戶數據的處理與以上流程一致。

將30%數據作為測試集,70%數據作為訓練集。在訓練集上建立模型,第一步使用樸素貝葉斯模型,第二步使用隨機森林模型。調整模型參數,找到在訓練集上表現結果最優的模型,最后使用測試集進行測試。對預測結果的評判不能只按照傳統的精確率、召回率等,因為除已標記的虛假用戶外,對于未知用戶類型并沒有確切的判斷。這里的判斷標準采用,其中代表樣本為正樣本的概率,r代表召回率,p代表精確率。使用這個公式來判斷分類器的性能。兩步法模型預測結果見表5所列。

4.2 一步法

上文提到的直接法是在正樣本上進行訓練,比較經典的單分類方法為one-class SVM模型。 在識別一個新的“點”(用戶數據)時,若落在該超平面內,說明屬于正樣本集,若不是則屬于其他類,但無法判斷出具體屬于哪一類[10]。one-class SVM模型的訓練樣本只有一類,與二分類問題有一定差別,本文只對物聯網用戶的正樣本數據進行訓練,最終訓練結果中挑出不屬于正常用戶的數據即可。

5 結 語

本文從物聯網角度出發分析了用戶識別模型,根據物聯網的特性使用機器學習方法建立模型,并進行分類操作。通過實驗可以看出一步法的準確率遠低于兩步法。盡管理論上現有模型可以達到較好的效果,但還有繼續改善之處:兩步法分類模型嘗試使用更多不同分算法組合進行訓練,以達到更為精準的結果;對于字段的提取,根據實際情況增加或減少,調整不同特性的權重比例,不斷完善,提高預測準確率。

參考文獻

[1]胡向東.物聯網研究與發展綜述[J].數字通信,2010,37(2):17-21.

[2]李榮.物聯網用戶界面如何工作[J].計算機與網絡,2019,45(12):38-39.

[3]王曉菊,田立勤,趙競雄.基于物聯網的用戶行為認證機制與分析[J].南京理工大學學報,2015,39(1):70-77.

[4]張溶芳,許丹丹,王元光,等.機器學習在物聯網虛假用戶識別中的運用[J].電信科學,2019,35(7):136-144.

[5]譚侃,高旻,李文濤,等.基于雙層采樣主動學習的社交網絡虛假用戶檢測方法[J].自動化學報,2017,43(3):441-460.

[6]張步良.基于分類概率加權的樸素貝葉斯分類方法[J].重慶理工大學學報(自然科學),2012,26(7):81-83.

[7]張璠.多種策略改進樸素貝葉斯分類器[J].微機發展,2005,15(4):35-36.

[8]徐少成,李東喜. 基于隨機森林的加權特征選擇算法[J]. 統計與決策,2018,34(18):25-28.

[9]方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J].統計與信息論壇,2011,26(3):32-38.

[10]丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011,53(1):2-10.

猜你喜歡
物聯網
基于物聯網的無線測溫模塊設計
軟件導刊(2016年9期)2016-11-07 21:56:29
基于物聯網ZigBee技術的智能家居監控系統 
軟件導刊(2016年9期)2016-11-07 21:32:45
物聯網監測技術在G15W112邊坡的應用
基于物聯網的健康管理服務模式
基于物聯網的煤礦智能倉儲與物流運輸管理系統設計與應用
基于高職院校物聯網技術應用人才培養的思考分析
如何在高校架設學生洗衣服務系統
科技視界(2016年22期)2016-10-18 17:23:30
基于無線組網的智慧公交站點信息系統研究與實踐
基于LABVIEW的溫室管理系統的研究與設計
論智能油田的發展趨勢及必要性
主站蜘蛛池模板: 亚洲国产天堂在线观看| 亚洲人成网址| 亚洲欧美另类专区| 色噜噜狠狠色综合网图区| 久久久久亚洲av成人网人人软件| 麻豆精品在线| 精品伊人久久久久7777人| 久久久久人妻一区精品色奶水| 精品人妻一区二区三区蜜桃AⅤ | 免费一级全黄少妇性色生活片| 福利在线不卡| 99久久这里只精品麻豆| 欧美色综合网站| 午夜国产精品视频| 中国成人在线视频| 最新国产你懂的在线网址| 国产麻豆aⅴ精品无码| 中国国产高清免费AV片| 国产又黄又硬又粗| 1769国产精品免费视频| 久久青草免费91线频观看不卡| 伊人久久大香线蕉影院| 波多野结衣中文字幕久久| 欧美A级V片在线观看| 亚洲无码视频喷水| 亚洲a免费| 国产精品一区二区在线播放| 久久黄色视频影| 无码电影在线观看| 国产精品理论片| 97se亚洲综合在线韩国专区福利| 日本久久网站| 日韩色图区| 毛片网站在线播放| 国产乱人伦偷精品视频AAA| 青草午夜精品视频在线观看| 欧美综合区自拍亚洲综合天堂| av大片在线无码免费| 欧美色综合网站| 欧美亚洲第一页| yjizz视频最新网站在线| 午夜啪啪福利| 成人第一页| 夜夜拍夜夜爽| 亚洲国产欧美自拍| 99在线小视频| 久久精品这里只有国产中文精品 | 国产成人无码AV在线播放动漫| 91精品啪在线观看国产91| 国产精品浪潮Av| 一区二区欧美日韩高清免费| 精品国产免费人成在线观看| 欧美a在线看| 人妻中文久热无码丝袜| 欧美国产日韩在线观看| 国产网友愉拍精品| 国产福利在线观看精品| 大香网伊人久久综合网2020| 午夜视频www| av在线手机播放| 亚洲无限乱码| 波多野结衣一区二区三视频 | 久久综合伊人77777| 亚洲精品国偷自产在线91正片| 啊嗯不日本网站| 国内精品九九久久久精品| 国产在线拍偷自揄拍精品| 毛片手机在线看| 狠狠ⅴ日韩v欧美v天堂| 亚洲精品在线影院| 18禁不卡免费网站| 色男人的天堂久久综合| 2021最新国产精品网站| 久久人人97超碰人人澡爱香蕉| 亚洲日韩国产精品综合在线观看| 欧美中文字幕一区二区三区| 亚洲人成影视在线观看| 综合色区亚洲熟妇在线| 欧美日韩国产在线播放| www亚洲天堂| 亚洲乱码视频| 爽爽影院十八禁在线观看|