999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向大數據的規則引擎驅動下信息分類方法

2021-11-17 08:37:22邵英儉
計算機仿真 2021年5期
關鍵詞:引擎規則分類

倪 海,邵英儉

(1. 北華大學大數據與智慧校園管理中心,吉林 吉林 132013;2. 北華大學,吉林 吉林 132013)

1 引言

信息時代快速發展的背景下,互聯網技術也隨之成為獲取大數據信息的重要手段,其從原來單一化趨勢逐漸朝著集成化和大數據化的方向發展[1]。在大數據中,將信息主要分為同步信息和異步信息兩種,在異步信息中,需要將不同時間段的信息進行分類[2-3]。規則引擎是一種高效的決策工具,它能夠從成千上萬異步信息中進行快速、準確的反復判決,并且負責從異步信息的微觀層面上對信息進行邏輯和現實的分離。

文獻[4]提出基于快速隱層優化的大數據分類方法,根據多個隱層網絡同時訓練優化隱層節點個數,采用分布式方法通過計算實現信息分類。該方法穩定性較強,但分類準確度有待提高,并且不能對不同信息類型進行有效劃分。文獻[5]提出基于多智能體策略的數據分類方法,將多智能體技術應用到網絡進化中,根據克隆選擇算法模擬網絡模型,通過增加抗體間的競爭提高網絡分析能力。該方法成本消耗較低,但由于人工神經大數據在整個訓練過程中,速度較慢,容易陷入局部最優的情況,從而嚴重影響了分類準確度和效率。

針對上述方法存在的問題,提出面向大數據的規則引擎驅動下信息分類方法。大數據信息分類問題屬于一個非線性問題,而支持向量機能夠得到大數據信息分類問題的全局最優解,在非線性問題中具有顯著的優勢,目前已經在大數據信息分類方面取到了廣泛地應用。粒子群優化算法是一種全局優化算法,它具有簡單易實現的優點,已經被廣泛的應用到分類識別等領域。根據規則引擎技術,結合支持向量機、粒子群算法與數據概化理論,完成大數據信息分類,并通過仿真驗證了所提方法的有效性。

2 基于規則引擎的大數據信息分類方法

2.1 規則引擎在大數據信息分類中的應用

規則引擎在大數據信息分類處理技術的主要目標是:根據相關的大數據信息,建立相應的分類處理規則,實現大數據信息規則管理流程的自動化[6];應用規則引擎技術,構建信息分類處理技術平臺,使工作人員能夠隨時進行信息規則的制定和管理;充分應用成熟的引擎部件,減少信息處理過程中的編程代碼的使用頻率;在一定程度上減少編程的工作量,提高大數據信息分類的效率。

在規則庫中包含所有針對大數據信息所建立的生成式規則,該規則根據信息所對應的參數進行描述,并且各個參數之間具有一定的邏輯性,以xml的格式進行存儲,其分類處理工作具體流程如下:

1)利用規則引擎中的接口函數,構建規則引擎對象。

2)利用規則定制模塊,將規則集中的大數據信息傳送到規則引擎中。

3)開啟引擎,將信息輸入到支持向量機中,采用粒子群算法選取最優的支持向量機參數。

4)得出信息的分類處理結果,并將其傳入到數據庫中進行保存[7]。

2.2 獲取大數據信息特征

通過對規則引擎下的大數據信息進行分析,構建大數據信息集模型,獲取大數據信息特征,具體過程如下:

為了能夠實現對大數據信息的分類,需要建立大數據信息集模型,以此來得到大數據信息特征。假設,大數據信息序列為s1(t),s2(t),…,sp(t),其能夠對節點能量預測進行基本描述[8],利用下式給出節點能量信息的狀態空間

S={k,n}

(1)

式中,0≤k≤K,0≤n≤N,k,n分別表示節點能量信息的橫縱坐標,根據多路由探測,將大數據信息進行發送,得到大數據局部信息的量化噪聲,其表達式為

mi(k)=S+qi(k)

(2)

式中,qi(k)表示信息量化噪聲。

大數據信息量化噪聲是一種高斯白噪聲,為了方便分析,在設定大數據信息量化的過程中,需要保證沒有外界噪聲的加入。即要將節點信息序列Pn(t)和大數據信息序列Sn(t)相結合進行卷積計算,得到兩者之間的卷積結果,構建大數據信息集模型為

E{w(k)}=Bi(k)×mi(k)

(3)

式中,Bi(k)為卷積計算得到的數值。以式(3)為基礎,得出大數據信息特征表達式

(4)

2.3 異步信息特征分類方法

采用核函數將大數據信息特征原始分類問題轉換到高維空間中,從而進行線性可分問題分析,并建立分類超平面[9]。

假設,用xi∈Rn表示訓練樣本向量,其所對應的期望輸出用yi∈{+1,-1}來表示,l代表訓練樣本的數量,d代表大數據信息的維數。利用下式給出,支持向量機所要解決的原始優化問題

(5)

式中,C表示懲罰因子;ξi表示大數據信息松弛變量。則原始優化問題相應的決策函數為

(6)

采用不同的核函數,可以建立不一樣的支持向量機分類器,現階段經常使用的核函數主要是徑向基函數(RBF),因為其只需要確定一個參數,并且具有和其它函數一樣的全局性能,所以采用RBF作為支持向量機的核函數[10],利用下式給出其表達式

(7)

式中,σ表示核函數寬度參數。

當采用RBF作為支持向量機的核函數時,需要對兩個參數進行優化,這兩個參數分別是xi和xj,xi和xj對支持向量機的分類性能會造成一定的影響。在支持向量機訓練的過程中,對這兩個參數進行合理的選取非常重要,采用粒子群優化算法找出最優的支持向量機參數,以此獲取最佳分類器[11]。

假設,搜索空間是由m個粒子構成的一個粒子種群,每一個單獨的粒子都會被看成是這個D維空間中的一個點。其狀態根據它的更新位置和速度進行描述

(8)

式中,ω表示慣性權重值,其計算公式如式(9)所示。隨著迭代次數的不斷增加,利用式(9)從起始值開始進行線性遞減;c1和c2表示為正整數的學習因子;rand代表處于0到1之間的隨機數。

(9)

采用粒子群算法對支持向量機參數進行優化,具體步驟如下

1)設定支持向量機參數的整個搜索范圍和粒子群種群中所有粒子的搜索范圍和最大速度。

2)初始化粒子群。隨機生成xi和xj這兩個參數,將它們當成種群中每個粒子的起始位置,并隨機設定每個粒子的起始速度。

3)求出各個粒子的適應度,得到每個粒子的全局位置,對該參數進行優化的主要目的是提高對大數據信息分類的正確率,將大數據信息分類正確率作為適應度函數

(10)

式中,yt和y分別表示大數據信息初步分類的樣本數量和總數。

4)根據式(9)得到各個粒子的慣性權重值,并通過式(8)得到所有粒子更新后的速度和位置,獲取全局最優位置。

5)判斷是否滿足最大的迭代次數,當它滿足時,停止搜索;不滿足則轉到(4),繼續搜索[12]。

根據支持向量機參數選取結果實現信息的初步分類。

2.4 信息屬性最優分類

在信息分類的過程中,需要使大數據中的眾多數據以最簡單的形式呈現出其最重要的屬性信息,將其從較低概念層抽象到較高概念層的方法稱之為數據概化理論。通過數據概化理論能夠實現對信息屬性的進一步分類。通常情況下,可以將信息劃分成數據立方體,把屬性不同的信息進行分類是面向屬性歸納中較為重要的手段之一,針對不同的信息屬性,將每個不同的信息分配到任意分類中相對容易,但在實際分類過程中,經常會出現部分信息屬性模糊的問題。對于未知的信息屬性進行分類,可以利用高聚類、低耦合的原理對信息屬性進行最優分類,具體分類過程如下。

信息屬性分類從本質上來說是對多維的信息數據樣本進行分類,將數據樣本值分成k組,將n描述為取出樣本的次數。通過列舉不同劃分結果,選擇出其中特征最為明顯的部分,用來作為判定的分類結果,根據這一原則進行最優分類。

假設有序樣本為X1,X2,X3…,Xi,其中Xi=(X1,X2,X3,Xm),那么假設其中某一類的樣本數據為{Xj,Xj+1,Xi},則該類的平均向量可以表示為

(11)

將數據樣本劃分為q個種類,那么種類劃分的第一個種類就是(Xq1,Xq1+1,Xq2-1),以此類推第二個為{Xq2,Xq2+1,Xq3-1},以此類推,當樣本確定取樣數值后,那么取值向量之間的總距離平方和是一個定值,那么根據上述分析,就可以通過遞推的形式實現對規則引擎驅動下的信息屬性進行分類。

3 實驗與仿真證明

為了驗證所提出面向大數據的規則引擎驅動下信息分類方法的綜合有效性,需要進行實驗。實驗用Matlab軟件進行數據處理,并在NS-2平臺上進行方法模擬。隨機采用基于快速隱層優化的大數據分類方法(方法1)和基于多智能體策略的數據分類方法(方法2)與所提方法進行對比實驗,實驗結果如下所示。

將平均誤分率(%)作為對比指標,對不同方法進行對比,結果如圖1所示。

圖1 不同方法的平均誤分率對比結果

分析圖1可知,樣本量不同的條件下,不同方法平均誤分率都有不同程度的變化。通過圖1進行對比可知,方法1和方法2的平均誤分率較高,而所提方法的平均誤分率低于文獻對比方法,因此證明,所提方法提高了大數據信息分類的準確率。

進行分類耗時(s)對比實驗,實驗結果如圖2所示。

圖2 不同方法分類消耗對比實驗

分析圖2可知,隨著樣本量的不斷增加,不同方法的分類耗時均呈現出持續增長的趨勢。但是所提方法的分類耗時最低,說明所提方法的分類效率最高,可以實現對信息的快速分類,具有一定的實用價值。

進行分類效果對比實驗,本次實驗隨機抽取多個信息數據,將這些信息數據分成3個信息集,分別為信息集1、信息集2和信息集3。其中,信息集1中包含8個信息素、信息集2中包含14個信息素,信息集3中包含10個信息素,分別采用所提方法和方法1、方法2對數據集進行分類實驗,圖3為信息素原始分布狀態,圖4為經過不同方法分類后的分布結果。

圖3 信息素原始分布狀態

圖4 不同方法分類效果對比實驗

分析圖4中的信息劃分結果可知,采用所提方法能夠有效劃分出不同信息集中的信息素,并將它們劃分至各自的數據集中,而方法1和方法2雖然可以將一部分信息進行劃分,但是劃分結果中部分信息素仍然不能劃分至相應的數據集中,說明所提方法能夠有效劃分不同類型的信息,劃分效果較好。

根據上述實驗可以看出所提方法在分類結果準確性、分類效率和分類效果方面均明顯優于方法1和方法2,經過上述分析,可以驗證面向大數據的規則引擎驅動下信息分類方法的有效性,證明其具備極強的信息分類能力。

4 結束語

針對以往大數據信息分類中存在的分類偏差較大、分類效率不高和分類效果不佳的問題,提出一種面向大數據的規則引擎驅動下信息分類方法。該方法通過求解各個粒子的適應度,得到了每個粒子的全局位置,同時,對該參數進行優化提高了對大數據信息分類的準確率。并根據數據概化理論對初步分類結果進行進一步的分類,實現信息屬性的最優分類。實驗結果表明,所提方法平均誤分率較低、分類完成時間較短、能夠將不同類型的信息進行劃分,分類效果較佳。未來階段將針對文章的不足之處加以改正,為異步融合算法的應用與發展提供理論依據和參考。

猜你喜歡
引擎規則分類
撐竿跳規則的制定
數獨的規則和演變
分類算一算
分類討論求坐標
數據分析中的分類討論
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
藍谷: “涉藍”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
教你一招:數的分類
TPP反腐敗規則對我國的啟示
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
主站蜘蛛池模板: 国产一区二区三区免费观看| 国产福利不卡视频| 国产精品99久久久久久董美香| 久久精品嫩草研究院| 久久先锋资源| 玖玖免费视频在线观看| 国产一区二区三区在线无码| 久草网视频在线| 日韩成人免费网站| 国产精品99r8在线观看| 国产极品美女在线| 99视频有精品视频免费观看| 亚洲国内精品自在自线官| 97国产在线播放| 欧美h在线观看| 91在线精品麻豆欧美在线| 一级毛片高清| www成人国产在线观看网站| 国产成人精品一区二区三在线观看| 91视频精品| 91麻豆精品视频| 亚洲欧美日韩久久精品| 2021国产v亚洲v天堂无码| 国产一线在线| 欧美区国产区| 无码中文字幕精品推荐| 国产免费黄| 五月天天天色| 日韩精品无码免费专网站| 内射人妻无码色AV天堂| 亚洲一级毛片在线观| 91av成人日本不卡三区| 毛片三级在线观看| 欧美一级在线| 人人91人人澡人人妻人人爽| 亚洲av无码人妻| 欧美黄网在线| 国产成人综合久久精品下载| 91久久青青草原精品国产| 国产午夜在线观看视频| 思思热精品在线8| 狠狠干综合| 91久久国产成人免费观看| 中文字幕一区二区视频| 午夜免费小视频| 伊人无码视屏| 日韩精品成人在线| 福利在线不卡| 91po国产在线精品免费观看| 精品色综合| 亚洲91精品视频| 国产精品jizz在线观看软件| 午夜精品久久久久久久99热下载 | 中日韩一区二区三区中文免费视频 | 亚洲日本韩在线观看| 中国国语毛片免费观看视频| 在线高清亚洲精品二区| 久久99精品久久久久久不卡| 91午夜福利在线观看| 国产成人免费手机在线观看视频 | 午夜欧美在线| 狠狠色噜噜狠狠狠狠奇米777| 热久久综合这里只有精品电影| 精品福利视频网| 欧美在线伊人| 五月婷婷丁香综合| 国内精品91| 久久黄色视频影| 久久久久人妻一区精品色奶水| 中文字幕亚洲综久久2021| 午夜免费视频网站| 久久精品嫩草研究院| 夜夜高潮夜夜爽国产伦精品| 久久久噜噜噜| 久久久久久午夜精品| 欧美福利在线| 天天综合亚洲| 91在线播放国产| 又爽又大又光又色的午夜视频| 国产视频一区二区在线观看 | 亚洲国产成人综合精品2020| 99在线视频免费观看|