張夢澤,張一舟,李凱勇
(1.韓國世宗大學,韓國 首爾 05006;2.青海民族大學物理與電子信息工程學院,青海 西寧 810007)
冷鏈物流的大數(shù)據(jù)是建立在物流系統(tǒng)的反饋信息技術上的,這樣能夠更加清楚地看到物流系統(tǒng)所反饋的信息,這樣能很好地監(jiān)控貨物的情況[1]。具體來說,就是在數(shù)據(jù)感知技術和信息反饋技術的基礎上來對大量的數(shù)據(jù)進行整合、挖掘和處理,過濾掉多余的信息,提取有效的信息,并讓這些有效的信息能夠共享,通過網(wǎng)絡來傳輸數(shù)據(jù),并把這些數(shù)據(jù)輸送到監(jiān)控端[2]。在這個過程中產(chǎn)生了重影識別和邊界孤立點等很多沒用的信息,過濾掉這些信息,并對這些信息進行識別,從而讓效率得到提高。這樣就能在大數(shù)據(jù)下形成獨立的領域,來集中數(shù)據(jù),提高挖掘技術,進而提高對數(shù)據(jù)的提取和辨別[3]。
賀琳等人[4]提出了一種新的區(qū)域物流系統(tǒng)空間演化特征信息提取法,對粒子群進行優(yōu)化、重組、更新,來重新構(gòu)建這些特征,通過對類別進行調(diào)整,提取矢量平衡點,來計算物流信息在有限數(shù)據(jù)集方面所形成的擾動矢量,從而形成目標函數(shù),有利于調(diào)整和重構(gòu)物流信息,并對這些物流信息及時提取,這樣所采用的方法能大大地縮短物流信息的提取時間,提高物流的通信效率;王妍等人[5]則提出了基于互信息的實時物流特征提取算法,在對移動網(wǎng)絡的電子商務物流信息進行主成分分析的基礎上來確定好物流信息所蘊含的強度,從而規(guī)定好原則,挖掘出其中的信息,通過主成分分析法來提取網(wǎng)絡物流信息,形成協(xié)方差矩陣,產(chǎn)生信息向量投影,采用對商務物流信息的及時抓取來降低噪聲,減少提取的時間,占用較小的空間,提高物流信息的質(zhì)量。
基于以上背景,本文將CART決策樹應用到了冷鏈物流大數(shù)據(jù)有效信息提取中,從而提高冷鏈物流大數(shù)據(jù)有效信息提取性能。
在冷鏈物流大數(shù)據(jù)上建立了有效信息是采用的非結(jié)構(gòu)化的冷鏈物流數(shù)據(jù)源,這些數(shù)據(jù)也許不完整或有誤,但是對這些數(shù)據(jù)的處理能夠很好地提高數(shù)據(jù)的質(zhì)量[6]。并且因為冷鏈物流大數(shù)據(jù)是離散的空間信息,而且這些信息是孤立的或是噪聲,所以要進行特征降維的方法來設計這些離散點,而對于孤立點的敏感問題,則要用單邊加權(quán)模糊支持向量機的方法,而對數(shù)據(jù)的預處理則是由數(shù)據(jù)的清洗、規(guī)范、集成和變化等過程組成的[7]。假設t0表示冷鏈物流大數(shù)據(jù)的有效信息變量分區(qū)起點,將冷鏈物流大數(shù)據(jù)有效信息通暢分布在第i層中,那么有效信息的返回狀態(tài)表示為
Y=AY+B[f(Y)+u]
(1)
式(1)中,A表示有效信息變量集,B表示無效信息變量,u表示物流需求系數(shù),f(Y)表示物流信息修正函數(shù)。利用CART決策樹對冷鏈物流大數(shù)據(jù)有效信息進行分布式計算,由于CART決策樹具有容錯性,計算過程中經(jīng)常出錯[8],因此,根據(jù)偏度概念對冷鏈物流大數(shù)據(jù)的有效信息進行修正,表示為

(2)


(3)

為了實現(xiàn)冷鏈物流大數(shù)據(jù)有效信息的實時提取,現(xiàn)在冷鏈物流大數(shù)據(jù)庫中挖掘出有效信息,利用冷鏈物流大數(shù)據(jù)有效信息中蘊含的關聯(lián)規(guī)則,挖掘出冷鏈物流大數(shù)據(jù)庫中的有效信息[10]。具體過程如下:
引入蘊含強度挖掘冷鏈物流大數(shù)據(jù)有效信息之間的關聯(lián)度,蘊含強度的表達式為

(4)
其中,η(t,s)表示有效信息在冷鏈物流大數(shù)據(jù)中產(chǎn)生的幾率。當采用蘊含強度度量冷鏈物流大數(shù)據(jù)有效信息的關聯(lián)規(guī)則時,關聯(lián)規(guī)則的度量方式如下
t?s(sup,conf,cov)
(5)
其中,sup表示支持度,conf表示置信度,cov表示覆蓋率。
在關聯(lián)規(guī)則的指引下,蘊含關聯(lián)規(guī)則可以表示為
t?s(η,α)
(6)
其中,η表示蘊含關聯(lián)規(guī)則的蘊含強度,取值范圍在-1到1之間,α表示蘊含強度的閾值。
基于冷鏈物流大數(shù)據(jù)中有效信息節(jié)點的數(shù)目計算,遍歷每一個有效信息,通過挖掘的冷鏈物流大數(shù)據(jù)有效信息,分析了冷鏈物流大數(shù)據(jù)有效信息。
冷鏈物流大數(shù)據(jù)有效信息的提取重點是檢驗有效信息在冷鏈物流大數(shù)據(jù)中出現(xiàn)的概率[11],冷鏈物流大數(shù)據(jù)庫中包含n個有效信息數(shù)據(jù)樣本,X表示有效信息集合,那么冷鏈物流大數(shù)據(jù)有效信息的時間序列為
X={x1,x2,…,xn}?Rs
(7)
其中,xi(i=1,2,…,n)表示冷鏈物流大數(shù)據(jù)有效信息的向量,計算公式為
xi=(xi1,xi2,…,xis)T
(8)
其中,T表示轉(zhuǎn)置向量。令c表示冷鏈物流大數(shù)據(jù)有效信息的時間序列中的分類系數(shù),vij表示冷鏈物流大數(shù)據(jù)i中第j個有效信息矢量,那么冷鏈物流大數(shù)據(jù)有效信息的更新公式為
V={vij∣i=1,2,…,c,j=1,2,…,s}
(9)
采用CART決策樹對冷鏈物流大數(shù)據(jù)有效信息的更新結(jié)果進行調(diào)整[12],實現(xiàn)冷鏈物流大數(shù)據(jù)的有效信息特征矢量重構(gòu),表示為

(10)
利用冷鏈物流大數(shù)據(jù)有效信息的時間序列,計算了冷鏈物流大數(shù)據(jù)有效信息的向量,通過更新和調(diào)整冷鏈物流大數(shù)據(jù)有效信息,重構(gòu)了冷鏈物流大數(shù)據(jù)有效信息的特征矢量。
在重構(gòu)冷鏈物流大數(shù)據(jù)有效信息特征矢量的基礎上,利用CART決策樹計算有效信息的權(quán)值,將有效信息決策樹矢量與均值聚類算法結(jié)合,計算冷鏈物流大數(shù)據(jù)有效信息的擾動矢量,通過構(gòu)建有效信息適應度目標函數(shù),調(diào)整并重構(gòu)有效信息的類別,實現(xiàn)冷鏈物流大數(shù)據(jù)有效信息的提取。
假設X′表示具有均勻便利性的冷鏈物流大數(shù)據(jù)有效信息的特征矢量數(shù)據(jù)集,一個冷鏈物流大數(shù)據(jù)有效信息決策樹由M各單獨的有效信息枝葉組成,那么在最優(yōu)目標策略下,滿足冷鏈物流大數(shù)據(jù)有效信息搜索的有限數(shù)據(jù)集為

(11)


(12)


(13)
根據(jù)上述公式,可以計算冷鏈物流大數(shù)據(jù)有效信息的最優(yōu)解,以及CART決策樹的聚類中心擾動矢量,從而得到冷鏈物流大數(shù)據(jù)有效信息的聚類矩陣,將其表示為

(14)
其中,c表示冷鏈物流大數(shù)據(jù)有效信息的差分步數(shù),uik表示冷鏈物流大數(shù)據(jù)有效信息決策矩陣,為了反映出冷鏈物流大數(shù)據(jù)有效信息在決策分類過程中的變化特性,計算了CART決策樹差分擾動下,冷鏈物流大數(shù)據(jù)有效信息的適應度目標函數(shù),表示為

(15)
其中,m表示冷鏈物流大數(shù)據(jù)有效信息向量的最大值,(dik)2表示冷鏈物流大數(shù)據(jù)有效信息樣本xk與vi之間的歐式距離,計算公式為

(16)
根據(jù)以上過程,可以通過下式計算冷鏈物流大數(shù)據(jù)有效信息在決策過程中的數(shù)據(jù)值大小,計算公式為

(17)
運用CART決策樹的差分擾動,產(chǎn)生一個冷鏈物流大數(shù)據(jù)有效信息的初始隸屬度矩陣,并置于決策樹中,得到冷鏈物流大數(shù)據(jù)有效信息的擾動變量,即
xn,G=xn,G+Δxi
(18)
其中,Δxi表示冷鏈物流大數(shù)據(jù)有效信息的數(shù)量增長,但是冷鏈物流大數(shù)據(jù)有效信息范圍的信息序列會受到有效信息梯度的影響,表示為
xn+1=4xn(1-xn),n=1,2,…,NP
(19)
根據(jù)以上公式的計算過程,可以得出冷鏈物流大數(shù)據(jù)有效信息的決策處于穩(wěn)定狀態(tài),在CART決策樹中加入冷鏈物流大數(shù)據(jù)有效信息的NP各擾動變量的混沌分量,表示為
Δxi=a+(b-a)xn,n=1,2,…,NP
(20)
為了避免冷鏈物流大數(shù)據(jù)有效信息在提取過程中陷入局部最優(yōu)的狀態(tài),Nth表示門限值,計算出冷鏈物流大數(shù)據(jù)有效信息在決策中的多樣性因子,即

(21)
采用CART決策樹采集與處理冷鏈物流大數(shù)據(jù)有效信息,提取出冷鏈物流大數(shù)據(jù)有效信息的第j個樣本值,調(diào)整冷鏈物流大數(shù)據(jù)有效信息的類別

(22)
其中,N表示冷鏈物流大數(shù)據(jù)有效信息數(shù)量,根據(jù)CART決策樹對冷鏈物流大數(shù)據(jù)有效信息進行擾動分解,計算出決策樹中第i′個有效信息的決策中心概率值

(23)
其中,xk表示第k個冷鏈物流大數(shù)據(jù)有效信息的動態(tài)慣性權(quán)重,a表示冷鏈物流大數(shù)據(jù)有效信息決策中心的調(diào)節(jié)參數(shù)。將冷鏈物流大數(shù)據(jù)有效信息的擾動序列添加到CART決策樹中,對冷鏈物流大數(shù)據(jù)有效信息進行第二次重構(gòu),提取出重構(gòu)處理后的冷鏈物流大數(shù)據(jù)有效信息

(24)
綜上所述,采用混沌算法計算了冷鏈物流大數(shù)據(jù)有效信息的決策權(quán)值,引入CART決策樹對冷鏈物流大數(shù)據(jù)有效信息進行調(diào)整和重構(gòu),實現(xiàn)冷鏈物流大數(shù)據(jù)有效信息的提取。
為了驗證基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法的性能,采用仿真軟件進行實驗分析,引入文獻[4]的冷鏈物流大數(shù)據(jù)有效信息提取方法和文獻[5]的冷鏈物流大數(shù)據(jù)有效信息提取方法作為對比對象,測試了冷鏈物流大數(shù)據(jù)有效信息的噪聲含量,結(jié)果如圖1所示。

圖1 冷鏈物流大數(shù)據(jù)有效信息的噪聲含量
從圖1的結(jié)果可以看出,采用基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法,提取到的冷鏈物流大數(shù)據(jù)有效信息是噪聲含量最少的,說明該方法可以有效保證冷鏈物流大數(shù)據(jù)有效信息的質(zhì)量,避免信息出現(xiàn)亂碼和失真的問題,提高了冷鏈物流大數(shù)據(jù)有效信息的提取性能。
為了實現(xiàn)冷鏈物流大數(shù)據(jù)有效信息提取的實時性,實驗測試了冷鏈物流大數(shù)據(jù)有效信息的提取時間,三種方法的冷鏈物流大數(shù)據(jù)有效信息提取時間對比結(jié)果如圖2所示。

圖2 冷鏈物流大數(shù)據(jù)有效信息提取時間對比結(jié)果
從圖2的結(jié)果可以看出,隨著冷鏈物流大數(shù)據(jù)有效信息越來越大,有效信息的提取時間越來越長。基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法所用的時間是最短的,原因是該方法通過引入CART決策樹,降低了冷鏈物流大數(shù)據(jù)有效信息的復雜度;文獻[4]冷鏈物流大數(shù)據(jù)有效信息提取方法的提取時間是最長的,說明基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法可以加快冷鏈物流大數(shù)據(jù)有效信息提取速度,保證了冷鏈物流大數(shù)據(jù)有效信息提取的實時性。
本文提出了基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取,針對傳統(tǒng)信息提取方法存在的不足,對冷鏈物流大數(shù)據(jù)有效信息進行了預處理、分析以及重構(gòu)實現(xiàn)了冷鏈物流大數(shù)據(jù)有效信息的提取,結(jié)果顯示,該提取方法可以保證冷鏈物流大數(shù)據(jù)有效信息提取的實時性,并提高信息質(zhì)量。