牛保超,王志剛,王憲臻,郭琦,公衍宇
(河北工業(yè)大學(xué) 信息工程學(xué)院,天津 300400)
隨著數(shù)字信息技術(shù)的飛速發(fā)展,針對(duì)各種傳感器數(shù)據(jù)的實(shí)時(shí)采集和處理在現(xiàn)代工業(yè)控制和科學(xué)研究中成為必不可少的部分。因此,不同數(shù)據(jù)采集手段的有效實(shí)施已成為測(cè)控設(shè)備可靠性和安全性的重要保障。在實(shí)際應(yīng)用中,一般采用固定周期的數(shù)據(jù)采集算法,根據(jù)預(yù)先設(shè)定的采集速率,周期性地采集性能數(shù)據(jù)。但是隨著技術(shù)的日益成熟、應(yīng)用領(lǐng)域的越加廣泛,為了控制實(shí)時(shí)性和精確性,實(shí)時(shí)測(cè)控領(lǐng)域?qū)?shù)據(jù)采集的頻率和精度需求越來越高。采樣頻率的升高導(dǎo)致系統(tǒng)負(fù)擔(dān)加重,處理能力大幅降低,并且大量的數(shù)據(jù)對(duì)存儲(chǔ)設(shè)備也提出了嚴(yán)峻的考驗(yàn)。因而,如何平衡數(shù)據(jù)數(shù)量、提高數(shù)據(jù)質(zhì)量成了當(dāng)前許多數(shù)據(jù)采集系統(tǒng)不得不面對(duì)的問題。
為了從根源上在保證數(shù)據(jù)質(zhì)量的同時(shí)減少采集數(shù)量,本文提出了一種方案,依靠已經(jīng)采集到的數(shù)據(jù),實(shí)時(shí)地進(jìn)行分析,從而不斷地修正采樣周期,使得采樣周期能夠快速、準(zhǔn)確地適應(yīng)被測(cè)對(duì)象的動(dòng)態(tài)變化。以保證在不丟失有價(jià)值數(shù)據(jù)的同時(shí),也不搜集過多價(jià)值不大的數(shù)據(jù)。
在測(cè)控系統(tǒng)中,現(xiàn)實(shí)中的溫度、壓力、速度等模擬量通過各種類型的傳感器按一定規(guī)律變換成為電信號(hào),以滿足信息傳輸、處理、存儲(chǔ)和控制等要求,因而數(shù)據(jù)的采集方法顯得尤為重要。圖1是藥物硬度檢測(cè)實(shí)驗(yàn)過程中壓力傳感器隨時(shí)間采集到的數(shù)據(jù)。
由圖1可知,在0~25s的采集過程中,測(cè)得50個(gè)數(shù)據(jù),數(shù)據(jù)量基本都在第5~13s內(nèi),僅用了16次即采集完畢,很明顯,傳統(tǒng)數(shù)據(jù)采集方法存在著嚴(yán)重的弊端:在采集對(duì)象變化平緩時(shí)采樣次數(shù)過多,加大了系統(tǒng)壓力;在采集對(duì)象變化劇烈時(shí)采樣次數(shù)不足,不能準(zhǔn)確反映采集對(duì)象的變化趨勢(shì)。

圖1 藥物硬度曲線
一般來說,有用信息往往來自數(shù)據(jù)的大幅度變化階段,因?yàn)榇蠓茸兓A段往往是被測(cè)量發(fā)生質(zhì)變的征兆。因而新算法需要實(shí)現(xiàn)的功能是,在有限的采樣頻率和存儲(chǔ)容量下,更精確地記錄變化情況,得到更多有用信息。具體來說,就是在數(shù)據(jù)變化平滑穩(wěn)定時(shí)減少采集數(shù)據(jù)點(diǎn)數(shù),而在數(shù)據(jù)變動(dòng)劇烈時(shí)加大采集的數(shù)據(jù)點(diǎn)數(shù)。采集策略如下:
① 當(dāng)采集到的系統(tǒng)數(shù)據(jù)變化平穩(wěn)時(shí),數(shù)據(jù)變化不明顯,采用最大采集周期Tmax,減少對(duì)價(jià)值不大的數(shù)據(jù)的采集。
② 當(dāng)采集到的系統(tǒng)數(shù)據(jù)變動(dòng)劇烈時(shí),數(shù)據(jù)急劇變化,采用最小采集周期Tmin,提高系統(tǒng)對(duì)變化數(shù)據(jù)的捕捉能力。
③ 當(dāng)采集到的數(shù)據(jù)存在潛在信息量時(shí),實(shí)時(shí)調(diào)整平衡關(guān)系,使得最優(yōu)采樣周期實(shí)時(shí)適應(yīng)數(shù)據(jù)變化。
當(dāng)前有多種針對(duì)采樣周期調(diào)整采集數(shù)據(jù)的方法。如Bai等人在 NCS(Networked Control Systems)系統(tǒng)中,采用效用函數(shù)(utility function)建立系統(tǒng)性能與采樣周期間的關(guān)系,并基于該函數(shù)調(diào)整采樣周期,降低數(shù)據(jù)采集對(duì)系統(tǒng)性能的影響[1],但是沒有考慮降低采樣頻率會(huì)增大采樣失真度的問題。Choi等人采用隨機(jī)抽樣機(jī)制,并依據(jù)誤差邊界(Error Bound)自適應(yīng)調(diào)整網(wǎng)絡(luò)數(shù)據(jù)包的采樣頻率[2],但是存在降低采樣頻率會(huì)增大誤差邊界,進(jìn)而增大采樣失真度的問題。王亞沙等人采用一元線性回歸對(duì)歷史采樣點(diǎn)擬合一條直線,然后根據(jù)該直線計(jì)算線性偏差平均值比,并根據(jù)線性偏差平均值比調(diào)整采樣頻率,以減小采樣失真度[3],但是由于線性偏差平均值比只采用最近一次采樣點(diǎn)相對(duì)于擬合直線的線性偏差與采樣平均值作計(jì)算,存在誤判率高、穩(wěn)定性差的問題。蓋炳帥等人也是采用一元線性回歸對(duì)最近多個(gè)采樣點(diǎn)擬合一條直線[4],但是根據(jù)該直線計(jì)算抖動(dòng)比用提高或降低一定量采樣周期的調(diào)整方式會(huì)存在采集變化速度可能跟不上系統(tǒng)信號(hào)的變化速度的弊端。
基于以上分析,本文在測(cè)控系統(tǒng)中提出了一種新的自適應(yīng)的采集周期調(diào)整方法。該方法采用一元線性回歸對(duì)最近的有限個(gè)采樣點(diǎn)擬合一條直線,然后根據(jù)該直線的斜率大小,實(shí)時(shí)地調(diào)整采樣頻率。驗(yàn)證實(shí)驗(yàn)表明,該方法能夠在降低平均采樣頻率的前提下減小采樣失真度,且與同類方法相比失真度低,穩(wěn)定性高。
自適應(yīng)數(shù)據(jù)采集算法在采集策略實(shí)現(xiàn)的情況下要保證以下兩點(diǎn)特性:
① 快速適應(yīng)性。在采集數(shù)據(jù)的過程中,前后數(shù)據(jù)變化量必須迅速反映到采集周期上。
② 抗干擾性。能夠剔除采集數(shù)據(jù)中因?yàn)樗矔r(shí)、短暫的外界沖擊而造成的變化。
假設(shè)y=f(t)[5]表示模擬量隨時(shí)間變化的曲線,S={(t1,y1),(t2,y2),…,(tn,yn)}表示采樣集合,其中t1<t2<t1<…<tn表示采樣時(shí)間。測(cè)控系統(tǒng)通過采樣到的各點(diǎn)的數(shù)據(jù)進(jìn)行系統(tǒng)實(shí)時(shí)控制。用直線依次連接S中各點(diǎn),得到采樣曲線y′=f′(t),y′=f′(t)和y=f(t)間的面積表示采樣失真度,則采樣失真度為:

本采集方法利用對(duì)最近采樣的N個(gè)點(diǎn)一元線性回歸,擬合成一條直線。用yi+1表示下一個(gè)采樣點(diǎn)的數(shù)值,yi,yi-1,yi-2,…,yi-N代表下次采樣前最近的 N 個(gè)采樣值,ti,ti-1,…,ti-N代 表 采 樣 時(shí) 刻,并 且 滿 足ti>ti-1> … >ti-N。以y=β0+β1t表示這N個(gè)點(diǎn)通過一元線性回歸擬合成的直線。由一元線性回歸可以求得β0和β1的最大自然估計(jì):


表1 斜率和采樣間隔對(duì)應(yīng)表
在實(shí)際數(shù)據(jù)采集中,經(jīng)常發(fā)現(xiàn)有些數(shù)據(jù)會(huì)在一段平滑的抖動(dòng)之間出現(xiàn)個(gè)別一兩個(gè)數(shù)值的突變,而這種突變只是傳感器受到外界不可避免的瞬時(shí)干擾而形成的噪聲,不能代表被測(cè)量的變化趨勢(shì),在算法預(yù)測(cè)下一個(gè)采集間隔的過程中應(yīng)當(dāng)被剔除。所以在本算法中可以適當(dāng)?shù)丶哟笠辉€性回歸的回歸窗口,讓多一些點(diǎn)參加擬合過程,可以很好地消除跳躍點(diǎn)的影響。因此,在數(shù)據(jù)采集之前,應(yīng)該先確定參數(shù)N,來平衡干擾和靈敏度之間的取舍。
采集流程如圖2所示。

圖2 數(shù)據(jù)采集流程圖
針對(duì)本文圖1中的實(shí)驗(yàn)數(shù)據(jù),分別使用等間隔數(shù)據(jù)采集算法和自適應(yīng)數(shù)據(jù)采集算法進(jìn)行了仿真實(shí)驗(yàn),仿真結(jié)果如圖3所示。

圖3 兩種算法的仿真結(jié)果
圖3(a)和圖3(b)都有60個(gè)采樣點(diǎn),不同的是圖3(a)采用的是等間隔采樣算法,采樣間隔為0.1s,圖3(b)采用的是自適應(yīng)采樣算法,其中使用的系統(tǒng)參數(shù)如表2所列。
通過對(duì)比可以很清楚地看到,在圖3(a)中,所有的采樣數(shù)據(jù)點(diǎn)都是均勻分布在時(shí)間軸上,而圖3(b)中的采樣點(diǎn)則是不均勻的。測(cè)量開始,以最小周期采樣,采樣4個(gè)點(diǎn)過后自適應(yīng)算法啟動(dòng)。通過表3中兩種算法仿真結(jié)果比較的數(shù)據(jù),可以很明顯地看到自適應(yīng)采集的優(yōu)勢(shì)。

表2 自適應(yīng)算法參數(shù)表

表3 兩種算法仿真結(jié)果比較
傳統(tǒng)的等間隔數(shù)據(jù)采集方法并不能按需采集數(shù)據(jù),因此本文設(shè)計(jì)了一種自適應(yīng)采集算法,在保證不丟失關(guān)鍵信息量的同時(shí)減少了采集數(shù)據(jù)的數(shù)量,提高了系統(tǒng)利用率。通過MATLAB仿真驗(yàn)證,自適應(yīng)采集方法較傳統(tǒng)的等間隔數(shù)據(jù)采集方法有一定的優(yōu)勢(shì),是一種可行的代替方案。
本方案已經(jīng)在藥物硬度檢測(cè)機(jī)上進(jìn)行了測(cè)試,效果良好。
[1] Bai Jia,Eyisi E P,Xue Yuan,et al.Distributed Sampling Rate Adaptation for Networked Control Systems[C]//The First International Workshop on Cyber-Physical Networking Systems.Shanghai:ACM/IEEE,2011:768-773.
[2] Choi B Y,Park J,Zhang Zhi Li.Adaptive Packet Sampling for Accurate and Scalable Flow Measurement[C]//Global Telecommu-nications Conference.Dallas:IEEE,2004:1448-1452.
[3] 王亞沙,王光興.網(wǎng)絡(luò)性能管理中一種數(shù)據(jù)采集算法的研究[J].計(jì)算機(jī)研究與發(fā)展,2002,9(39):1031-1037.
[4] 蓋炳帥,王勁林.網(wǎng)絡(luò)管理系統(tǒng)中一種自適應(yīng)的采樣頻率調(diào)整方法[J].網(wǎng)絡(luò)新媒體技術(shù),2012(1).
[5] Christos Stathis,Basil Maglaris.Modelling the self-similar behaviour of network traffic computer networks[J].Computer Networks,2000,34(1):37-47.