孫卓,鮑煦,林頡,張文策
(江蘇大學計算機科學與通信工程學院,江蘇 鎮(zhèn)江 212013)
近年來,隨著納米技術(shù)的快速發(fā)展,納米物聯(lián)網(wǎng)成為研究關(guān)注的熱點[1]。學術(shù)界將由納米尺度的組件組成,在納米或微米尺度范圍內(nèi),能夠執(zhí)行數(shù)據(jù)計算、存儲、分類和驅(qū)動等多種任務(wù)的設(shè)備稱為納米機器[2-3]。單個納米機器具有一定的局限性,因此為了能夠在更大程度上完成更復雜的任務(wù),納米機器需要通過信息共享、合作互聯(lián)組成分布式的納米網(wǎng)絡(luò)[2,4]。物聯(lián)網(wǎng)(IoT,Internet of things)的普及使納米網(wǎng)絡(luò)具有非常廣闊的應(yīng)用前景,在B5G 和6G 等技術(shù)中有許多潛在應(yīng)用,如生物納米物聯(lián)網(wǎng)(IoBNT,Internet of bio-nano-things)、納米傳感網(wǎng)絡(luò)等[5-6],是未來研究與開發(fā)納米尺度互聯(lián)網(wǎng)[2]和納米物聯(lián)網(wǎng)[7]的基礎(chǔ)。
傳統(tǒng)的通信技術(shù)受到收發(fā)器體積、能耗及生物兼容性等因素的制約,無法直接應(yīng)用于納米機器[2]。與傳統(tǒng)的基于射頻的通信系統(tǒng)不同,分子通信是一種以生物化學分子為信息載體的短距離通信技術(shù)。具有生物兼容性強、工作效率高[8]、能源消耗低等優(yōu)點。分子通信是IoBNT 中的一項重要技術(shù),它利用生物化學分子進行信息傳輸,實現(xiàn)在納米機器之間的通信,可應(yīng)用于由體內(nèi)智能傳感器組成的體域網(wǎng)中[6,9]。此外,分子通信在醫(yī)療工程、藥學應(yīng)用、工業(yè)和環(huán)保等領(lǐng)域也起到重要作用[10]。因此,分子通信被普遍認為是實現(xiàn)納米網(wǎng)絡(luò)最有效可行的通信技術(shù)之一[11]。
一個典型的分子通信系統(tǒng)包括發(fā)射機、信道和接收機,而信道是分子通信研究中的核心內(nèi)容,信道模型的準確與否直接影響分子通信系統(tǒng)設(shè)計的有效性和穩(wěn)健性。在分子通信系統(tǒng)中,信道特性與分子傳輸機制有關(guān),包括自由擴散、分子馬達、細菌馬達等[12]。其中,自由擴散是自然界中分子運動最普遍的形式,因此基于自由擴散的分子通信技術(shù)(MCvD,molecular communication via diffusion)近年來成為研究熱點[12]。
MCvD 中常見的發(fā)射機模型包括點源發(fā)射機(以下簡稱為點源)和球形源發(fā)射機(以下簡稱為球源),接收機模型分為吸收接收機(以下簡稱為吸收機)和透明接收機(以下簡稱為透明機)等。吸收機吸收在任意時刻撞擊其表面的分子,而透明機則對分子運動不構(gòu)成任何影響,僅記錄分子在透明機內(nèi)部的數(shù)量。目前,已有文獻討論了點對點分子傳輸系統(tǒng)(包括點源和球源)和透明機、吸收機或吸附可逆吸收機等的信道特征。常見的信道響應(yīng)包括吸收球的吸收速率、接收機的接收概率、信道中的分子濃度、分子在信道中的擴散特性等[12]。
對于點源發(fā)射分子的三維無邊界場景,文獻[13]推導了空間任意位置的分子濃度。Yilmaz 等[14]針對單個點源和一個完全吸收機(吸收概率為1)的MCvD 場景,推導了吸收機的吸收概率。在吸收概率小于1,部分分子被吸收后仍存在一定概率回到環(huán)境中的分子通信場景,Deng 等[15]對其進行了理論建模,推導了三維信道沖激響應(yīng)表達式,給出了任意時間區(qū)間內(nèi)吸附分子個數(shù)的穩(wěn)態(tài)解并提出了仿真算法。由于球源對其發(fā)射的分子有一定的影響,因此信道與點源存在的信道狀態(tài)不同。文獻[16]發(fā)現(xiàn)球源發(fā)射的分子濃度具有一定的方向性,并推導了方向增益。Genc 等[17]引入了2 種隨機分布函數(shù)對球源?球接收機信道進行建模。文獻[18]研究了被吸收邊界和反射邊界包圍的一對點源和透明機的分子通信系統(tǒng),推導了空間中任意位置、任意時刻的瞬時和穩(wěn)態(tài)分子濃度分布。文獻[19-20]研究了不規(guī)則擴散的分子通信系統(tǒng),對該信道進行建模并分析了反常擴散中定時調(diào)制方案和振幅調(diào)制方案的誤碼率。在研究分子通信網(wǎng)絡(luò)的過程中,不僅需要對點對點的分子通信信道進行建模,還需要分析多個接收機共存的場景下信道的變化特性。
文獻[21]提出了多個吸收機場景下提高仿真精度的方法,并基于該模型分析了吸收概率與發(fā)射機接收機之間距離的關(guān)系。文獻[22-23]利用隨機幾何的方法分析了多個隨機發(fā)射機和一個接收機(吸收球或透明球)的信道場景,推導了在吸收球或透明球處分子個數(shù)的數(shù)學表達式。Bao 等[24]研究了點源和2 個吸收球的分子通信系統(tǒng)模型,對其進行蒙特卡羅場景仿真,并提出了在其中一個吸收球處的吸收概率模型。Dinc[25]導出了具有球形吸收接收器的三維無界擴散通道脈沖響應(yīng)的解析估計。Huang 等[26]研究了基于一維擴散的分子通信系統(tǒng),分析了單個發(fā)射器和2 個完全吸收接收器之間的信道響應(yīng)。文獻[27]分析了2 個源、2 個接收機場景下的分子接收概率模型。文獻[28]利用高斯、泊松概率分布建模多個吸收機的MCvD 場景。然而,以上文獻并未考慮MCvD 場景中的干擾吸收機對空間分子分布的影響。
本文考慮一個點源、一個吸收機和一個透明機的MCvD 場景,研究吸收機對透明機接收分子個數(shù)的影響,并提出以透明機為研究對象的分子通信信道模型。本文通過觀測透明機的接收分子概率隨透明機到點源的距離、透明機和吸收機的夾角α以及時間t的變化,分析吸收型接收機對空間濃度的干擾,并給出干擾因子的表達式,進而提出了該場景的信道模型,仿真驗證了其準確性。此外,本文通過數(shù)據(jù)擬合確定該信道模型中的參數(shù),采用人工神經(jīng)網(wǎng)絡(luò)(ANN,artificial neural network)方法進行模型參數(shù)的學習,以大量數(shù)據(jù)驗證了該模型的合理性。
仿真結(jié)果表明,本文提出的基于多接收機場景的信道模型在考慮收發(fā)機的拓撲結(jié)構(gòu)、接收機之間和接收機對空間濃度的干擾的同時,還可以應(yīng)用在空間定位和預測等,在仿真中都有較好的成效。
本文研究的MCvD 系統(tǒng)模型如圖1 所示,包含一個點源S、一個吸收機R1和一個透明機R2,α為吸收機R1和透明機R2在點源S 處的夾角。S 在初始時刻釋放20 000 個分子,在擴散系數(shù)為100 μm2/s的環(huán)境中進行無規(guī)則的布朗運動,仿真步長為0.001s。R1的半徑為2μm,R2的體積設(shè)置為1μm3。由于球坐標系的對稱性,α取值落在[0,π]范圍內(nèi)。本文記錄仿真過程中每個分子的位置,總仿真時長為2 s,每隔一個仿真步長判斷一次分子的位置與吸收機和透明機的距離,分子一旦觸碰吸收機的表面或是在吸收機的內(nèi)部,就被該吸收機完全吞吃。每0.001 s 記錄每個分子的空間坐標,同時判斷是否被吸收機 R1吸收、是否在透明機R2內(nèi)。將被 R1吸收的分子從空間中移除,在R2內(nèi)的分子不發(fā)生反應(yīng),僅記錄R2內(nèi)分子數(shù)的變化。定義觀測概率密度(OPD,observing probability density)為某時刻R2內(nèi)觀測分子數(shù)與源發(fā)射總分子數(shù)的比值,累積觀測概率(COP,cumulative observing probability)定義為某時間段內(nèi)觀測分子數(shù)與源發(fā)射總分子數(shù)的比值。R2的OPD 和COP 分別記為。具體的仿真參數(shù)設(shè)置如表1 所示[14,24]。

表1 仿真參數(shù)

圖1 MCvD 系統(tǒng)模型
本文以透明機R2作為觀測對象來研究吸收機對自由空間分子分布的影響,R1對自由空間各點分子濃度的干擾情況通過觀測R2的球內(nèi)分子濃度變化得到體現(xiàn)。如圖1 所示的幾何關(guān)系可能會對透明機的分子觀測概率有較大的影響,所以d1、d2、α和t都滿足多樣性,對各種不同的場景進行仿真。
本文以α、d1、d2和t為主要因素描述了其對的影響。圖2(a)~圖2(d)分別描述了d1= 4 μm,t= 0.05 s、0 .1s、0 .8 s、2 s 時刻的空間分子分布概率,顏色越淺表示越大。從圖2(a)可以看出,在t= 0.05 s 時刻,當d2較小時,所有角度的都是相似的。此時,R1與S、R2相距甚遠,對R2幾乎沒有影響。但是,隨著d2的增加,在不同角度上明顯不同。以d2= 3 μm 為例,α越小,R2越測概率越小,即越小。隨著d2繼續(xù)增加,α的接近R1,R1對R2的干擾越大,R2的球內(nèi)分子觀影響再次減少,即增加。另一方面,以d2=10 μm為例,在所有角度上幾乎都是平坦的。因為從S到R2的距離為10 μm 時對隨機的自由擴散運動來說已經(jīng)是比較遠了,而此時t= 0.05 s,環(huán)境中的大部分分子還未移動到d2= 10 μm 的位置。
圖2(b)中對比不同d2位置的和d2的增加導致R1、R2和S 之間發(fā)生幾何關(guān)系的變化。d2越大,R2離S 越遠,R2觀測到的球內(nèi)分子數(shù)量越少。當α為銳角時,R2先向R1逼近,然后在d2增大的過程中遠離R1,即R1的干擾先增大后減小。隨著分子自由擴散過程的進行,通過仿真數(shù)據(jù)可以判斷圖2(b)中,t=0.1s已經(jīng)過了的峰值時刻,在整個場景中不斷下降,區(qū)塊的顏色更加清晰地印證了上述分析。在圖2(c)中,t=0.8 s,在整個場景中的數(shù)值都很小,R1的影響不再明顯。大部分分子被R1吸收,環(huán)境中剩余的分子大大減少,α和d2對的影響也開始減小。圖2(d)為t=2s時刻的空間分子分布概率圖譜,此刻空間中分子已經(jīng)所剩不多,仍在進行無方向性的自由擴散運動,α和d2的影響已經(jīng)完全消失。

圖2 透明型接收機在不同距離 d2和角度α 下的觀測概率密度fR2
當d2= 4 μm 時,不同場景下,t對透明機R2的分子累積觀測概率的影響如圖3 所示。

圖3 t 對透明機的分子累積觀測概率的影響
從圖3 可以看出,t的值被固定時,分別增加α和d1的數(shù)值都會導致的增加。
在僅有一個點源場景中,點源以沖擊函數(shù)δ(t)發(fā)射分子,空間中任意點的球形透明機概率密度如式(1)所示。

其中,Vrx為透明機的體積。然而,空間中存在一個吸收機作為干擾機的場景中,點源到透明機的信道模型是未知的,本文以單位體積的透明機為觀測對象,將透明機內(nèi)的分子觀測概率為球中心點的分子觀測概率,根據(jù)第2 節(jié)的仿真分析,MCvD 系統(tǒng)的透明機R2的OPD 為

將式(2)對t求積分,可得R2的COP 為

其中,erfc(?)為互補誤差函數(shù);I為干擾因子,表示R1對R2的干擾程度,數(shù)值為0~1,I越接近1,則R1對R2的干擾越小。本文通過大量的仿真,在式(2)的基礎(chǔ)上,得出不同場景下I的數(shù)值,如圖4所示。通過曲線擬合,I可以表示為

其中,k1和k2是調(diào)節(jié)參數(shù),具體數(shù)值取決于MCvD場景;r1表示 R1的半徑;系數(shù)k1和k2的估計方法為LM(Levenberg-Marquardt)算法[23]。本文可以通過機器學習算法訓練和預測數(shù)據(jù)來獲取參數(shù)。
在d2= 4 μm 的場景下,I隨著d1和α變化的情況如圖4(a)所示。已知該場景中d1>d2= 4 μm,則d1越大,R1越遠離S 和R2,R1對R2的干擾越小,因此I越接近1,并在d=0.8μm 附近達到峰值。在相同的前提下,α越大,I越接近1。將α=15°和α= 120°這2 個場景進行對比,α=15°時I為0.5~1,且隨d1的增加而快速增加;α=120°時I為0.95~1,且波動極小,d1對I的影響不明顯。α和d1越大,R1對R2的干擾越小,I越接近1。
在d1= 5 μm 的場景下,I隨著d2和α變化的情況如圖4(b)所示。隨著d2增加,點源和2 個接收機的幾何關(guān)系會經(jīng)過d2
圖5 揭示了I如何通過系數(shù)k1和k2影響fR2。從圖5(a)可以看出,在α=60°的場景中,d2增加時,k1和k2的變化不大,這說明d2對I的影響較小,R1對R2的影響較為恒定。圖5(b)給出了k1和k2隨α的變化曲線,以d2= 7 μm 為例,當α比較小時,k1的值比較大,隨著α的增大,k1曲線的斜率逐漸減小,I的值也趨于恒定,這與圖4 的結(jié)果一致。

圖4 不同角度下干擾因子I 與 d1 和 d2的關(guān)系

圖5 不同場景中主要參數(shù)k1和k2 的數(shù)值
式(2)可以認為是“一個點源和一個吸收機”場景下自由空間中MCvD的信道脈沖響應(yīng)。由R2的觀測概率密度可得,會出現(xiàn)一個峰值。對式(2)中的t求導,使/dt=0,此時t=tpeak,tpeak為峰值時間,計算式為

將tpeak代入式(2),可得觀測概率密度峰值fpeak為

在不同的d1、d2、α以及有無R1存在的場景下,透明機的瞬時觀察概率fR2作為時間t的函數(shù)的曲線如圖6 所示。從圖6 可以看出,式(2)計算結(jié)果與仿真結(jié)果曲線高度貼合,證明了本文提出模型的正確性。本文將2 種場景的變量分別代入式(5)和式(6)中,得到t1peak、f1peak、t2peak和f2peak的值如圖6 所示。根據(jù)式(5)和式(6)計算得出的峰值時間和峰值與圖6 所示曲線相匹配,證明tpeak只與D和d2有關(guān)。從圖6 還可以看出,在 R1存在和 R1不存在這2 種情況下,fR2的變化趨勢是相似的。這也表明了式(5)擬合結(jié)果與仿真結(jié)果的準確性。但是在 R1存在的情況下,的峰值明顯低于R1不存在情況下的峰值,說明點源S 釋放出的分子有一部分被 R1吸收,因此R2觀測到的分子數(shù)減少。

圖6 計算結(jié)果和仿真以及R1 不存在情況下仿真的對比
圖6 中2 個場景的擬合參數(shù)及擬合結(jié)果如表2所示。表2 中R-square 為相關(guān)系數(shù),它的取值范圍為[0,1],R-square 越接近1,表明方程的變量對因變量y的解釋能力越強,擬合模型越貼合數(shù)據(jù)。R-square 的計算式為

其中,Cov(X,Y)為X和Y的協(xié)方差函數(shù),Var[X]和Var[Y]分別為X和Y的方差函數(shù)。擬合數(shù)據(jù)和原始數(shù)據(jù)對應(yīng)點的誤差平方和(SSE,sum of the squares of errors)為

均方根誤差(RMSE,root mean square error)為

其中,n表示樣本數(shù)量,yi和表示因變量的實際值和預測值。在表2 中,R-square、SSE 和RMSE均在合理的數(shù)量級上,證明了擬合的有效性。

表2 圖6 中2 個場景的擬合參數(shù)及擬合結(jié)果
不同d1、α和t的場景中,透明機的累計觀察概率作為d2的函數(shù)比較計算結(jié)果和仿真結(jié)果如圖7 所示。從圖7 可以看出,隨著d2的增加而減少,這與第2 節(jié)的分析是一致的。d2和α同時增大,即R1與S、R2的距離同時增大時,R1遠離其他節(jié)點,因此R1對R2的干擾減小,增大。式(3)曲線和仿真曲線的變化趨勢相同,式(3)數(shù)值和仿真結(jié)果的高度吻合,證明了參數(shù)擬合和模型的有效性和正確性。

圖7 計算結(jié)果和仿真結(jié)果
為了使式(2)和式(3)中構(gòu)建的信道模型在實際場景中能夠有效應(yīng)用,本文使用ANN 對參數(shù)k1、k2進行訓練。對于ANN 的訓練,本文使用反向傳播和貝葉斯正則化來處理過度學習,根據(jù)LM 算法優(yōu)化更新權(quán)值和偏差值。在ANN 訓練中,本文將390 個樣本組成的數(shù)據(jù)作為訓練數(shù)據(jù)集A,其中70%被劃分為訓練子集,其余30%被劃分為2 個樣本個數(shù)相等的子集用于驗證與測試,這些樣本利用式(2)和式(3)來擬合大量仿真數(shù)據(jù)得到,并進行隨機分組。
人工神經(jīng)網(wǎng)絡(luò)訓練過程的流程和數(shù)據(jù)集結(jié)構(gòu)如圖8 所示。以每個特定場景的模型參數(shù)為輸入?yún)?shù),利用LM 算法對仿真數(shù)據(jù)進行擬合求出ki值,并將其作為輸出參數(shù),構(gòu)成了帶有場景參數(shù)的訓練和預測數(shù)據(jù)集。訓練和預測數(shù)據(jù)集形成后,訓練數(shù)據(jù)被輸入ANN 進行訓練。訓練后的神經(jīng)網(wǎng)絡(luò)只需要輸入系統(tǒng)參數(shù)d2、α(驗證數(shù)據(jù)集的輸入?yún)?shù))而得到預測調(diào)節(jié)參數(shù)。將完成每一次訓練后進行預測得到的預測數(shù)據(jù)集和驗證數(shù)據(jù)集的調(diào)節(jié)參數(shù)ki進行對比,預測數(shù)據(jù)和驗證數(shù)據(jù)對應(yīng)點的均方誤差(MSE,mean square error)如圖9 所示。表達式為


圖8 人工神經(jīng)網(wǎng)絡(luò)訓練過程的流程和數(shù)據(jù)集結(jié)構(gòu)

圖9 不同訓練次數(shù)時的MSE
MSE 越趨近0,表明預測數(shù)據(jù)和實際數(shù)據(jù)越相近,即訓練得到的關(guān)系式的正確性越高。圖9 中曲線表明訓練次數(shù)為8 時MSE 最小,即最佳性能點;更少次數(shù)的訓練會發(fā)生“欠擬合”,缺乏對參數(shù)之間關(guān)系的充分學習;更多次數(shù)的訓練會發(fā)生“過擬合”,不能有效學習參數(shù)之間的關(guān)系。
訓練子集、驗證子集、測試子集,以及全部數(shù)據(jù)的回歸系數(shù)曲線如圖10 所示。從圖10(a)~圖10(c)可以看出,訓練子集、驗證子集、測試子集都具有非常強的相關(guān)性結(jié)果。從圖10(d)可以看出,全部數(shù)據(jù)訓練得到的擬合曲線貼合訓練數(shù)據(jù),相關(guān)性高,而59 個測試數(shù)據(jù)的相關(guān)性略有降低,測試數(shù)據(jù)集的驗證數(shù)據(jù)的相關(guān)度也與此相似。由此可見,該ANN 模型是可行的。

圖10 不同數(shù)據(jù)集的回歸分析
為了檢驗ANN 的泛化能力,本文使用同樣來自式(2)和式(3)的另外的390 個樣本組成的預測數(shù)據(jù)集B 去測試數(shù)據(jù)集A 訓練得到的神經(jīng)網(wǎng)絡(luò),回歸分析如圖11 所示,訓練得到的擬合曲線貼合測試數(shù)據(jù),相關(guān)性高,系數(shù)為R= 0.9751,由此再次證明了該ANN 模型的可行性。

圖11 預測數(shù)據(jù)集的回歸分析
最后,本文使用數(shù)據(jù)集A 通過其他對比算法進行ANN 訓練,再用數(shù)據(jù)集B 對其泛化能力進行檢驗。使用的對比算法如表3 所示,訓練的結(jié)果如表4所示。從表4 可以看出,LM 算法最適用于ANN 模型的訓練與泛化。

表3 對比算法介紹

表4 不同算法泛化能力比較
本文以點源、吸收機和透明機共存的自由擴散分子通信系統(tǒng)為研究對象,分析吸收機對自由空間中分子運動的影響,進而對其進行信道建模。此外,本文提出了使用ANN 方法對信道模型參數(shù)進行學習,仿真結(jié)果證明了所提信道模型的準確性。