張 振,賈濟鋮,康 健,林 云*
(1.哈爾濱工程大學 信息與通信工程學院工信部重點實驗室,黑龍江 哈爾濱 150001;2.北京宇航系統工程研究所,北京 100086)
根據IoT Analytics的數據分析,盡管新冠病毒疫情不斷,但物聯網市場仍在持續增長。2020年,物聯網連接數量首次超過傳統網絡設備連接數量,共計有217億個設備連接到網絡中,其中117億個(約54%)物聯網設備相互連接。預計到2025年,將會有超過300億個IoT設備彼此連接[1]。
由于無線網絡的開放性,加大了其遭受非法用戶接入以及大規模惡意攻擊的風險,并已經成為嚴重阻礙無線網絡技術發展應用的因素之一。傳統的無線網絡安全協議存在一定漏洞,如連接WiFi的設備極易受到MAC地址偽造、取消身份驗證的洪泛攻擊等。
近年來,基于物理層的安全防護機制得到廣泛研究,在網絡入侵檢測[2]、頻譜感知問題[3]、設備的克隆檢測[4]、故障診斷[5-6]、目標跟蹤以及雷達檢測[7]等領域都發揮重要作用。
本文首先介紹射頻指紋基本理論,包括基本模型、產生機理、分類識別過程和射頻指紋特性;然后對射頻指紋提取與識別技術的研究工作進行回顧和總結;接下來簡要介紹了射頻指紋系統的評估方法;最后對射頻指紋識別技術進行總結及發展展望。
“射頻指紋”是通過分析設備的無線信號,提取得到的設備獨特特征[8-10],是設備的物理層本質特征,只與設備本身的硬件特征相關。盡管通過更精確的制造和質量控制手段可以減少這種硬件差異,但由于會導致生產成本顯著提高,因此在實際環境中通常不可行。IoT設備連接總數如圖1所示,在當前物聯網設備大幅度增加的情況下,基于射頻指紋的識別技術能有效提高無線網絡安全性,近些年得到了廣泛的關注和研究。

圖1 IoT設備連接總數Fig.1 Total number of IoT device connections
輻射源設備的射頻指紋識別系統如圖2所示。無線設備輻射射頻信號,射頻指紋識別系統進行信號的采集與分析,并最終得出設備的分類識別結果。發射機在處理信號過程中會將設備獨特的特征攜帶在信號中,通過天線輻射到無線信道。而在無線信道中,多徑無線鏈路特性將會很大程度地影響系統的性能[11]。
信號傳輸到接收端,隨后系統對信號進行預處理、變頻、相位補償、能量規范化以及消除不合格信號等。信號預處理階段,應盡量減少噪聲,因此信號采集和預處理通常需要高端儀器。近年來,考慮到實際應用情景,開始研究基于通用軟件無線電設備等中低端接收設備的射頻指紋提取和識別。
對接收的信號進行指紋匹配過程通常通過距離測度法,例如歐氏距離和馬氏距離;或使用標準分類器,例如支持向量機、最近鄰分類器及卷積神經網絡(Convolutional Neural Network,CNN)等,對來自不同設備的指紋進行分類和識別。

圖2 射頻指紋識別系統框圖Fig.2 Block diagram of RFF identification system
圖3為數字輻射源設備的典型結構,可以看出輻射源設備的硬件構成存在諸多“缺陷”,而且這些損傷僅與硬件電路相關,這也是射頻指紋識別技術的物理基礎。

圖3 輻射源設備典型結構Fig.3 Typical structure of radiation source equipment
導致這些誤差產生的原因,主要是由于電子元件存在制造容差和漂移容差。制造容差是指由于設備材料和加工工藝誤差,電子元器件的電氣參數與其標稱值之間存在一定的容差。漂移容差是指由于使用時間變長導致的元器件電氣參數的退化,使得系統偏差變大。此外,輻射源設備運行由于使用環境的變化,同樣會引起器件參數發生變化。除了電子元件的容差,硬件差異還包括印刷電路板材料、走線布局、加工工藝及封裝工藝等。
這些硬件容差就是產生射頻指紋的物理基礎。最早在1995年,即有學者利用無線信號進行設備識別[12]。而“射頻指紋”的概念是2003年由Hall等人[13]提出。經過研究分析,可用的硬件特征包括時鐘抖動[14]、DAC采樣誤差[15]、混頻器頻率偏移、功率放大器非線性[16-17]及調制器子電路等。具體體現在輻射源的射頻信號中[18],圖4為IEEE 802.11a的信號復包絡示意圖,可以看出接收機采集的信號極為豐富,包括瞬態信號段、穩態信號段及數據信號段等,有多種信號段可以用于進行特征的分析與提取。

圖4 IEEE 802.11a無線信號Fig.4 IEEE 802.11a wireless signal
射頻指紋分類識別模塊如圖5所示,包括訓練和識別兩個過程。在訓練過程中,系統對輻射源設備進行采集并存儲,通過特征提取模塊對信號進行分析,記錄其射頻指紋模板,作為合法設備的射頻指紋庫。在識別過程中,通過采集待識別設備的射頻信號,將提取的射頻指紋與指紋庫中的合法設備指紋模板進行匹配,最后輸出系統的識別結果。
識別過程的任務可分成兩類:一類是身份認證,判斷待識別設備是否為指紋庫中合法登記設備(1:1認證);另一類是身份識別,可以得到待識別設備的身份信息。具體為判斷待識別設備是否與其聲稱的身份匹配(1:N識別)。系統輸出識別結果的最典型應用是允許或禁止某一設備訪問。

圖5 射頻指紋分類識別模塊Fig.5 RFF classification and identification module
通過對當前研究成果進行總結,一般來說射頻指紋應具備如下5個特性:
① 唯一性可以保障射頻指紋能夠真正應用于設備識別,因此不同設備必須具備不同的射頻指紋。當前研究表明,輻射源設備的硬件容差性質是射頻指紋唯一性的內因。不同廠家不同型號的設備指紋特性往往具有較大差異,而同一型號的設備差異相對較小,且接收機采集信號時的采樣、量化、濾波等過程也會一定程度上影響這種設備間微弱的差異。所以如何充分發掘輻射源設備間的特征差異,以保證系統的識別效果是當前研究的難點。
② 通用性保障射頻指紋識別系統能夠正常使用。一方面,發射機的射頻指紋特征應具備通用性,即同一類別所有輻射源設備均可從中提取系統需要的射頻指紋;另一方面,接收機也需具備通用性,即利用不同的接收設備均可從發射機中提取出相同的特征,構成相同的射頻指紋,保證系統的適應性。
③ 獨立性是指在發射機穩態信號中提取的射頻指紋只與發射機的硬件設備有關,與發射的信號內容無關。也就是說,在發射機發射不同信號內容時得到相同的射頻指紋,從而保證系統不受傳輸數據影響。
④ 穩健性是指射頻指紋識別系統應在各種因素的影響下保持穩定,即保證系統的識別魯棒性。當前許多研究結果表明,溫度、電壓、信道環境、收發設備距離以及天線極化方向等因素都會影響系統識別性能。因此保證射頻指紋具有穩健性也是當前研究的重點。
⑤ 長時不變性是指隨著輻射源設備的使用和器件老化,提取的射頻指紋不隨之而變化,或變化很小。由于長期投入使用的設備會存在一個重要的問題:實時提取的射頻指紋與該設備在射頻指紋庫中的模板存在較大不同,使得系統無法正確識別該設備。因而要求射頻指紋具有長時不變性。
在分析了識別系統模型、射頻指紋產生機理以及特性后,討論系統中最為關鍵的指紋特征計算與提取模塊。該模塊通過對預處理后的無線信號進行分析,計算得到可以用于唯一表征輻射源特征的射頻指紋,從而實現輻射源設備的有效識別。
瞬態信號是發射機切換工作狀態時產生的信號,不包含傳輸的調制信號內容,不受信號數據部分的影響,具有數據獨立性。瞬態信號只與發射機內部結構設計和器件工藝有關,不同發射機產生的瞬態信號不同,能夠表征發射機硬件特性。
2001年,Ellis等人[19]從瞬態復包絡信號中的振幅和相位信息提取特征,提取的指紋更具普遍性且不需特殊修改。2004年,文獻[20]提出了一種基于噪聲注入訓練集的技術,可以提高噪聲信道中的設備識別性能。

表1 瞬態信號射頻指紋提取技術
2008年,Kim等人[21]利用信號的瞬變特征對6個WLAN網卡進行識別,得到了很好的識別結果。類似地,SusKi等人[22]使用高端設備對發送信號進行采集,將信號頻譜的相關性作為射頻指紋。2009年,Danev等人[23]提出了基于提取應答器響應信號的調制形狀和頻譜特征的識別方法。在50張RFID卡上進行測試,達到了較好的效果。
2016年,田金鵬等人[24]使用信號的平均功率與幅度峰值的比值作為瞬態強度,并將其用于識別發射機設備。2017年,謝非佚等人[25]提取基于信號幅度排序的特征,該算法高效且錯誤率低。
2019年,Yang等人[26]采集了發射機從開機到進行數據通信到關機的整體突發信號,將其分為上升瞬態信號段、穩態信號段和下降瞬態信號,并提出一種基于稀疏表示(SRC)的分類方案[27],使用多組信號段作為射頻指紋的識別性能優于僅使用一個信號段的結果。
2020年,張敏等人[28]提出一種基于I/Q失配的新型射頻指紋特征提取方法,相比之下具有更加優越的射頻指紋識別性能。文獻[29]在多徑信道環境下,利用信道互易性對發射機射頻指紋進行估計,該方法可廣泛適用于單天線或多天線時分雙工系統。
輻射源設備的瞬態信號存在大量的細微特征信息,非常適用于設備的身份識別,可以從中提取具有唯一性的設備指紋特征。一般來說,輻射源設備的瞬態信號持續時間極短,這一點可以從圖4觀察到。因此為了提高設備識別精度,就要求信號采集設備的采樣精度以及瞬態信號的截取精度也隨之提高。另外,設備的開關機瞬態信號一般只在開關機瞬間產生,且很大一部分的IoT設備處于長期休眠或開機的狀態,很難獲取其瞬態信號用于設備的識別。針對這些不足,研究人員提出了基于穩態信號的射頻指紋識別算法。
穩態信號是指輻射源的無線信號在功率穩定后的信號部分,其內容主要為摻雜信道噪聲的通信信息數據。這一部分的無線信號同樣可以通過提取一系列設備獨有的信息作為設備特征,來進行設備的分類識別。

表2 穩態信號射頻指紋提取技術
2008年,Brik等人[30]提出一種PARADIS的技術用于識別WLAN網卡,在調制域測量單個無線幀的差異來實現識別,在鑒別超過130個相同的802.11網卡時準確率超過99%。同時該方法可以適應移動、不同的噪聲條件和硬件老化情況。2009年,Carroll等人[31]研究了在驅動信號不可用的情況下發射機識別問題,在這種情況下非線性系統被看作是一個有信號從其輸出的黑盒。結果表明,當輸出信號嵌入相空間時,產生的吸引子仍然對小的非線性效應敏感,并可用于識別發射機。
2011年,Yan等人[32]基于器件的調制域特征來識別MIMO設備。該方法可以提高識別精度,且對特征漂移影響具有更好的適應性。2014年,Peng等人[33]提出利用I/Q不平衡作為設備射頻指紋。
2015年,任春輝[34]從多重分形理論出發,提出使用時變分層指數分析不同電臺暫態包絡信號特征。2016年,Huang等人[35]提取了無線信號的歸一化置換熵對輻射源個體進行表征,對不同電臺的識別率高達95%。2017年,文獻[36-37]對信號的譜特征進行了研究。同年,韓潔等人[38-39]使用3D-Hibert能量譜及紋理分析的方法達到了較好的識別效果。2018年,黃少馳等人[40]通過能量占比的角度,選擇出最佳的降維方法進行進一步指紋特征提取。2019年,劉贏等人[41]使用基于雙譜分析的方法,通過深層CNN實現雷達信號的有效識別。2020年,潘一葦等人[42]通過將信號轉為矢量圖的方式,實現輻射源的識別。
基于信號星座圖的特征提取是基于穩態信號的一種有效的射頻指紋特征提取方法,被廣泛應用于提高無線物理層安全[43]。文獻[44]對信號的星座圖進行優化,并提出一種基于歐氏距離和幅度距離的二維評估方法,在較低信噪比下仍能獲得較高準確率。
在設備識別過程中,提取的特征數量有限,對于大量設備的識別需要考慮特征容量的上限。文獻[45]從理論上描述了一個識別系統的用戶容量,提出一種基于射頻指紋和用戶身份之間整體互信息的理論方法,研究了在保證最低系統性能情況下的可識別用戶數量問題。
基于穩態信號的指紋特征提取方法克服了傳統應用瞬態信號的不足,相較于瞬態信號持續時間更長且更易獲取,所以對接收設備的精度要求低,對于信號的檢測精度也沒有很高的要求,因此更具有可操作性和方法可行性。但同時由于穩態信號細微特征往往隱藏在信號的傳輸數據中,這對指紋特征提取方法提出了很高的要求。同時,當前常用的穩態信號特征往往維度較高,這也對后續的計算提出了很高的要求。
傳統特征提取方法往往依賴于專家和領域知識,通過對信號進行去噪、信號變換等處理[46],在變換域提取特征,然而這種方法很難提取到最優特征。特征提取是電磁信號識別的關鍵步驟,其優劣將直接影響信號識別的準確率,這種人為提取“經驗性”的特征,使得特征工程方法普遍存在泛化能力差的問題,通常每種方法一般針對有限的幾種電磁信號和特定的環境。
深度神經網絡作為一種從數據中自主學習不同層次特征的方法,其在圖像識別、語音識別、動態頻譜管理、自動駕駛及信號處理等領域已有大量成功應用[47-50]。同樣可將該方法引入到輻射源識別應用中[51-52]。
2018年,Ding等人[53]采用CNN使用雙譜進行輻射源識別。沈偉國等人[54]通過增強局部學習方法,實現了有效的輻射源設備分類。Zhao等人[55]使用一種基于拒絕采樣的遷移學習方法進行設備識別,該方法的優點在于受信道影響小。Chatterjee等人[56]提出了RF-PUF方案,利用數據部分的波形,在不同信道條件下,對10 000個發射機的正確識別率高達99%,是目前的研究中,研究規模較大、實驗效果較好的一項工作。
2019年,Lin等人[57]提出使用基于降維及機器學習的方案,來解決無線設備的入侵檢測問題。Yu等人[58]提出一種多采樣卷積神經網絡(MSCNN),在54個設備的識別實驗中,達到了很好的識別效果。Yu等人[59]還提出一種基于去噪自動編碼器的深度學習識別模型,同樣獲得了較好的識別精度。文獻[60]通過加入噪聲來進行數據增強,從而提升識別準確率。2020年,文獻[61]提出一種基于深度殘差網絡的輻射源個體識別算法,其算法在-5 dB信噪比下可以達到95%的識別精度。
在經歷直接將神經網絡作為分類器,對手動提取的高維特征進行分類識別的階段后,人們將特征提取與分類識別兩個步驟閉環處理,直接輸入I/Q數據,實現更高精度的端到端輻射源個體識別。與此同時,基于深度學習模型的部署應用也日趨重要,有學者討論了如何實現復雜模型在邊緣設備上的具體部署問題[62]。
然而,深度學習屬于黑盒模型,存在可解釋性較差的不足。且人們無法解釋射頻指紋特征的深層數學原理,導致深度學習方法在獲得高性能的同時,更容易陷入過擬合狀態。現在,結合信號處理的射頻指紋特征來提升深度學習模型性能的方法,正受到人們的廣泛關注,其關鍵在于提高對輻射源信號的分析和對指紋特征的理解與設計能力。
目前對于射頻指紋識別方法的研究大多數都集中在基于專家知識對信號直接提取特征進行設備識別,對于利用發射機器件特性唯一表征設備的研究很少。基于發射機非線性模型的特征提取方法,包括提取發射機的器件模型參數特征和發射機的系統模型參數特征。大多數研究是應用器件的非線性變化提取特征作為指紋,而直接對發射機整體進行建模作為指紋特征的研究非常少。

表3 基于物理建模方法的輻射源識別
針對DAC引入的非線性誤差[15],Polak使用Brownian橋隨機過程建模輻射源發射機DAC器件非線性行為,提取其器件特征用于設備識別。針對射頻放大器的非線性曲線,Zhang和Liu以無記憶多項式模型,對其進行數學建模[16,63],簡化了功放非線性模型的求解。文獻[64]將發射端RF前端的非線性失真建模為射頻指紋,然后提供了一個基于假設檢驗的理論模型來評估識別準確性。
Zheng等人[65]提出了一種基于函數建模的數據獨立和信道魯棒的物理層識別系統,以傳輸數據作為輸入,傳輸RF信號作為輸出。對調制到功率放大的物理層過程進行建模,可以表示發射機中硬件的唯一性和信號處理過程。作者提出利用核回歸模型來學習并為每個認證設備建模。
對射頻指紋數學模型的正向推導非常復雜,需要考慮發射機、信道及接收機等一系列影響因素。但是這是一個非常重要的研究內容,只有解決這一問題,才能擴大射頻指紋技術的應用領域。
建立射頻指紋提取和識別系統后,如何正確評估整個系統具體性能指標極為重要。常用的射頻指紋識別系統指標主要有分類識別的準確率(ACC)、拒真率(FRR)、認假率(FAR)以及相等錯誤率(EER)等。理論上,系統的識別性能不能通過任何計算方法獲得,需要通過大量的性能測試來進行統計或者估計具體數值。用于評價射頻指紋系統的參數如圖6所示。

圖6 射頻指紋系統評估指標Fig.6 RFF system evaluation index
① 準確率,即系統對合法設備正確識別的概率。平均樣本錯誤率與之互補,即系統錯誤分類的樣本數約占樣本總數的比例。這兩個衡量指標可以對系統的分類結果給出直觀的評估。
② 拒真率是指“無法對能夠認證成功的指紋進行匹配”的失真概率,也就是合法設備進行指紋匹配無法被認可的概率。拒真率與用戶設定的硬件匹配度和門限密切相關。
③ 相等錯誤率主要是用于系統整體效能的評價。綜合考量FAR和FRR兩個指標,即可搭建系統識別結果的ROC曲線。其中,FAR值隨著閾值的增大而減小,FRR值隨著閾值的減小而增大。其中存在著兩者數值相同的點,通常可以用此點來衡量識別算法的整體性能。
④ 為了保證系統不會過度學習,通常采用k-折交叉驗證方法直接進行上述評估并獲得統計參數。即將測試中的數據集整理成k個平行的子集,一個作為學習訓練,其余k-1個子集用來評估準確性,這樣可以做k次評估,從而保證系統不會出現過度學習的現象。
無線網絡的擴展越來越來快,越來越多的設備正在接入網絡,安全問題是一個日益凸顯的問題。為了彌補現有安全認證方法的不足,學者們研究基于物理層的硬件電路特征,將其作為唯一身份ID進行識別。射頻指紋識別技術可以應用于大多數現存無線通信設備的識別和認證過程,提高無線網絡的安全性能。射頻指紋識別技術具有諸多優勢,但在實際應用中仍然存在一些問題:
① 缺少對射頻指紋產生過程的正向推導數學模型,即無法量化設備間射頻指紋特征的差異。這也就導致目前的射頻指紋識別研究只能從信號處理的角度出發,不斷模擬真實的設備指紋特征。因此,需要對輻射源的各個器件進行數學建模,找尋最本質的設備間物理差異,實現高精度、高穩定的識別。
② 缺少一個公開的、正確的、完備的輻射源識別數據集。這導致目前的研究無法橫向比較,也就使得算法優化迭代變得艱難,對射頻指紋識別的研究無法深入。因此需要一個公認的數據集,幫助學者們進行深層次的研究,真正解決射頻指紋識別的應用問題。
③ 射頻指紋的適應性較差。目前研究中的大多數射頻指紋特征,通常對信號調制樣式、通信協議、輻射源規格有一定限制,且對使用場景、適用范圍等較為敏感。實際應用中,電磁環境復雜多變,目前的系統無法對新的信號、環境、設備變化做出及時的反應。因此需要提取更具魯棒性、可擴展性的射頻指紋特征,來提高系統的適應性。
④ 射頻指紋特征的提取效率。目前大多數方案中,均需要專家知識深度參與,使得系統性能提高的程度極為受限。因此需要借助人工智能的方法,實現射頻指紋的智能提取,擺脫系統對專家知識的依賴,從而提高系統的適應能力以及進行識別的效率。
⑤ 隱私問題與可能遭受的攻擊。射頻指紋識別技術需要對輻射源的無線信號進行采集與分析,在此過程中如何保證用戶的隱私安全極為重要,而目前有關于此方面的研究較少。另一方面,射頻指紋也會受到諸如信號重放及中間人等手段的攻擊,如何保障射頻指紋識別系統的安全運作也同樣重要。
射頻指紋識別技術作為提高無線設備安全性能的重要發展方向之一,已經在近20年得到廣泛的研究。本文詳細總結了射頻指紋特征提取與識別的方法,進行了各種技術的歸納與比對,并簡要分析了各方案的特點。此外,對系統性能評估方法進行了介紹。最后,分析了現有方案中的諸多不足,提出了未來研究的趨勢并對研究方向進行展望。