唐奔宵, 王麗娜, 汪 潤, 趙 磊, 陳青松
(武漢大學 國家網絡安全學院,湖北 武漢 430072)
移動互聯網、智能終端、位置服務等新技術的融合催生了移動應用和服務(簡稱APP)的空前發展.借助于智能終端中的多樣化傳感器,面向個性化定制的移動應用更是為用戶帶來了豐富且便捷的生活體驗.這其中,以加速度傳感器、陀螺儀、方向傳感器等為代表的運動傳感器在APP 中得到廣泛應用.然而,移動服務的個性化定制依賴于個性化的數據采集,單個傳感器或者多個傳感器的組合可被攻擊者用來區分用戶的個體差異,進而帶來隱私問題.現有研究表明:運動傳感器能夠作為媒介被利用構建側信道攻擊[1],竊取用戶的敏感輸入[2,3]、獲得用戶的運動狀態[4,5]、識別并追蹤特點設備[6?9].更重要的是,基于運動傳感器的側信道攻擊易于實現,并且隱蔽性極強.與通話、GPS 等模塊不同,當前智能終端架構并沒有對運動傳感器賦予高等級安全的權限,APP 不需要任何權限即可訪問運動傳感器[10].惡意程序也可以通過Web 瀏覽器[11],或者利用系統漏洞繞過沙盒機制獲取傳感器數據[12].因此,如何對抗運動傳感器的側信道攻擊,是一個非常嚴重且至關重要的課題.
針對運動傳感器側信道攻擊的防護應該同時考慮運動傳感器的應用廣泛性和側信道攻擊的低門檻特點,需滿足可用性、普適性、和靈活性等需求.
1) 可用性:從應用角度來看,運動傳感器廣泛應用于多樣化的APP,針對側信道攻擊的防御方案不能影響用戶使用APP 時的正常工作流程,不能以犧牲用戶體驗的方式防御側信道攻擊.
2) 普適性:側信道攻擊的手段和目的多樣化,包括泄露敏感輸入、特殊用戶識別等,防御方案在攻擊手段面前應具有普適性.
3) 靈活性:智能終端的硬件和軟件定制化程度很高,進而產生很多差異化的操作系統版本,防御方案應該能夠盡可能地減少對APP 和操作系統的修改,同時,應能夠在各種操作系統和硬件設備下進行遷移,不應受到實施環境的約束.
盡管研究者提出了很多防御方案[13],現有的防御機制均不能同時滿足上述需求.已知防御方案可以分為以下4 類.
1) 抑制傳感器性能.通過降低傳感器的采樣頻率,甚至禁止APP 訪問傳感器[14,15]是最直接的對抗側信道攻擊的防御方案,但由于難以區分數據訪問的目的,限制傳感器性能的解決方案會嚴重影響APP 的正常運行,犧牲用戶體驗,不滿足可用性需求.
2) 傳感器訪問控制.通過APP 數據流的上下文信息判斷是否允許其訪問傳感器數據[16],但是訪問控制無法防御偽裝成合法APP 的惡意攻擊,因此普適性存在欠缺.
3) 隨機化方案.以最具代表性的系統鍵盤隨機化方案[17]為例,它通過隨機化虛擬鍵盤的布局,破壞傳感器數據與用戶輸入行為之間的映射關系.但是該方案對于以追蹤為目的的側信道攻擊無能為力,修改用戶已經非常熟悉的鍵盤布局對于用戶體驗而言也十分不友好,無法滿足可用性和普適性.
4) 傳感器數據破壞.文獻[18]提出,通過嗅探程序向用戶進行敏感操作過程中產生的傳感器數據中注入大量噪聲,破壞傳感器數據可用性.然而注入行為本身破壞了Android 的安全機制[19],依賴于對特定系統的修改,不具備靈活性需求.
針對上述研究問題,本文提出基于差分隱私Laplace 機制[20]的傳感器信號混淆方案,能同時滿足可用性[21]、普適性和靈活性的需求.我們對傳感器原始讀數進行混淆,設計了運動傳感器側信道防御方案.隨后,本文提出了側信道攻擊的理論分析框架,通過分別分析信號混淆對于特征數值、特征分布以及學習模型的干擾過程,論述了本方案的防御原理,論證了本方案對現有環境中幾乎所有運動傳感器側信道均具有防御能力.最后,基于11種典型側信道攻擊建立防御實驗,驗證了該防御方案對抗實際攻擊的效果.
本文研究的主要貢獻如下.
(1) 針對運動傳感器側信道防御不足的問題,揭示了運動傳感器側信道構建的通用模型.同時,提出了一種基于差分隱私的傳感器信號混淆防御方案,該方案對攻擊者和用戶完全透明,在可用性、普適性、與靈活性上均具有突出表現.
(2) 建立了抗側信道攻擊的防御干擾理論分析框架,結合具體運動傳感器側信道,詳細地分析了防御方案干擾側信道攻擊的各種因素以及干擾原理,論證了本文提出的運動傳感器側信道防御方案能夠有效對抗符合通用模型的各種類型側信道攻擊.
(3) 對8 種典型的輸入側信道和3 種追蹤側信道進行系統的防御實驗,驗證了本文提出的運動傳感器側信道防御方案在應對實際攻擊時的有效性,并對實驗現象進行了合理的討論與分析.
本文第1 節討論運動傳感器側信道的通用模型.第2 節介紹防御方案中的信號混淆方法.第3 節與第4 節分別從特征分布、特征數值和學習模型的角度討論信號混淆對側信道構建的干擾原理.典型傳感器側信道的防御實驗和結果分析在第5 節中呈現.第6 節介紹相關工作.第7 節對本文工作進行總結.
用戶使用移動設備時,設備的空間狀態會產生與用戶行為相關的改變.例如:當點擊手機屏幕某個位置時,手機會受外力的作用而轉動,移動設備中的運動傳感器能夠感應到運動狀態的改變,并以不同的形式(加速度、角速度、空間角度等)響應,攻擊者能夠利用“運動傳感器-運動狀態-用戶行為”之間的映射關系構建側信道,竊取用戶隱私信息.我們把以點擊位置為目的的運動傳感器側信道稱為“輸入側信道”,以用戶運動行為[4,5]為目的的側信道稱為“狀態側信道”.其中,輸入側信道常被用于泄露用戶的PIN(personal identification number)、支付密碼、實時聊天內容等隱私信息,具有更強的危害性.
運動傳感器還被用于構建“追蹤側信道”.研究結果表明:由于生產廠商、使用年限、物理損壞等因素影響,手機中的傳感器具有獨特的缺陷,導致實際測量的數據與真實值之間存在符合線性仿射變換的誤差,利用該特性能夠實現對特定設備的追蹤.通過對各種類型側信道的構建原理和實施過程進行分析,我們發現基于運動傳感器的側信道攻擊可以通過相同的模型描述,如圖1 所示.

Fig.1 Common pattern of motion sensor-based side-channel attacks圖1 運動傳感器側信道攻擊通用模型
圖1 中,映射系統表示側信道的利用對象,包含了傳感器數據與特定行為或設備之間的映射關系.定義基于傳感器讀數的特征空間χ?Rn為n維向量的集合,向量的維度n依賴于具體側信道實施方案.用戶行為空間由類標記集合Y={c1,c2,…,cK}表示,cK表示可能的行為,例如點擊屏幕的某個位置或者某臺具體設備.X是定義在傳感器特征空間χ上的隨機變量,Y是定義在用戶行為空間Y上的隨機變量,則運動傳感器側信道可以看做是用戶行為Y與傳感器特征向量X的聯合概率分布P(X,Y),構建側信道實際上是學習條件概率分布P(Y|X)的過程.運動傳感器側信道的構建包含了數據預處理、特征提取和分類器學習等3 個階段,根據側信道針對的具體目標和實施場景,側信道選擇的傳感器類型、特征屬性、分類器模型等存在差異.
由上述分析可得:無論哪種類型的運動傳感器側信道,其關鍵都在于用戶行為與傳感器之間映射關系P(X,Y)的學習過程[22].因此,可以通過干擾側信道的學習階段實現防御.對抗機器學習[23,24]領域中,研究者分別通過干擾學習模型的訓練階段和預測階段,有效地降低了機器學習的預測效果.然而,已有的對抗機器學習方法并不適用于運動傳感器側信道防御,主要原因在于:實際環境下,防御框架無法準確區分出側信道攻擊的不同階段.
針對上述問題,本文結合差分隱私的思想,設計了一種基于傳感器讀數混淆的防御方案,無差別地向傳感器讀數中注入少量噪聲,具體信號混淆方法將在第2.2 節介紹.
差分隱私是對通過算法消除個人隱私的數學定義,用于在保證一定統計數據精度的情況下,有效確保高度的隱私性.設ε為正實數,A為一隨機算法,A將數據集作為輸入.數據集D1和D2為非單一元素數據集,且2 個數據集僅相差1 個元素,若A的所有可能輸出的子集S滿足公式(1),則稱算法A是ε-差分隱私:

其中,概率取決于算法的隨機性.差分隱私中,某個查詢函數f的敏感度s由f在2 個相鄰數據集D1和D2上的最大差異|f(D1)?f(D2)|決定.
Laplace 機制是最常用的差分隱私機制,通過向查詢結果中添加受控噪音降低查詢結果的準確度.Laplace噪聲的概率密度函數為noise(x)∝exp(?|x|/β),x為概率密度函數中的自變量.在Laplace 機制下,滿足ε-差分隱私的A輸出副本可以表示為f(x)+Lap(s/ε).
差分隱私具有嚴格的數學證明,能夠在最大化攻擊者能力的前提下,保證用戶的隱私安全.這與側信道防御場景相似,即假設攻擊方能夠獲得盡可能豐富的用戶信息.另一方面,混淆方案的首要前提是盡可能地減少對用戶體驗的影響,需要隨機函數以較高的概率產生低值噪聲,例如負指數分布.然而,負指數分布產生的噪聲均為正值,進行噪聲注入后,所有的特征將向同一個方向進行平移,并不能最大化各類特征區間之間覆蓋.因此,由兩個不同方向的指數分布背靠背拼接在一起所構成的雙指數分布,即Laplace 分布,更適合進行側信道學習過程的干擾.通過注入服從Laplace 分布的隨機噪聲,某些維度上的統計特征可以近似地看成向正負方向同時進行平移,當各類特征區間接近時,特征樣本的覆蓋程度將被最大化,更大程度地降低了特征精度.詳細的防御原理將在后續兩節進行闡述.
此外,相比于相似對稱性的高斯分布等常見分布,Laplace 分布具有尖峰的特點.根據我們的研究,少量的噪聲足以對側信道造成顯著干擾,為保證數據的可用性和實時性,我們希望得到更多的低值噪聲.圖2 展示了相同尺度參數下高斯分布與Laplace 分布的概率密度函數,由圖中能夠看出,在輸出范圍內,Laplace 分布能夠以較高的概率輸出低值噪聲.雖然噪聲的數值越高在干擾模型學習能力上越具有優勢,但也降低了傳感器數據的可用性.而且經實驗發現,注入服從高斯分布的噪聲會對用戶體驗產生明顯的負面影響.綜合考慮差分隱私技術與防御場景需求,本文選擇以拉普拉斯分布產生隨機噪聲.

Fig.2 Probability density function圖2 概率密度函數
將統計特征提取步驟近似地看做查詢操作,為運動傳感器的每一維(Android 下運動傳感器通常包含3 個維度)的讀數實時添加符合Laplace 分布的隨機噪聲noise~Lap(0,βd)進行信號混淆,其中,

sd為當前維度d的敏感度,其值等于窗口范圍內傳感器讀數的最大值與最小值的差值.混淆因子ε表示信號混淆程度,由Laplace 的概率分布函數可知:ε越大,概率密度的尺度參數越小,產生高值噪聲的概率越大.
相比于合法APP 中傳感器的相關功能,傳感器側信道對數據的精度更加敏感,魯棒性更低.本文提出的運動傳感器側信道防御方案通過差分隱私中的Laplace 機制,以隨機概率向傳感器的當前信號x(n)注入隨機噪聲noise(n):

其中,xo(n)表示混淆后的傳感器讀數.我們將該方案稱之為“平移混淆”,對傳感器的響應時間也以相同方式進行混淆.為實現對用戶和側信道攻擊方的完全透明,對框架層中的android_hardware_SensorManager模塊進行修改.APP 在應用層實例化SensorManager對象,重寫回調函數onSensorChanged,當傳感器檢測到設備狀態變化時,傳感器數據將經由android_hardware_SensorManager模塊向應用層的回調函數反饋.我們在框架層中添加一個緩存對象用于存放底層響應的傳感器數據,并實時注入符合Laplace 分布的受控隨機噪聲,若隨機噪聲高于當前讀數一定比例,則重新產生隨機噪聲.信號混淆具體方法可參考我們先前的研究[21].
為了保證合法應用程序中傳感器相關功能的正常使用,將噪聲的程度控制在一定范圍內.然而,運動傳感器側信道對輸入數據中的噪聲(例如環境中的白噪聲)具有一定的魯棒性,過少的噪聲可能難以有效降低側信道攻擊的成功率.此外,由于具體實現方案和攻擊場景的差異,基于信號混淆的防御機制能否普適地對抗側信道攻擊有待驗證.因此,后續兩節中我們將結合具體的輸入側信道和追蹤側信道攻擊,分析噪聲注入對攻擊的干擾原理和影響因素,論證防御機制有效性.
參與研究分析的設備見表1,其中包含了當前市場上主流手機生產廠商的多種型號設備以及操作系統版本.實驗與分析過程中,所有設備的采樣頻率均為50HZ.

Table 1 List of devices表1 研究設備列表
近年來,雖然指紋、人臉識別等生物認證的研究趨于成熟,但是字符密碼、圖像密碼等依靠用戶輸入的傳統身份認證機制仍然在市場中占主要地位[25].我們篩選出研究領域中具有較大影響力的8 輸入側信道做為案例進行研究,各個輸入側信道的詳細信息見表2.
參與研究的追蹤側信道見表3.

Table 2 List of input side channels表2 輸入側信道列表

Table 3 List of tracking side channels表3 追蹤側信道列表
不同于機器學習中的噪聲(標簽噪聲和輸入噪聲),直接在傳感器讀數中注入的混淆噪聲具有全局性,即干擾行為同時存在于側信道的學習和攻擊過程.為了驗證防御方法在不利環境下的防御性能,假設樣本同時具有正確性.由于干擾的全局性特點,側信道的訓練集和預測集中的樣本分布會發生同步改變,因此,傳統機器學習中的噪聲干擾原理在當前場景下并不適用.本節中,我們首先驗證數據集的樣本分布情況,然后對特征數值受噪聲注入的影響狀況進行分析.
運動傳感器側信道的核心是從已有的數據中學習用戶行為與傳感器數據之間的映射規律,并對未知的行為做出決策.因此,訓練集中的數據應具有較好的總體代表性,即假設訓練集與預測集獨立同分布.因為噪聲的全局性,對于傳感器讀數的混淆行為并不會對數據集的同分布假設造成影響.
重新定義X為原始傳感器特征空間中任意維度上的隨機變量,Y為引入噪聲后的改變量,Z為添加噪聲后的特征隨機變量,易得X,Y獨立分布.添加噪聲可以看做在當前特征維度引入1 個或多個獨立Laplace 分布的隨機變量,而注入行為可以分解為“加、減、乘、除”這4 種基本操作.
對于加法操作,若(X,Y)的概率密度為f(x,y),則Z=X+Y的分布函數為

所以,Z的概率密度fz(z)為

通過加法添加噪聲后,訓練集與預測集之間保持相同分布,分布函數由噪聲分布和原始特征分布共同決定.同理可得,減法操作Z=X?Y的概率密度函數為

對于乘法操作,Z=XY的分布函數可以表示為

新的特征隨機變量Z的概率密度fz(z)為

同理,以除法形式添加噪聲的新特征變量Z=X/Y的分布函數可以表示為

除法操作后,特征隨機變量Z的概率密度為

因此可知:混淆后的新特征集服從與隨機噪聲相關的概率分布,側信道訓練集和測試集之間仍然滿足獨立同分布的假設.
由第1 節可知,運動傳感器側信道的學習階段需要從傳感器讀數中提取統計特征構造特征向量.特征值受到噪聲信號的具體影響依賴于統計方法以及特征的空間分布.以時域和頻域下典型特征為例,討論噪聲對于特征數值的影響.
首先,隨機噪聲符合期望為0 的Laplace 分布,當傳感器讀數的長度足夠時,平移混淆方法對于平局值、均差等特征產生很小的影響.設當前傳感器的某個維度上的信號序列長度為n:{Xi}:=x1,x2,…,xn,則時域中均值M特征值描述為

設傳感器讀數xi處以平移混淆方式注入隨機噪聲,則混淆后的樣本平均值可以表示為

由公式(12)得,平移混淆并不會影響側信道的平均值特征.類似地,經過混淆后的時域均差D特征為

考慮噪聲數值的符號,上式可以表示為

在混淆程度較小的情況下,小數值噪聲的出現概率更大,噪聲的均值更小,均差特征受到噪聲的影響有限;隨著混淆程度增大,均差特征被干擾的程度隨之增加.注入噪聲對于非線性統計的特征具有更明顯的影響.以時域下標準差σ與均方根R為例,經平移混淆后,傳感器讀數序列的標準差特征σo表示為

經平移混淆后的均方差屬性Ro為

由公式(15)和公式(16)得:平移混淆會對標準差、均方根等非線性統計特征產生較大影響,影響程度依賴于傳感器讀數序列以及隨機噪聲強度.在實際數據集中,通過對已知傳感器側信道中時域特征進行統計得出:平移混淆下,特征隨混淆因子增大而呈現非下降趨勢(上升或保持),其中包括了極值、方差等常用特征,以及偏斜度、峰度、相關系數等非常用特征.以平均值、標準差和均差特征為例,圖3 展示了3 種特征受平移混淆的影響差異,特征提取自線性加速度x方向.圖中橫坐標表示對傳感器信號的混淆程度,縱坐標表示特征的數值.可以看出,與上述分析結果一致:均值特征基本不受添加噪聲的影響;均差的影響隨混淆影子的增加而呈現線性增長;受到混淆影響最大的為均方差特征,干擾呈現指數型上升.

Fig.3 Value changes of time domain features of linear acceleration in x direction under different levels of translating obfuscation圖3 不同程度平移混淆下線性加速度x 方向上時域特征數值變化
某些輸入側信道[31]和追蹤側信道[7]會提取頻域特征作為時域特征的擴充,攻擊者將傳感器產生的信號序列作為離散的信號,并通過離散傅里葉變換得到信號的頻域表示{Xk}:=X0,X1,…XN?1,其中,

設傳感器讀數序列的離散傅里葉變換為X(ω),噪聲序列noise(n)的離散傅里葉變換為Noise(ω),其中,ω=ej2π/N,則根據離散傅里葉變換的線性特性可得:

由公式(18)可知,平移混淆對傳感器數據頻域的影響僅與引入的時域噪聲相關.時域噪聲信號在時間軸上服從隨機分布,因此,頻域噪聲信號的分布與時域噪聲分布無直接關系.當混淆程度較小時,時域上的噪聲難以改變原始信號的變化趨勢,平移混淆在信號頻域上的干擾主要體現在高頻部分;隨著混淆因子的增大,信號的低頻部分也會出現明顯的干擾.圖4 顯示了頻域中,點擊按鍵“1”時產生的x維度上加速度信號受混淆因子ε=5 平移混淆的影響情況,圖中橫坐標表示頻率,縱坐標表示幅度.
可以看出,由于Noise(ω)≥0,信號幅度在所有頻率上均會產生非零增長.因此,基于頻域提取的絕大部分特征都會受到信號混淆的影響.
以標準差特征為例,設樣本在頻域的標準差為σs,進行平移混淆后,頻域標準差改變為

由公式(19)得:頻域標準差特征的改變程度與原始信號及噪聲信號相關,噪聲信號的高頻干擾對于頻域標準差特征的影響更大.

Fig.4 Impact on frequency signal of acceleration in x direction with obfuscation level ε=5圖4 混淆程度ε=5 的平移混淆對于加速度x 維度上頻域信號影響
考察K-不規則性特征IKs:

K-不規則性的改變量僅與噪聲在頻域的分布有關.圖5 直觀地展現了平移混淆對于頻域標準差和K-不規則性特征的影響情況,其中,混淆因子ε∈{0,1,5,9},特征提取自點擊按鍵“1”,“3”,“7”,“9”,“0”這5 類事件對應的加速度x維度上的信號.

Fig.5 Impact on frequency features K-regularity and std deviation with obfuscation level ε∈{0,1,5,9}圖5 混淆程度ε∈{0,1,5,9}的平移混淆對頻域K-不規則性與標準差影響情況
圖5 中,橫坐標表示樣本的頻域標準差特征,縱坐標表示K-不規則性特征.混淆因子較小時(圖5(b)),平移混淆對于傳感器信號頻域的干擾有限,標準差和K-不規則性沒有出現明顯的變化;混淆因子增大后,2 類特征的改變程度逐漸增強(圖5(c)、圖5(d)).此外,由于噪聲信號在時間上具有隨機性,頻域特征的改變沒有穩定趨勢.
綜上所述,傳感器讀數有限的情況下,平移混淆會導致絕大部分統計特征產生改變,各類特征由于提取方法的差異,受平移混淆的影響程度存在明顯差異.混淆行為對時域特征的影響與噪聲的概率分布相關,但在頻域特征上的影響無明顯規律性.根據機器學習原理,特征對于學習的貢獻能力各異,因此,上述結果必然影響模型的預測.
本節將從學習模型的角度分析信號混淆對抗運動傳感器側信道可能存在的影響因素.信號混淆對于輸入側信道和追蹤側信道的物理意義不同,且攻擊場景存在很大差異,因此分別討論輸入側信道和追蹤側信道下的模型受影響情況.
研究[33]表明:當點擊手機屏幕時,用戶具有獨特的行為習慣(敲擊力度、時間間隔等),輸入側信道中,待預測類別之間僅存在由于點擊位置不同而產生的微弱行為差異.同時,手機屏幕的尺寸進一步限制了行為差異,這些因素反應在特征空間上表現為各個類別之間的邊界模糊.
4.1.1 特征區分度分析
信號混淆可以被近似地看作對傳感器數據進行平移,根據第3 節中的分析結果,混淆操作對特征的影響差異性可能導致類別之間的混疊程度增加,降低各類別的區分度,使得類別之間的邊界變得更加模糊.
我們通過互信息(mutual information,簡稱MI)[34]描述各維度上特征在特征空間中的區分度,互信息定義為

其中,U,V分別表示k-means 聚類和真實聚類,|?|表示當前類別中的樣本數量.首先記錄傳感器在用戶輸入過程中產生的加速度a、角速度g、方向角度o和磁強m信號,根據數字鍵盤布局分為10 個類別,分別提取已知輸入側信道中共同的典型時域和頻域特征,對各個維度的特征計算互信息,結果如圖6(a)所示,其中,橫坐標表示具體特征類型,縱坐標表示對應特征的互信息值.

Fig.6 Mutual information of typical time and frequency features of 4 motion sensors’ readings圖6 4 類運動傳感器數據的典型時域和頻域特征互信息
從圖6(a)中可以看出,不同傳感器下的特征之間互信息分布存在明顯差異,說明各種類型的運動傳感器對于輸入行為具有特殊的映射形式.此外,相同傳感器下的不同特征之間的區分度差異較大,例如,時域上最大值(Max)的互信息約為0.76,而最小值(Min)的互信息值只有0.18 左右.對傳感器信號進行混淆因子ε=5 的信號混淆,再次計算每個特征維度的互信息,結果如圖6(b)所示.比較圖6 子圖,信號混淆后的數據集中,部分特征的互信息降低,表明特征在對應維度上的混疊程度增加.
特征區分度的改變會影響邏輯回歸、決策樹等學習模型,這些模型通過尋找最優決策邊界的方式,構建空間判別類域.根據對已有側信道研究的統計,決策樹與邏輯回歸模型都屬于運動傳感器側信道的最佳學習模型,因此,類別之間區分度的降低是信號混淆能夠抵抗輸入側信道的可能原因之一.
以決策樹模型為例,討論區分度對輸入側信道的影響過程.決策樹以重要性描述特征之間的相對區分度.設當前樣本集合D中具有y類樣本,pk(k=1,2,…,y)為集合中第k類樣本所占的比例,集合D進行決策的信息熵表示為

以信息增益作為節點劃分準則,設特征向量中的連續屬性a有n個可能取值,并按大小排序{a1,a2,…,an},t為屬性a的劃分點,D可以被劃分為tD?與tD+,將相鄰區間[ai,ai+1)的中位點作為候選劃分點,考察包含n?1 個元素的候選劃分點集合Ta={(ai+ai+1)/2|1≤i≤n?1},則連續屬性a對樣本集D進行劃分所獲得的信息增益為

Gain(D,a,t)是D基于劃分點t二分后的信息增益,信息增益越大,a確定的情況下對于當前剩余樣本分類的重要性越強.由于節點使用連續屬性劃分后,后續節點依然可以使用相同屬性進行劃分,因此,相對重要性更強的關鍵特征將會主導模型的學習預測走向[35].若決策樹中相對重要性高的特征的實際區分度降低,則模型的整體預測能力差.Accessory 側信道利用決策樹模型學習傳感器信號特征,提取加速度3 個維度上加速度傳感器數據和歐幾里得級數的時間域統計特征,構建輸入側信道.混淆因子ε∈{0,1,5,9}時,決策樹訓練階段各個特征的重要性變化過程如圖7 所示.

Fig.7 Impact on translating obfuscation on feature importance of decision tree model圖7 平移混淆對決策樹模型的特征重要性影響
圖7(a)~圖7(c)中顯示了不同混淆因子下各類特征的相對重要性,橫坐標表示側信道中的特征類型,縱坐標表示相對重要性.平移混淆對于不同特征重要性的影響情況各異:原始特征向量中相對重要性較小的特征在注入噪聲后的數據集中依舊保持低區分度;傳感器3 個維度上的均方根RMS和最大值Max 受到平移混淆的影響較為明顯,其中,均方根的相對重要性隨混淆程度增加而增強,最大值呈現相反趨勢.圖7(d)中顯示了傳感器x方向上均方根和最大值的互信息變化情況,2 類特征在對應維度上的區分度均隨混淆程度的增大而降低.最大值特征在模型中的相對重要性降低,同時區分度也降低,因此,該特征不會為模型做出有利貢獻;均方根特征逐漸主導模型預測,但是該特征的互信息呈下降趨勢,各混淆程度下的區分度均低于原始數據集中最大值的區分度,最終導致側信道攻擊準確率下降.
我們分別隨機抽取了訓練集和測試集中部分樣本特征,比較信號混淆前后的實際分布情況,如圖8 所示.對比圖8(a)和圖8(c),平移混淆使得樣本在對應維度上的混疊程度增加,同類樣本點之間的分布分散.原始數據集下最大值特征的相對重要性較高,因此決策邊界垂直于縱坐標方向;經過平移混淆后(圖8(c))最大值特征的區分度急劇下降,均方根獲得了相對更高的重要性,決策邊界垂直于均方根所在的橫坐標方向.然而,此時均方根的區分度不及原始數據中最大值的區分度,新決策邊界兩側出現了更多的錯誤類別.

Fig.8 Distribution of maximum and root mean squre in training set and prediction set with obfuscation level ε∈{0,9}圖8 混淆程度ε∈{0,9}平移混淆下訓練集與預測集中最大值和均方根分布情況
定義樣本“1”正例,樣本“9”反例,上述側信道的分類結果的混淆矩陣見表4.其中,TP,FP,TN,FN分別表示真正例、假正例、真反例、假反例的樣例數.正例的查準率Pp和反例的查準率Pn表示為

由于主導決策邊界的特征區分度變低,預測集中(后文圖10(d))中的假正例FP和假反例FN增加,真正例TP和真反例TN數量減少,即ΔFP,ΔTN≤0,經混淆后的查準率改變為


Table 4 Confusion matrix of prediction result表4 預測結果混淆矩陣
我們在頻域特征中進行同樣的實驗,并得到了相似的結果.由上述實驗分析可以得:平移混淆能夠通過降低特征之間區分度的方式,對抗基于空間判別類域的輸入側信道攻擊.綜上所述,各維度上特征之間區分度的降低是信號混淆方案抑制輸入側信道攻擊的原因之一.
4.1.2 特征值域分析
研究過程中發現:當使用t-SNE(t-distributed stochastic neighbor embedding)算法[36,37]對特征樣本進行降維后,未經信號混淆的原始數據中,各個類別之間無法從視覺上進行區分.然而對所有特征進行歸一化后再進行降維,各個類別之間出現了明顯的邊界.因此可以猜測:原始特征向量中可能存在的數值值域較大但區分度低的屬性,進而導致降維后各個類別之間難以劃分.
因同樣以特征間距離描述相似性,k-NN 等模型的分類效果也會受到特征值域影響.不同于決策樹等模型,k-NN 不具備伸縮不變性.根據第3.2 節和第4.1.1 節,添加噪聲導致某些特征的值域擴大,并且降低特征的區分度,因此,信號混淆可能通過增大低區分度特征的值域方式,主導側信道偏向錯誤預測方向.我們對經平移混淆的數據集進行離差歸一化(min-max normalization),重新通過k-NN 構建Accessory 側信道,實驗結果如圖9 所示.

Fig.9 Impact of normalization on prediction accuracy of single tap position of Accessory side channel圖9 歸一化對于Accessory 側信道單次點擊預測準確率的影響
圖9 中,圓點表示Accessory 側信道在歸一化后的混淆數據集中預測準確率,三角形表示側信道在未歸一化數據集中結果.相同混淆程度下,歸一化能夠有效提高Accessory 側信道攻擊準確率,說明特征向量中始終存在具有大值域、低區分度的特征.隨著混淆因子的增大,歸一化的效果逐漸降低,混淆因子ε=0 時,歸一化提高了Accessory 單點預測準確率約18 個百分點;混淆因子ε=9 時,提升的準確率只有約7 個百分點.高混淆程度下,注入大數值噪聲的概率增加,歸一化導致特征精度丟失.假設歸一化能夠完全去除特征數值范圍的影響,那么歸一化后提高的準確率近似地等于特征值域對側信道的影響能力,因此可以得出結論:平移混淆導致特征值域改變并不是側信道攻擊受到抑制的原因.
我們在其他輸入側信道的驗證中得到了相似的結果.綜上所述,輸入側信道的特征向量中,存在具有較大值域且區分度低的特征,引導k-NN 等不具備伸縮不變性的模型的預測方向.然而,特征值域的影響在平移混淆中隨混淆程度的增長而降低,所以信號混淆雖然會導致特征的值域改變,但并不是輸入側信道攻擊受到抑制的主要原因.
追蹤側信道基于傳感器存在獨特誤差的背景,運動傳感器由硬件缺陷產生的誤差服從一次線性仿射變換,平移混淆可以理解為干擾傳感器讀數的偏移誤差.圖10 描述了平移混淆方案對傳感器讀數的影響意義.圖10中,橫坐標軸表示傳感器某一方向的真實信號,縱坐標軸表示該方向上的讀取信號,紅色實線與藍色實線分別表示設備1 與設備2 的傳感器線性誤差關系.假設初始環境下,傳感器讀數完全符合誤差假設,2 臺設備只有在極小范圍內(圖10 中圓圈范圍)無法通過誤差關系進行區分,我們稱該范圍“設備盲區”.通過平移混淆注入隨機噪聲后,真實值與讀數之間的線性誤差關系在縱坐標方向上發生了平移,誤差關系在圖10 中虛線區域內波動,設備盲區擴大到圖中陰影部分.

Fig.10 Interference principle of data obfuscation for tracking side channel圖10 數據混淆對追蹤側信道的干擾原理
4.2.1 特征區分度分析
誤差特征是追蹤側信道的基礎,因此,誤差的區分度在一定程度上決定了追蹤側信道的攻擊效果.追蹤側信道攻擊場景中,設備與設備之間傳感器硬件差異明顯,通常情況下,不同設備傳感器的偏移特征和增益特征具有很高的辨識度.FingerPrint[38]側信道通過偏移特征與增益特征構建2 維特征向量,實現對設備的識別.從表1 實驗設備中隨機選擇4 臺設備,計算加速度傳感器在z方向的增益特征和偏移特征,重力加速度g=9.7936 為實驗地點的重力加速度,二維特征空間分布如圖11(a)所示.

Fig.11 Impact on hardware error of accelerometer by data obfuscation with ε=1圖11 ε=1 數據混淆對加速計硬件誤差影響情況
從圖11(a)中能夠看出,不同設備的線性誤差在增益特征與偏移特征維度上均具備良好的區分度,特征向量在2 維特征空間中分布清晰,僅從視覺上就能夠精確地識別設備類型.對數據集分別進行混淆因子ε=1 的平移混淆后,特征分布如圖11(b)所示.平移混淆導致設備誤差關系的盲區變大,不同設備樣本之間在特征空間中出現了重疊,區分度下降.理論上,干擾傳感器間的誤差關系的行為將直接影響從傳感器讀數中提取的其他特征.
我們在實驗數據集中加速度(包含重力影響)和線性加速度中提取了表3 中3 類追蹤側信道所涉及的共240類特征計算互信息,結果如圖12(a)所示.追蹤側信道中設備之間的差異性明顯,大部分特征具有很高的分區度.對上述實驗數據集進行混淆因子ε=1 的平移混淆后,再次計算各特征的互信息,結果如圖12(b).除極個別特征以外,信號混淆使得追蹤側信道中大部分特征的區分度降低,高區分度特征的數量有所下降.總體而言,特征的平均區分度遠低于未混淆數據集特征下區分度.

Fig.12 Impact on mutual information of typical tracking side channels’ features by data obfuscation with ε=1圖12 典型追蹤側信道特征互信息受ε=1 數據混淆影響
追蹤側信道的重要性實驗結果與輸入側信道重要性實驗相似,不再重復討論.綜上所述,信號混淆行為通過破壞傳感器讀數誤差關系,影響基于傳感器讀數的各類特征區分度,進而實現對追蹤側信道攻擊的防御.
4.2.2 特征值域分析
本節中討論特征值域改變對于追蹤側信道的影響情況.與輸入側信道特征向量類似,追蹤側信道的特征向量中同樣存在低區分度、大數值的屬性.通過對特征樣本進行歸一化處理,能夠使得進行t-SNE 降維后的各類別之間辨識度提高,不同設備之間將會呈現清晰的聚類結果.
為了探究平移混淆對特征值域以及不具備伸縮不變性學習模型的影響,我們拆分3 種輸入側信道特征向量中的時域特征和頻域特征,枚舉所有可能的特征組合,并通過k-NN 進行學習.實驗發現:當其他特征與偏斜度等個別特征組合時,模型的預測能力隨信號混淆的引入出現明顯波動.偏斜度是對傳感器數據分布偏斜方向及程度的度量,由于追蹤側信道的攻擊場景中所有傳感器數據均在設備靜止平放時收集,導致偏斜度接近.進一步分析發現:在未經混淆的特征中,偏斜度具有遠超其他特征的值域,能夠主導模型的預測結果.偏斜度與均差在平移混淆下的分布情況如圖13 所示.
圖13(a)為原始數據集中偏斜度和均差特征的分布情況,均差特征維度上(y方向),不同設備之間區分度明顯;而偏斜度特征維度上(水平方向),各類樣本重疊率非常高.觀察特征的值域,均差雖然具有較高的區分度,但其值域僅為[0,0.05],遠遠低于偏斜度的值域[?3,3],因此,模型的表現受到偏斜度特征的主導.對數據集進行混淆因子ε=1 的平移混淆后(圖13(b)),偏斜度的值域并沒有受到信號混淆的影響,然而均差的值域改變為[0,20],模型的主導特征由偏斜度轉變為具有較高區分度的均差,側信道的預測準確率反而提升.
將偏斜度這一類具有大值域且區分度低的特征歸一化后,以k-NN 構建的 MobileTracking,Tracking Exploring 和AccelPrint 側信道在原始數據集中準確率分別提高至98.4%,97.1%,98.9%.考慮實際側信道攻擊時,攻擊者如果通過歸一化提高側信道攻擊能力,則幫助消除了特征值域的影響,信號混淆能夠有效抵抗追蹤側信道,若攻擊者未進行數據預處理,則側信道的攻擊能力較差,即便信號混淆可能導致攻擊準確率出現略微提高,但仍然不足以造成威脅.

Fig.13 Impact on the distributions of skewness and average deviation by translating obfuscation圖13 平移混淆對偏斜度特征和均差特征的分布影響
根據以上原理分析可以得出:基于信號混淆的防御方案在對抗輸入側信道和追蹤側信道時,主要通過降低特征之間區分度、增加混疊程度的方式實現側信道防御.理論上,由于傳感器側信道攻擊中需要識別的類別之間邊界接近,因此即使低程度的信號混淆也能夠影響攻擊的成功率,并且該防御方法對于符合運動傳感器側信道通用模型的攻擊均有效.
本節對表2 中8 種輸入側信道進行傳感器信號混淆防御實驗.實驗數據收集于15 位參與者,分別覆蓋了多個年齡段與性別.實驗中,因為數據集改變后實際最優分類器可能與文獻中使用的建議分類器不符,所以首先通過不同的機器學習模型構建側信道,找出上述側信道在當前數據集下最合適的分類器模型.各輸入側信道在本文數據集下的分類器模型比較結果見表5.

Table 5 Impact of learning model on experimental input side channels (%)表5 實驗環境下學習模型對輸入側信道的影響 (%)
表5 中,除Practicality 側信道外,準確率均表示側信道預測10 類點擊位置(數字鍵0~9)的單次預測情況.Practicality 側信道攻擊的對象為完整的輸入序列,因此準確率表示對10 種6 位長度輸入序列的單次預測結果.在當前數據集下,邏輯回歸模型與隨機森林模型的表現情況相對較好,部分輸入側信道使用k-NN 模型也能達到較高的預測準確率.
下一步,利用平移混淆對傳感器原始數據集進行信號混淆,從中隨機選取訓練集與測試集進行50 次重復實驗,取實驗結果的均值作為最終結果.為避免學習模型干擾,我們選取上述6 種學習模型中表現最好的4 類模型分別構造8 種輸入側信道.表6 為各輸入側信道分別在混淆因子ε∈{0,1,2,3,4,5,6,7,8,9,10}的平移混淆下單次點擊預測準確率分布情況.

Table 6 Results of defense experiment against input side channel by translating obfuscation (%)表6 平移混淆對抗輸入側信道實驗結果 (%)
由表6 中的實驗結果可看出,由于噪聲的注入降低了各點擊位置對應特征之間的區分度,所以在任意模型下,通過對傳感器讀數進行平移混淆均能夠有效地降低所有8 種輸入側信道的攻擊準確率.隨著混淆程度的增大,防御效果越發明顯,各側信道最優模型下混淆程度ε=1 時,準確率平均下降約1 個~9 個百分點;當混淆程度增加至ε=10 后,預測準確率平均下降約13 個~27 個百分點.此外,側信道的初始預測準確率越高,信號混淆導致的準確率下降幅度越明顯.
輸入側信道的單次點擊預測誤差會隨著預測序列長度的增加而累積,以攻擊效果最優的Textlogger 側信道為例,攻擊長度為4 的PIN 時,未進行信號混淆情況下,側信道的平均成功率約為32%,即有約9 成的概率在6 次嘗試之內攻破PIN.進行了混淆程度為ε=1 的平移混淆后,Textlogger 攻擊PIN 的平均成功率為21.5%,達到相同的破解概率需要10 次嘗試.當混淆因子增加到10 后,嘗試次數至少需要45 次,但是大多數智能設備在自動鎖屏前僅允許5~10 次失敗,因此,由平移混淆實現的側信道防御方案能夠有效抑制輸入側信道攻擊.
雖然追蹤側信道的相關研究在運動傳感器側信道領域的比重較小,但是由于追蹤側信道實施的前提假設更少,且不同類型設備的傳感器硬件誤差存在明顯差異,追蹤側信道的威脅同樣不容忽視.本節中,我們對表3 中的3 種追蹤側信道進行實際攻防實驗.將表1 中的10 臺設備正面朝上水平放置,以5s~7s 內的加速度傳感器、陀螺儀和方向傳感器信號做為獨立初始樣本,識別對應設備.
與輸入側信道實驗一致,為驗證數據集的可用性以及數據集對于學習模型的影響,首先使用多種機器學習模型實現上述追蹤側信道攻擊.通過不同學習模型實現的追蹤側信道在原始數據下的攻擊結果見表7.

Table 7 Impact of learning model on experimental tracking side channels (%)表7 實驗環境下學習模型對于追蹤側信道的影響 (%)
表7 中的結果表明:在本文數據集中,隨機森林模型更適合構建TrackingExploring 側信道與AccelPrint 側信道,決策樹模型更適合于構建MobileTracking 側信道.下一步,通過平移混淆對傳感器數據添加隨機噪聲,混淆因子ε∈{0,1,2,3,4,5,6,7,8,9},分別使用隨機森林、決策樹和k-NN 模型構建3 種追蹤側信道,實驗結果見表8.

Table 8 Results of defense experiment against tracking side channels (%)表8 追蹤側信道對抗實驗結果 (%)
根據表8 中的實驗結果,信號混淆對于追蹤側信道的干擾主要呈現于兩個方面.
· 首先,防御機制應對不同學習模型時存在差異,信號混淆能夠顯著抑制基于決策樹和隨機森林模型構建的追蹤側信道攻擊的準確率,但在對抗由k-NN 模型構建的追蹤側信道時反而產生反作用.該現象與第4.2.2 節中的分析結果一致,構建側信道所提取的特征當中存在數值較大且區分度低,但不易受噪聲影響的屬性,因此進行噪聲注入后反而導致攻擊準確率上升.然而,該情況并不會阻礙實際防御效果,因為側信道預處理過程中的歸一化能夠消除值域的干擾,即使未進行歸一化處理,提升后的攻擊準確率仍然遠低于其他模型下構建的側信道.
· 其次,混淆程度對于追蹤側信道防御效果的影響無關,雖然噪聲注入能夠立刻較大程度地抑制攻擊準確率,但是增加混淆程度并不能明顯增強對于追蹤側信道的防御效果,其原因在于設備之間硬件差異較大,導致對應樣本類別間的邊界比較清晰.
上述結果有利于決定實際防御過程中的傳感器信號混淆程度范圍,僅需考慮合法應用中傳感器相關功能對于噪聲的承受能力.
下一步討論待識別設備數量對側信道防御的影響情況.我們從表1 中隨機篩選5 臺設備樣本進行攻擊實驗,實驗中的追蹤側信道均由最優模型構建,實驗結果見表9.

Table 9 Impact of number of device on defense against tracking side channels (%)表9 追蹤側信道對抗效果受設備數量影響情況 (%)
比較表8 與表9 中的實驗結果,信號混淆方案的防御效果與設備數量成正比例關系,追蹤側信道待識別的設備數量越多,則防御效果越好.實際的攻擊場景中,待識別的設備數量可能遠遠多于10 臺,因而基于信號混淆的側信道防御機制能夠在實際應用中產生更加優異的對抗效果.
本節中,我們從應用方面驗證了本文所提出的運動傳感器側信道防御方案能夠有效干擾各種類型側信道攻擊,通過注入少量噪聲,即能夠在不影響用戶體驗的前提下實現無差別的運動傳感器側信道防御.該方案與側信道類型、側信道構建模型和特征無關,具有非常良好的普適性與防御能力.
6.1.1 輸入側信道
運動傳感器被廣泛應用于構建側信道攻擊,攻擊者通過學習傳感器數據與點擊行為之間的映射關系,推測用戶的輸入信息[2,3].加速度傳感器、方向傳感器、陀螺儀等運動傳感器都可以作為側信道媒介[39].Cai 等人[40]利用陀螺儀和方向傳感器構建了TouchLogger 側信道攻擊,首次指出按鍵產生的設備震動與鍵位之間存在高相關性,該理論成為了輸入側信道的最重要理論之一.TapLogger[30]側信道由陀螺儀和加速度傳感器實現,作者提出,通過加速度信號的波形區分點擊事件的發生.文獻[28]通過合理的特征處理,利用加速度傳感器與陀螺儀實現了對長序列文本輸入的有效攻擊.Noor 等人[41]的研究指出,相鄰點擊事件之間的手勢改變同樣能夠用于推測點擊位置;Negulescu 等人[42]在此基礎上實現了側信道的構建.除了Android 系統,Marquardt 等人[43]在iOS 下實現了輸入側信道,作者通過放置在鍵盤附近的iPhone 收集用戶敲擊鍵盤時產生的桌面震動信息,推測點擊行為.某些智能穿戴設備同樣能夠被用于構建運動傳感器側信道攻擊[14].
上述輸入側信道的實際攻擊目標均為用戶點擊觸屏的位置,因此在攻擊連續的輸入序列時會產生累計誤差.Aviv 等人[32]將側信道的攻擊對象改變為完整的輸入序列,通過擬合用戶輸入完整PIN 時產生的加速度信號,提取統計特征,識別特定的輸入序列.這類輸入側信道與基于行為特征的身份認證[44,45]方法非常相似.除字符密碼外,攻擊也適用于圖形密碼[46,47].然而,僅4 位長度的PIN 就存在104種排列組合,如何構建完整可靠的訓練集,是這類輸入側信道有待解決的首要問題.
6.1.2 追蹤側信道
追蹤側信道通過傳感器的硬件誤差,提取指紋信息作為識別設備的唯一標識.Bojinov 等人[38]通過提取加速度傳感器線性誤差關系中的增益誤差與偏移誤差,構建了追蹤側信道攻擊.當用戶使用移動設備訪問網站時,攻擊者可以在服務器端通過瀏覽器獲得加速度信息用于識別匿名用戶.除此之外,該研究還指出,麥克風等非運動傳感器同樣能夠幫助進行用戶識別.Das 等人[6]同樣通過Web 瀏覽器獲取加速度傳感器讀數,構建側信道進行用戶追蹤.不同的是,該側信道并沒有直接使用增益誤差和偏移誤差作為設備特征,而是提取其他統計特征用來反映傳感器的硬件標識.研究者分析了在實際的攻擊場景下追蹤側信道的表現情況[7],為提高側信道攻擊準確率,作者們新增了線性加速度傳感器和陀螺儀,并實施更合理的特征工程方案.Dey 等人[8]利用移動設備加速度傳感器的獨有特征構建追蹤側信道,在實驗環境和實際環境中均取得非常優異的表現.
針對移動設備鍵盤惡意按鍵推理攻擊的可行性已經被多個研究工作所證實,但是在保護方面研究較少.對傳感器進行訪問控制是一種可行的側信道防御方案.Conti 等人[16]提出了一種基于上下文的訪問控制機制,該機制可以將用戶從人工設置訪問權限中釋放出來,但是他們所實現的機制需要對已有的操作系統進行復雜的修改,而本文提出的方法只需要在框架層中嵌入少量程序.此外,限制訪問控制機制實際應用的最大問題在于無法防御來自具有合法權限的APP 所進行的側信道攻擊,相比之下,本文方法對應用層程序實現無差別防御.文獻[14]和文獻[15]提出,通過強制降低傳感器采樣頻率或禁止傳感器運行的方式防御傳感器側信道攻擊.然而,這種行為對于非惡意應用的影響非常嚴重,許多APP,例如射擊游戲等,需要較高的采樣頻率以達到用戶滿意的運行效果.我們的防御方案能夠在進行有效防御的同時,保證合法應用的正常運行.
Shrestha 等人[18]在用戶輸入敏感信息的過程中向傳感器讀數中注入強烈噪聲的方式完全破壞傳感器讀數,然而該方案不但可能造成正常應用程序的失效,還可能由于突破Android 的沙盒機制而被判定為惡意行為.此外,該方案容易被攻擊者利用注入有利于構建側信道的信息[23,24].由于無法準確判斷用戶何時進行敏感信息輸入,該方案仍然依賴于安全意識普遍較低的用戶決策.與之相比,我們的防御過程實施于系統框架層,不會被惡意攻擊者繞過或利用,此外,由于完全透明于應用,防御將不會有用戶行為的干擾.
輸入側信道的基本假設是攻擊者知道目標用戶使用的鍵盤尺寸和布局,Young 等人[17]首次提出隨機改變目標鍵盤的布局是針對輸入側信道攻擊的有效保護策略.在此基礎上,Maiti 等人[48]對默認布局中的按鍵大小、排序等采取不同程度隨機化,一定程度上平衡了隨機鍵盤策略的易用性和安全性.通過改變鍵盤布局的防御方法具有明顯的局限性:首先,改變廣泛使用且用戶已經非常熟悉的默認鍵盤對于絕大部分用戶而言是不友好的,而且除了系統的默認鍵盤外,很多APP(微信,支付寶等)自帶鍵盤,難以將鍵盤布局隨機化策略應用到所有APP中;其次,布局隨機化策略無法防御同樣利用運動傳感器的追蹤側信道攻擊.
已有的工作在以下兩個方面存在缺陷:首先,已有研究無法有效平衡用戶體驗與防御能力,要么犧牲用戶體驗來提高防御效果,要么保證了用戶體驗而防御能力較差;其次,已有的研究無法做到對各種類型側信道的普適防御.本文提出的防御方法有效地解決了上述問題:通過在系統框架層進行信號混淆,能夠對各種類型側信道的構建過程進行干擾,實現了該防御方案的有效性和靈活性.此外,我們在先前的工作[21]中分析了合法應用程序與側信道對于傳感器數據精度的差異,討論了各種類型運動傳感器相關功能的噪聲承受上界,提出了各類合法功能的建議混淆范圍,進而保證防御方法的可用性.與其他研究相比,該防御方案實現了防御能力與用戶體驗的平衡,具有優異的應用價值.
本文針對移動設備運動傳感器側信道攻擊,提出了基于Laplace 機制的傳感器信號混淆防御方案,并對防御原理進行了詳細和全面的理論分析.本文的防御方案中,通過平移混淆方式向傳感器讀數中無差別地注入服從Laplace 分布的少量隨機噪聲,在保證APP 正常運行的前提下,有效降低各種類型的運動傳感器側信道攻擊成功率.該防御方案部署在系統框架層,對于攻擊者和用戶完全透明,不會破壞系統原有安全機制,具有良好的可用性、普適性和靈活性.首先,對運動傳感器側信道的構建過程進行了分析,討論運動傳感器側信道通用模型;然后,從理論層面分析了信號混淆干擾運動傳感器側信道學習階段的原理,進而證明本文提出的信號混淆方案對于符合模型的傳感器側信道均有效;最后,對8 種典型的輸入側信道以及3 種追蹤側信道進行防御測試,驗證防御方案在應對實際攻擊時的有效性,其中,混淆程度ε=10 時,平移混淆降低輸入側信道單次預測準確率平均約19個百分點,降低追蹤側信道單次設備識別準確率平均約13 個百分點.本文的研究不僅能夠在側信道防御的實際應用中發揮積極作用,對后續運動傳感器側信道相關工作也具有重要的參考價值.