張長勝,周 洌,任小波,李 川
(昆明理工大學 信息工程與自動化學院,云南 昆明650500)
在促進業務信息化以及網絡化快速發展的同時, 信息化技術給用戶的業務信息系統帶來了越來越多的安全問題,惡意代碼是其中一個倍受矚目的安全問題[1-2]。
針對Android[3]系統的惡意代碼檢測技術主要有動態檢測和靜態檢測技術。其中,最經典的是基于惡意代碼特征指令序列的靜態檢測方法, 其通過分析軟件的源代碼等信息,與已知的惡意代碼進行匹配,檢測是否包含惡意代碼特征來確定,被廣泛應用于各種殺毒軟件。N.Peiravian[4]使用純靜態分析,通過提取 APK 的權限與 API 調用,并構建高維特征向量,使用機器學習的方法對數據集進行判斷,來確認軟件是否含有惡意代碼。董勝亞[5]提出基于 KNN 的 Android 平臺軟件異常監測模型。傳統的靜態檢測方法因為需維護樣本庫使得其應用受到制約。但是隨著云計算技術的發展,有效解決了傳統靜態檢測技術中樣本庫內容不斷增加的難題,使靜態檢測技術突破了樣本庫維護的瓶頸[6]。因此,本文采用基于粗糙集算法的方法,建立特征模型,提取權限特征、API特征,在機器學習算法的基礎之上,對安卓惡意代碼特征進行分析檢測。
在粗糙集(RS)中,特征屬性叫做故障案例,由決策屬性、條件屬性組成。相似性由特征屬性決定。在計算特征相似度時,不同特征屬性的權重也不相同[7]。到目前為止,確定屬性權重的方法分為3類:(1)基于Z.Pawlak屬性重要度的概念[8],通過代數的形式來算出屬性權重;……