三亞學院信息與智能工程學院 鄒琴琴
隨著網絡環境以及結構的復雜化發展,各種數據信息呈現出爆發式的增長,海量的數據信息使得信息管理工作更加的困難。所以,需要不斷的加強信息安全管理工作,通過數據挖掘技術在大量的數據當中提取對社會發展以及經濟增長有用的信息。目前,網絡安全技術存在相應的問題,比如安全漏洞多、防護水平低等,這些在一定程度上影響到了網絡信息安全性。由此可見,對信息化時代數據挖掘產生的信息安全問題進行研究具有重要的意義。
隨著人工智能等科學技術的迅速發展,使得各種數據朝著指數增長的方向發展,因此需要在海量的信息當中獲取更多有價值的內容,從而滿足用戶的不同需求。但是不同行業對數據信息的實際需求存在著很大的差別,而通過數據挖掘技術能夠在各種數據信息當中提取到有價值的內容,能夠給數據的應用者提供完善的信息服務。
數據挖掘技術就是指從海量的信息當中快速地搜索到人們需要有價值的內容,利用現代化信息技術、大數據技術等獲取到相關的信息資源。能夠進行數據挖掘的信息數據需要是真實的、有效的,且經過獲取和篩選后得到的信息需要是對社會有意義的。在數據挖掘的過程中,相應的數據庫越大、信息量越大,其挖掘后的結果也更加的具有科學性、代表性,因此,數據挖掘技術的核心部分就是對數據的處理效率。
數據挖掘技術的方法主要包括數據關聯、數據分類及數據聚類等。利用數據挖掘技術,第一要對數據庫資源進行分析,提取出有價值的內容,同時進行加工處理,變為有利于進行數據挖掘的形式。第二,利用科學的數據算法對數據進行提取,同時進行評估,以便以簡單的方式呈現給用戶。大數據挖掘技術主要有數據的提取、預處理、深度挖掘以及評估等幾個過程。
在信息化時代背景下,個人信息數據收集隨處可見,海量的數據信息雖然可以給人們提供一定的便利性,然而在使用數據的過程中,該行為是不透明的,因此使得人們的隱私會受到危害。當個人用戶在享受一些機構提供的服務時,往往會簽訂相關的免責協議書或者合同條款等,這些聲明中往往包含用戶協議、隱私等。當簽署協議之后表明機構組織能夠利用數據信息給用戶提供相應的服務。在這一過程中,用戶的數據信息就會傳輸到互聯網當中。比如,當用戶使用共享單車的時候,就會獲取相應的位置信息以及時間等。此外,能夠進行云存儲服務的公司可以獲取用戶傳輸的文字、視頻、語音等內容。而能夠進行AI語音服務的機構就可以獲取用戶的位置、語音信息、關鍵字等。
在實際生活當中,很多因素都會使得用戶隱私出現暴露。由于智能化終端的廣泛應用,通過大數據技術,機構組織就可以獲取用戶的位置信息、聲音等。當用戶進行購物的過程中,與此相關的支付金額、賬戶、消費類型等內容也會上傳到互聯網當中。用戶的隱私問題一直在持續的發展,且產生大量的數據,而只有“事件”才能被保護起來。但是還存在很多的連續數據也與用戶的隱私相關,這部分不能得到有效的保護,給不法分子帶來可乘之機。
用戶以及設備都會產生很多的數據,然而數據之外的部分信息可能也會存在一定的隱患。根據相關學者指出,現階段互利網上僅存在20%的信息,而有80%的數據還游離在互聯網之外,并且大部分是作為垃圾數據的游離狀態。比如,用戶設備的日常數據,手機中刪除的照片、視頻等。這些數據都存在被傳到互聯網上的可能性,當數據信息進行處理之后就能夠獲取到很多隱秘的信息,從而帶來巨大的威脅。
除此之外,游離的數據按照目前互聯網中開放性的信息資源,并且進行邏輯推理之后能夠對機構等的數據安全帶來威脅。當用戶由于喜好等原因拍攝一些照片時,傳輸當網絡當中的時候,這些游離的信息就會被獲取到。然后分析組織再進行數據測試,利用卷積神經網絡模型開展深度學習。當建立好相應的模型之后,就能夠更容易的應用到數據的挖掘過程中。此外,根據人工識別分析能夠獲取到事件當中的主要內容。因此,在互聯網當中存在的大量的游離信息能夠對組織造成巨大的影響。
為了確保網絡信息的安全,需要提高網絡環境的安全性,按照現階段行業的發展現狀分析,第一,要對隔離以及訪問控制技術進行科學應用與創新。其中,不僅要完成物理層面的更新,還要不斷地加強邏輯層面的隔離,禁止一切未授權的網絡用戶訪問網絡資金。第二,合理的使用反病毒技術。木馬病毒等是威脅信息安全的重要影響因素,因此,為了加強數據信息的安全性能,可以建立一個科學的病毒預警和防護機制,一旦受到病毒的威脅與損害時,利用病毒檢測技術就能夠在較短的時間內檢測出來,同時完成對數據信息安全性的定性分析,及時的解決此問題。最后,在網絡系統當中加入數據統計分析功能,保證系統可以對用戶的訪問次數及時間進行記錄,并且對網絡環境的使用情況及時地進行反饋,保證網絡不會受到病毒的攻擊。另外,還要在網絡環境當中加入備份以及恢復等功能,這樣不僅能夠確保信息受到攻擊后不被刪除破壞,而且使得相應的信息在最短的時間內恢復到原來的狀態。
在進行數據挖掘的時候,需要確保挖掘信息的安全性,主要表現為數據的存儲安全、傳輸安全和信息的使用安全等方面。在數據實際挖掘的過程中,第一,要使得數據信息存在物理層面的邏輯完整性,其中,邏輯完整性以及保密性是保證數據安全的核心內容。當保密數據傳輸的時候,數據的安全性對其挖掘操作至關重要,現階段,在各種應用環境內,一般應用傳輸加密技術、數據完整性技術等來確保數據傳輸時的安全性。除此之外,在實際操作過程中,也要確保信息的安全性以及傳輸過程的準確性,防止出現信息丟失等問題。使用的安全性主要指當數據應用的時候必須對使用主體開展核驗以及校準工作,防止未經授權的用戶使用相應的數據資源,以便提高信息的安全性。
在數據挖掘技術的支撐下,解決信息安全問題需要構建科學的數據挖掘模型,可通過以下幾點:
第一,可以按照關聯性的分析結果來建立相關的數據模型,根據現階段的研究技術,關聯數據模型一般是利用外部攻擊的相關內容進行分析和總結,同時根據現階段應用的數據挖掘技術,展示出使用較為廣泛、效果較好的攻擊行為態勢。對于攻擊行為而言,主要包括攻擊類型、源地址以及目的地址等幾個部分,同時能夠表現出攻擊行為的主要特點。所以,在確保信息安全的過程中,需要對攻擊次數較多的行為進行綜合和分析,并且建立相應的數據模型,以便構建科學的數據體系。
第二,建立完善的事件預測機制。預測機制主要是指當對某一個事件的發展趨勢進行跟蹤調查的時候,通過數據挖掘技術里面的聚類算法,同時利用相應的演算過程判斷此事件能否是大規模的網絡攻擊行為,而面對大規模的網絡安全事件,其出現的次數并不是主要的研究內容,其中,需要重點關注的內容就是事件發生的擴散程度、面積以及相應的速度等。例如,在對數據信息進行檢測的過程中,如果出現某一種木馬病毒的IP地址數量迅速地增加,就需要引入充分的關注,所以出現這種事件的現象就可以看做一次網絡攻擊事件。除此之外,還要構建可控數量的預測模型。一般而言,可控數量的預測模型是對觀察事件的受控主機的增長情況進行分析與監控,能夠對事件的感染進行一個科學的判斷。通過對受控主機狀態的增長情況的分析,能夠在未察覺異常情況前采用有效的檢測方式,從而得出主機在受到攻擊后其數量出現大規模的增長,可以得出受控主機狀態的增長趨勢。例如,在監測的過程中如果出現木馬病毒等,并且主機之前從未發生過這種攻擊情況,在監測的時候發現主機被病毒感染,那么主機就處于受控情況下的增長狀態。
第三,可以建立分析和處理模型,此模型的建立一般是對相關的數據和事件進行處理,以便提升被控主機的處理水平。在模型分析的過程中,主要是對未處理過的主機以及處理效率等進行全面的評價,這樣就能夠得到主機處理能力的評價標準。
本文通過對信息化時代數據挖掘產生的信息安全問題的研究,使我們了解到了,在信息化時代背景下,數據挖掘產生的信息安全問題日益突出,給用戶的身份信息安全帶來了巨大的隱患,主要體現在對個人數據信息的影響以及“游離”數據對組織的影響等兩個方面。因此,需要建立安全的網絡環境,確保數據挖掘信息的安全性,同時構建科學的數據挖掘模型,從而保證網絡信息安全。