于淑香 王浩
摘 要:大數據分析環境下的網絡安全系統優化算法應用,具有嚴格的控制原則。本文主要針對大數據環境下,網絡安全數據檢測算法應用形式進行探討,并針對大數據分析過程中容易產生的網絡安全隱患問題進行總結。可以作為網絡安全系統優化算法構建應用的技術參照,同時本文所提出的程序匯編控制方法具有實踐應用意義。經過大數據網絡安全系統優化算法改進實驗,最終得到一種局域網絡環境下更安全高效的運算處理系統。
關鍵詞:大數據分析;網絡安全;系統優化
中圖分類號:TP301 文獻標識碼:A
1 引言(Introduction)
大數據分析環境下對網絡系統進行優化構建,最常使用的安全檢測算法為模式匹配法、機器學習算法和指紋檢測算法。大數據分析環境下,算法指標提取是實現網絡安全優化的重要環節,對于算法指標提取控制,需要從大數據環境中確定一個分析范圍,所選取的算法指標應該具有針對性。能夠與網絡安全系統中的各項參數相匹配,保持一致共同實現大數據分析[1]。數據片段選擇可以作為網絡安全系統優化算法開展的針對對象,數據片段選擇不僅要從高效運算角度出發,更應該考慮處于大數據網絡環境中,數據自身存在的威脅。隨著數據分析下載任務進行發現風險隱患也能及時停止,避免將帶有病毒的數據下載到網絡資源存儲設備中,數據庫對接還需要選擇高效算法為連接基礎,算法幫助下數據資源之間存在差異性也能利用極端時間來調整一致。數據庫在網絡環境下,可以幫助提升算法應用安全性,數據庫對接和安全防護作用下所開展的各項算法應用也將順利進行。網絡風險與數據庫傳輸中的安全控制選擇,應該體現出數據庫的存儲能力,并對數據存儲中的各項資源,優先選擇安全部分來計算。
2 大數據分析環境下的網絡安全數據流檢測算法
(Network security data flow detection algorithm
in big data analysis environment)
(1)模式匹配算法
模式匹配算法根據大數據網絡環境下所得到的數據流,與網絡系統內預先設定的數據庫進行匹配,匹配結果保持一致的數據可以進入到優化運算中。模式匹配運算方法,并不是針對單個字符來進行的,而是能夠將字符整理成數據流集合。用于處理復雜的數據分析,通過數據匹配可以節省大量時間,模式匹配屬于深度開發算法,會在匹配過程中表達出不同數字符號特征,并將大數據分析過程中所傳輸的參數,整理成為特征一致的字符,這樣在傳輸和共享階段便不會出現匹配誤差。網絡環境中存在的安全威脅形勢多變,因此在對算法進行選擇時,應該體現出靈活多樣性,可以根據不同使用方向自動調整,整理成為安全的字符控制模式。
模式匹配算法中對于字符表達采用DFA模式,該種方法屬于一種正表達模式,會根據數據產生順序來進行匹配。該種方法具有較快的匹配速度,在運算效率上可以滿足大數據環境下網絡安全需求,但對系統內存要求十分高,需要同一DFA集合中,能夠同時滿足不同種數據分析變化。
(2)機器學習算法
機器學習算法屬于一種自動更新模式,能夠根據網絡環境下所遇到的不同隱患,來自動匹配算法防護模式。機器學習算法需要安全口令來進行驗證,通過安全驗證的信息數據更新,下載需求才可以得到滿足。機器學習法最常用在DPI系統上,數據流安全檢測中,可以在網絡環境中自動獲取數據更新包,并按照安全協議來進行下載資源與數據庫之間的匹配。匹配成功后視為所下載數據與系統安全內容相同,接下來的數據自動更新計劃也將能夠繼續完成。當機器學習算法應用中檢測發現數據流內存在風險隱患,會對此類信息特征進行采集,并整理成為集合保存在數據庫中,針對風險集合所構建的數據庫。在網絡信息環境下會自動發出警告,同時對已經識別的安全數據流進行防護,避免網絡病毒入侵到機器學習算法核心控制系統內[2]。該算法在數據流分類能力上是其他模式所難以達到的,由于需要對認定的風險項目進行二次識別,因此在機器學習算法應用中,運算消耗時間也比較大,適合應用在機械生產自動化控制中。
(3)指紋檢測算法
指紋檢測算法屬于網絡安全系統中的一種驗證模式,最常用在移動網絡設備中,可以對用戶啟動網絡系統身份進行識別與驗證。當以用戶身份發出請求時,在指紋識別檢測結果中表現出異常。該種算法會從兩個,方面來進行安全檢測,首先是對指紋驗證通過的用戶,會將所檢測得到的數據流自動匹配到安全訪問模塊中。另一部分沒能通過指紋驗證的用戶請求,將會被自動隔離,視為風險項目作出處理。大數據環境下網絡安全系統優化算法的改進,主要是針對運算速度提升與安全防護精準度來開展。為了可以不用在end+1-min_location>=w時,遍歷w窗口中的值,采用一個2*2的二維數組存儲當前的最小值、最小值后面的次小值及其位置。需要注意的是,此算法需要考慮這樣一個問題——當cur與min_location之間的距離大于w時,需要從次小值的位置到cur位置間重新選取最小值和次小值,而且要保證次小值在最小值的后面。大數據處理技術正在逐漸向移動網絡設備層面開發應用,不僅要對常規互聯網進行安全防護,更應該考慮移動網絡設備特征,形成一種符合移動網絡設備使用中安全防護需求特征的算法。指紋識別對于數據流的匹配過程比較簡單,會將預先存儲的指紋特征與請求指紋特征進行對比,相似度達到安全認證標準后便能夠通過請求。指紋庫生成如圖1所示。
3 大數據分析環境下網絡安全系統優化算法改進
(Optimization algorithm of the network security
system in the big data analysis environment)
(1)算法指標提取
為確保大數據分析速度,大數據分析中可以預先截獲數據流,針對于網絡安全系統中數據庫內信息相匹配的資源優先運算,并確定出文本邊框界定范圍生成數據庫后,利用網絡信息傳輸環境,來構建文本框[3]。針對網絡環境下,可能會產生的風險隱患,形成多樣性防護系統。假設文本塊字數為n,首先使用Karp-Rabin算法公式,生成n-k+1個數字。對n-k+1個數,選取前W個數字(1,...,W)中的靠右邊的最小值,下一次選取第2個到第W+1個數字中的最小值,依次進行下去,一直到第n-w+1個字符。將這些最小值設為邊界,得到(b1,b2,b3,b4,…)。回到原文本塊中,取文本塊中的第b1個字符到第b2個字符間的文本塊。然后通過MD5計算文本塊的Hash值,即指紋。優先選擇大數據環境下的可靠信息片段,利用文本框算法邊界確定縮小運算時的峰值范圍,大數據環境下每一項運算任務進行所針對的數據,都應該保障運算順序,以免在數據類型劃分中出現干擾情況。確定數據分析運算順序后,接下來進行的數據歸類也能高效進行,并不會產生數據之間的干擾。數據庫文本框的應用是對數據資源使用中,運算內容的確定,文本框確定作用下,不會產生數據重復運算的問題。
(2)數據片段選擇
通過數據片段優化選擇,體現出系統內部更為高效的控制內容,數據片段選擇,可以結合大數據分析中文本框界定來進行。綜合探討出不同方向對于大數據系統選擇的需求,并通過文本框優化構建出符合大數據環境功能實現的網絡安全系統。由于Winnow算法每次都是從下一個字符尋找長度為W的窗口中的最小值,造成很大的計算冗余。當取得第1個數到第w個數間的最小值min時,min值前面的數字肯定比min值大,也就是說,在后面的min次比較中,min值前面的數肯定不是最小值,那么只需要比較min值和其后的數字即可。但是,為了保證獲得完整的邊界值,在第二次比較時,應該比較起始點為min,終點為w+1間的數。由此可得,假設當前窗口min值的位置是location,窗口的末端位置為end;下一次僅比較min_location的值同end+1的值即可;針對移動網絡設備所開展的數據優化,在對數據片段確定時,同樣需要體現不同數據構建過程中對于網絡風險隱患的控制能力。綜合大數據分析處理需求,對原有算法體系作出優化,尤其是移動網絡設備,更應該考慮網絡系統構建自身對數據算法的需求。對移動網絡與互聯網兩個不同方向的算法選擇進行綜合控制,移動通訊設備自身存儲空間比較小,如果算法應用中占用大量空間將會影響最終的數據傳輸,對此數據片段盡最有效部分進行應用,避免傳輸速度受到影響[4]。
(3)數據庫對接
數據庫對接是實現網絡資源下載的基礎,將網絡設備中的數據庫與實時數據傳輸系統進行結合,利用大數據環境下信息處理速度提升特征,為網絡信息選擇和數據優化處理提供環境。有關于數據對接傳輸中可能會產生的風險隱患,在算法優化時也會重點處理,僅僅依靠預防控制方法是很難達到最佳效果的。因此數據優化還應該從實質性內容層面開展,尤其是針對大數據分析運算中的網絡安全需求,算法優化時為避免出現故障,可以采用實時對接的模式進行運算。安全檢測系統數據庫對接如圖2所示。
4 大數據分析環境下網絡安全系統優化算法的實現
(Implementation of the optimization algorithm of
the network security system in the big data
analysis environment)
(1)數據存儲
大數據分析環境下安全系統優化算法應用后,需要對功能實現情況進行檢驗,首先從數據存儲層面來進行。判斷在數據存儲過程中,是否能夠對網絡環境中存在的風險進行有效規避,對于數據存儲和傳輸期間可能會產生的功能隱患,構建安全防護基本框架便可以得到解決[5]。在安全防護基本框架中所存在的各項功能隱患問題,會通過系統文本框形式展現出來。針對大數據分析網絡安全所開展的數據運算任務,也能在文本框規定范圍內精準實現,對于文本框與大數據環境之間的對接融合,提升數據存儲能力可以對安全運算對接匹配進行檢驗。一旦數據存儲內容與網絡環境中下載的資源存在誤差,通過安全優化算法,也可以更高效地控制解決。大數據分析技術應用圖如圖3所示。
大數據分析環境下網絡信息傳輸,需要體現出移動網絡與互聯網絡兩種不同形式,目前wifi無線網絡也是一種網絡接入點形式,在系統中更應該考慮這一特征,并體現出綜合控制對網絡信息傳輸中的誤差補償效果。
(2)文本框劃分
文本框劃分同樣建立在軟件程序匯編基礎上,軟件程序匯編會確定詳細的范圍,通過文本框劃分來避免數據運算中相互干擾影響進度的情況。文本框中所存儲的信息是有網絡環境中實時下載更新的,基于互聯網絡環境下開展的數據信息存儲和各項網絡資源更新,利用無線網絡傳輸。可以實現同一端口連接多個設備的使用目標,同時對于數據流的生成,以及連接應用,在數據庫更新防護作用下,也可以達到最佳安全控制效果。對于網絡傳輸與數據實時更新控制,文本數據庫在內容形式上始終保持自動學習更新狀態,在網絡環境下更高效地下載并使用資源,數據運算處理任務實現不會受到影響。對于網絡環境下的各項資源檢測,可以利用自主學習技術來優化數據資源更新效果。網絡數據庫資源使用,學習能力是首先要保障的,通過學習能力引入,來實現大數據分析環境下網絡安全系統設法控件的創新,無論是文本框使用還是最終的數據資源庫建立,在學習技術幫助下都能夠確定明確的方向目標。
(3)數據流生成
數據流生成可以對網絡安全系統功能進行強化,利用網絡環境中的資源優化更新,觀察數據流生成后,與預期的功能效果之間是否存在誤差。生成不同安全性檢測曲線,并利用數學建模來對曲線內的參數節點進行優先運算,建立起與文本框相匹配的數據資源庫。數據流生成后行成與網絡系統安全需求相匹配的資源,建立在移動網絡設備自動安全檢測信息技術上,數據流能夠自動完成控制內容匹配,充分建立起安全檢測文本框架,實現大數據分析環境下不同信息安全檢測需求的實時匹配。發現匹配結果與分析內容之間產生隱患,也能夠在大數據控制基礎上,進行規劃整合。當所下載得到的數據存在大幅度誤差和波動時,也能夠通過數據文本框更新來進一步控制。數據流劃分并得到驗證后,網絡系統安全性已經完成初步判斷,對于一些比較容易出現的潛藏隱患,在系統內部會有針對性的構建并用,利用大數據環境中綜合控制處理技術,來全面提升數據流的更新下載安全性。
5 結論(Conclusion)
雖然本文提出的對指紋算法的改進可以檢測出在網絡上傳輸的數據是否含有敏感信息泄露問題,但是不能解決檢測具有相同語義的敏感信息是否也被泄露。當文本發生較大規模的更改,或者只是將字面做了更改,語義沒有變化的時候,就不能檢測出敏感信息的泄露問題了。該方面內容仍然需要繼續強化研究。
參考文獻(References)
[1] 何歡.群智能算法優化神經網絡在網絡安全的應用[J].現代電子技術,2016,39(20):12-14.
[2] 齊銀峰,譚榮建.基于改進粒子群優化算法的BP神經網絡在大壩變形分析中的應用[J].水利水電技術,2017,48(2):118-124.
[3] 王延緯,劉凡,丁濤,等.含多分區電力系統能量備用實時優化調度的動態積極集求解算法[J].西安交通大學學報,2017,
51(4):45-52.
[4] 劉洋,劉博,王峰.基于ParameterServer框架的大數據挖掘優化算法[J].山東大學學報(工學版),2017,47(4):1-6.
[5] 葉娟.基于網絡數據包的大數據分析程序設計與開發[J].軟件工程,2018,34(1):35-37.
作者簡介:
于淑香(1978-),女,碩士,講師.研究領域:軟件工程.
王 浩(1977-),男,博士,講師.研究領域:人工智能,軟件工程.