牛玉嶺 恒銀金融科技股份有限公司研究院
隨著計算機網絡的發展和普及,網絡傳感器的應用范圍逐步擴大。為了保證嵌入式網絡傳感器的正常運行,需要收集傳感器的多路觀測數據。網絡傳感器多路觀測數據用于描述傳感器的工作狀態和數據采集。目前大多數檢測方法是檢測數據中的異常,并且難以保證測量數據的準確性。為了保證嵌入式網絡傳感器多路觀測數據的可靠性,需要對數據觀測結果進行測試。不同的專家學者從不同角度對多路觀測數據進行了測試,但這些探測方法仍存在一些亟待解決的問題。基于密度的數據檢測方法引入了滑動時間窗口和網格的概念,將觀察數據細分為滑動時間窗口,并通過信息熵對細分數據進行修剪和篩選,去除數據中的大部分正常數據,并通過異常值判斷剩余數據,以實現觀察數據檢測。然而,該方法花費很長時間并且難以實現實時數據檢測。基于蟻群算法的多徑觀測數據檢測方法,將蟻群算法收斂的路徑用作異常路徑。通過計算每個異常路徑中節點的測量值,并基于該值確定數據的異常點,完成數據檢測,建立基于邊緣計算的數據檢測模型序列來測試數據。但是,這種方法在過程中,占用的計算機內存很大,這對網絡運行的速度有很大的影響。
在系統中,數據通常表示為用戶行為矩陣。用戶行為矩陣的垂直坐標代表用戶,矩陣的水平坐標代表產品,用戶或網頁。傳統推薦系統主要從矩陣和網絡的角度分析和預測用戶的未來行為,典型的建模方法是矩陣分解。此外,啟發式方法可用于預測矩陣中具有空值的元素,例如協作過濾的相關方法。在社交網絡中,這兩個圖表退化為簡單網絡。在這兩個圖中,推薦系統估計在基于網絡中的現有連接而沒有連接的兩個點之間建立連接的概率,并預測用戶的未來行為。
當網絡用戶對某種類型的信息感興趣時,他通常會瀏覽該信息的相關目錄,查看他關心的信息的詳細情況,并最終可能在線下載或付費。根據目錄層次結構管理信息。每個頁面信息由查詢語句動態生成,以達到跟蹤用戶瀏覽過程的目的。隨著電子觀看和下載的普及,通過互聯網完成電子信息交易具有廣闊的前景。使用UNSPSC 對信息進行編碼使得信息提供者,信息服務和用戶之間的信息交換更加準確和有效。當使用該編碼系統時,信息服務需要為每個電子信息產品編譯特定代碼,以便信息服務可以跟蹤信息使用中的各種活動。傳統的商品分類方法不能滿足詳細的產品數據要求。 通過研究參考模型并相應地進行調整,構建一個更適合網絡電子信息的信息目錄系統。代碼完全采用分層系統,在原有UNSPSC 分類四個層次的基礎上增加信息提供者代碼和信息特定內容代碼等信息,便于分類,搜索,匹配,記錄和結算;同時,它還為計算用戶興趣強度提供了基礎。當用戶通過網站上的目錄瀏覽相關信息時,標識號作為SQL 命令的查詢條件,通過查詢字符串在數據庫服務器中搜索合格產品,并將其寫入用戶的瀏覽記錄。
用戶瀏覽過程記錄在瀏覽索引庫中,包括瀏覽日志表和瀏覽索引表。瀏覽日志表中的每條記錄包括瀏覽信息頁的目錄標識號和訪問時間。由于Internet上的網頁不一定按嚴格的目錄順序鏈接,因此用戶不一定完全遵循樹目錄來訪問它們的命令。因此,在建立模型時,不僅需要記錄用戶直接讀取和下載的信息,還必須通過鏈接記錄信息交易的行為,并采用上述改進的模型算法。不僅可以找到用戶按目錄順序訪問的路徑,還可以使用提供程序代碼記錄未按目錄順序鏈接的信息,從而更準確地記錄最終采用的信息。
預測模塊通過數據訪問端口發送預測結果,并將它們存儲在數據存儲模塊中。不同的安全預測模型使用不同的計算方法,計算方法的有效性反映在大型嵌入式網絡上節點信息的傳輸速度上。預測模型不能一次對大量的數據執行操作。因此,節點信息通常被分成若干段,這些段被并行地分配給多個節點,并且操作的結果被一起寫入轉發節點以進行向外傳輸。這個過程需要一些時間,否則傳輸可靠性不高且極易受到網絡帶寬的影響。在高速傳輸中保持高傳輸和可靠性并不容易。目前,基于博弈論的安全預測模型可以在不同的采集時間保持較小的浮動和較高的數值傳輸速度。隨著計算節點數量的增加,基于博弈論的安全預測模型可以最好地利用節點計算能力的極限值來獲得良好的節點信息搜索性能。
權重公式只根據節點的統計特性反映用戶對信息節點的訪問頻率。它并不反映用戶對節點的關注受到時間的影響。一般認為,最近的觀察結果應更能表明用戶對最近信息訪問的興趣,對于長期未被訪問的節點,隨著時間的推移,興趣強度應繼續下降。也就是說,系統應該更加關注用戶最近的興趣,現在使用指數平滑法來預測用戶對特定鏈接的興趣。指數平滑法是一種時間序列分析和預測方法。它使用移動加權平均法,根據過去的實際數字和預測來預測短期行為。這種方法不需要大量的歷史數據,計算量相對較小,能很好地消除隨機因素的影響,并且很好地反映預測對象隨時間的變化。因此,可以將每個瀏覽周期的權值之和作為觀測值,通過指數平滑的方法得到每個節點的權值。即使用戶不按目錄的順序訪問電子信息,他們也是如此可以自動為當前節點上層的所有節點添加權重。因此,對于上層節點,它表示分層目錄結構中的某種類型的信息,并且其權重總是大于下層節點。當然,上述結果與臨界值的選擇,信息目錄結構的深度和每層的寬度以及樣本的選擇密切相關。當上述條件發生變化時,結果也會發生變化。根據預測算法的實驗值,與強調不同信息的各種預測方法(包括時間序列模型,回歸預測,灰色模型等)相比,更接近實際情況,預測方法簡單,結果有較高的可信度。
大型嵌入式網絡在安全,監控,通信等領域具有很高的應用價值。它體積小,能耗低,存儲容量大,擴展性能好,性價比高,滿足了人們對各方面信息獲取的要求。隨著信息技術的不斷創新和發展,互聯網用戶數量顯著增長,網絡結構出現了大量漏洞。具有大存儲容量的大型嵌入式網絡的節點信息面臨安全挑戰,安全預測對于信息安全非常重要[3]。預測技術的過程和實現是研究的重點。新的想法已經出現,新的概念不斷被引入,新技術層出不窮,新產品已經產生,從底層硬件技術提供的解決方案到頂級軟件的想象力,所有人都在不斷尋求新的技術。嵌入式互聯網將比PC 時代產生數百倍的服務器和超級嵌入式服務器,這些服務器將與各種物理信息和生物相關聯。未來的互聯網技術將成為嵌入式互聯網的主導地位。