王巍巍,王愛蓮,宋 韌
(吉林財經大學,吉林 長春 130117)
智慧校園將校園生活、管理、科研以及教學完美的充分融合,方便校園生活、豐富校園文化,形成透明高效的校務治理機制。由于 IP地址具有不方便記憶和無法顯示地址組織的性質,因此設計了域名,并利用網域名稱系統將域名和 IP地址相互映射,可直接由計算機讀取 IP地址數串,使人們更方便地訪問因特網。而在智慧校園內,學生、教師以及其他人員,對電腦的應用都必不可少,所以需要構建校園智慧網絡并分類識別其用戶的多標簽域名,便于管理。
文獻[1]采用DGA算法躲避檢測,提出了一種基于ASCII編碼方式定義域名編/解碼器,并進行進行分類器訓練和性能評估,對最新產生的DGA域名進行識別,用于DGA域名檢測器的訓練評估。文獻[2]提出城市管理案件目標識別算法,利用移動端設備自帶的攝像頭拍攝案發現場視頻并在MobileNet中增加新的超參數,優化輸入輸出圖像的通道數與每個通道所產生的特征圖數量,優化IOS移動設備分類與識別效果。文獻[3]以智能技術為手段,構建了情報領域的系統辨識過程框架,集成系統輸入、輸出的數據,不斷地去優化系統識別模型。
但收到域名分類識別方法精度較低、過程較為復雜等因素影響,用戶實際應用需求難以滿足,為此本文提出一種基于FIT AP的智慧網絡網多標簽用戶域名分類識別方法,該方法創新之處是在無線網絡管理框架中,使用管理隧道進行接入點服務管理、監控與配置,并經過條件熵、信息熵以及聯合熵,獲取用戶身份特征的集合信息增益,有效提升分類識別效率。
智慧校園的主要核心特征是為校園師生提供全面智能的環境感知以及綜合服務信息平臺,并基于校園特色的個性化服務,即利用智能感知環境與綜合信息服務平臺,形成一個能夠互相交流以及互相感知的接口,將學校和外部世界共聯。其中,域名是通過一串用點分隔的名字構成的,作為intemet上某一臺計算機或者是計算機組的名稱,主要應用在在數據傳輸時,對無線網絡的集中管理,其中,無線AC(接入控制器)和AP(無線接入點)二者之間可利用LWAPP協議構建數據與管理通道。再接上控制器利用管理隧道進行接入點服務配置、監控以及管理,利用接入控制器為無線接入用戶提供網絡服務[4]。
在集中框架管理無線網絡內,接入控制器就是整體無線網絡核心,能夠實現該無線網絡服務管理,所有接入點成功與接入控制器構建鏈接,而在接入控制器中得到對應服務配置之后,就能夠為無線網絡提供接入服務。
接入控制器與集中管理框架無線網絡接入點二者間,全部是利用LWAPP協議所建立的,可以同時支持IPv4以及IPv6協議。
即將接入控制器作為服務器,能夠連接IPv4與IPv6網絡接入點,接收請求,同時接入點能夠利用IPv4或IPv6動態選取接入控制器,進行連接創建[5]。
在設備啟動時,能夠自動發現控制器并進行訪問,并選擇當前能夠提供最佳服務的訪問控制器構建鏈接。由于接入點的配置為零,因此無法判斷當前所訪問的網絡是IPv4網絡還是IPv6網絡,因此如果接入點未成功通過IPv4網絡與接入控制器連接,則接入點應首先與IPv6網絡發現連接,然后接入點將切換到IPv6,以完成接入控制器發現處理和連接。
另外,無線接入用戶使用的是IPv4網絡還是IPv6網絡,對無線網絡用戶來說,是透明的,而無線設備只是實現了無線接入用戶數據的二層轉發。兩個接入控制器和接入點之間將使用 LWAPP隧道完成轉發,但無論接入控制器或接入點,都是基于二層信息完成轉發,而且 LWAPP隧道的封裝負載,也是二層協議的報文。作為 LWAPP協議的一部分, LWAPP不關心上層用戶的無線訪問協議,而無線訪問用戶也不需要關心 LWAPP數據隧道應用的IPv4協議或IPv6協議[6]。
FIT AP設備作為零配置的設備,相對于AP與AC構建的IPv4隧道或者是IPv6隧道,FIT AP能夠自助完成,且控制器能夠同時支持IPv4以及IPv6隧道。
FIT AP構建隧道的過程如圖1所示。
1)確保 FIT AP正常工作;
2)在 LWAPP客戶端啟動時連接 AC,并啟動 AC的動態連接,在這個過程中, FITAP只是成功地構建到 AC,以便更好地提供服務。
3) LWAPP客戶端首先在IPv4隧道和 AC之間建立完整的連接。
4)如果應用IPv4隧道,則無法找到 AC連接,并與 AC建立的連接,因此把 LWAPP客戶端切換到IPv6隧道,否則, FITAP使用IPv4隧道提供服務。
5)如果應用IPv6隧道,同樣也則無法找到 AC并 AC建立連接。因此把 LWAPP客戶端切換到IPv4隧道,否則, FITAP使用IPv4隧道提供服務。
FITAP設備可以在所有網絡中使用。通過上面提到的自動IPv4和IPv6隧道機制,將FITAP安裝在IPv4網絡中,即 FITAP可以利用IPv4隧道與 AC建立連接。相反,在 FIT AP安裝了IPv6網絡之后, FIT AP就無法應用IPv4隧道構建與 AC之間的連接,從而能夠構建AC與IPv6隧道的連接并開始提供服務[7-8]。
具體某高校的IPv6無線網絡接入方式,如圖2所示。

圖2 IPv6無線網絡接入示意圖
通過圖2能夠看出,接入控制器AC與IPv6無線網絡進行連接,該接入控制器AC在無線網絡內起到了IPv6的Portal的功能,完成無線網絡和IPv6網絡連接,即而構建IPv6的無線網絡模式。而接入點FIT AP是經過IPv4骨干的網絡與接入控制器進行連接與創建的,完成穿越IPv4網絡,從而提供的無線網絡接入服務,在無線接入的用戶成功與接入點AP所創建的無線鏈路連接,這樣就能夠成功的與IPv6無線網絡完成連接。
通過無線網絡提供的接入服務,無線終端完成了與IPv6網絡的連接后,終端就可以動態地獲取IPv6地址,也可以在靜態IPv6地址上進行設置,然后,無線終端就可以訪問IPv6網絡的所有服務。與此同時,無線終端的所有數據,都是通過無線網絡接入點和接入控制器之間的通道進行傳輸的,而無線接入的用戶,在使用IPv6接入網絡時,則不必擔心是否通過IPv4網絡[9]。
在利用智慧校園網對用戶特征的分類進行識別時,利用條件熵、信息熵以及聯合熵獲取用戶身份特征的集合信息增益,對用戶域名與標簽二者之間關系完成區分,以此完成用戶域名特征的多標簽分類識別,提升分類識別的效率。
將X設成表示智慧校園內一個實例,L表示候選用戶域名的特征標簽集合。Y表示實例X相應用戶域名特征的標簽集合,就是Y?L,O表示多標簽的數據集合,而在集合O內具有t個樣本,具體多標簽的數據集合公式是
O={(Xi,Yi)|1≤i≤t}
(1)
式中:Xi表示智慧校園的用戶域名特征向量,Yi表示用戶域名特征的向量相應標簽集合。
將H(A)設成表示集合A={a1,a2,…,am}信息熵,具體H(A)的公式為

(2)
式中:p(ai)表示元素ai先驗的概率。在將H(B|A)設置成表示集合A的基礎中集合B={b1,b2,…,bn}條件熵,具體H(B|A)的計算公式為

(3)
當處于集合A基礎之下的集合B不確定程度,經過條件熵H(B|A)完成衡量,把H(AB)設置成表示集合A和集合B聯合熵,具體公式為

(4)
而聯合熵、條件熵以及信息熵三者之間的關系,具體如下所示
H(AB)=H(A)+H(B|A)
(5)
式中,將IG(B|A)設置表示信息增益,經過信息增益對集合A與集合B有關程度完成衡量,具體計算公式為
IG(B|A)=H(A)+H(B)-H(AB)
(6)
在集合A與集合B信息增益越大時,那么說明集合之間有關的程度就越大。經過信息增益對標簽與用戶域名特征的關系完成區分。
根據所獲得的信息增益選擇用戶域名特征候選集的首項,并通過類標簽間的相關性計算類標簽重要度,根據計算得到的類標簽重要度與用戶的域名特征權重相結合,完成用戶域名特征排序,再利用用戶域名的特征相關度選擇用戶域名特征,設定閾值,并將滿足條件的特征引入最終用戶域名特征集內,從而完成校園智慧網多標簽用戶域名分類識別。
經過信息增益求出候選用戶域名特征集合H首項,依據上述獲取信息增益的最大用戶域名特征Xi作為特征集合H首項。
經過類標簽相關性計算用戶域名特征的類標簽重要程度W(Yi),具體W(Yi)的計算公式是

(7)
式中:O(Yi,Yj)表示校園智慧網的用戶域名特征標簽間相關度。將W(Xi)設成表示校園智慧網用戶域名特征屬性權重,具體W(Xi)計算公式為
W(Xi)=O′(Xi,Y)-R(Xi,H)
(8)
式中:O′(Xi,Y)表示類標簽集合Y和用戶域名特征屬性Xi二者間相關度,R(Xi,H)表示特征集合H和用戶域名特征屬性Xi間具有的冗余度。經過上式進行計算能夠獲得用戶域名特征屬性權重,且與類標簽的重要度進行結合,把權值最高用戶域名特征屬性引進特征集合內,對上述步驟重復進行,一直完成校園智慧網絡的用戶域名特征排序。
將O(H,Y)設置成表示用戶域名的特征組和類標簽二者間相關度,具體計算公式為

(9)
式中:O(Xi,Yj)表示用戶域名特征與標簽二者之間的相關度,|H|表示特征集合H內具有元素總數目,|Y|表示多標簽集合Y內具有的元素個數。


(10)
式中:N表示整體用戶域名特征屬性個數。能夠滿足下式用戶域名特征組Hi引入最后用戶域名特征的集合X′。具體公式為

(11)

(12)
將{Hi|Hi∩X′≠Hi}設置成表示無選取剩下用戶域名的特征集合,在將ΔO(Hi,Y)設置成表示用戶特征的集合Hi增益,具體計算公式為
ΔO(Hi,Y)=O(Hi,Y)-O(Hi-1,Y)
(13)
設閾值ε,而閾值ε計算公式為

(14)
式中:|X′|表示已選用戶域名特征集合X′總數目,r表示用戶域名特征組增益的標記。在選取用戶域名特征組Hi要滿足Hi∩X′≠H并且ΔO(Hi,Y)>ε時,把Hi所相應的第i個用戶域名特征,加入最后用戶域名身份特征的集合X′內。
通過上述方法就能夠對校園智慧網絡的多標簽用戶域名進行分類識別。
為了驗證本文方法的有效性,計算機硬件選擇In-tel Core2 Quad 2.3 GHz,2GB內存,軟件操作系統選擇Windows7系統。
選取某學校1000名用戶學生的域名進行測試實驗,最后在同一條件下,將本文方法與文獻[1]、文獻[2]、文獻[3]方法進行對比,具體對比結果如圖3所示。

圖3 不同方法的識別精度對比結果
依據圖3能夠看出,其它文獻方法對用戶的識別精度越來越低,而在600條之前識別精度的曲線波動趨勢較小,而在600條之后出現非常明顯的波動趨勢。而本文方法的識別精度一直保持在90%左右,雖然出現輕微的上下浮動,不過浮動較小,可以忽略不計。
將本文方法與文獻[1]、文獻[2]、文獻[3]方法在識別時間方面進行對比。對比結果如圖4所示。

圖4 本文方法與傳統方法對比結果示意圖
通過圖3能夠看出,本文方法的識別精度要明顯高于其它方法,且在識別的過程較為簡單,魯棒性良好,說明用戶人員一旦在智慧網絡中上傳數據,本文分類識別方法就可以對其進行管理,滿足實際應用需求。
無線終端在訪問IPv6網絡所有服務的過程中,需要獲得用戶域名特征屬性權重,且與類標簽的重要度進行結合,這個結合的過程用用戶域名特征屬性的排序效果即影響識別效果反映,因此進行類標簽的重要度結合效果實驗,驗證整體識別效果。對比結果如圖5所示。

圖5 用戶域名特征屬性權重對比結果
如圖5可知,在12個排序階段的情況下,本文方法的用戶域名特征屬性的排序效果即影響識別效果較強,皆高于文獻方法,最高權重為1,說明在整體識別上,本文方法魯棒性較佳。
1)基于FIT AP,對智慧網絡網多標簽用戶域名分類識別方法,利用條件熵、信息熵以及聯合熵獲取用戶域名特征集合的信息增益,區分用戶域名與標簽二者之間的關系,對用戶域名特征的多標簽分類識別。
2)識別精度一直保持在90%左右,解決精度較低,且過程較為復雜等問題。
3)整體智慧網絡網多標簽用戶域名分類識別過程簡單高效,用戶域名特征屬性的排序權重為1,可以提供一種全面感知、協作性、網絡化與數據化一體的生活服務、管理、科研以及教學的校園環境。