張建英
(河南科技職業(yè)大學 河南 周口 466000)
新時代社會互聯(lián)網(wǎng)技術(shù)的不斷進步,大數(shù)據(jù)應用越來越廣泛。計算機可以通過編程算法的運行實現(xiàn)代替人腦對事物進行識別分類。智能識別系統(tǒng)是基于對大量數(shù)據(jù)的處理學習,類似人為經(jīng)驗總結(jié)的機器學習系統(tǒng),更多的是平臺大數(shù)據(jù)進行統(tǒng)計分析并分類學習。本文對大學生網(wǎng)絡行為數(shù)據(jù)進行識別系統(tǒng)研究,由于大學生網(wǎng)絡行為相關(guān)管理制度和途徑不完善,這就要求對大學生的網(wǎng)絡行為進行分析,希望能夠通過信息管理系統(tǒng)分析研究,正確指引大學生網(wǎng)絡行為習慣,在大數(shù)據(jù)背景下促進大學生網(wǎng)絡行為更加有利于學習教育和自身的健康發(fā)展。
大數(shù)據(jù)技術(shù)應用產(chǎn)生于互聯(lián)網(wǎng)技術(shù)的進步[1]。近年來,隨著大數(shù)據(jù)技術(shù)平臺的不斷完善以及國家通信基礎(chǔ)設(shè)施的不斷完備,“互聯(lián)網(wǎng)+”智慧生活的智能終端設(shè)備走進生活,推動了大數(shù)據(jù)時代的到來。在此背景下,為了保證網(wǎng)絡環(huán)境的計量監(jiān)管信息的安全,需要對網(wǎng)絡行為進行合理監(jiān)管。各個行業(yè)的網(wǎng)絡行為數(shù)據(jù)都具有行為推動作用,出于對網(wǎng)絡行為的管理需要,對網(wǎng)絡行為使用數(shù)據(jù)的分析并進行可視化的操作,評估預判下一行為的趨勢,提高網(wǎng)絡行為效率,降低網(wǎng)絡行為錯誤風險是研究熱點。網(wǎng)絡用戶的大數(shù)據(jù),通常是通過統(tǒng)計軟件進行海量信息統(tǒng)計存儲,利用分析軟件進行大數(shù)據(jù)處理分析,對足夠大的數(shù)據(jù)進行算法學習,可以超越原有數(shù)據(jù)庫架構(gòu)[2]。與此同時,伴隨大數(shù)據(jù)技術(shù)的進步,實現(xiàn)傳統(tǒng)信息采集方式無法完成的快速提取、識別、管理和服務的數(shù)據(jù)采集。大數(shù)據(jù)技術(shù)是人類歷史進步標志性的時代產(chǎn)物,讓大數(shù)據(jù)技術(shù)發(fā)揮管理和分析使得技術(shù)實現(xiàn)最大社會效益,合理使用大數(shù)據(jù)技術(shù)能夠?qū)Υ髮W生網(wǎng)絡行為管理產(chǎn)生指導價值,進而對獲取大學生網(wǎng)絡行為數(shù)據(jù)為高等教育的管理政策合理化更新提供科學參考。
大數(shù)據(jù)技術(shù)作為當下數(shù)據(jù)分析領(lǐng)域的主要技術(shù),基于大學生網(wǎng)絡行為數(shù)據(jù)進行大數(shù)據(jù)處理分析,計算機通過數(shù)據(jù)算法學習,數(shù)據(jù)分析結(jié)果更具準確性和針對性[3]。通常高校大學生網(wǎng)絡行為管理方式是通過對調(diào)研結(jié)果進行記錄分析。管理分析的人確定調(diào)研樣本對象,對上網(wǎng)時間、上網(wǎng)地點、上網(wǎng)方式、網(wǎng)絡功能內(nèi)容以及大學生生活對網(wǎng)絡的依賴性進行調(diào)研統(tǒng)計。這種方式調(diào)研結(jié)果的時效性、真實性都是不夠的,而利用大數(shù)據(jù)技術(shù)可以跨過人為觀察和回答,直接通過網(wǎng)絡終端后臺網(wǎng)絡數(shù)據(jù)進行全量采集、實時統(tǒng)計。大學生在進行網(wǎng)絡行為的同時就可以產(chǎn)生行為數(shù)據(jù)并記錄保存,然后對存儲的網(wǎng)絡行為數(shù)據(jù)進行分析評估。
大學生的網(wǎng)絡行為大致可以分為4個板塊,學習、娛樂、社交和消費,見圖1。

圖1 大學生網(wǎng)絡行為
每一個行為板塊都有對應的行為目的,網(wǎng)絡學習是為了信息獲取,網(wǎng)絡娛樂通常進行游戲影視等,網(wǎng)絡社交是大學生業(yè)余交流互動的主要方式,網(wǎng)絡消費是為了提高生活內(nèi)容品質(zhì)。明確大學生的網(wǎng)絡行為目的,就得細分大學生的網(wǎng)絡功能實現(xiàn)使用工具,例如網(wǎng)絡學習是在中國知網(wǎng)還是萬方數(shù)據(jù)查找資料等,通過大數(shù)據(jù)明確大學生的網(wǎng)絡行為具體內(nèi)容。
大數(shù)據(jù)的技術(shù)架構(gòu)主要是通過數(shù)據(jù)分布計算處理分析,數(shù)據(jù)分布得越精細,網(wǎng)絡數(shù)據(jù)延時越低[4]。大數(shù)據(jù)主要利用堆棧技術(shù),通常有基礎(chǔ)、管理、分析和應用4層[5]。作為架構(gòu)的最底層基礎(chǔ)層主要是用來對網(wǎng)絡行為數(shù)據(jù)進行采集和實時跟蹤。架構(gòu)的第2層管理層,其作用是對采集的網(wǎng)絡行為數(shù)據(jù)進行隨機提取、信息轉(zhuǎn)化和系統(tǒng)數(shù)據(jù)裝載,這一層的存儲管理計算可以為后期的數(shù)據(jù)智能化提供保障。第3層分析層就是將數(shù)據(jù)信息智能化,通過算法挖掘分析,可以得出大學生網(wǎng)絡行為習慣的潛在規(guī)律,為大學生行為管理方式提供依據(jù)。最后的應用層是對大數(shù)據(jù)分析結(jié)果做出決策判斷,達到系統(tǒng)服務用戶的作用。
在大學生網(wǎng)絡行為的分析模型客戶端層面,用戶的功能以學校校園網(wǎng)絡為數(shù)據(jù)收集范圍。由于在校大學生上網(wǎng)是通過校園服務器外接,因此學生賬戶信息可以作為個人信息采集接口。大學生上網(wǎng)的網(wǎng)絡行為數(shù)據(jù)可以實時記錄,將行為數(shù)據(jù)根據(jù)網(wǎng)絡學習、網(wǎng)絡娛樂、網(wǎng)絡社交、網(wǎng)絡消費分類保存。結(jié)合學校網(wǎng)絡行為管理考察標準,對學生的網(wǎng)絡行為進行評估。評估有個人評估和總體評估,個人評估就是對系統(tǒng)識別的網(wǎng)絡行為進行規(guī)范指導,總體評估是對校網(wǎng)學生的網(wǎng)絡行為進行總結(jié),以可視化的方式反饋給在校師生。
互聯(lián)網(wǎng)的發(fā)展使得各類信息實現(xiàn)網(wǎng)絡傳送,大學生是網(wǎng)絡用戶中最為活躍的群體之一,所以大學生網(wǎng)絡行為如何有效管理問題,如何處理大學生網(wǎng)絡行為數(shù)據(jù)變得尤為重要。大學生網(wǎng)絡行為的傳統(tǒng)調(diào)研方式缺乏時效性和準確性,隨著大數(shù)據(jù)時代的到來,使得大學生行為數(shù)據(jù)可以可視化呈現(xiàn),大數(shù)據(jù)技術(shù)的核心作用是展現(xiàn)數(shù)據(jù)的現(xiàn)實應用價值,而計算機對數(shù)據(jù)算法學習是其核心技術(shù)[4]。系統(tǒng)通過對大量網(wǎng)絡行為數(shù)據(jù)進行處理分析,使得網(wǎng)絡行為管理更加精準化、人性化。
將采集到的大學生網(wǎng)絡行為數(shù)據(jù)以分布式文件的形式保存在HDFS系統(tǒng)中,通過映射和歸約的方式對數(shù)據(jù)做計算處理,基于算法通過Hadoop進行數(shù)據(jù)計算訓練,生成大學生網(wǎng)絡行為數(shù)據(jù)模型,最后將模型可視化提供給客戶端。系統(tǒng)流程圖見圖2。

圖2 系統(tǒng)流程圖
模型的基礎(chǔ)層。該層主要功能是用Python、數(shù)據(jù)采集平臺等對網(wǎng)絡行為數(shù)據(jù)進行采集和實時跟蹤,并且根據(jù)HDFS系統(tǒng)進行分步式保存。
模型的管理層。該層主要功能是對采集的網(wǎng)絡行為數(shù)據(jù)進行隨機提取、信息轉(zhuǎn)化和系統(tǒng)數(shù)據(jù)裝載。通過映射歸約批量處理網(wǎng)絡行為數(shù)據(jù),極大方便了對分布式存儲的數(shù)據(jù)程序編寫,通過系統(tǒng)實現(xiàn)指定映射函數(shù)和歸約函數(shù)進行大量數(shù)據(jù)計算,可以為后期的數(shù)據(jù)信息挖掘提供保障。
模型的分析層。該層主要功能是將數(shù)據(jù)信息智能化,通過Hadoop中實現(xiàn)算法,對數(shù)據(jù)進行模型訓練挖掘分析,可以得出大學生網(wǎng)絡行為習慣的潛在規(guī)律,為大學生行為管理方式提供依據(jù)。
模型的應用層。該層主要功能是對大數(shù)據(jù)分析結(jié)果做出決策判斷,達到系統(tǒng)服務用戶的作用。
此系統(tǒng)主要是分析大學生網(wǎng)絡行為識別問題,其主要目標是對大量大學生上網(wǎng)產(chǎn)生的網(wǎng)絡行為數(shù)據(jù)進行處理。所選擇的網(wǎng)絡行為數(shù)據(jù)是多類信息的存儲模塊,模塊數(shù)據(jù)的文件需要進行結(jié)點處理,效率低下[3]。為了克服該數(shù)據(jù)處理問題,根據(jù)映射歸約機制,采取對數(shù)據(jù)不切片的方式,使存儲的數(shù)據(jù)設(shè)計統(tǒng)一,提升系統(tǒng)的數(shù)據(jù)處理性能。
系統(tǒng)運行環(huán)境是檢驗系統(tǒng)的重要階段,運行系統(tǒng)的環(huán)境能力對測試結(jié)果具有很大的影響。測試環(huán)境選用合適的客戶機和服務器。功能測試應當對系統(tǒng)的每一層進行分步測試,為用戶提供合格的系統(tǒng)服務。測試結(jié)果的評估按照需求分析進行功能評估。
大學生網(wǎng)絡行為識別系統(tǒng)可以實現(xiàn)大學生網(wǎng)絡行為數(shù)據(jù)通過大數(shù)據(jù)技術(shù)進行潛在行為規(guī)律可視化,將網(wǎng)絡行為展開成詳細和具體的數(shù)據(jù)模型進行分析。在實際的高校網(wǎng)絡行為管理中,可以將大數(shù)據(jù)識別大學生網(wǎng)絡行為這一技術(shù)充分利用起來,使得大數(shù)據(jù)技術(shù)規(guī)范約束好學生的網(wǎng)絡行為習慣。在對大學生網(wǎng)絡行為數(shù)據(jù)的采集整理分析過程中,不僅能夠有效管控學生的網(wǎng)絡行為,了解學生的網(wǎng)絡功能使用的喜好和關(guān)注內(nèi)容,同時在分配學校網(wǎng)絡資源時也可以根據(jù)大數(shù)據(jù)分析結(jié)果對學生提供個性化網(wǎng)絡內(nèi)容服務[4-5]。將系統(tǒng)識別分析結(jié)果反饋給學生個人,成為自適應學習工具,彌補傳統(tǒng)學習方式存在的盲目性,投其所好提高學習積極性,使得學生在高校得到更好的學習成長。
綜上所述,本研究建立大學生網(wǎng)絡行為識別系統(tǒng)是為了對大學生網(wǎng)絡行為的學習、娛樂、社交和消費進行分析、歸納,構(gòu)建有效可行的指導、監(jiān)督、信息反饋運行機制,使得大學生網(wǎng)絡行為管理變得越來越高效。同時,也可以為我國高校管理部門和教育部門提供參考,促進高校教學方式優(yōu)化升級。