999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校學生上網行為分析研究及輿情監控對策

2013-04-29 00:44:03丁青蔡文杰吉翔
計算機時代 2013年8期
關鍵詞:數據挖掘

丁青 蔡文杰 吉翔

摘 要: 以南京農業大學工學院應用為例,利用數據挖掘工具實現對計費網關日志數據的采集,并對用戶群體行為即不同時間段的在線賬號數、用戶使用時長與流量、用戶訪問目的地址三個方面進行研究。對如何改進高校網絡輿情監控建設,培育健康和諧的網絡輿論生態給出了若干對策與建議。

關鍵詞: 數據挖掘; 計費網關; 輿情監控; 行為分析

中圖分類號:G41 文獻標志碼:A 文章編號:1006-8228(2013)08-11-03

0 引言

輿情是“輿論情況”的簡稱,是指在一定的社會空間內,圍繞中介性社會事件的發生、發展和變化,民眾對社會管理者產生和持有的社會政治態度[1]。網絡輿情是社會輿情的直接反映。高校的網絡輿情更有其特殊性,會在短時間內迅速影響到大學生的態度和觀點,甚至影響到他們在現實中的行為,因此,需要及時采取措施,實施輿情監控,以控制和引導事態發展。本文從校園網計費網關系統日志分析入手,利用專業的數據挖掘軟件工具對校園網用戶行為日志進行各個角度的詳細分析,再從多個方面對高校網絡輿情監控給出對策和建議,以使管理者能夠牢牢把握輿論控制權,引導網絡輿情,維護網絡信息安全。

1 研究背景與目的

網絡輿情研究,需要對高校學生用戶行為進行深入挖掘和分析其行為產生的原因[2], 及時發現他們對學校和社會的意見、情緒和態度,進而使管理者及時地改進和創新各類管理辦法,形成網上、網下共同教育的和諧局面。因此,管理者應該通過對大學生網絡輿情及時有效的管理,來控制不良網絡輿情,維護校園穩定。本文力圖以最新時間點,選擇相關的日志數據,對用戶行為的特征項進行總結分析,以實證研究的方法嘗試網絡輿情監控新的探索。

2 研究方法

2.1 研究思路

行為分析研究方法主要有統計、聚類。統計方法多用于在模式己知的情況下快速的得出結果,而在模式未知的情況下,一般都使用聚類的方法[3]。此次實證研究的數據取自校園網計費網關,在真實網絡環境下,可以獲得的原始數據量通常都比較大,數據的復雜程度較高,以工學院為例,每天產生的原始記錄高達6GB的數據量。如何使用高效工具,做到對大量的數據進行提取、過濾、轉換、集成,以便從中發現知識,是對校園網用戶行為分析的關鍵所在。通過對底層數據的考察筆者發現,用戶行為的各項參數之間存在著關聯性,例如,在線賬號數、在線時間、使用網絡的時長、網絡流量、目的地址、網絡服務類型等之間都是有聯系的。在綜合分析結果的時候,我們把各參數中用戶模式己知的項進行統計分析。

2.2 分析流程和使用工具

校園網用戶行為分析流程可以分為以下幾個部分。

⑴ 數據抽取部分,主要是采集工學院城市熱點計費系統所保留的各項日志數據,根據分析的重點對各字段進行抽取,從源數據庫讀取所需要的數據部分。

⑵ 數據轉換和加載部分,按照最終形成的數據結構,對源系統每個記錄進行轉換,轉換以后就可寫入數據倉庫,可采用SQL語句或批量加載,這一部分是為下一步統計準備有用的數據。

⑶ 統計分析部分,這是整個行為分析的關鍵部分。通過從不同角度對用戶行為進行統計和分析,幫助管理者及時掌握真實校園網用戶需求的變化,從中發現一些有趣的特點和規律,實現對現有校園網用戶輿情全面的把握。

⑷ 工具采用了SQLSever 2008的SSIS工具和EXCEL2010。

3 日志結果與分析

本文的分析工作主要針對用戶群體行為的三個方面進行研究,即不同時間段的在線賬號數分析、用戶使用時長和流量的分析、用戶訪問目的地址分析。

3.1 分時間段的在線人數分析

分析各個時段網絡的用戶在線賬號數,可以從宏觀上了解大學生的網絡使用情況。根據最新時間點,我們提取了2012年11月11日到11月17日一周的用戶數據,一共48510條,將一周的分析結果生成線狀圖,如圖2所示。

圖2從縱向和橫向的角度清晰地反映了校園網用戶在線賬號數一天中的變化趨勢,以及一周內在線賬戶的變化趨勢。

從一天中的變化趨勢來看,第一個高峰在12點到13點中出現,這個時間學生教師上課完畢,中午正好是午休期間,用戶上網人數最多。一天中的第二個高峰在16點到達,因為16點一般是學生下午兩節課結束后回到宿舍的時間,此時在線人數較多。一天中第三個小高峰在21點出現,說明學生大多數下晚自習的時間就在21點左右,回到宿舍他們又開始登錄網絡,從圖上來看,基本上到了23點,由于學生公寓停止供電,在線賬號數有一個明顯的回落。

同時從一周內的變化可看出,周六在線人數最多,而周日在線人數最少,其余一周的數據則與日劇增,也說明周六學校在線人數為最高。對在線人數的分析,主要是根據各個時間段在線賬號數的不同,可以對網絡輿情的監控,網絡的策略變化給出一個合理的參考時段。

3.2 用戶在線時長以及使用流量的分析

利用對比分析法,我們將校園網用戶分成不同類別的組,分別研究他們的上網行為差異,抽取了一個月的用戶日志數據并利用SSIS工具進行聚類,形成下面的用戶行為模式。

⑴ 電子閱覽室用戶代表了機房用戶,基本上是以學生為主,由于開放時間所限,這類用戶使用時長不會超過12個小時,月流量在30G左右。

⑵ 家屬區用戶使用時長在12個小時以內的有132人,占到91.7%;而12個小時以上的有12人,占8.3%。大部分人月流量在100G以內。

⑶ 辦公區用戶使用時長在12小時以內的占到了85.9%。但是這類用戶超過12小時的人數達41人,占14.1%,并且在23-24小時還有一個小的躍增,可以判斷這類用戶有經常熬夜或者不關機的習慣,同時月流量也在500G以內,針對這類用戶管理者應該予以提醒,使其不濫用各項資源,節約校園網帶寬。

對于用戶在線時長和流量分析,目的是了解用戶占用網絡帶寬的情況,對于在線時間過長,占用帶寬過多的用戶,管理者應該予以重點監控,并采取措施進行限制。

3.3 學生用戶訪問目的地址分析

首先提取學生區訪問的日志文件,對其每一行的訪問目的地址記錄進行統計和分析,使用split函數以Tab為分隔符將行記錄劃分為各個字段,從而獲得URL字段;然后,使用spilt函數以反斜杠“\”為分隔符將URL字段進行劃分;最后利用Perl的哈希結構進行分類統計。當日志文件所有的記錄均按照上述過程處理之后,就可以輸出各個網站訪問的統計結果。通過該算法實現了用戶訪問10000次以上的網站都被記錄下來,統計并生成圖表,如圖3所示。

在輿論監督中要特別引起注意是對SNS網站、BBS網站和門戶網站進行監控,這幾類網站在工學院中訪問次數較高的分別是人人網,西祠網和新浪網,可見隨著高校網絡的普及,尤其是博客,微博,學生個人網站的出現,在網絡上表達意見,態度,情緒和信念等,日益成為大學生活的重要內容,對這類網站的監控也必須予以加強。

4 網絡輿情建設對策和建議

4.1 出口部署網絡輿情監測系統

目前不少高校都在校園網出口處部署了輿情監測系統,這類系統一般都具有比較強大的過濾功能,比如基于內容的過濾手段,包括:過濾用戶通過搜索引擎搜索的指定關鍵字、過濾包含指定關鍵字的網頁、過濾含指定關鍵字的URL地址等,作為管理者應將譬如包含色情、反動、暴力或非法的網站過濾掉,屏蔽不利于大學生成才的信息,提高網絡出口的安全性。

但是,從輿情監測軟件的調研情況看,大部分軟件只有網絡爬蟲模塊起主要作用,雖然在技術上部分實現了基于web頁面異構數據的信息抽取與集成,然而他們對所采集到的信息的定性定量分析并不到位,還需要對所獲得的日志信息進行科學篩選、智能分析與研判,同時管理人員要在某些敏感時間段密切跟蹤學校某區域的網上輿情動態,及時搜集具有前瞻性的信息,一旦出現校園網絡輿情危機苗頭,可在第一時間了解網絡輿情內容,分析網絡輿情的性質,判斷網絡輿情的影響,科學應對[4]。

4.2 全面實現實名用戶認證

信息化的普及,使得目前很多高校都提供無線和有線接入方式,而無線接入的方式會導致在問題用戶定位上存在時間和地點的不確定性;同時,高校越來越開放,很多臨時來高校的人員和臨時活動要求連入校園網絡,這就要求監管部門制定嚴格的準入機制。目前在高校校園網中全面實現實名用戶認證是必要而緊迫的。以工學院為例,上網的賬號與學生的學號或教工的工號進行捆綁,除教工生活區、服務器和特殊設備采用多元組綁定技術直連校園網外,其他所有用戶要進入校園網均須進行身份認證,臨時賬號必須由各負責部門提出申請并定位到具體地點,從而切斷非法用戶聯入校園網。

4.3 形成校園獨有的網絡輿情載體

高校網絡輿情建設要重視對校園門戶網站、校園新聞網和各類網絡文化的網站的投入,特別是對高校網絡輿情的重要載體BBS的建設[5]。通過多種手段凸顯引導信息,把重點新聞和重要觀點設置在論壇顯眼與強勢位置,在處理突發事件時決不能失聲,要形成高校輿論引導的強大聲勢,搶占網絡輿論話語的主導權。

在構建高校BBS論壇上的熱點話題時,高校管理部門要把握高校網絡輿情話語的主動權;強化對突發事件重要信息的解讀,挖掘新聞深度,使大學生對突發事件的認知建立在全面理性的基礎上,切忌千篇一律,要認真聽取學校不同輿論的聲音;充分發揮輿論領袖的引領作用,轉移高校網絡輿情的焦點,消除不良輿情信息的誤導,逐步引導大學生朝著預期設定的方向發展,從而正確引導高校網絡輿論走向。

4.4 加強網絡輿情組織保障

宣傳部或網絡管理部門可設立日常辦公機構,配備專職人員,開展日常工作,同時加強建立高水平的輔導員隊伍。輿情引導的效果和成敗與引導主體密切相關,輔導員是與大學生聯系最為緊密的引導主體,其輿情引導的效果決定了高校輿情引導的成敗[6]。同時要加強工作制度建設,建立起新聞發言人,日常值班,工作研討等制度,建立行之有效的校園突發事件預防辦法和處置方案,并將網絡輿情作為其中重點內容。

5 結束語

校園網用戶行為分析是改善校園網運行質量,提高高校網絡輿情管理效率的一個有效途徑,它能為網絡的管理者提供決策的必要依據。隨著網絡技術的普遍發展,高校輿情監控工作將大有作為,另外隨著信息化的深入,對無線方式下的高校用戶行為分析以及輿情管理,將是高校網絡輿情監控的重要發展方向。

參考文獻:

[1] 王來華.輿情研究概念:理論方法和現實熱點[M].天津社會科學院出版社,2003.

[2] 丁青,周留根,朱愛兵.基于K-means聚類算法的校園網用戶行為分析研究[J].微計算機應用,2010.31(6):74-80

[3] 梁循.數據挖掘算法與應用[M].北京大學出版社,2006.

[4] 陳少平.高校網絡輿情危機的研究及處置對策[J].中國青年研究,2012.3:5-9

[5] 曹銀忠,許方圓.高校網絡輿情引導研究[J].毛澤東思想研究,2012.29(6):146-150

[6] 李宗琦,徐順鋒.高校輔導員輿情引導工作實證研究——以西安市部分高校為例[J].西安電子科技大學學報(社會科學版),2012.22(5):121-124

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 在线观看无码av五月花| 欧美中文字幕在线二区| 日韩精品一区二区三区大桥未久 | 国产高清在线丝袜精品一区| 一级在线毛片| 亚洲天堂久久久| 国产日韩精品一区在线不卡| 丝袜高跟美脚国产1区| 亚洲中文字幕在线一区播放| 亚洲日韩欧美在线观看| 亚洲国产天堂久久综合| 有专无码视频| 久久综合色天堂av| 欧美一区二区啪啪| 亚洲第一国产综合| 国产免费羞羞视频| 老司机精品一区在线视频 | 福利在线一区| 久久久久青草大香线综合精品| 色综合久久无码网| 538国产视频| 波多野结衣中文字幕一区二区| 国产亚洲精久久久久久久91| 国产在线欧美| 欧美在线中文字幕| 日本精品中文字幕在线不卡 | 亚洲欧州色色免费AV| 波多野结衣一区二区三区四区视频 | 免费国产无遮挡又黄又爽| 999国产精品永久免费视频精品久久| 日韩 欧美 国产 精品 综合| 老司机久久99久久精品播放| 国产美女自慰在线观看| 久久婷婷六月| 色综合久久综合网| 亚洲人成影院在线观看| 欧美成人影院亚洲综合图| 人妻精品久久久无码区色视| 亚洲欧美国产高清va在线播放| 精品视频一区在线观看| 国产尤物jk自慰制服喷水| 日本高清有码人妻| 日韩A级毛片一区二区三区| 国产高清自拍视频| 国产精品熟女亚洲AV麻豆| 国产精品精品视频| 亚洲天堂网视频| 亚洲有无码中文网| 亚洲国产日韩欧美在线| 国产在线精彩视频二区| 国产高清国内精品福利| 伊人色在线视频| 亚洲欧美另类专区| 欧洲熟妇精品视频| 国禁国产you女视频网站| 亚洲日韩精品欧美中文字幕| 91无码人妻精品一区| 国产一区二区在线视频观看| 国产成人三级| 久久久受www免费人成| 中字无码av在线电影| 国产亚洲精品yxsp| 亚洲va欧美ⅴa国产va影院| 精品视频91| 精品91在线| 免费毛片全部不收费的| 国产成人综合在线观看| 久久人妻xunleige无码| 国产成人综合在线观看| 国产精品免费入口视频| 国产精品成人一区二区不卡| 伊人久久青草青青综合| 新SSS无码手机在线观看| 成人免费午间影院在线观看| 久久久久青草大香线综合精品| 国产精品无码作爱| 国产精品欧美激情| 国产免费人成视频网| 国产精女同一区二区三区久| 97影院午夜在线观看视频| 又大又硬又爽免费视频| 日本精品中文字幕在线不卡|