999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析高校網(wǎng)絡(luò)輿情信息來源及采集方法

2016-05-14 08:56:00劉儒夢陳銀茹趙麗娜
青春歲月 2016年8期
關(guān)鍵詞:頁面學(xué)校信息

劉儒夢 陳銀茹 趙麗娜

【摘要】隨著網(wǎng)絡(luò)的膨脹式增長,建立完善的網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)是現(xiàn)代高校急需解決的問題,它有利于準(zhǔn)確掌握學(xué)校輿情動態(tài)、把握學(xué)生發(fā)展方向、維護(hù)學(xué)校的和諧穩(wěn)定。網(wǎng)絡(luò)輿情來源主要分為網(wǎng)站BBS,即時通訊軟件、貼吧、微博。輿情信息的采集方法包含基于博客的采集、基于貼吧的采集、基于網(wǎng)站的采集以及利用關(guān)鍵詞詞頻分析法采集。

【關(guān)鍵詞】高校;網(wǎng)絡(luò)輿情;信息采集

新媒體時代,網(wǎng)絡(luò)對大學(xué)生的影響越來越大,但是由于大學(xué)生社會經(jīng)驗(yàn)不足、辨識能力有限,面對網(wǎng)上良莠不齊的信息,有時會產(chǎn)生錯誤的判斷,甚至被一些別有用心的人利用,產(chǎn)生嚴(yán)重負(fù)面影響,進(jìn)而影響校園的和諧穩(wěn)定。因此,高校職能部門迫切需要做好網(wǎng)絡(luò)輿情信息的監(jiān)管工作。對負(fù)面的網(wǎng)絡(luò)輿情做到事先預(yù)防,事中引導(dǎo),事后處理。因此,對高校輿情來源及輿情信息采集方法的分析具有很大的現(xiàn)實(shí)意義。

一、高校網(wǎng)絡(luò)輿情信息來源及特點(diǎn)

通俗來講,網(wǎng)絡(luò)輿情是因各種熱點(diǎn)或者與自身利益相關(guān)的事件而產(chǎn)生的通過互聯(lián)網(wǎng)傳播的人們對于該事件的所有認(rèn)知、態(tài)度、情感和行為傾向的總和。

新媒體時代的高校網(wǎng)絡(luò)輿情信息來源極為豐富,主要包括學(xué)校門戶網(wǎng)站BBS、各學(xué)院網(wǎng)站BBS、微博、貼吧、博客,即時通訊軟件qq、微信,以及各種新聞app。

高校網(wǎng)絡(luò)輿情信息具有迅捷性和互動性。由于移動通信工具的便捷性、大學(xué)生休閑時間相對充裕以及大學(xué)生積極互動的特點(diǎn),使得一些新出現(xiàn)的熱點(diǎn)信息,可以在很短的時間內(nèi)進(jìn)行蔓延,形成輿情。以河北金融學(xué)院為例,2016年三月份發(fā)生在校園內(nèi)的白色轎車事件。在沒有確認(rèn)真?zhèn)蔚那闆r下,“白色轎車內(nèi)幾個大漢遇單身女學(xué)生遍追拉上車”的消息在一天之內(nèi)已經(jīng)在百度貼吧,各個qq群,微信群,以及qq空間,朋友圈內(nèi)瘋傳了。就此事件而言,如果學(xué)校處理不當(dāng),會對學(xué)校治安以及學(xué)生心理產(chǎn)生不良影響。

高校網(wǎng)絡(luò)輿情信息具有多元性和目的性。大學(xué)生關(guān)注的信息既包含與自身利益相關(guān)的問題、也包含學(xué)術(shù)問題和政治問題。他們參與輿情的目的多樣化,包括結(jié)交朋友、交流情感、學(xué)術(shù)討論、開闊眼界、解決問題等。學(xué)校的貼吧、網(wǎng)站BBS、qq群、微信群、新聞app等,為他們提供了交流的平臺。一般這些平臺基本上不需要實(shí)名認(rèn)證,便于同學(xué)們暢所欲言。

高校網(wǎng)絡(luò)輿情具有爆發(fā)性。由于熱點(diǎn)信息傳播迅速,參與者多,且客體是沒有社會經(jīng)驗(yàn)、辨識力不足、正義感較強(qiáng)的大學(xué)生。若學(xué)校網(wǎng)絡(luò)輿情信息監(jiān)管力度不夠,極易偏離熱點(diǎn)本態(tài),在短時間內(nèi)形成負(fù)能量網(wǎng)絡(luò)輿情,在學(xué)校在不知情的情況下,影響學(xué)校聲譽(yù)、學(xué)校良好氛圍、學(xué)生態(tài)度。

二、高校網(wǎng)絡(luò)輿情信息采集方法

網(wǎng)絡(luò)輿情采集的核心在于網(wǎng)信收集,即快速準(zhǔn)確收集延時輿情信息,在互聯(lián)網(wǎng)中,由于信息量龐大,存在形式多樣復(fù)雜,僅僅采用人工收集顯然難以實(shí)現(xiàn),必須運(yùn)用信息技術(shù),利用軟件自動收集。以自動收集為主、人工收集為輔,對互聯(lián)網(wǎng)信息進(jìn)行廣泛收集。本文主要從以下幾個方面介紹輿情信息獲取方法。

1、基于博客的信息采集

首先,每個博客服務(wù)托管商(以下簡稱BSP)下的注量都很龐大,且BSP首頁鏈接較少,難以在互聯(lián)網(wǎng)上識別出較多的博客頁面。其次,blog數(shù)據(jù)源更新頻繁,需要使用實(shí)時刷新采集機(jī)制采集博客信息。再次,博客中一般都用到了RSS(Really Simple Syndication)技術(shù),RSS是描述及同步網(wǎng)站的一種具有格式化特點(diǎn)的格式,在Web應(yīng)用中被廣泛使用。基于博客的這些特點(diǎn),可以利用基于抓取時間和分析HTML文檔的方法來識別博客。設(shè)計(jì)基于RSS的分布式博客搜索引擎,實(shí)現(xiàn)對更新頻繁的頁面進(jìn)行實(shí)時性搜索。

2、基于貼吧的信息采集

貼吧的信息采集主要用到了頁面爬取技術(shù)和內(nèi)容提取技術(shù)。頁面爬取技術(shù)主要用于完整地對貼吧內(nèi)各個主貼、回帖的內(nèi)容進(jìn)行爬取,得到頁面代碼。該爬蟲優(yōu)先搜索主貼,再根據(jù)主貼分析出各主貼的回帖鏈接,并將主貼和回帖全部下載。由于下載下來的為源代碼,所以需要利用內(nèi)容提取技術(shù),對網(wǎng)頁html、css、JavaScript源代碼進(jìn)行分析,提取代碼中的帖子的全部內(nèi)容信息。然后再將非結(jié)構(gòu)化的語句結(jié)構(gòu)化,存入數(shù)據(jù)庫中。

3、基于網(wǎng)站的信息采集

隨著Ajax技術(shù)在網(wǎng)站的應(yīng)用越來越普遍。傳統(tǒng)的網(wǎng)絡(luò)爬取技術(shù)已經(jīng)不能滿足現(xiàn)在網(wǎng)站信息采集的需要。

信息采集過程包含兩個部分,信息爬取和信息優(yōu)化。信息爬取的頁面分為兩種,靜態(tài)頁面和動態(tài)頁面。對靜態(tài)頁面的采集比較簡單,一般采用將HTML頁面解析成文檔DOM樹,采用遞歸方式,對DOM樹種的文本節(jié)點(diǎn)以及元素節(jié)點(diǎn)進(jìn)行信息提取。動態(tài)頁面中嵌入了很多JavaScript、Ajax異步調(diào)用腳本語言,動態(tài)頁面爬取相對靜態(tài)頁面提取比較復(fù)雜。在動態(tài)頁面中,很多有價值的信息是用戶主動與界面進(jìn)行交互之后出現(xiàn)的,因此,必須對傳統(tǒng)的爬蟲程序進(jìn)行改進(jìn)。Ajax頁面可通過傳統(tǒng)爬蟲程序獲得,之后對Ajax頁面進(jìn)行加載和渲染,保存用戶與頁面交互前的DOM結(jié)構(gòu),并將DOM結(jié)構(gòu)中的所有時間添加到指定事件隊(duì)列,然后依次對事件進(jìn)行觸發(fā),并將變化后的DOM結(jié)構(gòu)保存,直至所有的事件觸發(fā)完畢,再將所有保存過的DOM結(jié)構(gòu)輸出,完成初步的Ajax網(wǎng)頁信息爬取。再通過對DOM結(jié)構(gòu)進(jìn)行抗干擾優(yōu)化,存入數(shù)據(jù)庫,即完成網(wǎng)站信息的采集。

三、關(guān)鍵詞與變異關(guān)鍵詞頻率分析

網(wǎng)絡(luò)輿情信息一般是非結(jié)構(gòu)化的,需要將非結(jié)構(gòu)化信息轉(zhuǎn)換成結(jié)構(gòu)化信息之后,存儲在專門的數(shù)據(jù)庫中。采用關(guān)鍵詞與變異關(guān)鍵詞詞頻分析法,對相近關(guān)鍵詞及變異關(guān)鍵詞匯總,繪制關(guān)鍵詞隨時間的頻率變化曲線,并對其進(jìn)行排序。可以分析出當(dāng)前熱點(diǎn)輿情以及有熱點(diǎn)輿情發(fā)展趨勢的信息。以便于高校有針對性的對輿情進(jìn)行管理。

四、總結(jié)

完善的高校網(wǎng)絡(luò)輿情信息管理,可以對學(xué)校穩(wěn)定和和諧起到預(yù)警作用,可以為學(xué)校的管理和教學(xué)提供現(xiàn)實(shí)依據(jù),可以使學(xué)校了解學(xué)生層次素質(zhì)與心理,有益于學(xué)校發(fā)展。網(wǎng)絡(luò)輿情信息的采集方法,必將受到學(xué)校職能部門重視。

基金項(xiàng)目:河北金融學(xué)院大學(xué)生科學(xué)研究基金資助項(xiàng)目,項(xiàng)目編號:DXSKYY2015030

【參考文獻(xiàn)】

[1] 高天宏. 互聯(lián)網(wǎng)輿情分析中信息采集技術(shù)的研究與設(shè)計(jì)[D]. 北京郵電大學(xué), 2015,3.

[2] 孟東霞, 陳 剛, 封二英. 基于校內(nèi)貼吧的高校輿情預(yù)警系統(tǒng)的設(shè)計(jì)與構(gòu)建[J]. 青春歲月, 2015,4.

[3] 李雁行. 基于詞頻分析法的高校網(wǎng)咯輿情研究熱點(diǎn)分析[J]. 內(nèi)蒙古科技與經(jīng)濟(jì), 2015,4.

[4] 張東霞. 基于高校學(xué)生微博的網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)及輿情分析研究[D]. 華南理工大學(xué), 2013,6.

[5] 溫淑春. 試論經(jīng)濟(jì)社會轉(zhuǎn)型時期的輿論特征[J]. 理論界, 2008,7.

[6] 劉前紅. 新媒體背景下輿情的特征分析[J]. 新媒體研究, 2016,4.

【作者簡介】

劉儒夢(1994—),女,河北邢臺人,河北金融學(xué)院本科在讀,主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

陳銀茹(1993—),女,河北張家口人,河北金融學(xué)院本科在讀,主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

趙麗娜(1994—),女,內(nèi)蒙古赤峰人,河北金融學(xué)院本科在讀,主要研究方向:金融學(xué)。

猜你喜歡
頁面學(xué)校信息
大狗熊在睡覺
刷新生活的頁面
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
學(xué)校推介
留學(xué)生(2016年6期)2016-07-25 17:55:29
奇妙學(xué)校
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
同一Word文檔 縱橫頁面并存
淺析ASP.NET頁面導(dǎo)航技術(shù)
I’m not going back to school!我不回學(xué)校了!
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: AV片亚洲国产男人的天堂| 国产欧美日韩一区二区视频在线| 亚洲区第一页| 囯产av无码片毛片一级| 18禁黄无遮挡网站| 国产一区二区影院| 亚洲天堂区| 欧美亚洲欧美| 日本一区二区三区精品AⅤ| 黄色网页在线观看| 久久久黄色片| 国产精品偷伦视频免费观看国产| 高清无码不卡视频| 99视频精品全国免费品| 日韩色图区| 久视频免费精品6| 成人亚洲天堂| 99久久99这里只有免费的精品| 永久毛片在线播| 亚洲香蕉在线| 亚洲a级毛片| 国产精品深爱在线| 成年av福利永久免费观看| 99精品福利视频| 日韩免费毛片视频| 精品国产Av电影无码久久久| 三上悠亚一区二区| 青青青国产视频| 久久久精品无码一区二区三区| 国产福利在线免费| 爱爱影院18禁免费| 婷婷综合在线观看丁香| 国产成人永久免费视频| 欧美成人精品一级在线观看| 精品国产三级在线观看| 玩两个丰满老熟女久久网| 中文字幕在线视频免费| 亚洲人成影视在线观看| 91区国产福利在线观看午夜| 国产精品伦视频观看免费| 亚洲一区二区日韩欧美gif| 亚洲无码91视频| 在线播放国产99re| 亚洲欧美一区二区三区麻豆| 国产欧美高清| 成人一区专区在线观看| 午夜限制老子影院888| 亚洲三级色| 亚洲乱伦视频| 四虎永久在线视频| 国产亚洲精品无码专| 成人无码一区二区三区视频在线观看 | 亚洲人成网站观看在线观看| 国产正在播放| 午夜精品一区二区蜜桃| 亚洲免费三区| 中文字幕首页系列人妻| 美女裸体18禁网站| 在线色综合| 97国内精品久久久久不卡| 亚洲第一视频网| 亚洲成人www| 亚洲国产综合精品中文第一| 久久久久人妻一区精品色奶水| 亚洲色图欧美| 久久综合成人| 日本人妻丰满熟妇区| 久久网欧美| 亚洲制服丝袜第一页| 无码乱人伦一区二区亚洲一| 欧亚日韩Av| 不卡国产视频第一页| 国产一区二区三区视频| 精品色综合| 91免费国产高清观看| 国产在线观看一区精品| 欧美色综合网站| 不卡无码h在线观看| 中文成人在线| 谁有在线观看日韩亚洲最新视频| 久久a毛片| 无码综合天天久久综合网|