999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析高校網(wǎng)絡(luò)輿情信息來源及采集方法

2016-05-14 08:56:00劉儒夢陳銀茹趙麗娜
青春歲月 2016年8期
關(guān)鍵詞:頁面學(xué)校信息

劉儒夢 陳銀茹 趙麗娜

【摘要】隨著網(wǎng)絡(luò)的膨脹式增長,建立完善的網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)是現(xiàn)代高校急需解決的問題,它有利于準(zhǔn)確掌握學(xué)校輿情動態(tài)、把握學(xué)生發(fā)展方向、維護(hù)學(xué)校的和諧穩(wěn)定。網(wǎng)絡(luò)輿情來源主要分為網(wǎng)站BBS,即時通訊軟件、貼吧、微博。輿情信息的采集方法包含基于博客的采集、基于貼吧的采集、基于網(wǎng)站的采集以及利用關(guān)鍵詞詞頻分析法采集。

【關(guān)鍵詞】高校;網(wǎng)絡(luò)輿情;信息采集

新媒體時代,網(wǎng)絡(luò)對大學(xué)生的影響越來越大,但是由于大學(xué)生社會經(jīng)驗(yàn)不足、辨識能力有限,面對網(wǎng)上良莠不齊的信息,有時會產(chǎn)生錯誤的判斷,甚至被一些別有用心的人利用,產(chǎn)生嚴(yán)重負(fù)面影響,進(jìn)而影響校園的和諧穩(wěn)定。因此,高校職能部門迫切需要做好網(wǎng)絡(luò)輿情信息的監(jiān)管工作。對負(fù)面的網(wǎng)絡(luò)輿情做到事先預(yù)防,事中引導(dǎo),事后處理。因此,對高校輿情來源及輿情信息采集方法的分析具有很大的現(xiàn)實(shí)意義。

一、高校網(wǎng)絡(luò)輿情信息來源及特點(diǎn)

通俗來講,網(wǎng)絡(luò)輿情是因各種熱點(diǎn)或者與自身利益相關(guān)的事件而產(chǎn)生的通過互聯(lián)網(wǎng)傳播的人們對于該事件的所有認(rèn)知、態(tài)度、情感和行為傾向的總和。

新媒體時代的高校網(wǎng)絡(luò)輿情信息來源極為豐富,主要包括學(xué)校門戶網(wǎng)站BBS、各學(xué)院網(wǎng)站BBS、微博、貼吧、博客,即時通訊軟件qq、微信,以及各種新聞app。

高校網(wǎng)絡(luò)輿情信息具有迅捷性和互動性。由于移動通信工具的便捷性、大學(xué)生休閑時間相對充裕以及大學(xué)生積極互動的特點(diǎn),使得一些新出現(xiàn)的熱點(diǎn)信息,可以在很短的時間內(nèi)進(jìn)行蔓延,形成輿情。以河北金融學(xué)院為例,2016年三月份發(fā)生在校園內(nèi)的白色轎車事件。在沒有確認(rèn)真?zhèn)蔚那闆r下,“白色轎車內(nèi)幾個大漢遇單身女學(xué)生遍追拉上車”的消息在一天之內(nèi)已經(jīng)在百度貼吧,各個qq群,微信群,以及qq空間,朋友圈內(nèi)瘋傳了。就此事件而言,如果學(xué)校處理不當(dāng),會對學(xué)校治安以及學(xué)生心理產(chǎn)生不良影響。

高校網(wǎng)絡(luò)輿情信息具有多元性和目的性。大學(xué)生關(guān)注的信息既包含與自身利益相關(guān)的問題、也包含學(xué)術(shù)問題和政治問題。他們參與輿情的目的多樣化,包括結(jié)交朋友、交流情感、學(xué)術(shù)討論、開闊眼界、解決問題等。學(xué)校的貼吧、網(wǎng)站BBS、qq群、微信群、新聞app等,為他們提供了交流的平臺。一般這些平臺基本上不需要實(shí)名認(rèn)證,便于同學(xué)們暢所欲言。

高校網(wǎng)絡(luò)輿情具有爆發(fā)性。由于熱點(diǎn)信息傳播迅速,參與者多,且客體是沒有社會經(jīng)驗(yàn)、辨識力不足、正義感較強(qiáng)的大學(xué)生。若學(xué)校網(wǎng)絡(luò)輿情信息監(jiān)管力度不夠,極易偏離熱點(diǎn)本態(tài),在短時間內(nèi)形成負(fù)能量網(wǎng)絡(luò)輿情,在學(xué)校在不知情的情況下,影響學(xué)校聲譽(yù)、學(xué)校良好氛圍、學(xué)生態(tài)度。

二、高校網(wǎng)絡(luò)輿情信息采集方法

網(wǎng)絡(luò)輿情采集的核心在于網(wǎng)信收集,即快速準(zhǔn)確收集延時輿情信息,在互聯(lián)網(wǎng)中,由于信息量龐大,存在形式多樣復(fù)雜,僅僅采用人工收集顯然難以實(shí)現(xiàn),必須運(yùn)用信息技術(shù),利用軟件自動收集。以自動收集為主、人工收集為輔,對互聯(lián)網(wǎng)信息進(jìn)行廣泛收集。本文主要從以下幾個方面介紹輿情信息獲取方法。

1、基于博客的信息采集

首先,每個博客服務(wù)托管商(以下簡稱BSP)下的注量都很龐大,且BSP首頁鏈接較少,難以在互聯(lián)網(wǎng)上識別出較多的博客頁面。其次,blog數(shù)據(jù)源更新頻繁,需要使用實(shí)時刷新采集機(jī)制采集博客信息。再次,博客中一般都用到了RSS(Really Simple Syndication)技術(shù),RSS是描述及同步網(wǎng)站的一種具有格式化特點(diǎn)的格式,在Web應(yīng)用中被廣泛使用。基于博客的這些特點(diǎn),可以利用基于抓取時間和分析HTML文檔的方法來識別博客。設(shè)計(jì)基于RSS的分布式博客搜索引擎,實(shí)現(xiàn)對更新頻繁的頁面進(jìn)行實(shí)時性搜索。

2、基于貼吧的信息采集

貼吧的信息采集主要用到了頁面爬取技術(shù)和內(nèi)容提取技術(shù)。頁面爬取技術(shù)主要用于完整地對貼吧內(nèi)各個主貼、回帖的內(nèi)容進(jìn)行爬取,得到頁面代碼。該爬蟲優(yōu)先搜索主貼,再根據(jù)主貼分析出各主貼的回帖鏈接,并將主貼和回帖全部下載。由于下載下來的為源代碼,所以需要利用內(nèi)容提取技術(shù),對網(wǎng)頁html、css、JavaScript源代碼進(jìn)行分析,提取代碼中的帖子的全部內(nèi)容信息。然后再將非結(jié)構(gòu)化的語句結(jié)構(gòu)化,存入數(shù)據(jù)庫中。

3、基于網(wǎng)站的信息采集

隨著Ajax技術(shù)在網(wǎng)站的應(yīng)用越來越普遍。傳統(tǒng)的網(wǎng)絡(luò)爬取技術(shù)已經(jīng)不能滿足現(xiàn)在網(wǎng)站信息采集的需要。

信息采集過程包含兩個部分,信息爬取和信息優(yōu)化。信息爬取的頁面分為兩種,靜態(tài)頁面和動態(tài)頁面。對靜態(tài)頁面的采集比較簡單,一般采用將HTML頁面解析成文檔DOM樹,采用遞歸方式,對DOM樹種的文本節(jié)點(diǎn)以及元素節(jié)點(diǎn)進(jìn)行信息提取。動態(tài)頁面中嵌入了很多JavaScript、Ajax異步調(diào)用腳本語言,動態(tài)頁面爬取相對靜態(tài)頁面提取比較復(fù)雜。在動態(tài)頁面中,很多有價值的信息是用戶主動與界面進(jìn)行交互之后出現(xiàn)的,因此,必須對傳統(tǒng)的爬蟲程序進(jìn)行改進(jìn)。Ajax頁面可通過傳統(tǒng)爬蟲程序獲得,之后對Ajax頁面進(jìn)行加載和渲染,保存用戶與頁面交互前的DOM結(jié)構(gòu),并將DOM結(jié)構(gòu)中的所有時間添加到指定事件隊(duì)列,然后依次對事件進(jìn)行觸發(fā),并將變化后的DOM結(jié)構(gòu)保存,直至所有的事件觸發(fā)完畢,再將所有保存過的DOM結(jié)構(gòu)輸出,完成初步的Ajax網(wǎng)頁信息爬取。再通過對DOM結(jié)構(gòu)進(jìn)行抗干擾優(yōu)化,存入數(shù)據(jù)庫,即完成網(wǎng)站信息的采集。

三、關(guān)鍵詞與變異關(guān)鍵詞頻率分析

網(wǎng)絡(luò)輿情信息一般是非結(jié)構(gòu)化的,需要將非結(jié)構(gòu)化信息轉(zhuǎn)換成結(jié)構(gòu)化信息之后,存儲在專門的數(shù)據(jù)庫中。采用關(guān)鍵詞與變異關(guān)鍵詞詞頻分析法,對相近關(guān)鍵詞及變異關(guān)鍵詞匯總,繪制關(guān)鍵詞隨時間的頻率變化曲線,并對其進(jìn)行排序。可以分析出當(dāng)前熱點(diǎn)輿情以及有熱點(diǎn)輿情發(fā)展趨勢的信息。以便于高校有針對性的對輿情進(jìn)行管理。

四、總結(jié)

完善的高校網(wǎng)絡(luò)輿情信息管理,可以對學(xué)校穩(wěn)定和和諧起到預(yù)警作用,可以為學(xué)校的管理和教學(xué)提供現(xiàn)實(shí)依據(jù),可以使學(xué)校了解學(xué)生層次素質(zhì)與心理,有益于學(xué)校發(fā)展。網(wǎng)絡(luò)輿情信息的采集方法,必將受到學(xué)校職能部門重視。

基金項(xiàng)目:河北金融學(xué)院大學(xué)生科學(xué)研究基金資助項(xiàng)目,項(xiàng)目編號:DXSKYY2015030

【參考文獻(xiàn)】

[1] 高天宏. 互聯(lián)網(wǎng)輿情分析中信息采集技術(shù)的研究與設(shè)計(jì)[D]. 北京郵電大學(xué), 2015,3.

[2] 孟東霞, 陳 剛, 封二英. 基于校內(nèi)貼吧的高校輿情預(yù)警系統(tǒng)的設(shè)計(jì)與構(gòu)建[J]. 青春歲月, 2015,4.

[3] 李雁行. 基于詞頻分析法的高校網(wǎng)咯輿情研究熱點(diǎn)分析[J]. 內(nèi)蒙古科技與經(jīng)濟(jì), 2015,4.

[4] 張東霞. 基于高校學(xué)生微博的網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)及輿情分析研究[D]. 華南理工大學(xué), 2013,6.

[5] 溫淑春. 試論經(jīng)濟(jì)社會轉(zhuǎn)型時期的輿論特征[J]. 理論界, 2008,7.

[6] 劉前紅. 新媒體背景下輿情的特征分析[J]. 新媒體研究, 2016,4.

【作者簡介】

劉儒夢(1994—),女,河北邢臺人,河北金融學(xué)院本科在讀,主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

陳銀茹(1993—),女,河北張家口人,河北金融學(xué)院本科在讀,主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

趙麗娜(1994—),女,內(nèi)蒙古赤峰人,河北金融學(xué)院本科在讀,主要研究方向:金融學(xué)。

猜你喜歡
頁面學(xué)校信息
大狗熊在睡覺
刷新生活的頁面
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
學(xué)校推介
留學(xué)生(2016年6期)2016-07-25 17:55:29
奇妙學(xué)校
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
同一Word文檔 縱橫頁面并存
淺析ASP.NET頁面導(dǎo)航技術(shù)
I’m not going back to school!我不回學(xué)校了!
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 婷婷亚洲最大| 成人在线第一页| 91久久夜色精品国产网站| 不卡无码网| 国产美女一级毛片| 国产乱人伦AV在线A| 欧美日韩国产精品va| 亚洲av无码成人专区| 日本精品αv中文字幕| 亚洲动漫h| 毛片视频网| 91在线视频福利| 国产成人AV男人的天堂| 日本精品αv中文字幕| 国产免费观看av大片的网站| 国产丝袜一区二区三区视频免下载| 中文纯内无码H| 无码人妻免费| 国产在线一区视频| 亚洲精品少妇熟女| 人妻丝袜无码视频| 熟女日韩精品2区| 久久国产精品影院| 亚洲国产精品一区二区第一页免 | 草逼视频国产| 国产sm重味一区二区三区| 小13箩利洗澡无码视频免费网站| 啪啪啪亚洲无码| 色综合a怡红院怡红院首页| 2020久久国产综合精品swag| 久久国产拍爱| 91麻豆国产精品91久久久| 久久一日本道色综合久久| 九九热精品在线视频| 亚洲精品第五页| 国产拍揄自揄精品视频网站| 免费A∨中文乱码专区| 18禁色诱爆乳网站| 国产精品v欧美| 欧美激情成人网| 不卡国产视频第一页| 亚洲香蕉伊综合在人在线| 欧美特级AAAAAA视频免费观看| 天天视频在线91频| 国产精品分类视频分类一区| 精品国产成人高清在线| 日韩精品亚洲人旧成在线| 伊人久久久大香线蕉综合直播| 国产网站免费看| 啊嗯不日本网站| 91国内视频在线观看| 国产人免费人成免费视频| 国产精品成| 国产精品9| 嫩草在线视频| 久久精品女人天堂aaa| 国产在线精品99一区不卡| 99在线视频网站| 亚洲人成网7777777国产| 国产青榴视频| 在线视频精品一区| 91久久偷偷做嫩草影院| 在线观看无码a∨| 老司国产精品视频91| 91久久偷偷做嫩草影院电| 2020久久国产综合精品swag| 亚洲天堂日韩在线| 免费jjzz在在线播放国产| 热re99久久精品国99热| 99视频精品全国免费品| 国产情精品嫩草影院88av| 欧美中文字幕在线二区| 人人91人人澡人人妻人人爽| 亚洲经典在线中文字幕| 成人综合久久综合| 国产肉感大码AV无码| 国产麻豆精品久久一二三| 国产成人免费| 国产va视频| 免费国产高清视频| a级毛片一区二区免费视频| 人妻无码中文字幕一区二区三区|