999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據環境下的網絡文學輿情控制系統

2016-01-16 17:42:36蔡禮淵
中國市場 2016年2期
關鍵詞:網絡文學

蔡禮淵

[摘要]文章通過對網絡文學現狀、輿情控制的必要性;網絡文學輿情特征;網絡文學輿情監控系統設計三個方面進行探討,以期人們能夠快速、全面地把握信息內容和發展趨勢。

[關鍵詞]網絡文學;輿情控制;大數據環境

[DOI]10.13939/j.cnki.zgsc.2016.02.206

1網絡文學現狀,輿情控制的必要性

20 世紀 90 年代中后期,信息時代的來臨和網絡的普及,互聯網、手機、衛星等信息傳播工具的出現,極大地豐富了小說的發表和傳播渠道,同時也讓小說的生產、傳播方式發生了很大的變化。特別是對于互聯網和手機這樣的新媒體,每個人都可以成為小說的生產者和傳播者。這時一些別有用心的人利用網絡文學傳播虛假信息,散布反動言論,欺騙網民、誤導輿論。還有一些低級庸俗、淫穢色情、虛假欺詐等輿情信息在網上不斷出現,危害網絡與信息安全。網絡文學輿論對人們意識形態的影響已成為極其重要的因素。

2015 年 7 月 23日,中國互聯網絡信息中心(CNNIC)在京發布《第 36 次中國互聯網絡發展狀況統計報告》。數據顯示,截至2015年6月,我國網民規模達6.68億,半年共計新增網民1894萬人?;ヂ摼W普及率為48.8%,較2014年年底提升了0.9個百分點。其中將互聯網使用于觀看網絡文學的有28467萬戶,占總用戶數量的42.6%。為了更好地了解輿情關注的熱點,讓網絡文學更好的為民眾服務,另外,保護網絡文學用戶遠離輿情信息的侵擾,建設和諧的社會主義國家,政府部門有必要采取有力措施對網絡信息進行必要的監控。因此,深入分析研究網絡文學輿情監控領域中的信息技術成為一項緊迫而重要的課題。

2網絡文學輿情特征

網絡文學從一開始就呈現了與傳統文學不同的特點。網絡文學有以下特點:

文字信息為主。網絡文學,與網絡新聞、網絡視頻、網絡報紙等不同,網絡文學主要以文字為主,幾乎沒有其他形式的信息表達。傳播途徑相對固定。網絡文學雖然比傳統文學傳播途徑靈活,但是比起其他的網絡信息,網絡文學的傳播相對固定,只有可記錄的一些網站和地址可以發布。

3網絡文學輿情監控系統設計

根據網絡文學輿情監控的特征可設計一個多層次結構的監控體系??煞譃閿祿尤雽印⑿畔㈩A處理層、趨勢分析層、應用層設計、系統管理。

3.1數據接入層設計

要對網絡文學輿情進行監控就要獲取網絡上的信息,而數據接入層就是完成這項工作的。由于網絡文學的性質,文本為主和發布點相對固定決定了數據接入層設計的結構。數據接入層分為采集、傳輸和儲存三個部分。

3.1.1數據的采集

由于網絡文學發布點雖然多但是相對固定,所以不需要不間斷的到網絡各處尋找相關數據。建立網絡監控,監控網絡節點的發布、更新、修改,一旦發現情況,就對傳輸程序給以信息。

同時,監控點以外也有可能發布網絡文學。可以應用已經成熟的爬蟲等算法,對全網、搜索引擎進行概率性搜索。以其結果建立新的監控節點,或提出報警。

3.1.2數據傳輸

當發現監控節點更新或修改等情況以后,進入數據傳輸環節。數據傳輸環節就是將找到的網絡文學數據傳回服務器。由于這時在網絡傳輸數據有可能遇到網絡擁堵、站點暫時無法連接、頁面缺失等不同的狀況。應對這些情況需要建立循環隊列下載、斷點續傳、設置有效時效等手段來保證下載數據的準確性和有效性。

3.1.3數據存儲

當數據采集來了以后就需要將數據進行存儲了。

首先要選擇存儲介質,由于數據量大、難以采集,所以要選擇容量大穩定可靠的存儲介質。磁盤陣列是個比較好的選擇。

其次儲存格式,由于幾乎所有數據都是文本,所以建立比較簡單的儲存結構就行了。一般由文件頭(Head)和數據(Data)組成。文件頭包含網絡文學的出處、地址、路徑、采集時間等必要信息。數據為網絡文學采集下來的原始信息,主要有一個或多個原始網頁。

3.2信息預處理

信息采集來了以后就要進行信息處理了。對于一篇是什么意思計算機是不知道的。要讓計算機找出那些不合適的文學作品就要教會計算機找到一些敏感的詞匯并進行分析和判斷。于是信息預處理又分為分詞、去噪、加權等操作。

3.2.1分詞

當計算機發現“ISIS(The Islamic State of Iraq and Greater Syria)”這個詞很容易和恐怖分子聯系起來,但是當計算機看見“恐怖分子”時,完全可能理解成“看起來好恐怖,分子真多”, 所以如果面對中文信息不采用分詞技術,那么會導致信息數據的無法使用。現在比較成熟的分詞方法有不少,這里選取基于特征掃描的字符串匹配的分詞方法。字符串匹配的分詞方法又叫作機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行匹配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。這類方法簡單、分詞效率較高,但漢語語言現象復雜豐富,詞典的完備性、規則的一致性等問題使其難以適應開放的大規模文本的分詞處理。識別出一個詞,根據掃描方向的不同分為正向匹配和逆向匹配。根據不同長度優先匹配的情況,分為最大(最長)匹配和最小(最短)匹配。

3.2.2去噪

網頁中的“噪音”是影響基于網頁內容的工作的質量的一個重要因素,快速準確的清除網頁中的噪音內容是提高這些工作質量的關鍵技術之一。這里使用了一種網頁凈化的方法,該方法以一組啟發式規則為基礎,利用信息檢索的技術以及網頁的特征,提取網頁的主題以及和主題相關的內容,從而達到網頁凈化的目的。

3.2.3加權

同樣的一個詞放在不同的環境下,對整篇文章內容的影響是不一樣的,對于上面劃詞確定下來的關鍵詞、敏感詞要進行加權才能表現出它的性質。

3.3分析和結論

有了以上的工作以后,我們就可以對數據進行分析并得出結論了。

對數據的分析手段有很多,這里我們采用相似性統計分析的統計學手段對其進行分析。相似性統計分析是在相似性檢索的基礎上再對檢索出來的結果進行的一系列的統計分析操作。相似性檢索的算法主要是基于特征詞提取和倒排索引技術,具體描述如下:

(1)對資料庫中的每篇文檔進行自動分詞和提取特征詞。

(2)對資料庫中的文檔按特征詞建立倒排索引庫,建立索引的相關屬性,包括詞頻、位置以及文本長度等。

(3)根據每篇文檔中包含特征詞的多少、位置、詞頻、文檔的長度等信息來計算庫中文檔與待檢索文檔的相關度,相關度超過一定閾值的文檔即可作為相關文檔處理,并給出相關系數。

4結論

本文論述了大數據環境下的網絡文學輿情監控系統的研究與實現。文章首先分析了網絡文學輿情監控的必要性,以及目前現狀。針對網絡文學輿情監控系統的體系結構和主要功能模塊進行了設計,為系統各模塊的功能、性能及技術實現設計了詳細的解決方案。并且,對網絡文學輿情監控系統的技術主體技術進行了深入研究。將多種技術有效結合,對復雜的網絡文學信息進行多屬性、多角度的分析,分別給出直觀的分析結果,以便人們能夠快速、全面地把握信息內容和發展趨勢。

參考文獻:

[1]索紅光,王玉偉.一種用于文本聚類的改進 k-means 算法[J].山東大學學報:理學版,2008(1):61-64.

[2]唐籍濤.網絡輿情監控中新詞識別問題的研究[J].計算機技術與發展,2012,22(1).

[3]萬小軍,等.一種自動分析互聯網上熱點主題傳播過程的方法及系統[P].中國專利:CN101231641A,2008-07-30.

猜你喜歡
網絡文學
走進中國網絡文學的五大熱點
對待網絡文學要去掉“偏見與傲慢”
當代陜西(2019年8期)2019-05-09 02:23:26
網絡文學竟然可以這樣“玩”
當代陜西(2019年8期)2019-05-09 02:23:24
網絡文學趨向“一本正經”
當代陜西(2019年8期)2019-05-09 02:23:22
揭秘網絡文學
當代陜西(2019年8期)2019-05-09 02:23:16
網絡文學發展與批評及理論的互動關系
新聞傳播(2018年8期)2018-12-06 09:03:06
網絡文學IP化的“技術標準”——以《瑯琊榜》為例
消費導刊(2018年10期)2018-08-20 02:56:34
網絡文學“走出去”是中國文化的成功嗎?
華人時刊(2017年17期)2017-11-09 03:11:48
網絡文學的誕生
網絡文學催生新的文化可能性
主站蜘蛛池模板: 亚洲精品少妇熟女| 日本免费福利视频| 亚洲黄色网站视频| 亚洲毛片在线看| 四虎永久在线精品国产免费| 欧美人与动牲交a欧美精品| 日韩激情成人| 亚洲第一在线播放| 久久免费看片| 日本精品视频一区二区| 51国产偷自视频区视频手机观看| 国产在线无码av完整版在线观看| 区国产精品搜索视频| 国产精品亚洲а∨天堂免下载| 国产成人无码AV在线播放动漫| 久久综合九九亚洲一区 | 久久久受www免费人成| 亚洲欧洲日产国产无码AV| 午夜不卡视频| 欧美在线一二区| 97se亚洲综合| 亚洲婷婷六月| 亚洲成a人片在线观看88| 亚洲激情99| 亚洲国产黄色| 免费一级α片在线观看| 国产精品白浆在线播放| 91精品啪在线观看国产| 青青国产成人免费精品视频| 亚洲第一天堂无码专区| 日韩性网站| 福利视频久久| 美女免费精品高清毛片在线视| a级毛片一区二区免费视频| 国产男人的天堂| 日本欧美在线观看| 国产精欧美一区二区三区| 国产精品亚洲片在线va| 国产婬乱a一级毛片多女| 伊人久久青草青青综合| 尤物精品国产福利网站| 亚洲欧美成aⅴ人在线观看| 日韩在线视频网站| 国产精品视频导航| 免费高清自慰一区二区三区| 久久亚洲中文字幕精品一区| 任我操在线视频| 日韩a级片视频| www.国产福利| 色综合国产| 啪啪永久免费av| 国产精品一区二区无码免费看片| 福利小视频在线播放| 久久久久无码国产精品不卡| 99视频在线观看免费| 丰满少妇αⅴ无码区| 久久这里只精品热免费99| 国产精品免费福利久久播放| 精品国产欧美精品v| 国产精品自拍合集| 国产爽歪歪免费视频在线观看| 亚洲国产欧洲精品路线久久| 在线日韩一区二区| 亚洲色图欧美| 国产精品污污在线观看网站| 日本高清成本人视频一区| 91久久国产综合精品女同我| 成人亚洲天堂| 中文字幕在线观看日本| 黄色在线不卡| 蜜桃视频一区二区| 国产91小视频| 爱做久久久久久| 亚洲成人一区二区| 有专无码视频| 九九香蕉视频| 欧美久久网| 成人福利一区二区视频在线| 一级成人a做片免费| 欧美亚洲中文精品三区| 亚洲 欧美 中文 AⅤ在线视频| 国产精品片在线观看手机版|