999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡的微博話題預測及分析

2017-05-17 09:05:05張琳
數字技術與應用 2017年3期

張琳

摘要:提出了基于神經網絡的微博話題預測與分析系統,介紹了此系統的整體結構與流程,并說明了該系統具有抓取話題信息及其相關內容、建立數據庫、熱門話題預判等功能,從各個角度表明該系統對商業情報分析、行業調研、信息安全、網絡輿情預警十分具有研究意義,本文對系統其中的數據處理和分析這一流程進行了重點闡述,并法分別闡述了固定權重、函數構建和神經網絡這三種算法的主要內容、公式以及它們優缺點,并且對神經網絡訓練這一過程進行了仿真結果分析。我們采取三種算法相結合的方法來進行數據處理,對話題熱度進行預判,可以綜合三種方式的優點,避免一些缺點。系統將這三種方式相結合,使其更加貼近人類思考方式,提高預測準確度。

關鍵詞:話題熱度;權重;神經網絡

中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9416(2017)03-0082-02

1 引言

近幾年,社交網絡飛速發展,各大社交媒體的用戶量呈指數性上升,微博也成為人們獲取和發布信息的重要渠道,其熱門話題也已經成為了網絡熱點的風向標。微博話題預測與分析,可向用戶提供了解熱門信息的渠道,還能節省時間;對于網絡社交媒體網站的管理人員來說,可以幫助他們更好的了解用戶群體的喜好;對于企業來說,能幫助他們迅速了解市場動向,為業務決策提供數據支持和指導[1];對于政府來說,有助于了解民眾關注點與文化道德傾向,為施政方向提供參考等等。本文提出了將神經網絡的思想應用在話題預測中,使微博話題更有預見性,提高預測準確度。

2 系統結構

系統的整體結構如圖1所示。首先從新浪微博開放接口中獲取并識別出話題信息,建立話題數據庫,并通過網絡爬蟲技術從微博搜索中抓取到與話題有關的微博數據,均進行特征提取[2]后分類存入話題相關數據庫中,對這些數據處理和分析后作出預判哪些話題為熱門話題,哪些為非熱門話題。本文將主要闡述數據處理分析這一過程中用算法實現對熱門話題的預判這一流程。

3 神經網絡

3.1 固定權重計算

權重,即將話題熱度分為閱讀量、轉發量、增長率等影響因子,為其中每種影響因子分配各自的系數。最終將各項影響因子與其系數相乘再進行累加可得到話題熱度。這種方式的優點是劃分精細,可根據測試后數據增減影響因子,改動系數,但其缺點明顯,自適應能力差,所需數據量太過龐大。其計算公式為:

(1)

式(1)中,T表示話題熱度,表示權重,表示影響因子。

3.2 構建函數計算

根據各項數據之間的關系,可以簡單地抽象為一個熱度得分與權重的線性關系,得分越高,對應權重在有限范圍內同比上升。這種方式需要在前期獲取大量數據進行測試和構建函數模型,最后得到話題熱度。利用這種方式,我們可以在一定程度上進行簡單的話題預測模擬。其具有較為清晰的邏輯,編程較為簡單的優點,缺點是需要大量的真實數據來構建函數模型。其計算公式為:

(2)

式(2)中,T表示話題熱度,表示權重上限,表示權重下限,表示此話題下內容條數上限,此話題下內容條數下限,表示當前內容條數。

3.3 神經網絡算法

神經網絡算法是指讓機器模擬邏輯性的思維,根據邏輯規則進行推理的過程。人工神經網絡按照一定的學習準則,自發發現環境特征和規律性,減少下次犯錯的可能性,達到高準確度的理想狀態[3]。其優點是模擬人類思考的方式,對話題熱度預測的方式更加人性化,自適應力強,通過大量的訓練課提高預測的準確性,但它的編程比較困難,邏輯比較復雜。神經網絡訓練公式:

(3)

式(3)輸入樣本X根據誤差e對權重A不斷調整,直到e接近零;表示權重變化率,其取值不能過大或過小,過大會影響權重的穩定,過小會使調整權重時收斂太慢。

3.4 概述

我們的方法綜合利用了以上三種思想。我們首先將話題的閱讀量、評論數、粉絲數按照一定比例賦予固定的權重,存入基本庫,得到熱度基值;而對于一些比較抽象的影響因子,例如名人效應、時效性、內容生動性、國家政策等沒有明顯劃分標準的因素,我們首先利用一些少量的數據來構建一個簡單的函數,提取內容特征來并建立附加庫,再通過神經網絡算法思想利用訓練數據來不斷調整權重,豐富并完善附加庫,最終得到熱度附加值。最后,將熱度基值與熱度附加值相加得到話題熱度。

4 測試結果與分析

4.1 神經網絡算法應用

輸入訓練數據,先根據當前的權重計算,看誤差是否達到訓練要求,若沒有則對權重進行調整,直到誤差接近于零,計算出的結果與訓練數據的結果一樣,然后再進行下一組數據的讀取,重復以上步驟,直到所有結果達到訓練要求。其神經網絡算法流程圖如圖2。

4.2 模擬結果與分析

如圖3,在做神經網絡訓練預測時,我們采取兩個點做回歸分析。橫坐標為目標值target,縱坐標神經網絡輸出。為防止過擬合,我們運用matlab對數據劃分成三分,trainning表示訓練,validation表示驗證,test表示測試,最后統計了整體狀況all,只有trainning數據參加訓練,其他兩組數據不參加訓練,用于檢驗。訓練進行時,目標target和訓練test數據之間的誤差會越來越小,validation數據和目標之間的誤差也越來越小,曲線也越來越接近對角線。

5 結語

本文對微博熱門話題預測進行了分析,針對數據處理及分析這一過程中的算法問題進行研究,綜合應用了固定權重法、構建函數法和神經網絡算法這三種算法。若要提高預測的準確度,我們還需考慮更多影響因子與劃分標準,需要更多數據加以測試與改進,優化我們的算法,使其有更多的應用價值和更加廣泛的應用平臺。

參考文獻

[1]姚婧.中文微博的話題檢測和預警[D].上海:上海交通大學,2012:1-2.

[2]劉月杰.基于中文微博的話題趨勢預測[D].北京:北京郵電大學,2013:1-3.

[3]梁野.郭寧寧.基于機器學習的網絡媒體熱點話題預測研究方法與實現[J].微型機與應用.2014.33(15).

主站蜘蛛池模板: 五月六月伊人狠狠丁香网| 国产精品视频第一专区| 毛片久久久| 国产欧美精品专区一区二区| 2021国产在线视频| 久久成人免费| 国产xxxxx免费视频| 毛片久久久| 激情午夜婷婷| 一级毛片网| 亚洲一级毛片在线观播放| 亚洲美女一区| 国产性生交xxxxx免费| 国产18在线播放| 99在线视频免费| 亚洲啪啪网| 国产jizzjizz视频| 好吊色妇女免费视频免费| 99久久精品国产精品亚洲| 久久精品亚洲专区| 99热线精品大全在线观看| 亚洲三级网站| 欧美亚洲一区二区三区在线| 亚洲无线一二三四区男男| 91久久夜色精品国产网站| www.youjizz.com久久| 国产在线观看第二页| 久久一本精品久久久ー99| 欧亚日韩Av| 国产乱子伦无码精品小说| 一本久道热中字伊人| 视频二区国产精品职场同事| 亚洲熟女偷拍| 天天干天天色综合网| 日韩欧美国产三级| 亚洲欧美色中文字幕| 福利一区在线| 亚洲综合激情另类专区| 日韩二区三区| 五月婷婷精品| 日韩欧美高清视频| 一级毛片高清| 九色91在线视频| www.91在线播放| 国产日韩欧美精品区性色| 国产一级二级三级毛片| 五月婷婷欧美| 伊人久久婷婷五月综合97色| 欧洲一区二区三区无码| 无码中文字幕乱码免费2| 日韩精品一区二区三区免费| 国产精品无码一二三视频| 国产av无码日韩av无码网站| 久久中文字幕2021精品| 亚洲首页国产精品丝袜| 亚洲男人的天堂久久香蕉| 久久精品一卡日本电影| 国产特级毛片aaaaaa| 国产国语一级毛片| 99这里只有精品免费视频| 欧美在线视频不卡| 怡春院欧美一区二区三区免费| 1769国产精品视频免费观看| 久久精品丝袜| 黄色网址免费在线| 91无码视频在线观看| 久久福利网| 色悠久久综合| 国产精品国产三级国产专业不| 国产美女主播一级成人毛片| 亚洲精品成人片在线观看| 青草午夜精品视频在线观看| 亚洲精品大秀视频| 大陆精大陆国产国语精品1024| 国产精品网曝门免费视频| 亚洲欧美日本国产专区一区| 国产男人的天堂| 亚洲无码在线午夜电影| 在线视频亚洲欧美| 伊人丁香五月天久久综合| 最新国语自产精品视频在| 自慰网址在线观看|