999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在線社交網絡信息傳播建模及轉發預測研究

2022-08-15 06:48:02傅熙雯
科技與創新 2022年16期
關鍵詞:分類特征用戶

傅熙雯

(云南大學,云南 昆明 650091)

隨著科學技術的不斷發展,在線社交平臺不斷增多,如微博、微信等,其不僅具有傳統媒體的“時空偏向”特征,同時還可實現信息傳播主體多元化、內容碎片化,為人們提供多樣化選擇,滿足人們的個性化需求。

為促進復雜網絡以及系統科學領域不斷發展,需對在線社交網絡信息傳播機制進行深入探究,提升互聯網治理水平。因此,亟需對在線社交網絡信息傳播進行建模分析,并進行轉發預測。

1 分類預測模型

機器學習模型種類較多,常見的機器學習模型主要包括決策樹、支持向量機和樸素貝葉斯等,不同模型均有一定的應用優勢和弊端,本次在線分析社交網絡信息傳播建模中采用隨機森林模型。

對隨機森林本質進行分析發現,其屬于決策樹組合,是一種集成了bagging和具有隨機性特征分裂方法的組合分類器,對于輸入數量無需進行預處理,在建模前無需進行特征選擇,在模型運行中,通過對變量的重要性進行選擇,分析不同輸入變量對模型的重要程度。

另外,在實際應用隨機森林模型時,泛化誤差率較低,數據集中可包含異常值和噪聲,即使數據確實,依然保持較高的預測準確性,可有效提升預測結果準確性,并且能夠平衡誤差,預測性能較好。除此以外,在模型中,各個決策樹均相互獨立,能夠避免過擬合問題產生[1]。

2 預測結果評估方法

在數據分析過程中,需應用多種度量指標,在本次建模分析中采用召回率(recall)和精確度(precision),可準確反映出稀類分類實際情況。

2.1 召回率和精確度

對于兩分類問題,可用混淆矩陣表示,{+,-}指正負類的標簽集合,“+”代表正類,“-”代表負類。根據給定分類模型,即可準確計算測試機,共包含4種分類。

f++(TP)為真正類,樣本預測類別為正,真實類別為正;f+-(TP)為假負類,樣本預測類別為負,真實類別為正;f-+(TP)為假正類,樣本預測類別為正,真實類別為負;f--(TP)為真負類,樣本預測類別為負,真實類別為負。

根據混淆矩陣,即可對召回率(R)以及精確度(P)進行計算:

在模型分類效果評估中,還可采用F1度量這一指標,F1為召回率和精確度的平均值,如果R和P均最大,則F1即可最大化,三者之間的關系如下:

2.2 受試者工作特征曲線

受試者工作特征曲線即ROC曲線,在模型評估完成后,對于評估所得結果,可繪制成曲線,即可對不同分類模型的差異進行對比分析。在曲線二維平面中,橫軸和縱軸分別為假正率及真正率,長度均為1。在ROC曲線評估模型的實際應用中,可采用以下2種分析方式:對ROC曲線的偏向進行觀察,如果ROC曲線偏向左上角,則模型分類性能較好;對ROC曲線下面積(AUC)進行觀察,如果AUC較大,則模型分類效果較好[2]。

ROC曲線繪制流程如圖1所示,其中a為樣本,如果閾值為C,則a為正類;如果閾值小于等于C,則a為正類。

圖1 ROC繪制流程

3 轉發預測模型設計

在本次在線分析社交網絡信息傳播建模中,采用隨機森林模型,對于模型參數可采用用戶特征關鍵詞權重,據此創建興趣加權隨機森林模型(WRF)。在無加權RF模型中,對于各個用戶的特征變量,可采用一個權重參數,其能夠對權重進行調節,充分展現出各個用戶特征變量的差異。對興趣差異進行分析發現,主要體現在興趣數量和興趣程度2個方面。各個用戶輸入變量的特征加權值計算方式如下:

式(1)中:weight(f)為特征f的最終權重;index(f)為該特征某用戶的興趣權重;index(f)mean為該特征權重值的平均值。

在本次研究中,計算模型的關鍵步驟如下:①清洗數據集,數據集主要分布在多個文本中,因此,通過對數據集進行合并和去重處理,即可有效清洗數據集;②在數據集清洗完成后,可利用轉發屬性以及非轉發屬性,將數據集分為2種類型,再對各個數據集上各項指標的累積度分布情況進行計算,然后繪制CDF曲線;③創建轉發行為預測指標體系,并根據式(1)對各個應用戶的興趣加權參數進行計算,然后再對各個特征進行加權計算;④將原始特征變量以及特征變量輸入隨機森林模型中,對R、P以及F1進行計算,然后在此基礎上繪制ROC曲線,對各個指標在模型中的重要性進行對比分析;⑤以多種用戶屬性作為基礎,并進行分類預測,對各個屬性分類效果進行比較[3]。

4 在線社交網絡信息轉發預測結果分析

4.1 模型預測分析

在模型分析前,在獲得原始數據后,需對所有數據進行清洗,在此過程中,可利用Python編程語言中的Numpy以及Pandas工具包,對數據進行拆分、合并處理,同時還可對缺失值進行有效處理。在數據清洗完成后,即可利用R語言界面友好的“rattle”數據挖掘工具包對模型進行計算分析。

在隨機森林模型計算中,決策樹數量的影響較大,在隨機森林模型計算分析中,一般默認決策樹數量,但是在具體的計算過程中,為了對模型進行優化處理,要求合理定義最佳參數。隨機森林模型計算誤差和決策樹之間的關系如圖2所示,分析圖2發現,OBB指模型的泛化誤差,“0”指否定結論的誤判率,“1”指肯定結論的誤判率。比如選擇微博平臺作為研究對象,在用戶轉發行為預測分析中,可對多個模型進行對比。

圖2 決策樹數量與模型誤差關系

在預測分析中,可利用改進后的隨機森林模型(WRF)與經典森林模型RF和Logistic回歸模型相比,各項性能指標均比較好,精度更高,同時召回率指標和F1分值也有所提升。由此可見,在對用戶興趣加權進行調整后,通過利用WRF,可對用戶轉發微博信息的行為進行準確預測。

為了能夠對不同模型中用戶轉發行為預測性能進行對比,需對ROC曲線進行繪制和分析,并對ROC曲線下方面積(AUC)進行計算,據此對各個模型的性能進行對比。當AUC在1.0~0.5之間時,如果AUC接近1,則模型分類效果較好,如果AUC在0.9以上,則分類準確性較高;當AUC在0.7~0.9之間時,分類準確性較高;當AUC在0.5~0.7之間時,準確性較低;如果AUC為1,則模型最完美;當AUC為0.5時,模型效果最差[4]。

確定模型指標重要性程度,可選擇2個度量標準,即精度平均減少值(Mean Decrease Accuracy)和節點不純度平均減少值(Mean Decrease Gini),如果2個值較大,則指標重要性也較高。在2種度量標準下,各個指標的排名差異較大,其中,轉發性以及轉發活躍度對于WRF分類效果的影響最大,而用戶分類關鍵詞數量以及性別對于模型分類的重要性最小。

4.2 不同用戶屬性的轉發預測性能

在對模型分類預測性能進行評估后,即可確定不同指標的重要程度,為了能夠對用戶轉發行為進行預測,可選擇3個屬性進行分析,包括特征屬性、行為屬性及興趣屬性。

3類用戶屬性預測結果差異較大,其中,行為屬性預測結果準確性較高,而用戶興趣屬性預測結果準確性較低。另外,在3類指標中,特征屬性的召回率較高,興趣屬性預測召回率和特征屬性預測召回率相近,行為屬性召回率最低。

通過對F1分值進行對比發現,行為屬性效果最好,興趣屬性得分最低。數據集具有不平衡特征,因此,在對模型分類能力進行分析時,需對精確度指標以及召回率指標進行分析,通過對F1度量結果進行對比分析發現,用戶行為屬性分類效果最好,由此可見,用戶的轉發行為、評論等會對轉發行為產生較大影響,另外,不同用戶粉絲屬性以及關注人屬性等會對用戶信息轉發行為產生較大影響,用戶興趣處于不斷變化中,對于用戶信息轉發行為的影響比較小。

在繪制ROC曲線后,通過對ROC曲線進行分析,可發現用戶行為屬性的分類效果較好,對用戶轉發預測的影響較大。用戶3類屬性的ROC曲線如圖3所示,行為屬性ROC曲線最靠近左上角,因此,AUC值最大,由此可見,行為屬性對于用戶轉發行為的影響較大,其次為用戶特征屬性,最后為用戶興趣屬性。

圖3 3類屬性的ROC曲線

5 總結

綜上所述,本文主要對在線社交網絡信息傳播建模方法以及用戶轉發行為預測方式進行了詳細探究。在在線社交網絡平臺運行中,在信息傳播方面,用戶行為驅動為十分重要的內在影響機制。在本次研究中,創建用戶興趣加權的隨機森林模型,在用戶轉發行為預測中選擇3個屬性,分別為特征屬性、行為屬性和興趣屬性,通過將隨機森林模型(WRF)與傳統森林模型以及Logistic回歸模型進行對比發現,WRF模型的分類性能比較好。另外,在WRF模型的基礎上,對各項屬性評分以及ROC曲線進行對比,確定行為屬性預測效果較好,能夠反映出用戶行為習慣對在線社交網絡平臺運營中信息傳播的影響。

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 国产在线精品美女观看| 亚洲AV无码久久天堂| 国内精品九九久久久精品| 狠狠色丁香婷婷综合| 国产激爽大片在线播放| 人人爱天天做夜夜爽| 亚洲人免费视频| 色播五月婷婷| 国产激情无码一区二区APP| 2019国产在线| 亚洲人成网7777777国产| 在线播放精品一区二区啪视频| 99性视频| 日韩精品免费一线在线观看| 午夜日b视频| 国产成人区在线观看视频| 亚洲五月激情网| 国产成人区在线观看视频| 欧美天堂久久| 91无码国产视频| 国产91色在线| 欧美日韩国产在线播放| 日韩高清一区 | 一本久道热中字伊人| 日韩欧美91| 黄色网站不卡无码| 国产一二视频| 欧美激情视频一区二区三区免费| 欧美亚洲网| 免费黄色国产视频| 91免费国产在线观看尤物| 国产精品分类视频分类一区| 国产一级毛片高清完整视频版| 亚洲AV成人一区二区三区AV| 最新午夜男女福利片视频| 亚洲欧美国产高清va在线播放| 亚洲欧美日韩综合二区三区| 亚洲男人的天堂网| 国产激情影院| 99久久国产综合精品女同| 欧美精品一二三区| 国产精品漂亮美女在线观看| 免费国产福利| 久久久久亚洲av成人网人人软件| 午夜啪啪网| 国产极品粉嫩小泬免费看| 韩国自拍偷自拍亚洲精品| 久久精品国产精品青草app| 91网在线| 国产一级毛片网站| aaa国产一级毛片| 亚洲中文字幕97久久精品少妇| 欧美日韩国产精品综合| 欧洲日本亚洲中文字幕| 亚洲国产高清精品线久久| 永久成人无码激情视频免费| 色悠久久综合| 超清人妻系列无码专区| 成年人福利视频| 夜夜高潮夜夜爽国产伦精品| 综合色天天| 久久久久久午夜精品| 欧亚日韩Av| 国产真实乱人视频| 日韩一级二级三级| 激情无码字幕综合| 高清亚洲欧美在线看| 国产精品吹潮在线观看中文| 国产经典在线观看一区| 欧美一区二区啪啪| 久久频这里精品99香蕉久网址| 中文无码毛片又爽又刺激| 先锋资源久久| 免费观看亚洲人成网站| 国产成熟女人性满足视频| 亚洲综合第一区| 国内毛片视频| 人妻丰满熟妇αv无码| 综合亚洲网| 久久精品亚洲专区| 日本爱爱精品一区二区| 欧美日韩久久综合|