◎鄭家錄
(秭歸縣電視臺融媒體中心 湖北 秭歸 443600)
標題黨,是指在以互聯網為代表的論壇或媒體上,通過引人注目的標題來吸引受眾注意力,當受眾點擊進去發現與標題落差很大而又合情合理,以達到增加點擊量或知名度等各種目的網站編輯、記者、管理者和網民的總稱。
標題黨現象的成因,除了商業模式的驅動,還有用戶多樣性、不同用戶體驗需求對標題黨內容標準的不一致,標題黨現象難以根除。本文從日常實際中,截取了五大門戶網站上篩選出標題黨內容,從數據上分析標題黨的五大特征。
1.驚!一男子喝醉酒竟然和動物……(武松打虎)
2.驚呆了!睡了十二年的戰友,竟然是女兒身!(花木蘭)
3.中國學生數學神乎其神的原因,美國人終于破解了……(中國學生比較能吃苦)
4.膽小別看!醫鬧患者當場砍死醫生,場面血腥!(曹操殺華佗)
5.驚悚!38歲李玉剛滿頭白發老態龍鐘(化妝)
6.黃曉明暴打楊穎,真正的原因是這樣的,令人驚訝!(澄清媒體造謠)
這一類標題黨在信息流中雖然比較少見,但是引起的用戶反感效果最強。其中一類為通過事件某一個側面,用引人聯想型的文字描述,多與低俗擦邊,來吸引點擊。我們以負面評論作為評判標準,這類文章的負面評論最多,用戶最為反感[1]。
1.中國小將被擊倒后暴走,一拳KO泰拳王。
2.國乒天才打出絕世無解球,對手被嚇懵,解說員瘋狂。
3.楊建平為師弟報仇,把韓國拳手拎起來揍。
在這一類標題中以用戶情緒為出發點,渲染夸大事實,以此來刺激用戶點擊。這些內容普遍點擊率較高,時長及閱讀完成比并不低。
這一類標題黨多利用數字,追隨社會熱點,多用“為什么、你、全世界、99%”等敏感詞匯,多引用名人案例來刺激用戶的求知欲,刺激用戶的好奇心。內容本質上是比較普通的事件[2]。
根據五大門戶內容數據,將最近一個月的內容按閱讀時長、CTR、閱讀完成比分段,閱讀時長(0-20秒,20-60秒,60-120秒,120-180秒,180秒以上),CTR(0-6%,6%-10%,10%-15%,15%-20%,20%+),閱讀完成比(0-30%,30%-50%,50%-80%,80%-100%),最終交叉有80種組合,大致分析了每種組合中的內容情況,發現數據規律性很明顯。
熱血戰狼文、噱頭、部分標題黨CTR水平在20%以上,完成比80%以上,博眼球內容較多。但閱讀完成率低,另外通過差評的角度對內容進行區分,抽查了一部分差評較多的內容,發現差評的類型比較多,差評占比達到40%以上。
我們調研了約100名不同年齡、職業的用戶,通過用戶過去喜歡看哪類內容,各類內容閱讀深度如何,對標題黨內容是否敏感,是否喜歡看大眾的獵奇內容,還是偏好垂直、深度內容,發現對同一篇文章,這100名用戶對標題黨的認知不一致,有50%的內容偏差。
根據數據特征的差異性,在現在互聯網數據分發階段,我們可以利用后延數據算法模型來對文章進行區分。在召回和排序算法中考慮閱讀時長、閱讀完成比、分享率、收藏率、評論率等多維度數據,降低點擊率的影響,通過用戶深度反饋——分享、收藏等指標,來抑制單純刺激點擊產生的“馬太效應”。
在目前各家互聯網公司的分發模型中,多采用機器學習常見的FFM模型、FTRL等模型來預測內容點擊率,我們以此為處罰點,構建分發模型,例:
后驗數據特征=點擊×系數A+分享×系數A1+收藏×系數A2+閱讀完成率×系數A3+正評×系數A3-負評×系數A4
在此公式中我們將A1、A2、A3、A4系數靈活設置,將正面系數調大,可以抑制單純以點擊驅動的分發模式。
對于一般型標題黨內容略微夸大,但不存在誤導用戶行為的稿件,互聯網不會將之扼殺,但是為了兼顧用戶體驗,需要對用戶進行分群。存在同一部分內容一部分用戶最喜歡,而另一部分用戶最不喜歡,可見通過用戶歷史興趣再結合人工經驗梳理來對用戶分群,能對用戶細分起到一定效果。對于不同水平的用戶所表現出的數據特點也會有所差異,時間緊迫,可以先對高端用戶,標題黨敏感,喜歡深度內容,不喜歡高點擊率、大眾、獵奇內容的用戶,進行低質量內容限制,后續逐漸優化梳理映射規則,覆蓋全部用戶并做到精準分發[3]。
我們發現有些明顯標題黨品質很差、平均時長和閱讀完成比很低的內容,還是有一些用戶讀完了,可以認為這些人就是對標題黨不敏感的用戶。也有一些平均點擊率X%以下、平均時長和閱讀完成比也不高的內容,同樣有一部分用戶認真讀完了,仔細分析發現這些內容都是領域內比較垂直、有深度的內容,大部分普通用戶是沒有興趣閱讀的,而認真讀完的用戶都是在這方面興趣很垂直的用戶。
因為用戶在某領域的知識水平和興趣度是不同的,根據統計的平均CTR、時長、完成比等都是在所有用戶上的表現,一些資深人士的行為很容易被大部分的普通用戶的行為掩蓋,導致這些后驗數據失去個性化分發的作用。而這種現象在財經、體育、軍事、軍情、時政、國際、社會等幾個專業性強的類別下表現更加突出[4]。
差評可以識別出一部分低質內容,去掉大部分用戶不喜歡的內容,但對于有爭議內容、戰狼文,并不適合一刀切,而是找到對其感興趣的用戶進行推薦。其實我們忽略了一篇內容是哪些人貢獻了這些點擊和行為,只需將平均數據拆解到用戶群體,便可以將內容屬性和用戶屬性劃分開。
除了依靠數據和用戶分群之外,還需要人工輔助。需要在人工梳理用戶和內容分類的基礎上,對信息流分發過程中的召回、排序算法進行優化。對一篇文章,不單單通過所有用戶的后驗數據進行排序,需要細化到不同用戶群的表現,內容之間的排序要考慮同類用戶群下的數據表現。
互聯網平臺要加強內容審核,依靠編輯的經驗判斷來提升內容品質。通過文章審核、媒體評級等手段凈化內容生態。
標題黨游走于質量“灰色地帶”,給互聯網公司帶來收益的同時,也在消耗平臺的用戶體驗,縮小平臺的生命周期。對標題黨的治理任重而道遠。