王嬋娟
抖音推薦算法初探*
王嬋娟
(廣東農工商職業技術學院,廣東 廣州 510000)
隨著互聯網時代的高速發展,為短視頻發展創造了良好的先決條件,眾多視頻平臺如雨后春筍般不斷涌現。其中抖音APP以準確定位、精簡制作、智能算法推送等模式受到了廣大網民的歡迎,用戶數位呈爆炸式增長,躍居各大短視頻軟件榜首。以抖音平臺為例,對其推薦算法進行初步分析研究。
推薦算法;抖音;短視頻;互聯網
隨著智能手機及無限流量包的普及,短視頻發展勢頭迅猛。較之于傳統圖文的瀏覽方式,碎片化內容的短視頻更易贏得受眾青睞。據官方數據顯示,截至2018-06,短視頻行業用戶量已達5.94億,在所有互聯網的用戶中約占74%,且滲透率還在不斷提高。
最早進入短視頻行業應用的是美國VIDDY,于2011年發布獲得成功后,快手、秒拍、騰訊微視等眾多客戶端也紛紛上線。經過市場的打磨、用戶原始積累后,2015—2018年短視頻行業迎來了百花齊放的春天。各大平臺紛紛找準定位,快手主推草根原創文化,秒嗨以體育視頻為制作方向。在百家爭鳴的發展過程中,抖音猶如一匹黑馬,2019-05國內DAU達3億左右,峰值3.1億,廣告收入約為26億左右,是受歡迎度最高的APP。
抖音,是一款可以拍攝短視頻的音樂創意短視頻社交軟件,該軟件于2016-09上線,是一個專注年輕人音樂短視頻社區平臺。用戶可以通過這款軟件選擇歌曲,拍攝音樂短視頻,形成自己的作品。本文主要分析抖音的推薦算法。
以下從10個方面來談談抖音推薦算法的特點。
每一個新的視頻會有一個基礎的推薦量,大概在幾百。比如400的流量池,抖音會通過這個來測試視頻的受歡迎程度,測試人群里會包含該賬號的關注者,也有相當一部分是全新用戶。測試如果發現該視頻受歡迎程度高,抖音會繼續給流量,從而進入一個良性循環。
主要的推薦因子有點贊數、評論數、轉發數、完播率、復播率,這幾個是最重要的判斷視頻熱門程度的因子。瀏覽、點贊和評論的數量比一般是10 000∶100∶1,這個比例根據粉絲群體和視頻的熱門程度會有不同。例如一個關于TFBOYS的抖音號,瀏覽數和點贊數比平均能達到5∶1,當前視頻推薦算法主要還是基于用戶行為。
單個視頻的時間性不強,這個是區別于一般信息流(視頻/新聞/微博等)的重要特點。這個特點證明:①視頻不是發得越多越好,越新越好,還要看受眾歡迎程度;②好的視頻會被持續推薦和挖掘(甚至長達可能半年或1年)。對于抖音來說所有視頻就是一個視頻池。以前沒被發現的好視頻,也可能會持續被挖掘出來。
抖音雇傭了大量的真人來做視頻內容審查,一方面看視頻內容是否違反了規定;另一方面看內容是否有熱門潛力(例如發視頻的時候@“抖音小助手”是引起抖音注意的一個方法,當然實踐中可能@的人過多,就不容易受到關注)。南方周末曾經有篇文章也專門提到今日頭條在二、三線城市有大量的人工團隊做這方面的工作。
非原創的內容非常容易被限流,一旦被限流或降權相當于關進了小黑屋,再想出來就比較難(也會收到相關的警告通知)。比較常見的有從網上找來圖片堆疊聯播,修改熱門小品視頻等,遲早會被發現(被算法或人工審核發現)。
物以類聚,人以群分,音樂本身是一個非常強的分類器,每個音樂都會有標簽,這個標簽會用來區分人群、情感、性格等,例如聽周杰倫歌曲和TFBOYS歌曲的人群大部分是不重疊的。音樂的選擇很多時候決定了視頻的成敗(類似音樂DJ,每個人對音樂的追求也不一樣)。
視頻要擊中某個熱門話題或相關事件,可以是視頻本身擊中,也可以是評論里被網友帶節奏。例如一個視頻,評論里被網友帶起“真香”的節奏,視頻直接引爆。
萬事開頭難,酒香也怕巷子深,好的產品一定是需要推廣的,熱門產品=好產品本身+營銷,好的內容通過推廣可以快速覆蓋有相同興趣的更廣的人群。互聯網產品一般都提供了付費推廣功能,Dou+功能允許用戶購買流量,例如某個視頻如果覺得抖音的基礎流量池比較少,可以花錢(100元起)有針對性地擴大投放范圍(可選擇目標年齡人群、目標城市、投放時間長度等)。
Dou+投放后臺如圖1所示。抖音APP在海外每年要花幾億美金做推廣。

圖1 Dou+投放后臺示意圖
Dou+的推廣效果有幾點需要注意:①有針對性地投放。選擇人群的年齡和城市(一、二線等),不同的賬號本身的定位和受眾人群不一樣。②選擇用戶活躍時間段投放。午飯時間,16:00—22:30(尤其是18:00—21:00),節假日的早晨是抖音用戶非常活躍的時候。③非原創內容或者有不符合國家或平臺規定的不要投放,Dou+只允許投放原創內容,投放需要通過審核。
另外,抖音的計算平臺對視頻分析會產生影響。大數據計算包括實時計算和離線計算,在用戶上傳視頻后,抖音對視頻進行實時分析,往往很快得出審查是否通過的結論或者打上相應標簽;低峰時期抖音對視頻會做離線計算(尤其是疑似有問題的),所以有時候某個視頻之前還能使用Dou+推廣,隔幾天就發現被定義為非原創,無法投放。
視頻內容與風格盡量一致,目標人群垂直,例如TFBOYS的粉絲大都是比較年輕的女孩,和喜歡編程的人群交叉度不高。
符合平臺規則的產品或使用好平臺規則的產品,一定是最具生命力的產品。平臺的規則,具體就是哪些能做,哪些不能做,哪些是推崇的,不符合規則的產品實際上是風險很大的產品,例如抖音的口號是“記錄美好生活”,這句話的解讀就是:①原創內容;②用攝像頭記錄娛樂、快樂、美好、正能量的事物。
平臺的審查需要通過工具和人力,在平臺初期可能工具能力和人力跟不上,但最終這兩方面會越來越強,要從發展趨勢來考慮。基本不符合社區價值導向的最后都難逃被限流或被降權。其他平臺例如小程序也是一樣,用戶數到了幾百萬的,投入巨量的小程序,由于一直打插邊球在被平臺識別后被關閉。
在一個關于TFBOYS王俊凱的抖音賬號上發了一條王俊凱講述自己雖然被魚刺卡,發誓再不吃魚,但后面又忍不住吃的短視頻。王俊凱+被魚刺卡過的共鳴+“真香話題”,直接引爆視頻,10:00點發布,13:00已經有128 000的瀏覽量,增加了865個粉絲,14 000個贊,191個評論。評論里面還形成了幾個話題:真香定理、真香警告、真香。網友的喜愛體現在了評論里,引來嵌套式的點贊(例如網友的評論繼續被點贊),不少粉絲在評論里@自己的朋友,瀏覽/點贊比大概是10∶1,點贊數/粉絲增長數比大概是10∶1,點贊數/評論數比大概為100∶1。
G206
A
10.15913/j.cnki.kjycx.2019.24.048
2095-6835(2019)24-0110-02
王嬋娟(1983—),女,湖南人,碩士,講師,研究方向主要為商務數據分析、推薦算法研究。
廣東農工商職業技術學院科研項目“深度學習算法在預測電商熱銷品方面的應用研究”(編號:xyyb1720)
〔編輯:張思楠〕