劉集
TikTok陷入風口浪尖,未來顯然還不明晰,在股權、營運權、源碼與資料的分配下各方利益都僵持不下。如果說TikTok 的算法會影響國家安全,想必能讓程序員笑掉大牙,熟悉機器學習的人不相信 TikTok 真的發展出什么獨門秘技,是硅谷無法破解或模仿的。
然而同時 TikTok 的成就也擺在眼前,它是從中國崛起走向世界網絡服務中的優秀“作品”。不僅席卷美國,在印度、中東、東南亞都以奇跡般的速度發展。TikTok 是過去 10 年第一個新的全球社群媒體,突破了由 YouTube、臉書、Instagram 等美國上一代社群媒體的控制。
通常來說,媒體要打入陌生的文化圈非常困難,有著五千年華夏歷史的中國本身也不是強勢的文化輸出國。TikTok的成功,靠什么?
尤金·衛曾在亞馬遜、Flipboard 與 Hulu 帶領過產品團隊。同時他也是電影導演,因此對于媒體常有獨到見解。最近他寫了兩篇文章分析 TikTok 的優勢,分別是《TikTok 與分類帽》(TikTok and the Sorting Hat)與《像算法一樣的看》(Seeing like an Algorithm)。
他指出社群媒體最重要的資料叫興趣圖譜(interest graph)。也就是用戶的喜好。知道用戶喜歡看什么,平臺才能推送適合的內容,以及適合的廣告。
然而傳統社群媒體都是通過間接的資料建立興趣圖譜:社交圖譜(social graph)。傳統平臺鼓勵用戶加好友、點贊、追蹤等,建立社交關系。接著平臺再根據社交關系推論用戶的興趣:你的朋友都喜歡這個,你可能也喜歡?比如當下的微信,就是從聊天開始慢慢擴展出平臺化的社群功能。
這種做法至少有四個問題。第一,不精確。例如許多人追蹤一些微博大V,可能是想看科技評論,但博主有時也會聊小孩、教育,對他們來說就是不需要的信息。
第二, 無法規模化(scale)。可規模化是指量體增加仍維持同樣的品質。可是在傳統社群媒體上,當朋友與追蹤對象突破數百,甚至數千人時,動態墻就變得一團混亂。小學同學、同事、父母、應酬上只聊過一次的朋友、不認識的意見領袖等,全部的言論擠在一起,這得花多大力氣才能區分開啊。
第三, 導致一些群體的對立和罵仗。有一本書叫《同溫層時代的生存指南》,其中解釋過,傳統社群媒體篤信自由主義,認為平臺應該容納多元化的想法、語言。現實卻是人類無法處理這么多信息,意見不統一就陷入了口水仗。
第四, 不公平。先行者在傳統社群媒體有優勢。平臺為了鼓勵創作者累積追蹤者,會優先導引流量給那些已經累積許多追蹤者的人。這導致貧者益貧,富者益富。新人難以追上先行者,長期以往,就沒有興趣在平臺上發表創作了。

最壞的結果是用戶流失,如果遇到新的技術出來,這個平臺可能垮得很快。用戶覺得平臺上的內容太亂、沒有趣、充滿對立與憤怒,于是一個一個地離開了。
社交是個大命題,現在互聯網廠商和用戶都知道流量為王,TikTok的核心在于由“中央計算”來決定流量的去向,每一個用戶看到的推薦內容都由算法決定。
TikTok 的算法幾乎不考慮社交圖譜,而是完全偏重用戶的使用行為。只要你的影片能吸引一小批人駐足,算法就會推薦給其他可能感興趣的人,這解決了傳統社交的問題。
首先,算法分配更公平。TikTok 會根據用戶的停留時間,用戶是否按愛心、瀏覽創作者首頁、點擊音樂來源或標簽等行為來判斷用戶的興趣,這讓新加入的內容創作者更有機會突圍。
其次,可以規模化。每個人看到的推薦都不一樣,也不會各種內容擠在一起。就像《哈利·波特》中的學院制分配,將學生分到不同學院,但是學習又能在一起。用戶在 TikTok 上也吵不起來,因為不知道彼此看了什么內容。
最后, 算法推薦更精確。TikTok 直接建立興趣圖譜,避開了社交圖譜內含的雜訊。而且顯然這種方法在全球都適用。
然而,可能有用戶會問,為何 TikTok 的算法特別精確?歐美的互聯網巨擘難道程序基建不比我們強?算法本身不特別,關鍵在于字節對于后臺數據的大量分析。
TikTok 原名 Musical.ly,是一個在美國青少年之中躥紅的小社群媒體,特別適合制作歌唱影片。后來字節跳動并購了Musical.ly,將之改名為 TikTok,并串接了字節跳動的招牌算法。同時字節跳動開始為 TikTok 狂打廣告,據說在 2018 年就花了 10 億美元廣告費,第一批用戶由此建立。

TikTok早期的短視頻資料除了自身策劃,主要源于自由創作者
有了種子用戶,TikTok開始收集資料,其資料主要是自給自足的——完全來自APP內。
TikTok可能從交友平臺學來這樣的設計:左滑沒興趣,右滑喜歡。相較之下,傳統社群媒體則采取無限滑動(infinite scroll)機制,讓用戶可以不斷地往下滑。
但是TikTok用起來也有一些比較麻煩的地方,用戶要一直用手滑動,確實比較累,還容易得腱鞘炎。然而卻讓算法能取得更清楚的資訊,知道每一個動作對應的影片。相反的,臉書、Instagram 等的畫面中隨時都有至少兩則內容,算法很難判斷用戶是為了哪一則內容停留。
另一個例子是傳統社群媒體不允許按“不贊”(downvote)。但 TikTok 的設計已經內含了不滿意的訊號——只要你停留時間夠短,就是表示沒興趣。
從TikTok還可以取得其他資訊,例如用戶可以點擊唱片圖標,連接至其他使用同一則音樂的影片。用戶可以點擊愛心或創作者頭像,顯示你格外有興趣。創作者上傳影片時會下標簽(tag)。TikTok 的算法也會判斷影片中的內容,諸如物件、人物、性別、表情、影片長度、濾鏡效果等,當然 TikTok 也知道觀眾的喜好資料。
所以綜上所述,TikTok 最大的創新并不是算法,而是整個產品圍繞算法做的需求設計。業內人士稱之為算法友善(algorithm-friendly)設計。這跟一般的使用者友善(user-friendly)略為不同,就好像算法也化身為團隊成員。
TikTok 拋棄了社交圖譜的打法,創造了自給自足的資料回饋圈(feedback loop)。用這些資料訓練算法,用戶就能看到真正有興趣的內容。而越多用戶使用 TikTok,就有越多創作者在此博求關注。
社群媒體是雙邊平臺:一邊是觀眾,另一邊是創作者。TikTok 不只研究觀眾的興趣,也研究如何刺激創作者生產內容。
TikTok 創造了創意性的網絡效應(the network effect of creativity),但沒有詳細解釋。不過身為創作者,我們可以觀察到幾個特色。
首先,TikTok 提供易上手的創作工具,讓用戶可以快速地制作短片,并加上各種效果,滿足了視頻制作者的需求。
其次,TikTok 提供各種范本(template)。創作者都知道,創意的核心是抄襲,咳咳,應該說致敬。TikTok 上有許多人翻唱同一首歌、跳同一支舞或是用同一個梗,就是一種創意模仿。
而 TikTok 也鼓勵用戶和用戶之間的互動,讓創作者能輕松引用同一首音樂,也可以做雙人舞或者分屏拼接(duet)。
兩次, TikTok 提供數據。TikTok 會顯示當前熱門的關鍵字、標簽,引導創作者做相關的影片。這一點也蠻有計劃經濟色彩。
最后,TikTok 創造了一種互相連接、開放分享的文化。在算法之下,適者生存。創作者無法仰賴追蹤者數,必須時時觀察 TikTok 上的流行,察覺算法的偏好,并參與社群之中。而最快的方式就是合作、創意模仿。
TikTok 指出了一條路,讓算法居于核心,用設計來喂養算法。這個做法最終能規模化地掌握每一個人的個別興趣,而且不需要經過社交圖譜。這個設計概念不只適用影片或娛樂——字節跳動第一個算法作品是新聞APP今日頭條,未來也會出現在任何需要算法的產業,至少包括電商、課程、交友等。例如筆者就很希望有一個針對自己興趣,推薦科技文章的APP。相信在未來,各行各業都會出現采用 TikTok 模式或算法友善設計的挑戰者。