今天,至少有4億中國(guó)人通過算法獲取內(nèi)容,國(guó)內(nèi)創(chuàng)作者群體半數(shù)以上流量來自內(nèi)容推薦系統(tǒng)。通過算法實(shí)現(xiàn)的推薦技術(shù)基于用戶歷史數(shù)據(jù)和行為,推測(cè)用戶意圖,推薦合適的商品和內(nèi)容給終端用戶,顯著提高了用戶的點(diǎn)擊率和留存率。未來,算法推薦可能會(huì)成為互聯(lián)網(wǎng)公司的標(biāo)配。對(duì)于互聯(lián)網(wǎng)內(nèi)容產(chǎn)業(yè)相關(guān)從業(yè)者來說,了解算法與內(nèi)容推薦系統(tǒng)勢(shì)在必行。
書摘:帶著偏見看推薦
推薦其實(shí)不是一個(gè)新事物,它早已被應(yīng)用在了如淘寶購(gòu)物推薦、豆瓣電影推薦、點(diǎn)評(píng)美食推薦、攜程差旅推薦等不同的場(chǎng)景中,以提升服務(wù)質(zhì)量、優(yōu)化系統(tǒng)效率。
當(dāng)推薦技術(shù)應(yīng)用于內(nèi)容分發(fā)領(lǐng)域后,在已有傳統(tǒng)媒體、門戶網(wǎng)站仍然占據(jù)重要分發(fā)位置的情況下,質(zhì)疑的聲浪頻傳。如果你經(jīng)歷過PC時(shí)代,也許會(huì)覺得這一幕似曾相識(shí):當(dāng)年,傳統(tǒng)媒體對(duì)門戶發(fā)出過質(zhì)疑聲,中心化的門戶模式對(duì)去中心化的微博模式同樣質(zhì)疑過。只是歲月輪回,昨日的挑戰(zhàn)者成了今日的衛(wèi)道士,何其唏噓。
當(dāng)內(nèi)容分發(fā)全面進(jìn)入推薦分發(fā)時(shí)代,對(duì)這一分發(fā)模式的質(zhì)疑也就越來越多,很多人站出來號(hào)召大家要一起戳破“算法的泡泡”。
一種普遍觀點(diǎn)是:機(jī)器算法主導(dǎo)的精準(zhǔn)分發(fā),在提升閱讀體驗(yàn)的同時(shí),也極易導(dǎo)致由信息收窄帶來的一葉障目,即在算法分發(fā)下,用戶將深陷信息繭房當(dāng)中。
哈佛大學(xué)法學(xué)院教授、美國(guó)前總統(tǒng)奧巴馬的法律顧問凱斯·桑斯坦在其2006年的著作《信息烏托邦——眾人如何生產(chǎn)知識(shí)》中提出了“信息繭房”這一概念。通過對(duì)互聯(lián)網(wǎng)的考察,桑斯坦指出,在信息傳播中,由于公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的領(lǐng)域,久而久之,會(huì)將自身桎梏于像蠶繭一般的“繭房”中。這頂“信息繭房”的帽子,隨著信息流量分發(fā)的遷移,被扣到了不同的內(nèi)容分發(fā)服務(wù)頭上:
在國(guó)外,先后被吐槽的是谷歌的個(gè)性化搜索結(jié)果和臉譜網(wǎng)的信息流服務(wù)。
在國(guó)內(nèi),早在2012年就有人吐槽微博是“信息繭房”,如今吐槽的對(duì)象又變成了機(jī)器推薦分發(fā)。
當(dāng)信息生產(chǎn)的門檻不斷降低造成內(nèi)容量的大繁榮,當(dāng)信息消費(fèi)者的選擇權(quán)越來越大、越來越能夠主動(dòng)選擇而非被動(dòng)接受的時(shí)候,令人擔(dān)憂的“信息繭房”就會(huì)被越來越多地提及。
然而,過濾你的并不是算法泡泡。
在紙媒時(shí)代,當(dāng)用戶從特定的媒體人、特定的媒體刊物處獲取信息的時(shí)候,其信息獲取方式不就是紙媒版的訂閱關(guān)系分發(fā)嗎?各家紙媒有自己的題材偏好和內(nèi)容風(fēng)格,不也構(gòu)成了一個(gè)“繭房”嗎?當(dāng)面對(duì)報(bào)亭中琳瑯滿目的刊物和郵局的訂閱表時(shí),用戶的主動(dòng)選擇便構(gòu)成了他的認(rèn)知世界。
還記得那本月發(fā)行量逾700萬冊(cè)的雜志——《知音》嗎?其刊載的內(nèi)容正是今天飽受詬病的典型標(biāo)題黨樣例:《風(fēng)之谷啊我的妹妹,哥哥的未來獻(xiàn)給你》《再大的恨放下吧,喚醒前夫贏得親情一片天》。在10年前,為什么會(huì)有那么多人消費(fèi)這本雜志,在10年后的今天,就為什么會(huì)有同樣規(guī)模的人在消費(fèi)著類似內(nèi)容。從用戶需求的角度看,這些內(nèi)容符合大眾用戶偏好、可以滿足他們打發(fā)時(shí)間的需求,高閱讀量就是用戶主動(dòng)選擇的結(jié)果。
內(nèi)容作為一種消費(fèi)品,每個(gè)人都有選擇消費(fèi)途徑和消費(fèi)內(nèi)容的權(quán)利。無論是紙媒還是網(wǎng)媒,只要有足夠大的候選集和主動(dòng)選擇權(quán),用戶就一定會(huì)選擇自己更為偏好的信息載體和信息源。從內(nèi)容匱乏到內(nèi)容繁榮,從中心化一統(tǒng)到垂直化聚群,用戶的選擇更貼近自身喜好是不可逆轉(zhuǎn)的趨勢(shì)。
那些表示擔(dān)心的人,本身就是多源信息的消費(fèi)者,希望看到多源信息的渴望勝過了他們看到不感興趣內(nèi)容的不悅。而不擔(dān)心的人,本身就不曾有信息多樣性的焦慮,樂得在自己的小圈圈里打轉(zhuǎn)。
進(jìn)一步,對(duì)那些擔(dān)心的人來說:他們跳得出算法分發(fā),也跳不出社交關(guān)系分發(fā);跳得出社交關(guān)系分發(fā),也跳不出自己的認(rèn)知選擇邊界?!袄O房”始終存在,真正過濾你的,是你的認(rèn)知泡泡。
在這種情況下,將“信息繭房”歸罪于分發(fā)模式更像是因失語而產(chǎn)生的牢騷。與其吐槽分發(fā)模式,不如考慮在新的模式下如何優(yōu)化;與其大聲疾呼內(nèi)容分發(fā)服務(wù)商的道德義務(wù),不如將其歸結(jié)為內(nèi)容服務(wù)商的利益訴求。
“信息繭房”并不是內(nèi)容服務(wù)商的訴求,“用戶繭房”才是其訴求。為保證用戶更好地長(zhǎng)期留存,內(nèi)容服務(wù)商就勢(shì)必需要不斷探索用戶的內(nèi)容興趣偏好、了解用戶的觀點(diǎn)偏好:
你以為只給用戶展示他喜歡的類目就夠了?那你錯(cuò)過的就是拓展用戶興趣認(rèn)知的機(jī)會(huì)。只有給用戶展示多元化的內(nèi)容,才能夠讓他消費(fèi)更多內(nèi)容,停留更長(zhǎng)時(shí)間。
你以為只給用戶推薦他偏好的觀點(diǎn)就夠了?那你就可能錯(cuò)過用戶間的討論和互動(dòng)碰撞。給用戶展示多元化甚至有沖突的觀點(diǎn),對(duì)評(píng)論的刺激作用是顯著的。而在多元化的討論之后,內(nèi)容豐富的評(píng)論區(qū)也具有了可以消費(fèi)的價(jià)值。
如果你的認(rèn)知還停留在算法分發(fā)只會(huì)給你推薦感興趣的內(nèi)容上,那你的認(rèn)知泡泡,也該戳一戳了。
對(duì)內(nèi)容推薦的又一個(gè)常見誤解是:推薦系統(tǒng)會(huì)趨向于低質(zhì)量和Low(低格調(diào))的內(nèi)容。
什么樣的內(nèi)容是質(zhì)量好的內(nèi)容?對(duì)于食品,我們有諸如保質(zhì)期、配料成分表、制作工藝等方面的要求;對(duì)于衣物,我們有型號(hào)、材質(zhì)、洗滌方式的規(guī)范;對(duì)于內(nèi)容,這種非標(biāo)準(zhǔn)化的手工產(chǎn)品,是否也存在一套類似ISO9001的標(biāo)準(zhǔn)可以衡量呢?
大眾說好,專家也說好,“叫好叫座”大概是好內(nèi)容最理想的終局。但在達(dá)成“好”的共識(shí)之后,進(jìn)一步的問題是:如果一篇內(nèi)容專家不叫好,這樣的內(nèi)容是否應(yīng)該被過濾掉呢?
未必。
比如,明明自己覺得還不錯(cuò)的電影,為什么在影評(píng)人眼里變得滿目瘡痍,充滿各種各樣的問題呢?自己覺得還不錯(cuò)的橋段,在影評(píng)人眼中卻成了陳詞濫調(diào),缺乏創(chuàng)新與深度。
在貓眼電影工作的朋友的一番解釋讓我釋然:“你是觀眾視角,影評(píng)人是專業(yè)視角。專業(yè)的判斷跟大眾的喜好通常會(huì)存在認(rèn)知背景的偏差,在技法上有待改進(jìn)的內(nèi)容并不意味著缺乏受眾。一如范雨素的爆紅,從文字技法上看,她的內(nèi)容一定是有缺失的,但她對(duì)生活的記錄觸動(dòng)了許多人的心?!?/p>
(本文選自閆澤華《內(nèi)容算法:把內(nèi)容變成價(jià)值的效率系統(tǒng)》一書,內(nèi)容有刪減。)
編輯:牛綺思