知乎就是一個社會,算法的調整就是一次社會動蕩。
在近幾年的中文互聯網上,知乎是一個無法忽視的存在。沒有一個網站能像知乎這樣,雖然只有2000多萬用戶,影響力卻無處不在;沒有一個網站像知乎這樣,同時扮演了問答社區、搜索引擎、大眾點評、新聞社區、情感論壇、 第一人稱文學網等這么多角色。這就是一個生態。
知乎的用戶結構:兩極分化的金字塔
2014年8月的知乎用戶調查數據報告為我們勾勒出了這群“中文互聯網鄙視鏈”最頂端的群體的畫像。然而,知乎這個2000萬人的“知識社會”的社會結構是什么樣的?這時候就要請出知乎數據大帝,“看知乎”的創始人蘇莉安同學。
他于2014年8月通過以3,507,426名總用戶為樣本進行數據挖掘而推出的《第一次民間版知乎用戶分析報告》讓我們可以一窺知乎用戶的行為習慣、分工構成。
69.14%的用戶是完全沒有人關注的“小透明”,83.76%的用戶從未回答過問題,96%的用戶粉絲不足10人,而粉絲數超過1000的“大v”只占總用戶的萬分之九。而零關注、零提問、零回答的“三零用戶”占全體用戶的59.65%。65%的人只關注粉絲上千的3000多位“牛人”,近一半的人把所有目光完全限定在粉絲過萬的729位“大?!敝稀?/p>
這不只是一個金字塔社會,更是一個金字塔“頂角”小于1度的“針尖型”社會。這也印證了絕大多數用戶對于知乎的定義——“上知乎就是為了瞻仰神人”、“上知乎漲姿勢”、“上知乎就是為了開闊眼界”。也許新浪微博還能暫時安坐在“社交媒體”的交椅上,但是知乎真該放棄社交大夢了(然而并沒有)。不妨再補上一刀:在知乎你關注一個人時只有1.25%的概率得到回粉。
“大V路線”對于新浪微博來說可謂“成也蕭何,敗也蕭何”,知乎也是如此。雖然從去年開始,處于“成敗轉折點”上的知乎開始“矯枉過正”地賦權于“小透明”,還激起了少數大 V先拂袖而去的連鎖反應。不過,在此之前,知乎一直不遺余力地推動著“造星運動”,發掘了一批在線下默默無聞,卻能依靠問答成名的“知識英雄”。
知乎的中心化程度遠遠高于Quora,知乎創始人周源的關注者是Quora CEO follower數量的6倍。在知乎上, TOP 1 的“大V”李開復有87萬粉絲,而Quora上最受人追捧Wikipedia創始人Jimmy Wales不過15萬follower。
是中國網民的從眾心理、追星效應在作祟么?顯然并不是。這樣一座高聳入云的“知識金字塔”是知乎親手鑄造的。
“新版的動態是一個以人為核心的信息流。”這是2012年8月16日知乎首頁改版時周源的解釋,之所以將用戶關注的問題、話題、回答“折疊”進通知和話題動態里,只是為了拯救被不同維度篩選出的內容亂糟糟充斥的feed。知乎放大“人”作為信息節點的能量,希望用“人肉過濾器”來實現信息的篩選。(知乎團隊當仁不讓地扮演了curator的角色,黃繼新也在“當我取消關注黃繼新、張亮等人后,我在知乎是否更開心?”這一問題下為自己的刷屏行為辯護:“我現在其實是通過人肉的方法來解決系統將來依靠算法和產品來解決的問題。”)因為“基于問題/話題的feed設計可以在內容范圍上實現信息篩選,但無法在內容質量上進行信息篩選。”
“雖然動態出現什么內容,完全是個性化的選擇——感興趣就保持關注,不感興趣可以取消關注,但,這個成本對大部分用戶來說仍然太高了?!痹谥茉囱壑?,向微博、人人等SNS網站靠攏,對于新用戶來說是一個學習成本更低的選擇。
如此一來,高關注用戶“事實上”就成為了決定什么話題、問題、答案能被大多數用戶看到的“實名編輯”——關注度即權力。他們的一舉一動,一個回答、一個關注、一個點贊都能被成千上萬的用戶看到。
“大V出場自帶300贊”、“一處大V,全站大V”、“新手的回答只有被大 V的金手指臨幸,才有機會出頭”、“大V組團刷屏”……關注度馬太效應造成的“知乎怪象”愈演愈烈。而2014年12月之前以點贊數論高低的問題排名機制更是放大了大V的馬太效應。
我們可以順便看一下“鄰家小妹”豆瓣的情況。撐起豆瓣相冊半壁江山的“福根兒”不過才有18萬關注者,而水木丁、囧之女神等所謂的“豆瓣紅人”關注者都不超過10萬人。
“人肉代替算法”的權宜之策一直持續到2013年11月的首頁改版,造成的高關注用戶與“小透明”之間的權力失衡已經難以逆轉。也許,所有高門檻的UCG網站最終都會不可避免地演變成PGC網站。
首頁的改版:人肉過濾還是話題過濾
我在《商業價值》此前所作《豆瓣十年,一朝重來》一文解析中,曾經提到過豆瓣在“內容發現”問題上的路線之爭:算法推薦V.S.社交推薦。豆瓣雖然嘗試著兩條腿走路,然而每一條都有先天不足之處:推薦算法缺少用戶的頻繁“調教”導致精準度不高;社交推薦由于用戶的低活躍度而內容稀缺。
與豆瓣在兩種機制之間搖擺不定,首頁來回“變臉”不同,知乎對于人肉過濾和話題過濾的優劣長短,對于內容運營和技術能力有著清晰的認識。前文提到的黃繼新不惜“刷屏”充當人肉curator就是在早期推薦算法無法有效提高信噪比的情況下的一種權宜之計,用強運營來頂上技術的短板。
然而,首頁只推關注人的改版引發了用戶大規模的吐槽和反彈,堪稱知乎的第一次信任危機。(甚至出現了“如果知乎堅持新版你會退出知乎嗎?”這樣的問題)周源不得不站出來一再解釋改版的初衷源于話題推送的Bug暫時難以克服,“導致 feed 信噪比急速下降,很多新用戶被罵。這種情況讓我們很痛心。”
據知乎聯合創始人張亮透露,首頁feed之所以“一刀切”的改為以人為核心的機制,是因為同時(準確點說,是在首頁動手術20多天后)在首頁為話題開了一個入口(也就是把首頁的領域變成了話題)。知乎的思路是:讓訂閱的用戶和話題分開顯示,各取所需。然而,首頁feed卻只有一個,話題被擠下首頁,“躲進”二級頁面。當用戶要點開“話題”,然后在無數話題中選擇一個,點擊“動態”才能看到更新時,難怪他們會怒氣沖沖地質問“首頁的話題都不見了,那么關注話題還有什么意義?”
2012年8月這次怨聲載道的改版風波說明:蹣跚學步階段的知乎想要在Quora之外另辟蹊徑時仍顯稚嫩。一年多以后,一直飽受詬病的知乎首頁終于“改邪歸正”,這背后當然是知乎技術能力的不斷成熟。用戶關注話題下的內容才重新進入首頁動態,相比兩年前的升級之處在于“智能排序,動態內容會根據你的閱讀偏好不斷優化,越用越好用?!?/p>
問答排名算法:牽一發而動全身
我在前文曾經把知乎的點贊投票機制比作超級女聲,然而與“一人一票”的民粹型民主相比,知乎的段位還是要高上一籌。這主要體現在知乎的問答排名機制上:在2014年12月之前,知乎的回答排序算法是:得分=加權贊同數-加權反對數,得分越高回答越靠前。
與簡單粗暴的“一人一票,票票平等”相比,高權重用戶的投票,會對排序有更大的影響,他們的回答也會具有一定的排序優勢。按照知乎產品設計師黃濤的回答——“用戶在某個問題下的權重,是根據他過去在相關話題下的回答得到的贊同、反對和沒有幫助票數計算的。用戶過去回答的得票,體現了其他用戶在相關領域下對他能力的認可程度?!?/p>
如果把知乎比喻為一個城邦,那么他的治理規則既不是民粹式民主,也不是全然的精英統治,而是兩者兼顧。這套機制一定程度上保證了那些“專業性”與“通俗性”兼具的答案能夠浮出水面。
然而,很多時候,專業人士往往寡不敵眾(據媒體報道,500萬用戶時的知乎有3000名高權重用戶,比例僅為0.06%。哪怕他們手中的票以一當十,也還是杯水車薪),專業性往往要給“通俗性”讓路,信息密度往往要給閱讀快感讓路。這也就是為什么知乎的榜首回答動輒洋洋灑灑幾千言,連一篇分析房價走向的回答都要用暴漫、日和、網絡熱圖“人為”地制造起承轉合的“故事感”(畢竟,人人都喜歡看故事)。而很多專業領域的討論僅限于向外行人“科普”的ABC水平。
蘇莉安曾用“100字以上的答案掠走了贊同總數的80%;而1000字以上答案雖然總數不到4%,所有人點下的贊同卻有40%落在它們頭上。”來反駁“知乎變水了”這一論斷。然而,知乎的“水化”當然不僅僅是由于抖機靈的回答越來越多,而是由于用戶群體的不斷擴大,用戶平均水平的不斷降低,一個回答要想獲得高票贊同,不得不加入更多的背景介紹和通俗化包裝。曾經滿是干貨的社區也就變得越來越“水”了。按照黃濤的說法“一些誤導性、煽動性的高票內容,即使同時也有很多反對票,仍然排在認真、嚴謹但票數相對較少的優質回答前面?!?/p>
問題當然不止于此。單純以“贊同數-反對數”對回答進行排序的機制忽視了“時間”這一重要維度。一旦某些時間較早的回答獲得了高票,占據了高位,那么即使后來的回答質量更高,也會由于很難獲得足夠的曝光而贊者寥寥,從而被埋沒。尤其是,知乎上的大部分問題的熱度都會隨著時間的推移“冷卻“下來,正當其時的回答引起了足夠多的關注,姍姍來遲的回答則乏人問津。沒有多少人會從頭至尾看完每一個回答,排名靠前的回答就成了“馬太效應”的受益者。
久而久之,一個問題下面的回答就會像“化石”一樣固化下來,新的回答很難出人頭地。這對于躍躍欲試的新用戶無疑是個巨大的打擊,失去了源頭活水的社區也會慢慢變得靜若死水。
2014年12月,知乎開始對回答排名算法“動手術”了。
上面的威爾遜算法公式雖然復雜,但其實決定答案得分的主要有兩個參數:贊同率p(贊同數/反對數)和參數 。按照知乎數據帝chenqin的分析:p設置得越高,絕對贊同數就越重要,設置較低時,贊同率就越重要。當 等于0時,贊同率將起到全部作用。而數學帝曾加則觀察到:當n(贊同數+反對數)很大的時候,得分最重要的影響因素是 p,也就是贊同比。
相比于原來的算法,新算法最大的改變就是更看重贊同反對比,而不是贊同反對差,這意味著反對票的“殺傷力”大大增強。表面開來,那些“客觀中立”、“四平八穩”、“擺事實不講道理”的回答將會獲益,而那些觀點鮮明、站隊明顯、情緒化等容易“招黑”的回答將因為踩的人過多而沉底。
上文在分析“知乎為什么成功”時曾經提到:知乎人氣高漲的一個原因正是吸引了價值觀不同的群體(女權主義、中醫、左右派)之間的站隊、PK,形成了一個觀點爭鋒的輿論場,提高了知乎的活躍度。然而,正如魏武揮指出的那樣“真理越辯越明只是知乎一廂情愿的理想主義”,不同觀點的PK導致知乎的虐氣越來越重,一言不合便惡語相向,掐架謾罵成為家常便飯。長此以往,知乎理性討論的氛圍將蕩然無存。相比之下,以科學事實類問題為主,聚集了一幫理科生的果殼問答則很少有此困擾。所以,“贊同數-反對數”的答案排序規則一直沿用至今。
加大反對票的權重就是對“站隊現象”的一種矯正(也許是矯枉過正)。在新的算法下,xx粉和xx黑曾經“捉對廝殺”的回答因為互相踩踏將會雙雙降級,上位的將是各打五十大板,“安全無害”的回答。(在“中醫是偽科學嗎?應該如何看待中醫?”問題下,排名第一的回答寫道“中醫不是科學,中醫有效果,不解釋?!保┤欢瑺幾h越少的回答就越是好的回答嗎?懲罰“有態度”的回答或許能夠減少大家討論時的“火藥味兒”,讓排名靠前的答案趨向“中立”。然而,增強反對票的威力卻可能會鼓勵“正反雙方”互踩,使彼此更為“對立”。過去,讀者只需要用點贊來“是其所是”,現在他們還傾向于用反對來“非其所非”。
知乎之所以選擇不顯示反對者的名字及數量,正是為了給答題者以正向激勵,而不是負面激勵。而如今,匿名、數量不透明的反對票卻掌握了一個回答的排名升降,這種負面激勵恐怕會給答題者造成更大的困擾,也會鼓勵惡意反對的出現。
有63萬粉絲的yolfilm甚至說出了這樣的話:
當他們在微信群里得意洋洋地說,如何用小號集結,用軟件把某某某的答案點反對時。你們知乎的設計,容我再說難聽一些,就是為虎作倀。知乎若敗,那第一個敗象,就是2015年的“加大反對權重”設計。
友善度機制:知乎的“整風運動”
看了“如何評價知乎的友善度機制?”下面的80多個回答,你就會知道知乎管理員的“G點”有多低。以上4種言論在被人舉報后都被知乎管理員判定為“不友善”,被扣除相應的友善度點數。而當友善度點數被扣完之后,用戶就會被關進“小黑屋”,與被封號無異。要想恢復友善度只有3種辦法:1.舉報其他用戶的不友善行為;2.做題(比如上面那5道判斷題);3.等待每年的國際友善日大赦天下。
如果說加大反對票權重會讓答題者遭受不知何處飛來的“暗箭”,那么友善度則會讓題主回答、評論的每一個字都成為潛在的“靶子”。要知道友善度機制是“追溯以往”的,在2015年4月友善度機制上線之前的回答、評論也在舉報者的糾察范圍之內。也就是說,你在知乎上發的言越多,越有可能踩著別人的尾巴而遭到舉報。果然,就在友善度機制上線不久,在知乎上回答過300多個問題,收獲156萬贊同,2.4萬感謝的知友惡魔的奶爸就因為連續被十幾次舉報友善度被扣到了只剩半顆星,被剝奪了評論權限。為了防止有人繼續“挑刺”,他刪除了過去幾年所寫下的幾百萬字答案。
知乎友善度機制的初衷是鼓勵和引導社區用戶自治,構建和完善良性討論氛圍。然而,這種不舉不究,鼓勵用戶互相揭發(舉報別人可以提升自己的友善度)的做法實際上“防君子不防小人”。而且,由于對“不友善”的界定太過寬泛,管理員手中的自由裁量權過大。而且,在兩個人你來我往的對話中,哪些是輕蔑、誹謗、嘲諷、挑釁、歧視……的言論,更是仁者見仁、智者見智,全憑管理員是不是“玻璃心”。要知道,管理員也是有立場的。這不是自治,而是由管理員來控制言論尺度。
知乎本想通過友善度設計發起一輪“整風運動”,卻沒有換來期望中的人人謹言慎行,而是成了意見不合者打擊報復的“私器”。而且,知乎的懲戒機制對于那些“光腳的”三零用戶無效,他們完全可以再換個馬甲重新殺回來。而對于惡魔的奶爸這樣重度貢獻的用戶則是一顆隨時可能引爆的炸彈。這種表面上的權利平等恰恰是對內容生產者的不公平。用一位知友的話來表達就是“合著我一年敲幾百萬字的就活該被幾個三零用戶一晚上舉報光了抄光了封號?”
早在2013年初就有人在知乎上憂心忡忡地發問:如何重建知乎上相互信任和友善的氛圍?知友負二的回答可以送給知乎團隊:知乎不是世外桃源,整個中國社交網站的環境有多糟,知乎頂多也就只能做到比其他人好那么一點點,不要對知乎抱有不切實際的幻想。
2000多萬用戶的知乎早已不是當年那個溫良恭儉讓的知識烏托邦。這個時候還想用一套機制來對抗人性,規范人們的言行,不切實際的理想主義只會適得其反。