999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

互聯網信息分發機制研究

2022-03-24 13:19:22于書亞
媒體融合新觀察 2022年1期

于書亞

摘要:隨著技術的發展,互聯網時代的信息分發機制已與傳統媒體時代大有不同。網絡媒體平臺替代傳統的大眾媒體機構成為信息流動的重要中介渠道。傳統媒體時代的被動“受眾”向互聯網時代的“信息用戶”轉變,個體擁有了更多的信息自主選擇權。技術的高速發展使傳播環境從傳統的“一對一”發展成為“多對多”的信息爆炸時代,為解決內容消費痛點,社交性分發機制、搜索引擎式分發機制以及算法型分發機制紛紛應運而生并各自瓜分占領數字空間的內容分發渠道。

關鍵詞:分發機制 衍變 人機共治

互聯網平臺多樣的內容分發機制提升了信息-用戶的傳播效率,更好的滿足了個體用戶對信息的個性化需求,于此對應的是,傳統媒體機構日益失去了內容分發的主動權,面臨生存和發展的危機,其內容生產和分發模式的深度變革迫在眉睫。在流量和連接逐漸富余的時代,主流媒體如何在互聯網上建設有效的分發手段,建立“優質內容-用戶”的直接傳播關系、削弱平臺的控制力,發揮其優質內容資源的最大價值,并建設獨立自主可控的新興媒體平臺,將成為推動媒體融合背景下轉型發展的重要方向。

基于此,本文試圖通過梳理互聯網內容分發機制的發展歷程,對智媒時代下信息分發方式的機制原理進行深入研究,探究主流媒體在互聯網化的過程中如何解決信息分發的問題。

一、信息分發機制與算法型信息分發

傳統媒體時代,信息的生產和分發都是一體的,都由媒體機構完成。新聞的分發是粗放式、普適性的。由記者與編輯完成新聞采編,并藉由媒體自身的傳播渠道完成內容的發布,發布過程體現“群體式推送”的特征。由于受到主觀條件和客觀條件的限制,此時廣義上的“內容分發”難以進行細致的拆分,更加偏向于“發布”的概念,即重視媒體單向的傳播過程。而狹義的“分發環節”一般是指在報刊室將報刊、雜志等內容傳遞到讀者手中的這一環節。如果細化“分發”環節,強調的正是信息內容傳播至個體的這一過程。

信息分發是在新媒體時代下產生的新現象。強調的同樣也是媒體和平臺通過信息的發布和推送,最終收集到用戶的注意力。本文所界定的信息發布的概念沿用此描述。信息分發包括人工分發和機器分發兩種類型,前者包括媒體在新媒體平臺上進行信息發布和用戶轉發,后者是指應用算法、機器等技術在新聞聚合平臺上將信息內容精準推薦給用戶。

本文探討的信息分發機制是指,互聯網時代以來,信息分發成為相對獨立的傳播環節。平臺或機構如何將信息內容傳播至個體的精準匹配的過程?;ヂ摼W的信息分發機制不只是簡單地將新聞報道放置于“網絡版面”上,而是依據不同平臺特征,不同終端設備,不同使用場景下,采取不同的分發方式,從而更快實現“信息——人”的傳輸。由于這是在技術的助推下得以實現的,因此信息分發機制的發展進程始終緊密圍繞技術手段的進步。

本文所界定的信息分發機制聚焦于兩點:(1)完成了“信息——人”的完整傳播閉環,精準適配個人的信息需求;(2)從“信息”到“人”的過程中各個環節相互作用的過程,并依托算法最終達成精準分發。

算法分發機制是一種以算法為信息發布機制的核心技術,用以實現信息的自主推送,通過對大數據的整理和匯聚,并依據特定的程序自動抓取相關內容進行錄入、分析、排序、標簽化,并根據對用戶標簽的分析進行針對性的分發,將用戶與內容進行準確匹配,為用戶提供優質服務,最大程度實現用戶的個性化需求。

在當前的信息環境中,隨著技術的高速發展,算法以其強大和高速的數據處理能力介入到多種的信息交互過程中。因此本文探討的算法型的信息分發機制不僅局限于個性化推薦引擎式的信息分發,同樣也包括搜索引擎式的信息分發和社交式的信息分發。

二、互聯網信息分發機制的衍變

在我國,互聯網出現以前的信息內容的生產和分發是由國家壟斷,國家掌握著廣播、電視臺、報社、出版社等分發渠道?;ヂ摼W時代帶來信息生產和分發的進一步剝離,平臺成為信息分發的主要渠道。傳統媒體自建網站發布自己的新聞,門戶網站、搜索引擎成為了重要的信息發布平臺,它們并不直接生產新聞,而是獲取傳統媒體所生產的新聞并在自己的平臺上進行發布。之后,社交分發成為新的分發機制,各類服務類平臺也獲得了信息分發的能力。人工智能時代,算法分發占據信息分發體系的龍頭地位,使網絡時代所出現的各類新聞分發平臺進入新紀元,信息分發平臺和用戶平臺在一定程度上是重合的,即是新聞發布平臺,也是用戶接受平臺。依據其主導力量的不同,并結合互聯網技術發展階段,筆者將信息分發機制的歷史衍變分為“依據人工力量為主的分發機制”和“以算法為核心的分發機制”兩種模式進行梳理,它們各自具備不同的分發邏輯、技術手段和意義。

(一)人工分發

1.列表分發:分類索引,用戶拿取

由傳統媒體時代沿襲而來的編輯式分發機制仍然在互聯網崛起的當今時代占有一席之地,所謂的“編輯式分發”是指,“通過人工篩選和編輯,并基于受眾的共性需求向所有用戶分發相同的內容?!痹赪eb1.0時代,此類應用信息的列表式分發的平臺主要表現為門戶網站,門戶網站也被視為中國傳統媒體觸網發展的第一輪數字化轉型。肇始于上世紀九十年代,眾多傳統報刊開始嘗試在互聯網上建立自己的門戶網站,專業的編輯按照一定的標準將信息進行取舍,并最終按照不同的版塊呈現在統一的媒體平臺上,取舍和選擇信息的依據主要基于平臺定位、信息內容特質、用戶需求等。當前,此類門戶網站包括兩類,一是傳統媒體的新聞門戶網站,如人民日報、新華社等,二是互聯網的新聞門戶網站,如騰訊新聞、新浪新聞、網易新聞等。

隨著移動互聯網時代來臨,大多數傳統門戶網站的轉型突出表現為以傳統新聞門戶網站向移動端“挪移”。目前,我國大多數的新聞資訊APP仍采用“列表分發”的信息分發模式。由專業編輯統一設定媒體的欄目分類、更新頻率、內容審核標準等,編輯按照一定的標準將信息的重要性、顯著性進行把關并統一設定排序,所有用戶最終接收到的內容在統一的界面之上都是相同的。

總的來看,這種信息的列表式分發呈現具有顯著的特點:第一,其內容通常是廣泛而全面的,覆蓋社會各個層面、各個領域,以頭部內容為主;第二,分發主要依靠編輯的把關能力,對技術依賴性弱,界面頻道設定為不同分類的信息資訊,供用戶自行選擇感興趣的內容分欄獲取或自行搜索獲取信息;第三,內容生產受分發影響小。信息內容多數為傳統媒體內專業的采編團隊自行創作或轉載主流媒體的新聞內容,選擇內容的標準則由專業編輯統一把關,突出強調新聞價值性和顯著性。

2.社交分發:訂閱關注、社交傳播

伴隨大量互聯網用戶的廣泛介入和網絡帶寬的提升,互聯網服務能力的進一步提升,起始于BBS衍生出的社區論壇,每個用戶都可以自行建站,并與其他個體直接產生關聯。WEB2.0的概念開始被提出,用戶主導產品服務的時代來臨,并誕生了一批基于此種理念設計的社交產品,如Facebook、Reddit、YouTube等。由于信息的發布方式發生了根本性的轉變,信息的分發方式也隨之產生改變,一種基于XML的全新協議RSS被廣泛運用。不同于門戶網站的分發方式,RSS允許網站向用戶推送其最新摘要,當其運用于個人博客上時,便成為了一種全新的訂閱服務,即RSS集合閱讀器。這種閱讀器是完全個性化的,用戶所接收到的信息內容完全由用戶自己的訂閱列表決定。這一技術帶來了內容分發劃時代的變革。換言之,在WEB1.0時代,用戶接入互聯網獲取信息的最快捷路徑是通過聚合信息的門戶網站或搜索引擎,而在WEB2.0時代,用戶則可以直接通過訂閱或關注的用戶列表獲取信息。

隨著移動網絡的普及,信息的生產和分發權力下放至普遍個體,越來越多的人成為移動媒體的穩定用戶,社交也越來越成為信息生產與傳播的主要動力。隨著移動媒體的影響力不斷擴大,以社交為主的信息分發方式也逐漸成為主流。援引皮尤研究中心的數據,美國成年人中有超過70%的用戶每日通過社交媒體獲取新聞,在我國,則表現為微博、微信的一時火爆,我國通過社交媒體獲取新聞內容的人口比例高達八成。據2021年1月數據,微信日活達10.9億,微信朋友圈日活高達7.8億,微信公眾號日活達到3.9億??梢?,社交式分發仍然是當前內容分發格局中主流方式之一。

社交式分發方式是指,社交好友通過好友關注、點贊、轉發、評論等行為所實現的信息的傳播。首先需要在用戶之間建立一種社交性連接,再通過社交媒體中介渠道進行內容的分發。如微博始終將自身功能定位于“打造基于人際關系的信息生產和集散開放中心”,鼓勵使用該平臺的用戶隨時隨地分享和獲取身邊的新鮮事兒。當你在微博上與朋友互相關注,或關注了特定圈層的名人、網紅等,你在此平臺上所瀏覽到的內容維度便被劃定。每位博主的每一條動態、好友之間的私信等都可被稱為它的社交分發。又例如號稱“打造我國最大社交生態系統”的微信平臺,其內容分發的主要窗口是朋友圈、群組聊天、微信公眾號等。微信更加強調在熟人社交的強關系鏈基礎上進行信息分發和傳播。

社交式分發機制對傳播邏輯的改變是顛覆式的。在這種分發機制下,信息的傳播首次變為“千人千面”,每個用戶不再被動地統一接收單一的信息內容,而是通過自己的社交圈和興趣愛好擁有了個性化的內容消費。正如“世上沒有兩片完全相同的葉子”一樣,也沒有兩個人的“朋友圈頁面”或“微博首頁”是完全一致的,因為每個人都擁有獨特的社交結構和自身屬性。另外,社交式分發強調傳播過程中的“去中心化”,每個用戶都可以藉由自己的社交關系鏈條完成信息的接收與分發。信息的分發權由專業的記者與編輯讓渡到了每個普通受眾,每個人都可以成為社交關系鏈中內容分發的中心。與此同時,這也激活了大眾傳播時代被閑置的一些“長尾”內容。

社交式的分發機制下,用戶所接收的內容廣度和質量都更多由其自身選擇決定。一方面,信息的內容豐富程度由用戶的社交廣度所決定,關注更多的用戶即可帶來更多的內容;另一方面,內容的價值由社交關系鏈的質量決定,用戶也可以選擇關注特定圈層的名人,來彌補單一熟人社交分發中可能出現的同質化和圈層化的缺陷。

社交式分發機制下的內容價值更多由社交互動來評定。如微博熱搜和公眾號“10w+”的爆款文章,都是由內容的互動指標為內容增值,使其能夠進行更廣泛的裂變傳播,進而成為“熱門微博”展示在微博平臺的公共榜單首頁,或成為“爆款文章”在朋友圈引起瘋狂轉發。這不可避免的帶來了諸多病癥,諸如虛假新聞、低俗取向、營銷網文、雞湯文章等,此類為獲取更多互動指標的“無效信息”和內容生產源過多從而導致的“信息超載”使得基于社交關系的內容分發質量不斷降低。當前,Facebook、微信、微博等社交平臺都建立了相應的人工和技術審核制度來完善社交式的信息分發生態。

(二)算法分發

“算法”是計算機領域中的一種定義,指的是一系列解決問題的指令,代表著用工程和系統的方法來解決問題的某種策略。算法式分發機制即是指,利用編程技術來解決信息精準分發問題的一種機制。2016年,算法式信息分發內容已經超過資訊信息分發市場的50%,它意味著算法式分發已成潮流?!八惴ㄊ椒职l”之所以在社交式分發成為主流的分發機制后應運而生并得以廣泛應用,一方面是由于算法本就與大數據、人工智能等概念強相關,能夠處理海量、幾乎無上限的信息量,恰好解決了信源爆炸導致的信息超載等問題,同時更好的激活了以往小眾長尾內容的活力。另一方面,算法通過對社交式分發機制進行快速的重組和排序,再次優化信息的推薦結果??偟亩裕惴ㄐ头职l能夠最大限度實現對于海量信息價值的重新評估和有效適配,更加精準的滿足了用戶需求。目前,無論是新聞客戶端,還是社交媒體等平臺也紛紛引入算法,介入到信息分發中。算法式分發無疑成為信息爆炸時代實現人與信息更好更快的匹配的更優解法。因此,本文在之后所討論的互聯網信息分發機制也定位于最具分發效率的“算法型信息分發機制”。

依照用戶主動性的維度進行劃分,應用算法的主流分發機制主要包括兩種,分別是搜索引擎式的信息分發和個性化推薦引擎的信息分發。

1.搜索引擎:用戶搜索、算法調度

搜索引擎作為一種信息檢索技術,是信息傳遞過程中的一種渠道,伴隨著技術進步而產生,帶有獨特的媒介屬性??偟膩碚f,一方面,信息社會的壓力為搜索引擎的出現提供了時代背景,另一方面,技術的不斷進步也是搜索引擎發展的必要條件。至今,搜索引擎仍然是網民使用最多、最緊密的互聯網信息服務項目之一。在互聯網浩瀚如海的信息資訊中,搜索引擎猶如導航燈塔一般,幫助用戶在信息海洋中開辟出一條清晰的檢索路徑,以便我們更快找到所需信息。

搜索引擎式的信息分發肇始于WEB1.0時代。從技術范疇來講,搜索引擎共歷經三代發展:第一代以Yahoo搜索引擎為代表,主要依靠人工輸入數據并進行目錄式搜索和信息接收,很快,人類不再簡單滿足于這種方式;第二代搜索引擎以Google和百度為代表,用戶鍵入不同的關鍵詞并進行搜索,搜索引擎后臺則根據不同的算法規則由機器進行信息的快速檢索、調取、匹配和排序、分發,這大大提高了信息分發的效率;第三代搜索引擎轉向基于自然語言搜索,而非單一關鍵詞的匹配方式,讓搜索引擎更加“智能”,讀懂用戶所需。但從本質上而言,其分發機制仍舊需要依靠算法的支持,才能實現對海量數據的即時獲取與重組,并對用戶查詢內容作出準確快速的響應。

搜索引擎式的信息分發過程一般原理分為三步,分別是:(1)抓取網頁→(2)建立索引數據庫→(3)搜索內容的排序呈現,并引導用戶按照得到的搜索結果進一步搜索下去。

當前搜索引擎式信息分發最典型的應用,國外是Google,國內則是百度搜索。其原理是從互聯網提煉抓取各個網站的內容及超鏈,建立索引數據庫,在用戶檢索關鍵詞時依據一定的算法和數據庫中的索引詞進行匹配運算,并根據算法按照一定的排列順序給用戶提供檢索服務。Google和百度都擁有自己的檢索程序,能夠自己采集并建立網頁信息數據庫,當用戶進行相關內容的搜索時,能夠利用算法快捷直接地從自身的索引數據庫中直接調用,并將信息精準分發至用戶手中。這個過程類似于在智能詞典中檢索查字的過程。

搜索引擎式信息分發有以下特征:

第一,信息源包括所有互聯網上的網頁信息。第二,搜索引擎式信息傳播中的信息需求者不僅僅是被動接受,而是主動參與到傳播過程中,在搜索引擎數據庫建立之后,用戶通過“關鍵詞”介入到信息傳播過程中,從某種意義上說,“搜索引擎使用者”或“信息需求者”更加適合。第三,搜索引擎式信息分發過程呈現層次化的特點,從初試建立數據庫抓取的信息到后臺程序匹配呈現的信息,再到用戶實際會選取的需求信息,其信息量級逐層遞減,但信息的價值含量逐層增加。搜索引擎的信息分發是在信息需求方主動參與的基礎上動態呈現。第四,搜索引擎不僅只是作為傳播渠道的一種中介載體,而是承擔了信息整合與分發的全部工作,通過借助算法整合海量信息資源,并選擇突出或屏蔽某些要素的信息內容、確定信息呈現排列順序,并潛移默化地影響用戶的信息接收。在這種信息分發機制下,用戶更具有主動性,按照所需選取信息、及時反饋。

搜索引擎式信息分發機制開啟了信息的“完全私人訂制”時代。由于其技術工作原理,搜索引擎是一種完全由使用者主導的信息獲取技術,為用戶形成了一種“我想看的完全是我自己想看的”的狀態(理想狀態下),在此之前,任何其他媒介都無法實現這種信息分發。

2.推薦引擎:個性分析、精準匹配

推薦引擎系統最早被應用于電商領域,在大數據技術的不斷發展下,逐漸被應用于各種領域。推薦引擎式信息分發機制以今日頭條、一點資訊為代表的資訊應用為里程碑,發展勢頭日益高漲,逐漸成為信息資訊市場的顛覆性力量。

推薦引擎式的信息分發機制顛覆了傳統的內容生產與推送一體的模式,徹底分離了內容的生產與分發。按照個體不同的信息需求,為用戶提供定制化的信息推送。

算法推薦引擎一般包括“用戶模型、內容模型、推薦過程”三部分。

用戶模型反映的是用戶的相關信息,基于算法對用戶的特定數據進行描述。如年齡、地域、性別、階層、愛好,通過大量收集用戶數據、內容偏好、閱讀行為等標簽生成用戶畫像,從而勾勒出一個用戶的個性化特征。同時,基于人工智能的算法技術還具有機器深度學習的能力,通過對使用者的行為進行一段時間的跟蹤,能夠適時調整對用戶興趣的識別結果,極大的提升了信息分發和用戶需求之間的傳播效率。

內容模型是指對內容數據進行標簽化、建模、分類和排序。通過提取內容特征,擬定相似函數以便最大程度上和用戶特征進行匹配。推薦內容的精準度和內容模型的數量是正比關系。內容模型越多,推薦精準度越高。通過算法對互聯網上海量的內容進行精確的篩選,根據平臺的既定標準對信息的質量進行研判,根據“關鍵詞、熱度、時效性、轉載、原創度”等指標進行判定,滿足用戶對內容時效性、顯著性、趣味性等因素的需要。一般而言,需要經歷“重復標識——內容篩選——內容質量標識——時效判別——關鍵字提取分類”幾個環節。信息內容可以根據用戶畫像標記多個不同標簽,多個標簽形成一組反映用戶興趣的標簽集合,每個標簽使用的頻次則與用戶的興趣程度成正比。

推薦過程就是利用大數據將獲取到的用戶信息依據不同的算法應用于不同的環境中形成推薦內容?;诓煌乃惴P偷贸龅耐扑]策略,結合用戶反饋和平臺規則,獲得最終的推薦列表。

推薦引擎的分發機制實現了通過編程技術,在內容和用戶之間架起一座橋梁,大數據不再僅僅是海量信息的簡單堆疊,而是有序、有類的有效信息精準到達用戶。借助網絡爬蟲技術和算法技術,個性化推薦引擎能夠實現信息的精準分發,使具備定向屬性的標簽化信息適配用戶個性化需求,這與報紙、電視等傳統媒介機構形成鮮明對比。推薦引擎在當前的信息分發渠道上形成壟斷之勢。

推薦引擎式信息分發更加強調算法的主導地位,相比于人工式分發而言,不需大量專業人才或龐大的社交網絡作為基礎,算法能夠更加簡便迅捷、也更加了解用戶的個性化需求。而相比搜索引擎式分發而言,推薦引擎式的分發機制打破了用戶“主動獲知”的局限,從橫向上幫助個體拓寬了當前的眼界和認知范圍。同時,這類信息分發機制能夠滿足用戶在“被動”情景下的信息需求。你無須思考和行動,你感興趣的信息便會自動的到達你的面前。

三、互聯網信息分發機制技術原理:以“算法”為核心

隨著信息技術的進一步發展,web3.0時代加速來臨,以“算法”為核心的信息分發機制成為解決內容生產與用戶信息需求適配這一矛盾的重要工具。算法型信息分發在一定程度上決定著信息流向以及用戶對于信息內容的關注度。

(一)推薦引擎式分發機制:以“今日頭條”為例

在中國,今日頭條是推薦引擎式信息分發機制的代表。今日頭條將自身定位為一款“基于數據挖掘的推薦引擎,自身不生產內容,運轉核心是一套由代碼搭建而成的算法”。據公開數據顯示,今日頭條2019年6月的月活躍人數達到2.9億,仍在繼續增長。推薦引擎仍是當今信息環境中重要的分發工具。而今日頭條的核心分發邏輯則是通過“算法”進行內容的海量聚合和精準分發,以多元內容吸引用戶留存。

1.內容生產路徑:內容聚合與審核

內容的來源是內容分發的重要前提。今日頭條將自身定位與“新聞搬運工”式的內容聚合類平臺,顛覆了傳統傳播邏輯下的內容分發機制。其內容聚合主要來源于三個渠道,一是和平臺有合作協議的內容生產源,二是平臺利用爬蟲自主抓取到的所有信息資訊,另外,一些個體用戶主動向平臺提供原創內容。(如表2)

不同來源的相似話題將會在系統中統一被標注為同類標簽,如來自媒體①的內容A、B、C,來自媒體②的內容B、C、D,來自媒體③的內容A、C、D……以此類推,這些不同的內容標簽也將被用于后續的個性化推送過程中。

內容質量審核也是尤為重要的一環,包括機器的自動審核和人工審核兩部分。機器審核通過系統標注關鍵字詞,自動攔截部分不符合平臺推送原則的信息內容。審核包括標題長度、錯別字、價值取向、圖片、文字、視頻、音頻等各種類型的內容。機器審核會將相關違規信息標注出相應的顏色,轉入下一步的人工審核。人工審核包括初審——復審——終審三個環節,環環相扣,層層把關,確保平臺推送內容的質量,也為個性化的推送分發打下鋪墊。

2.個性化分發路徑:推薦系統適配用戶需求

個性化推薦的分發機制其核心在于算法。算法原理本質上是擬合一個用戶對內容滿意度的函數,即Y=F(Xi、Xv、Xc)。

內容、用戶和環境分別是三個基本變量。在今日頭條的分發機制中,主要包括四種基本算法,分別是:基于文本的算法(給用戶推薦與其瀏覽記錄匹配的資訊)、基于用戶的算法(相似矩陣用戶瀏覽過的資訊推薦)、基于關聯規則的算法(著重用戶和資訊本身的聯動邏輯)和基于場景的算法(包括地理位置、時間段等)??偟膩碚f,這四種算法的核心都是“貼標簽”。今日頭條通過機器識別、人工編輯和用戶自身提交信息等方式建立的標簽體系,并將“內容標簽”與“用戶標簽”“平臺標簽”進行交叉驗證,更好地實現內容——用戶的精準分發。這種分發過程包含四種環節要素:系統分析、內容分析、用戶分析及評估分析。

(1)系統分析

系統分析是為了實現用戶、場景及信息更加精準的匹配。一方面,用戶在建立個人檔案時和行為特征、興趣特征等數據幫助建立對于用戶的分類。另一方面,按照“優先鏈接機制”對聚合而來的信息內容進行分類、標簽化處理,摘要提取以及LDA主題分析等。在此過程中,場景分析也是極為重要的一環,帶有“場景標簽”的信息能更好擊中用戶的實時需求。場景式的分發常常糅雜在內容、用戶的推薦方式中,從地理位置、時間、網絡狀況、天氣及狀態等方面進行場景分類。用戶和環境的特征和信息的標簽一旦匹配,就可以進行資訊的分發,符合用戶此時此刻想要看到的信息內容。

今日頭條的個性化推薦模型依靠四類特征來實現內容、用戶與環境的匹配,分別是:第一,相關性特征,也就是將用戶的屬性和內容進行相似評估;第二類是環境特征;第三類是內容熱度特征,在平臺冷啟動時能更有效地將信息分發給普遍的用戶;第四類是協同特征,通過分析不同用戶之間的興趣、圈層相似度,拓寬其算法模型的自我學習能力,一定程度上可以緩解信息繭房。

(2)內容分析

如何將豐富的信息分發到對此可能感興趣的特定用戶面前,首先需要對這些內容進行智能分析和標簽化處理。內容分析包括文本、圖片和視頻分析三類,由于“今日頭條”最為代表性的分發內容仍是新聞資訊類,因此著重研究文本分析。

內容的“標簽”化處理是基礎的一環,主要依靠的算法技術是基于內容的推薦(content-based recommendation)。最重要的是進行文本特征的提取,語義標簽和隱式語義標簽,如關鍵詞、主題等。時空特征是“標簽化”的重要考量因素,應用基于新熱特征推薦,即基于全局內容的時效性、熱度進行推薦。如最新消息的實時推送,體現著時新性;又如來自深圳的最新交規對于北京本地的用戶意義不大。

另外,用戶查看完相關內容后,也將被打上和文本關鍵詞一致的用戶標簽。當你看完一篇有關“NBA”的文章,系統之后也會繼續為你推送相關的資訊。

內容分析在整個個性化分發過程中主要起到幾點作用:(1)用戶興趣建模,內容的“標簽化”可以有效地匹配用戶興趣建模,解決一部分推薦系統冷啟動的問題。(2)幫助內容推薦,與系統分析一起,能夠將與用戶和環境匹配度更高的信息分發給用戶。(3)生成頻道內容,不同的標簽內容進入不同頻道,如“娛樂”內容進入“娛樂頻道”,“學術”內容進入“學術頻道”。

(3)用戶分析

用戶分析同樣也是推薦系統的基礎環節之一,通過對用戶進行畫像建模,所有信息分發將基于用戶的個人興趣為起點,并以用戶的實際或潛在信息需求為落點。算法將根據用戶的興趣圖譜、用戶社會關系鏈圖譜、用戶歷史行為偏好等規則定制個性化內容并進行個性化分發。

用戶分析首先需要進行用戶的虛擬身份建模,其技術手段包括:基于爬蟲技術、數據庫及個人信息檔案(包括性別、年齡、職業、教育信息、興趣愛好等)、基于追蹤用戶歷史行為的推薦算法(點擊、瀏覽、轉發、評論、頁面停留時長等)。當用戶采用“第三方登錄”時,也能向其他平臺直接快速鏈接到用戶的個人信息以及興趣圖譜(也被稱為“投靠原則”),這有助于擺脫算法冷啟動的困境。

用戶分析另一部分是基于用戶的協同過濾(Collaborative Filtering Recommendation),通過機器模型進行數據評估和機器學習預測用戶的興趣類屬和場景化還原(也被稱為用戶冷啟動)應用賭博算法(bandit algorithm),給具有相同社會屬性的用戶推送同類資訊。

另外,用戶分析可以與內容分析進行交叉比對,分析用戶所瀏覽到的信息中不同標簽之間的聯系,并根據一定的社會網絡算法進行加權計算,并依據用戶的歷史使用行為不斷迭代用戶“標簽”,并繼續影響后續推薦內容的調整。這一環節是算法型信息分發機制的關鍵,直接影響到信息分發的精準度,并有效挖掘用戶的潛在需求。

(4)評估分析

評估分析是推薦系統的最后一個環節,即通過分析用戶滿意度來評估這個系統的推送效果。這一環節主要通過統一的評估測評師進行使用滿意度的調研,以及分析平臺的日活、月活數據等得到。評估系統的存在進一步促進推薦系統在內容的分發達到更好的效果。這一環節的存在意味著,算法分發并非意圖將決策權全部交由機器,人工力量仍能不斷的進行糾偏、設計、監督并且進行算法模型的維護和管理。

(二)搜索引擎+社交式分發機制:以“知乎”為例

“信息爆炸的互聯網汪洋大海中,有價值的信息始終是稀缺的”,知乎的誕生正是源于這樣的初心。從問答起步,知乎歷經八年成長為一個綜合性的知識內容平臺,目前涵蓋話題綜述25萬多個,問題總數2700萬多個,共計1.2億個回答內容,月活290億,打出了“有問題,上知乎”這句口號。通過個性化推薦和搜索功能,知乎通過打造全網個性化分發社區平臺,縮短了用戶和內容之間的距離,緩解了用戶信息過載的壓力。

知乎在內容的分發方面,主要由推薦、熱榜、圈子、話題、關注這幾大板塊,不同的板塊呈現的內容各有側重,所運用到的分發規則也有所區別。

知乎是基于虛擬社區,用戶之間通過提問和回答的形式進行交談、建立社會聯系并形成互動的網絡平臺。由上表可見,知乎的核心功能都離不開底層技術架構和算法在內容分發方面的重要作用。因此本章節選取“知乎”作為算法式信息分發機制的典型案例,來剖析它是如何搭建起成熟的“搜索”+“推薦”一體化的問答分發機制。

1.內容生產:多元內容生產者,算法調節社交分發

知乎這款產品的核心就是1個問題+N個回答的問答社區模式,共包含了三種不同類型的連接:一是人和人之間的連接,二是人與內容之間的連接,三是內容與內容自身的連接。在內容生產路徑的更新迭代中,同樣也引入了算法作為重要的工具,不僅加強了平臺的社區黏性,更進一步促進知乎的社交式分發的有效實現。

(1)早期:KOL入場積累優質內容池

優質的內容離不開用戶的優質輸出。知乎早期以邀請機制限定用戶數量,吸引李開復、雷軍等知名意見領袖下場答題,引來大量相似圈層的優質用戶,積累了大量優質答案,逐漸形成了精英社區的文化氛圍。在這一階段,內容的分發仍然遵循傳統社交分發的分發機制。

(2)中期:威爾遜算法激活社交生產與分發

2013年,知乎開放權限,吸引了大批的年輕互聯網人入駐,知乎社區開始充滿各種大開腦洞的提問與回答。但此時一些抖機靈、內容價值低的答案也陸續出現,并依靠其內容本身的傳播特性獲得更多的點贊和關注,導致部分用心答題的答主對平臺失去熱情。同時,一些大V開始在答題區內擁有馬太效應,新用戶的回答往往會排在后位,導致新人的曝光率難以提高,答題區內一家獨大。在此階段,如何維護問答社區的內容輸出質量,保持良好的用戶粘性,成為了知乎需要改進的方向。于是,知乎開始引入了威爾遜算法進行內容的隨機分發,以此來加持社區的用戶粘性。

威爾遜算法所控制的答案排序大致有如下規律:

①所有用戶看到的排序是相同的;

②獲得點贊會使回答排序升高,獲得反對會使回答排序降低;

③某個領域下的優質回答將提升該發布用戶在此領域下的投票權重;

④某個領域下的高權重用戶投票對內容整體排序影響力更高,此類用戶的回答排序也會更加靠近回答前端;

⑤使用匿名身份投票或答題時,不會計算用戶的權重。

用戶在某個領域下的投票權重,是基于其在該領域內相關話題下的點贊數、反對數、沒有幫助數共同決定的。但該算法不對用戶計算全局權重,即用戶的權重在每個領域下的值不可通用,在某個區域內提高權重的最好方法就是在該領域的相關話題下輸出優質答案。

威爾遜算法的導入,有效地減小了知乎大V的馬太效應,為一個更加公平客觀的社區環境提供底層技術架構,調動了新用戶的參與積極性,進一步促進了人和人的連接。

(3)后期:推薦系統刺激用戶創作欲望

為了讓用戶快速看到自己感興趣的提問,并且激發用戶的創作欲望,知乎在內容分發上從兩個方向進行了布局,從而促進內容生產的加強,分別如下:

問題提出

問題提出是一個從用戶的查詢中識別出意圖,發現知乎現在還無法滿足的意圖,引導用戶進行提問,并根據用戶的意圖生成合理的問題的過程,得到提問和描述后,后臺的卷積神經網絡模型會從知乎超過二十五萬個話題中選擇出最匹配的話題,進行話題的推薦和綁定。

問題路由

問題路由是如何分發問題以讓合適的用戶看到問題、激發他們的創作欲望。這是一個典型的機器學習排序(Learning to Rank)模式:先在眾多用戶中通過召回定位合適的范圍,然后通過 Pointwise/Pairwise/Listwise 等排序方法,找出最有可能接受邀請以及最有可能產生優質回答的用戶進行推薦,或讓用戶選擇委托系統進行邀請。問題路由在其中起到的作用就是提升匹配精準度和效率。

通過這兩種推薦系統的調節,一方面,在用戶無法通過搜索精準的獲得內容時,該用戶會成為平臺的下一個提問者,進而通過“1個問題”連接到“N個用戶+N個回答”。 另一方面,用戶在接收到“提問”時,就成為了內容的生產者,而內容的標簽也會和用戶的標簽更新綁定,成為其協同內容的分發新變量。從某種角度來看,這種算法的調節進一步強化了人與人、人與內容、甚至是內容與內容的連接。

2.分發路徑:算法推薦+用戶主動搜尋;推薦系統:算法式分發,既精準又多樣

知乎首頁信息流的個性化推薦應用的正是知乎的推薦系統。不同用戶在不同時間、不同場景打開的知乎首頁都是完全不同的。

受訪的知乎技術工程師表示:“我們的信息流推薦框架叫水晶球,一個基于多策略融合的多源內容推薦系統,之所以叫這個名字,是希望能夠通過這個系統得以一窺用戶想要看到什么內容,然后推薦給他”。

四、啟示與思考

(一)算法型分發機制仍存隱憂

1.當前流行推薦算法固有缺陷

在“算法分發”成為互聯網新聞資訊的主要分發方式的背景下,算法模型的“默認設置”掌管著復雜系統。這種默認設置的內容和特征取決于設置的設計者,而用戶又常常因為改變默認設置所需要的成本(知識、時間、精力等)而放棄修改。一般而言,這種“默認設置”更多衡量信息內容的熱度價值,即“點擊率”。這也就意味著默認設置是預設設置的人用于操縱系統和影響使用者的工具。從本質上來說,從“編輯分發”到“算法分發”是新聞資訊服務內置默認設置的一種調整。這意味著無論用戶如何選擇,或是不選擇,其結果都是接受系統選擇的結果。人們自主選擇信息的權力被不斷擠壓,僅剩下在不同機構提供的算法之間選擇。而目前幾種主流的算法模型都存在著相應的特點和不同的調整方向。

社交關系型分發機制中應用的算法規則難以有效應對前文提到的問題,即用戶社交關系鏈復雜前提下過多內容生產源所帶來的“信息超載”。另外,對親密社交關系的長期加權很容易使用戶陷入相對封閉的同質化社交圈。算法對親密社交圈的識別可以幫助用戶進行高效信息篩選,但是勢必會促使大范圍的交往變成私人領地內部的互動,并阻礙新的社交關系形成和維持。在宏觀層面上,這種對社交關系的強調會進一步加劇圈層的分化,不同圈層建構出迥異的群體認同和社會感知,社會割裂成一個個隔絕甚至對立的回聲室,社交平臺無法通過高效的信息傳播和意見送達實現社會整合功能,本應具有公共屬性的社交平臺變得碎片化。

興趣加權算法模型依賴系統內整個用戶歷史數據庫作為其推薦系統的原料,當數據嚴重稀缺時,會存在冷啟動(這里所謂的冷啟動是指對于某APP的新用戶,算法系統缺少其歷史數據,難以通過算法準確了解和把握其需求的狀況)差、推薦精準度下降等問題。加入基于模型的推薦可以有效地解決這一問題,通過算法根據訓練集數據學習得出一個復雜的模型,來預測用戶感興趣的信息,提升預測的準確度,但存在建模復雜的缺陷。

另外,興趣加權算法可以推薦用戶更愿意閱讀的內容,提高用戶的粘性。但是相比推薦系統在購物、音樂等領域的應用,其在信息分發中的應用需要更加嚴格的審視。如今,互聯網成為人進行社會感知的重要信息來源,基于興趣推薦的算法介入會使符合用戶頭腦中主觀期待的信息有更大概率被呈現,傳統大眾傳播時代的非個性化的信息環境變成“投其所好”式的定向投放,信息價值觀發生偏向,大眾傳播的教育、整合功能可能有所減弱。不同用戶接觸的資訊信息必然存在明顯的差異,且生活環境、生活方式差異越大的群體之間的信息結構差異也就越大。長此以往,這種資訊消費模式的發展和固化將導致 “知識鴻溝”和“信息鴻溝”的擴大,并進一步帶來社會群體之間的深度隔離和社會群體的分化。

2.算法型分發機制下的內容“流量經濟”

“流量經濟”這一概念最早是孫希有2003年提出,指的是“依靠人才、信息、知識、資金等要素資源的流動帶來經濟效益的一種行業業態”。內容的“流量經濟”是指,在當今的互聯網信息環境中,用戶的點擊、閱讀、瀏覽行為為平臺帶來的價值轉化。在此模式下,信息內容是吸引和留存用戶的載體,媒體為了獲得更大的商業價值,必須以更符合用戶個人興趣的內容來吸引他。

通過信息選擇的或然率可知,平臺為了獲取更多的用戶,一方面需要通過不斷優化分發技術,促進信息的分發效率,降低受眾“費力的程度”,而以算法為核心的分發機制恰是性價比最高的最優解。另一方面,娛樂化、碎片化、情感性的內容在單位時間內的閱讀難度更低,更易引起受眾興趣,得到更廣泛人群的接受。因此,算法本身作為一套數學公式,雖然是不帶有任何立場的。但算法分發機制的背后實則蘊含著其使用者的價值選擇和利益取向。在算法型分發機制下,為了抓住用戶的眼球,會出現低俗化、娛樂化、同質化內容大量充斥,標題黨層出不窮,內容質量參次不齊等問題的出現。這正是算法分發機制過于迎合用戶個人興趣所導致的內容泛流量化。

3.算法型分發機制加重“信息繭房”

信息分發機制的歷史發展進程中,越來越符合媒體去中心化、社交化的內容生產與分發趨勢,傳播邏輯轉向傳受一體化,發展至算法為核心的信息分發機制,受者本位成為信息分發的根本核心。但過度迎合受眾興趣的算法型信息分發機制,正越來越加重“信息繭房”。這也是眾多學者在探討算法技術所可能引起的負面問題中最為廣泛提及的一點。

“信息繭房”假說最早由凱斯·桑斯坦提出,他認為,在信息傳播中,公眾習慣只注意自己選擇的內容和使自己感到愉悅的信息,久而久之,公眾就桎梏于“蠶繭”一樣的信息繭房中。事實上,信息繭房在傳統媒體時代就已經存在,只是隨著算法分發技術的普遍應用,這一現象變得尤為突出。信息繭房并非由算法技術一手造成,而是人性的弱點。技術的發展讓個人擁有更強的主動選擇權,人們更加主動傾向于接受自己喜愛的信息內容,逐漸導致用戶的視野受限。在這樣的分發機制下,同質化的信息內容將個體包裹起來,形成密不透風的繭壁,個體受困其中卻不自知。

但算法型分發機制對用戶并沒有造成單純負面的“繭房”效應。從技術而言,正如今日頭條所應用算法推薦技術中的協同特征。即通過分析不同用戶之間的相似性,依靠機器自我學習能力逐漸提高算法推薦模型的優化迭代,有可能破除“繭房”。例如,A用戶平時喜歡瀏覽體育、財經和社會新聞,B用戶喜歡體育和社會新聞,那么系統也會嘗試給B用戶推送財經新聞。這樣做,部分程度上可以幫助解決所謂算法狹窄的問題。

另一方面,算法型的信息分發機制有利于用戶避免選擇信息接觸和認知不協調的心理機制。當用戶需求被推薦算法精準捕捉并適配內容時,個體用戶的內容需求可以被直接滿足,活躍用戶還可以使用搜索引擎和社交功能來拓展主題以及觀點范圍,獲得更廣的信息資源。因此,算法型分發機制在無形中可能會使得“信息繭房”得以強化,但并不是唯一原因。用戶的媒介素養、技術素養、信息接受習慣等都可能會導致“信息繭房”的加深。更重要的不是探討算法分發機制是如何使“繭房”加重,而是如何從算法優化、用戶自身、媒體擔當等方面去反思如何打破“繭房”的禁錮。

(二)新型主流媒體建設算法型分發機制的啟示

從傳統的“人工列表式”信息分發模式,到社交媒體的“UGC-社交分發”模式,再到以算法為核心的推薦引擎和搜索引擎的分發模式?;ヂ摼W信息分發機制的變遷既反映出傳媒技術的不斷進步,也體現了傳播邏輯的不斷改變。分發機制的變遷和發展對新型主流媒體的建設有著重要的啟示作用。可以從目前發展成熟的互聯網信息分發平臺的分發機制中得出對新型主流媒體在互聯網化的過程中建構有效的分發手段、加強信息分發的渠道建設得出幾點啟示。

1.理解“分發”,實現由受眾到用戶的理念轉型

傳統媒體時代,報刊的“分發”指的是報刊室將報刊、書本、雜志派送到讀者手中的那一環節,強調的是“to C”的最終一環。媒體互聯網化的初始階段,媒體對于互聯網上的信息分發概念停留在內容的“網絡版”刊登,即內容的發布,此類的發布機制仍然帶有濃重的單向度傳播烙印,受眾只是在被動的接受信息內容。

但隨著傳媒的發展和技術的進步,媒體權力不斷下移,普通大眾擁有了普遍的媒介接近和媒介使用權利,受眾的主動性逐漸突出,并逐漸朝向“用戶”轉型,擁有信息選擇甚至信息生產的主動權和能動性?!八惴ㄐ托畔⒎职l機制”實質上貫徹的正是用戶優先的理念,一切信息分發以用戶的個體需求和信息習慣為導向。實現從“受眾”到“用戶”的理念轉型,是媒介信息環境變化背景下建設有效的信息分發機制的基礎。按照“使用與滿足理論”,受眾在進行信息消費時是帶有明確的主觀目的性。因此,新型主流媒體應對受眾的主觀能動性和真實、個性化的信息需求基于足夠的重視,將“受眾”視為“用戶”,一切的信息生產和分發行為都以大眾的需求為導向。這種理念的創新是一切技術和制度創新的驅動力量。

2.理解“技術”,優化算法機制和模型

算法作為互聯網信息分發鏈條中的核心技術,根據個人愛好為用戶定制內容并進行分發。在此傳播環境下,新型主流媒體更應加強對算法的基礎常識。并根據用戶數據和內容的數據不斷優化算法分發機制,建立更加全面、科學的算法模型來分析用戶的興趣內容,增進數據的匹配度,并提升算法的透明度。推薦引擎、搜索引擎和智能社交式分發機制都可以為主流媒體打造互聯網上有效的分發手段提供可借鑒的技術思路。

(1)推薦引擎式分發機制

新型主流媒體建設分發機制的前提首先在于,深刻理解數據是算法分發機制的核心要素。推薦引擎式的分發機制核心就在于數據的獲取和匹配。為了實現信息內容和用戶的精準適配,首先需要獲取用戶數據和內容數據。用戶數據分析包含用戶的興趣特征分析、用戶身份特征分析和用戶的網絡歷史行為特征分析。目前而言,通過建立流式計算框架來進行用戶標簽的數據處理是今日頭條更高效率的做法。其流程如下:通過實施處理用戶數據,并在收集一定量的用戶數據后通過機器的自我學習不斷動態更新用戶的興趣模型,其使用的范圍更廣、效率更高,能夠解決大部分用戶的數據跟蹤推送。

內容數據的機器處理則包含兩個環節,首先利用LDA(Latent Dirichlet Allocation)主題分析生成模型,對信息內容按照詞、主題和文檔進行分類,并將每篇單獨內容按照不同的概率和不同主題的形式進行發布。接下來,使用基于深度神經網絡模型來進行文本的情感分析,從文字中識別出讀者對于特定內容的主觀意見、情緒等,從而進行符合人類情感態度的內容分發。

在用戶數據和內容數據的標簽化完成后,推薦引擎式分發需遵循兩種匹配邏輯:

一是為用戶找到他的內容,依托用戶數據完成跟蹤推送。依托于用戶數據分析后利用算法模型預測用戶可能感興趣的信息內容,并分別將部分用戶的數據作為訓練集和測試集,依次進行模型的評估測試,得到模型的準確率。簡單來講,用戶基數越大,用戶數據越豐富,推薦算法模型的預測正確率越高,推薦的信息內容更加精準。

二是為內容找到它的用戶,內容標簽精準集中目標用戶。對于已經標簽化的信息內容,通過分發和用戶反饋來對推送模型進行評估和修正。同時,用戶的行為數據也會影響內容分發算法的自我迭代,例如用戶最近關注體育類文章,機器學習會大批量自動抓取和生成相關的內容,有關體育的文章也會被優先推送至用戶。為了能夠使內容標簽精準集中目標用戶,需要使用協同過濾算法對用戶的興趣進行深度挖掘。

歸根到底,用戶的興趣圖譜精細化和內容標簽的多元化處理分類是完成兩種匹配邏輯的必要前提。

(2)搜索引擎+社區問答式分發機制

一方面,新型主流媒體要發揮資源優勢,加強在算法分發技術上的探索和運用。在搜索方面,加強機器對用戶語義的識別能力,精準洞察用戶需求,實現快速響應、智能響應。換言之,新型主流媒體建設搜索引擎式的分發機制,首先需要有多元、專業的信息資源庫存作為儲備,并以完善科學的搜索響應系統架構提供技術底層支持。

另一方面,利用協同算法聚合內容,豐富社區式問答分發功能,延伸分發觸角,擴大影響力。部分主流媒體平臺只停留于“用戶提問-相關回答”這一單一環節,當用戶在平臺搜索某個問題,平臺跳出一篇新聞的報道,整個搜索過程便終止了。用戶有相關的疑問時,在平臺提出問題,等待后臺編輯或其他網友的解答后,問答過程也終止了。新型主流媒體分發平臺可以借鑒“社交式分發”的邏輯,為其分發機制注入社交基因。如知乎平臺利用算法快速實現對用戶檢索內容或其問題的自動識別和分類呈現。新型主流媒體客戶端無須做到對于問答內容的面面俱到,但可以充分發揮平臺的權威性和專業性,在滿足用戶頭部新聞內容的需求同時,滿足用戶對于新聞信息的深度需求。例如對某一重點事件的報道可由專業編輯根據新聞發展分為“背景探析——時間進行中——長尾討論”不同階段,并在不同階段結合算法分發技術吸納更多用戶的關注和參與。背景探析部分可設置立足于新聞事件的專業問題,介紹新聞的相關背景并邀請到用戶參與事件的討論。在新聞不斷的發展變化中,發揮時效優勢,在恰當時機再次提出問題,包括新聞后續的討論和延伸方向,可以邀請到“專家觀點+草根用戶解讀+組織機構發聲+事件當事人現身說法”等不同主體共同參與新聞報道,從不同角度挖掘信息價值,從問答互動中挖掘報道素材和角度,并將優質的長尾內容納入到新一輪的信息生產與分發環節中,形成分發——再分發的完整閉環。這些功能的實現需要強大的數據處理能力和機器響應能力,對于不同信息內容進行“標簽”設定,并將平臺專業化內容+優質問答內容進行篩選-聚合-排序-呈現,并依據用戶畫像進行協同話題的推薦和分發。

總的來說,頭部的新聞內容成為最主要的流量入口,其分發算法中提高時效性、重要性、顯著性等新聞價值要素的權重,滿足用戶基礎的信息需求。同時,開拓尾部新聞問答的分發空間,滿足用戶信息個性化需求。這需要新型主流媒體不僅局限在頭部內容的分發層面,也需要對“原生信息”視為素材,吸引用戶的點贊或評論,進一步利用“再加工的信息材料”,提煉引導觀點,擴大影響力。由專業編輯+機器算法將這些長尾內容進行篩選及重新聚合、排序、審核、分類呈現。并發揮專業編輯把關、撰寫、整合的能力,提高長尾內容的整體質量,這些長尾內容也可以和頭部內容進行組合分發,使新聞報道更加完整、全面。

新型主流媒體客戶端應與“知乎”等移動新聞客戶端的問答式平臺形成功能區別,以自身優勢的資訊權威力和優質新聞資源吸引更多用戶,捕捉他們對于信息的深度需求,不僅僅局限于頭部新聞內容的分發,而是吸納更多長尾的信息問答內容,與互聯網平臺媒體形成差別,找到自己獨特的生態定位,在網絡分發渠道占據一席之地。

在 Feed 流的推薦場景下,用戶都是越來越“懶”的,大部分用戶希望及時不通過不進行繁瑣的操作,也能得到非常精準的推薦結果。這也是“水晶球”的信息流推薦框架意圖達到的分發效果。當用戶來到知乎的推薦頁面時,線上模塊的部分分為召回、排序和重排三個階段,并最終將返回的推薦結果展示給用戶,形成了我們所看到的千人千面的信息流頁面。

其中,“召回”主要是將盡可能“大而全”地將所有用戶可能感興趣的內容都提取出來,根據用戶的歷史行為表現(即用戶畫像),確定數十個推薦隊列,或者說數十個“召回源”的召回比例和召回數量。推薦隊列是一個個含有特定標簽的內容合集。有些隊列里內容性質相似,比如熱點新聞隊列、視頻隊列。還有的隊列與用戶行為緊密相關,比如關注的人隊列、搜索關鍵詞隊列。這一模塊主要采用的技術包括:對圖文內容、視頻內容的基本的識別和畫像,對用戶的畫像,以及圖文內容和視頻內容里面的實體識別以及關聯。

緊接著,“Ranking”會基于用戶可能感興趣的程度對所召回的全部內容進行重新排列,力圖更加“精準”的關聯用戶興趣,一般基于時間順序、線性加權等規則。Ranking模塊借鑒了Facebook的Edge Rank算法,加入了用戶親密度的參考維度,并在最近的優化版本Global Ranking中采用了深度學習模型、DNN(即深度神經網絡技術)等,能夠快速處理高達幾十萬的話題量級,DNN 可以在一百毫秒內對數百條召回內容完成打分和排序過程,決定推送給用戶的內容。

最后,“Reranking”則會根據平臺規則或業務需求,對推薦物料再次加工,如給視頻、圖文內容進行一定的提權;又如將相似內容隔離開避免話題堆砌感等,最終將推薦的內容分發至用戶。

知乎的推薦系統針對這一需求持續進行優化,比如:在召回環節,引入更多根據用戶的行為來召回內容的方式;在排序環節,把用戶的各種行為,以及內容的各種標簽都引入進來,并通過 DNN 神經網絡進行排序。

(3)推薦系統分發規則

為完成精準又多樣的個性化分發,在系統架構的底層支持下,知乎的分發規則應用的主要就是基于內容和用戶的協同過濾。

協同過濾(Collaborative Filtering)就是基于鄰域的算法,即使用某人的行為behavior來預測其它人會做什么。

基于用戶的協同過濾是指根據用戶對物品的偏好,找到相似的用戶,然后向當前用戶推薦相似用戶最喜歡的物品。其主要權重是用戶標簽之間的相似重合系數,預測目標用戶對相似物品的喜好程度,最后展示出最符合其預期的內容推薦給他。

如圖(表4)所示,用戶A喜歡內容1、內容3,用戶C喜歡內容1、內容3、內容4,從用戶的偏好行為數據中可以觀察到,用戶A與用戶C擁有相似的內容喜好,于是系統會優先將內容4也推薦給用戶A。

同時,基于內容的協同過濾規則也不盡相同,但它主要參考的是內容1與內容2、內容3……的相似程度,并根據用戶畫像,將內容推薦給當前用戶。

內容分類呈現結構化的特點。知乎的各個頻道、分類、話題都是對內容的一種分類。單個回答或文章來說,包括數值特征(如內容長度、點贊量、瀏覽量等)、內容類型(關鍵詞、話題ID)等。

內容理解不僅為匹配奠定基礎,同時也是知乎進行分發規則設定的另一種表現形式,即流量分發,其代表產品就是知乎的熱榜。以熱榜為代表的流量分發方式,可以引爆一些話題。

除了基礎的用戶自然屬性畫像以外,知乎更加重視用戶的行為畫像,如用戶搜索行為、點贊數、用戶評論數等統計特征。你在知乎的每一次關注、點贊、分享、評論、收藏,甚至某個回答的停留時長,都是你的一次行為標簽。平臺對不同的行為標簽有不同的權重,例如評論的權重大于點贊。多元的用戶標簽用于建立用戶畫像系統。

為了達到更好的分發效果,知乎并沒有單純使用以上其中一種作為單一的分發規則。通過進一步的相似度計算,完成二者的協同過濾。

因此,當你打開知乎首頁,看到給你推薦的那些內容,都是基于你過往的搜索、瀏覽、點贊、評論等行為標簽計算得來的,你的每一個動作,都是在為自己可能接受到的信息投票。

3.搜索分發:精準切中用戶需求

知乎打出“有問題,上知乎”這一口號。用戶主動獲取內容是知乎主要的內容分發形式,分為搜索和提問兩種形式。知乎作為一個大型的中文問答社區,有超過四千萬的提問和超過兩億條回答,其中蘊含了豐富的知識、經驗和見解,知乎搜索是幫助用戶快速獲取信息,找到答案的重要途徑,隨著媒介的升級,搜索結果的形式也不在局限于圖文,視頻解答也越來越多。

知乎首頁的問答內容依據“搜索算法”一系列的識別、匹配和排序后,將結果呈現在每個用戶的眼前,而推薦的依據則在于不同用戶的關注和搜索行為。

搜索,是用戶獲取信息,找答案最方便快捷的方式。在知乎,一次用戶搜索會經歷 Query 解析、召回、排序多個環節。用戶輸入 Query 之后,首先要進行 Query 解析,生成查詢 Query Tree 和語義表示向量。之后進入多隊列的召回模塊,召回階段從召回方式上說可以分為倒排召回和向量召回,在這一環節會篩選出前400的文檔進入到排序階段。排序階段又分為精排和重排序兩個環節,精排階段通過模型對多召回源的文檔進行統一打分,之后將 Top16的文檔送入重排序模型進行位置的微調,最終呈現給用戶。排序作為最后整個過程一環,對用戶的體驗有最直接的影響。

(三)新型主流媒體建設信息分發機制的創新思考

1.算法優化:主流價值觀駕馭的優質算法分發

對主流媒體而言,算法的廣泛應用是把雙刃劍。一方面,算法能夠為承擔主流價值傳播的主流媒體賦能,提升新聞生產能力與信息分發的精準度;另一方面,算法分發依據的邏輯規則也對主流意識形態帶來沖擊和影響。如何在算法廣泛應用的時代背景下牢牢掌握網絡輿論場上的主動權話語權,是主流媒體面臨的一大挑戰。

從國內典型的信息精準推送平臺的實踐看,新型主流媒體實現精準分發需要包含以下環節:其一是建立內容數據庫來聚合海量信息;其二是建立用戶數據庫來記錄用戶身份和行為數據;其三是建立標簽體系,標注內容信息與用戶數據,以便于匹配和調用二者;其四是確定規則,尋找相應算法,建立數學模型,開發計算機程序;其五是利用大數據訓練算法程序。總的來說,就是基于信息內容標簽來預測用戶不同場景下的信息需求,完善分發算法的標簽體系,不斷豐富其算法標簽中的內容要素,使標簽體系更加貼近用戶的需求和個人偏好,以提高分發的適配度和傳播效率。

更重要的是,作為主流媒體,將主流價值觀作為標簽納入到算法的取值和分析過程中,這是為實現社會公共利益的最大化所必要完成的。從社會維度看,社會主義核心價值觀是當今社會的主導價值觀,包含了國家、社會和公民層面的價值要求,其應當成為新型主流媒體算法機制建構的重要指導。從專業維度看,包含“真實、準確、客觀、公正”等在內的職業理念和操作準則,與強調“黨性和人民性統一”等原則的馬克思主義新聞觀,正在當下共同影響和規范著我國的信息傳播實踐。新型主流媒體的算法設計應充分體現主流價值觀,并將深入探索滿足社會成員個人的信息需要與促進其與社會一體化之間的辯證關系,以此為基礎提升算法分發的科學性。通過全面地分析把握用戶本質的信息需求,建立更加科學的算法規則,可從以“點擊量”為主要參考因素的模式,轉變為著力體現新聞內容的“重要性”的“社會化”標準。在這一標準的基礎上,新型主流媒體將能夠重點突出主流價值觀在信息分發環節中的把關作用,實現個人信息選擇和社會公共利益的最大平衡。為此,新型主流媒體需搭建相應權重和算法函數關系指導信息推薦中的“內容評級”和“用戶畫像”機制,建設起新型主流媒體平臺的精準推送能力。

其一,在用戶層面,充分體現信息對于用戶個人的“重要性”。移動傳播體系中的信息分發效果,依據主流價值觀作出的判斷是否能夠廣泛傳播,社會是否能夠在這樣的信息底層上達成共識,最終都取決于用戶的點擊打開和閱讀播放。這一過程中,可借鑒今日頭條、知乎等商業平臺算法分發機制規則設定中對于用戶需求、社交關系的權重分配,具體分析用戶個人的信息需求特征,精準推送相關信息。

其二,在內容層面,以主流價值指導內容數據庫建設和內容審核及評級。移動傳播時代的信息傳播是個人化傳播,而用戶個人的需求是多元且豐富的。用戶不僅需要新聞等公共信息,更需要各類娛樂資訊、生活資訊和自我表達的空間。互聯網技術提供了這樣的可能性。因此,新型主流媒體平臺需要比自己以往和比互聯網商業平臺在更大范圍內聚合各類信息和數據,并建立具有更多維度的科學的標簽體系,并在此基礎上,通過對各類資訊的科學評估,包括內容與社會主流價值觀的一致性等,來進行分發內容的把關,在一個品類豐富、高質量的內容數據庫的基礎上建構精準推送能力。

2.人機共治:建立分層分級“把關制度”

人工編輯在選擇新聞信息時候有基本的價值判斷標準,而算法技術雖然可以幫助快速篩選信息內容,提升分發效率,但缺乏更加專業化的判斷能力,因此突出“人工編輯”在新聞價值觀方面的引導,可以改善算法機械化的弊端,增強信息的價值含量,又可以使算法在深度學習中更加“懂”人。完成“工具理性”和“價值理性”的適配和相互促進。

一是在內容生產和分發方面,建設獨立于算法系統外的人工編輯預估系統,由有豐富編輯、審核經驗的傳統專業媒體團隊,從新聞價值等角度預判用戶的偏好,并將其預判的結果和機器的預測結果進行協同化計算處理,動態調整用戶畫像,并動態調整信息的分發權重。而不只是單純憑借機器對用戶歷史瀏覽行為數據的跟蹤來進行用戶標簽集的創建,通過相應的算法機制適配,保障用戶獲得更加全面、均衡的信息。這樣或能更好、更精準的實現用戶數據和內容數據的精準匹配,提升信息分發的效率。同時,利用人工智能和數據庫相結合的方式,結合心理學建模,加強平臺自動化進行內容審核和管控的力度,加強對虛假信息、泛娛樂化信息的甄別與控制,沉淀更多優質信息資源。加強人工干預和算法自動分發機制的配合,在某種程度上有助于平臺能夠進行不同類型素材的輸入,降低了內容同質化趨勢,保證信息內容的多元化。同時也能彌補算法難以判斷內容價值傾向的弊端,保證分發的內容具有一定的新聞價值。

二是動態調整不同類別新聞分發的權重,實現硬資訊和軟資訊之間的平衡,實現社會信息需求和個人信息需求之間的平衡,保證個人在獲取個人興趣內容之外也能獲得其他方面的信息內容。一定程度上能夠幫助用戶更好的擴展其內容接觸面,拓展興趣點,甚至引導用戶主動搜索更加多元化的信息內容,避免信息繭房。

三是恪守公正、真實的原則,利用技術手段通過對信息分發路徑各個環節的追蹤,實現對虛假信息的實時監測和快速識別,提升對虛假信息的有效管控,發揮全媒體時代互聯網信息“把關人”的重要作用,維持網絡空間良好信息秩序,營造安定有序的互聯網信息環境。

四是在分發機制的設定中保持審慎、公平的態度來制定算法規則和標準制定,在內容分發的各個環節中,謹慎避免“算法偏見”,防止用于算法訓練的原始數據集存在人為的不良傾向,遵循中立、公平的算法程序開發原則,同時引入專業人員實時對分發的流程和算法的自我學習流程進行檢測,提升信息交互質量,在分發之前較早的識別偏見、修正算法程序,保證用戶接收到的信息內容更加全面、客觀。

參考文獻

[1]匡文波.新媒體概論(第2版)[M].北京:中國人民大學出版社,2015.

[2]郭慶光.傳播學教程(第2版)[M].北京:中國人民大學出版社,2011.

[3]劉海龍.大眾傳播理論:范式與流派[M].北京:中國人民大學出版社,2008.

[4]胡正榮,段鵬,張磊.傳播學總論[M].北京:清華大學出版社,2008.

[5]林祥.互聯網時代媒體平臺經濟發展的理論與實踐[M].北京:國家圖書館出版社,2018.

[6]梅爾文·德弗勒,桑德拉·鮑爾—洛基奇.大眾傳播學緒論(杜立平譯)[M].北京:新華出版社,1990(原著出版于1957年).

[7]尼古拉·尼葛洛龐帝.數字化生存(胡泳,范海燕譯)[M].北京:電子工業出版社,2017(原著出版于1997年).

[8]沙蓮香.社會心理學(第二版)[M].北京:中國人民大學出版社,2006.

[9]納賽·佛林,小詹姆斯·坦卡徳.傳播理論——起源、方法與應用[M].北京:華夏出版社,2000(原著出版于1979年).

[10]《人工智能讀本》編寫組.人工智能讀本.北京:人民出版社,2019.

[11]保羅·萊文森.信息革命的自然歷史與未來(何道寬譯)[M].上海:復旦大學出版社,2011(原著出版于1998年).

[12]戴維·克勞利,保羅·海爾.傳播的歷史——技術、文化和社會(董璐等譯,第6版)[M].北京:北京大學出版社,2018(原著出版于2003年).

[13]米歇爾.機器學習(曾華軍等譯)[M].北京:機械工業出版社,2015(原著出版于1968年).

[14]彭蘭.網絡傳播概論(第3版)[M].北京:中國人民大學出版社,2012.

[15]鐘瑛.網絡傳播導論(第2版)[M].北京:中國人民大學出版社,2016.

[16]張鳳軍.基于Neo4j圖數據庫的社交網絡數據的研究與應用[G].湖南大學碩士論文,2016.

[17]王子今.郵傳萬里: 驛站與郵遞[M].長春:長春出版社,2004.

[18]喻國明.媒介革命:互聯網邏輯下傳媒業發展的關鍵與進路[M].北京:人民日報出版社,2015.

[19]宋建武.構建全媒體傳播體系的實踐路徑[J].傳媒評論,2021(02):13-16.

[20]宋建武.全媒體傳播格局中的主流價值引領[J].新聞與寫作,2019(11):1.

[21]宋建武,馮雯璐.全媒體時代主流媒體的數據化生存與發展[J].湖南大學學報(社會科學版),2019(33):153-160.

[22]宋建武.全媒體傳播格局中的主流價值引領[J].新聞與寫作, 2019(11):1.

[23]宋建武,黃淼.信息精準推送中主流價值觀的算法實現[J].新聞與寫作,2018(09):5-10.

[24]宋建武,陳璐穎.建設區域性生態級媒體平臺——打造新型主流媒體的路徑探索[J].新聞與寫作,2016(1):5-12.

[25]宋建武,黃淼,陳璐穎.平臺化:主流媒體深度融合的基石[J].新聞與寫作,2017(10):5-14.

[26]陳昌鳳,石澤.技術與價值的理性交往:人工智能時代信息傳播——算法推薦中工具理性與價值理性的思考[J].新聞戰線,2017(9):71-74.

[27]劉戰偉,劉蒙之.編輯、社交和算法:信息分發路徑、權力格局與未來圖景[J].城市黨報研究,2020(02),46-53.

[28]王萬良,李卓蓉.生成式對抗網絡研究進展[J].通信學報,201839(2):135-148.

[29]彭蘭.移動化、社交化、智能化:傳統媒體轉型的三大路徑[J].新聞界,2018(1),35-41.

[30]劉永俊.論大數據背景下編輯理念的變革之路——以“今日頭條”新聞客戶端為例[J].出版廣角,2015(9):96-97.

[31]彭蘭.未來傳媒生態:消失的邊界與重構的版圖[J].現代傳播,2017(1):4-5.

[32]師文,陳昌鳳.社交分發與算法分發融合:信息傳播新規則及其價值挑戰[J]. 當代傳播,2018(06):31-33+50.

[33]仇筠茜,陳昌鳳.黑箱:人工智能技術與新聞生產格局嬗變[J].新聞界,2018(1): 28-34.

[34]沈浩,袁璐.人工智能:重塑媒體融合新生態[J].現代傳播,2018(7):8-11.

[35]施威,熊佳敏.媒介技術演進的社會動因與選擇機制[J].新聞傳播, 2013(11):110-111.

[36]司崢鳴.技術演進中的傳統媒體發展重構——基于Web2.0理念下傳統媒體的現狀和未來[J].哈爾濱商業大學學報(社會科學版),2010(1):93-97.

[37]陶飛,劉蔚然,劉檢華,劉曉軍,劉強等.數字孿生及其應用探索[J].計算機集成制造系統,2018-24(1):1-18.

[38]蘇濤,彭蘭.“智媒”時代的消融與重塑——2017年新媒體研究綜述[J].國際新聞界,2018(1):13-14.

[39]金兼斌.機器新聞寫作:一場正在發生的革命[J].新聞與寫作,2014(9):30-35.

[40]黃典林,白宇.人工智能與新聞業變革的技術和文化邏輯[J].新聞與傳播評論,2018(6):31-40.

[41]李沁.沉浸媒介:重新定義媒介概念的內涵和外延[J].國際新聞界,2017(8):115-139.

[42]李煜.廣播史研究的范式轉移[J]. 現代傳播(中國傳媒大學學報),2014-36(9): 38- 45.

[43]蘇濤,彭蘭.“智媒”時代的消融與重塑——2017年新媒體研究綜述[J]. 國際新聞界,2018(1).

[44]杰羅姆.平臺型新媒體(Platisher)是有效的商業模式嗎?[J].中國傳媒科技,2014(23):5.

[45]方師師.雙強寡頭平臺新聞推薦算法機制研究[J].傳播與社會學刊,2018(1)45-47+31.

[46]方師師.算法機制背后的新聞價值觀———圍繞 “Facebook 偏見門” 事件的研究[J].新聞記者,2016(9):64-65.

[47]王茜.打開算法分發的 “黑箱” ———基于今日頭條新聞推送的量化研究[J].新聞記者,2017.

[48]段偉文.人工智能時代的價值審度與倫理調適[J].中國人民大學學報, 2017(6):98-108.

[49]傅丕毅,徐常亮,陳毅華.“大數據+人工智能”的新聞生產和分發平臺——新華社“媒體大腦”的主要功能和AI時代的新聞愿景[J].中國記者,2018(3):17-20.

[50]張洪忠,石韋穎,劉力銘.如何從技術邏輯認識人工智能對傳媒業的影響[J].新聞界,2018(2):17-22.

[51]美通社-美通說傳播.騰訊全媒派劉勝男談未來媒體的內容格局[OL].http://prnasia.com/blog/archives/20419,2018-1-3.

(作者系中國人民大學新聞學院碩士研究生)

主站蜘蛛池模板: 免费一级毛片在线观看| 国产精品男人的天堂| 久久黄色视频影| 精品国产99久久| 波多野结衣第一页| 国产黄色视频综合| 国产在线八区| 国内精品视频| 亚洲成人福利网站| 国产一区二区三区在线观看视频 | 中文字幕在线观看日本| 四虎精品黑人视频| 午夜国产精品视频| 99视频在线免费看| 日韩欧美中文在线| 国产精品va免费视频| 免费毛片视频| 无码久看视频| 久久成人国产精品免费软件| 精品成人一区二区三区电影 | 国产精品内射视频| 青青青草国产| 国产成人久久综合一区| 精品久久国产综合精麻豆| 欧美成人二区| 国产在线97| 国产老女人精品免费视频| 亚洲第一视频网| 日本午夜视频在线观看| 中文字幕1区2区| 三上悠亚精品二区在线观看| 国产美女一级毛片| 亚洲av成人无码网站在线观看| 亚洲欧美一区二区三区麻豆| av一区二区无码在线| 91无码人妻精品一区二区蜜桃| 国产一级小视频| 四虎影视库国产精品一区| 成人在线综合| 国产女人爽到高潮的免费视频| 国产乱论视频| 欧美在线导航| 国产成熟女人性满足视频| 久久青草免费91线频观看不卡| 国产69精品久久| 免费高清a毛片| 2048国产精品原创综合在线| 中文国产成人久久精品小说| 亚洲成人网在线观看| 久久婷婷综合色一区二区| 国产综合在线观看视频| 日本高清免费一本在线观看 | 免费一级大毛片a一观看不卡| 国产精品99久久久久久董美香| 亚洲成人www| 波多野结衣AV无码久久一区| 日韩色图区| 天天躁狠狠躁| 免费一级毛片| 青青热久麻豆精品视频在线观看| 又爽又黄又无遮挡网站| 亚洲自偷自拍另类小说| 波多野吉衣一区二区三区av| 国产精品播放| 国产剧情一区二区| 国产精品v欧美| 原味小视频在线www国产| 久久免费视频6| 91麻豆精品国产91久久久久| 国产成+人+综合+亚洲欧美| 亚洲欧美一区二区三区图片| 亚洲欧美综合精品久久成人网| aⅴ免费在线观看| 精品福利网| 999国内精品视频免费| 美女无遮挡免费网站| 一级香蕉人体视频| 1024国产在线| 欧美人在线一区二区三区| 99视频精品在线观看| 欧美人与动牲交a欧美精品| 人妻91无码色偷偷色噜噜噜|