謝新洲 王強
【摘要】個性化新聞推薦已經成為新聞服務的主要形式。用戶的信息需求是個性化新聞推薦的原動力,但同時互聯網技術、移動互聯網技術、感知和推薦技術、大數據和云計算技術的發展以及產業化的催化在個性化新聞的發展中也發揮了舉足輕重的作用。在此基礎上,結合相關技術發展動向,提出個性化新聞推薦未來將實現數據廣泛融合,智能感知和推薦技術將使個性化新聞推薦服務更加精準,使用場景更加多元,個性化新聞推薦的價值將從內容精準對接走向產品、服務和內容的全面精準對接,與此同時,“個性化—隱私悖論”問題將隨著個性化新聞推薦的發展及其深度嵌入人類社會生活而日益突出。
【關鍵詞】個性化新聞推薦;信息需求層次;信息技術推動;產業化;發展動力;發展趨勢
大數據、云計算、人工智能等技術的快速發展,對新聞傳播的創新發展產生了革命性影響,不斷推動傳播向精準化、個性化、智能化方向發展。移動互聯網迅速普及,使手機成為新聞工作者與用戶之間無時不在的互動通道。隨著技術的不斷進步和用戶量的不斷增長,個性化新聞推薦(PersonalizedNews Recommendation,以下簡稱PNR)已經成為新聞服務的主要形式,今日頭條、Flipboard等國內外聚合新聞類產品自推出后快速成長,取得了較高的市場占有率。[1]
本文根據信息需求層次理論探究PNR產生發展的拉動力量,結合技術發展對PNR的推動和產業化對PNR發展的催化作用,探析PNR發展的主要動力。在此基礎上,結合相關技術的發展,對PNR未來趨勢進行分析。
尼古拉斯·尼葛洛龐帝(NicholasNegroponte)對機器交互性的設想標志著個性化新聞推薦的萌芽[2],他隨后提出了“我的日報”(TheDailyMe)理念,并在《數字化生存》(BeingDigital)一書中較為詳細地展現了其對“我的日報”的設計。[3]
1993年,麻省理工學院媒體實驗室發起的新聞訂制服務實驗項目FishWrap是個性化新聞推薦最早的實踐。[4]此后,互聯網迅速普及,雅虎、谷歌等互聯網巨頭紛紛推出個性化新聞服務。雅虎推出了個性化服務項目“MyYahoo!”,通過界面個性化設置和RSS推送,實現了新聞內容的個性化推薦。[5]谷歌則依靠其搜索技術的優勢,推出了谷歌新聞(GoogleNews),匯集來自世界各地的新聞來源,向用戶進行個性化推薦。同時BuzzFeed、[6]DailyMeInc.[7]等專業從事訂制新聞聚合服務的提供商也快速成長。《紐約時報》《華爾街日報》等傳統傳媒機構也在數字化浪潮推動下,逐步推出了個性化訂制新聞[8]。
在門戶網站時代,PNR已經進入了快速發展的階段,但受限于訪問終端,PNR的使用場景和用戶模型的數據來源還十分有限。移動互聯網的發展和普及打破了這種限制,手機從單純的通信工具變成了人類社會生活不可或缺的一部分[9],極大推動了PNR的發展。同時得益于推薦技術的發展和進步、云計算和大數據帶來的算力提升以及3G、4G帶來的通信能力的發展,一點資訊、今日頭條、Flipboard等以新聞聚合和個性化分發為主要功能的產品搶占了新聞用戶的注意力,成為移動互聯網新的流量入口。
個性化新聞推薦對傳統的新聞生產帶來沖擊和變革,將新聞生產從“內容本位”轉變為“受眾本位”,進而將新聞用戶逐步帶入到新聞生產的中央,重塑了新聞業務鏈,成為建構注意力市場新的結構性力量。[10]新興技術與傳統新聞價值觀念在媒介發展過程中互相碰撞,PNR在發展過程中凸顯出一系列問題,如“信息繭房”效應導致的信息窄化、“把關人”缺失導致的信息失序、“搬運工”行為帶來的產權糾紛等[11]。
用戶的信息需求是PNR發展的原動力,但同時信息技術的推動和新聞商業化催化在其發展過程中也發揮了舉足輕重的作用,三者共同構成了PNR發展的主要動力。
(一)信息需求———PNR發展的拉動力量
根據美國信息學家科亨(Kochen)提出的信息需求層次理論,信息需求存在客觀狀態層次—認識層次—表達層次三個不同層次(詳見圖1)。[12]其中,表達層次信息需求的滿足有賴于用戶的表達和媒介服務能力;認識層次信息需求的滿足有賴于服務方與用戶的互動;客觀狀態層次需要的滿足則對服務方感知用戶的能力具有較高的要求。

1.客觀狀態層次信息需求對PNR的影響
客觀狀態層次的需求是信息用戶在一定的社會條件影響下出現的信息需求,這種信息需求狀態由客觀條件決定,不以信息用戶的主觀意志為轉移。決定這一層次需求的客觀因素可以分為宏觀環境、微觀環境和用戶自身屬性,是用戶所處環境因素與用戶自身屬性相互作用的結果。
由于移動互聯網已經成為新聞傳播的主要渠道之一,手機的廣泛使用提高了新聞用戶的真實性、地域性和交互實時性,今日頭條、Flipboard等PNR產品以此為基礎,通過將用戶所在位置、使用時間等物理環境特征作為變量加入推薦算法,顯著提升了推薦系統的準確度。而Facebook則是基于用戶所在社交網絡的社交環境,通過協同過濾算法提供新聞推薦服務,取得了商業上的巨大成功。[13]
現有產品通過滿足用戶環境信息對應的客觀信息需求所取得的成功,體現了客觀信息需求在PNR服務中的重要作用。但顯而易見的是,位置、時間甚至是社交等微觀環境要素,僅僅是決定用戶客觀信息需求的諸多因素中的一小部分,更多制度因素、社會文化因素、用戶的新聞使用場景和工作任務等決定用戶客觀需求的要素還無法納入推薦算法。情境感知、泛在信息環境感知等技術已經有了一些研究成果,但仍然處于基礎研究階段。[14]客觀信息需求感知的缺失也成為當前PNR面臨的“信息繭房”、信息失序和新聞的公共性、專業性等問題的主要原因。這一方面是由于客觀需求決定因素的復雜性及其在數字化方面的技術問題;另一方面,更加全面的感知意味著更多用戶數據的獲取,這在用戶隱私泄露方面存在不可避免的風險,PNR就此陷入“個性化—用戶隱私悖論”。
此后,新聞使用行為隨著互聯網的發展和普及實現了數字化、可計算,算法基礎也從用戶訂制這種主動提供的數據為主,逐漸轉變為以信息瀏覽、跳轉、收藏等為代表的用戶行為被動記錄的數據為主,用戶的數據獲取過程與信息消費過程實現了統一。用戶不再需要通過形式化表達來定義新聞需求,獲取用戶數據的障礙在不斷消除,同時行為數據和屬性數據得以整合,分類、聚類、網絡挖掘等數據挖掘算法和協同過濾算法在此期間日漸成熟,并逐漸應用于PNR中。
隨著網絡訪問終端的發展,用戶數據的獲取方式在不斷的多樣化,數據來源不斷拓展。第一次大程度的拓展伴隨著Web2.0的出現和發展,Web2.0參與性、協同性、集成性等一系列特征[20]使互聯網用戶從信息的被動接收者,成為信息生產者,來自用戶的內容為PNR的推薦精準化提升奠定了內容基礎,同時,自然語言處理技術和語義網技術又為用戶內容的理解提供了保障,基于內容和標簽的推薦算法得以迅速發展[21]。
社交網絡應用再次拓展了PNR數據來源,PNR用戶數據從行為數據、內容數據拓展到用戶的社交網絡數據,作為用戶環境數據的一部分逐步應用到PNR中,基于用戶社交網絡數據的新聞推薦逐漸成為PNR的主流算法思想[22],并在Facebook等產品中獲得成功。
移動互聯網與人類社會生活的深度融合,泛在信息環境的不斷擴大,進一步拓展了用戶數據獲取的范圍,基于情境的推薦技術成為PNR的技術前沿[23],PNR服務的基礎向用戶環境數據進一步深入,在用戶模型和用戶信息需求場景方面更進一步,也成為未來研究的熱點方向。
4.大數據、云計算技術提供了基礎設施保障
移動互聯網數據接入技術的不斷升級,使得互聯網數據量急劇增長,最近5年,移動互聯網接入流量每年都以超過100%的速度增長。根據IDC2018年發布的報告,全球每年產生的數據將從2018年的33ZB增長到175ZB,相當于每天產生491EB的數據。[24]以今日頭條為例,截至2018年,今日頭條每日數據處理量超過50PB、存儲數據超過1500PB、評論系統每天的評論數大概有1億條,在2017年年初,已通過部署17萬臺服務器來支撐其業務。[25]
作為以數據計算為基礎的服務,PNR面臨著海量數據快速增長帶來的巨大挑戰,云計算技術和大數據處理技術成為PNR重要的基礎設施。與此同時,由于云計算的超大規模以及分布式處理架構等特點,將傳統的推薦技術直接應用到云計算環境時會面臨推薦精度低、推薦時間延長以及網絡開銷大等問題,導致推薦性能急劇下降[26],這一挑戰又反過來促使推薦技術的進步和發展。在推薦算法與云計算、大數據技術的互動過程中,PNR逐步實現了分布式計算、基于全樣本的模型擬合及實時更新,進一步提升了PNR的智能化程度、用戶體驗和推薦精度。
(三)產業化———PNR發展的催化力量
PNR作為新興的新聞服務形式,改變了傳統媒體的資源配置模式和傳受關系,成為吸引受眾碎片化注意力的有效方式,進而成為建構注意力市場的新結構性力量[27],PNR商業化應用和產業化發展催化了PNR的快速發展。
1.產業化促使PNR迅速普及
新聞媒介具有特定的產業屬性,在PNR出現以前,國內外新聞傳播已經形成了成熟的產業結構,傳媒作為一種市場形態,其本身就是在信息需求促使下產生規律作用的結果,這為PNR的快速發展奠定了產業基礎和用戶基礎。當PNR出現后,由于其更加符合用戶的信息需求,因而快速以市場化形態出現,在市場主體推動下迅速普及,逐步成長為傳媒產業中獨特的產業形態,并依靠其對用戶需求的快速分析、計算并滿足,成長為主流的新聞產品形態。
2.產業化促使PNR形成信息生態
PNR多以技術型而非媒體型企業起步并為人所熟知,PNR本身并不產生內容,必須有優質的內容來源。因此,對于PNR來說,其發展需要信息生態作為土壤,這一生態至少包含新聞生產者、新聞用戶和新聞傳播者,前兩個生態角色已經隨著傳媒產業的成熟穩定存在,PNR則扮演了新聞個性化分發和精準傳播的角色,并且隨著PNR的不斷發展,產權問題和內容來源問題日益突出,PNR運維主體也逐漸出現角色多元化,在扮演好傳播者角色的同時,也利用其技術優勢和資本渠道,通過搭建平臺,構建起一個自主可控的信息生態,從百度到微博、微信,到今日頭條、一點資訊,無不經歷著從傳播者到生態構建者的發展歷程。PNR在媒體產業化構建的信息生態中成長,在發展過程中反作用于信息生態,并重構了信息生態,進而催化了PNR的快速發展。
3.產業化促使PNR可持續增長
移動互聯網已經成為新聞用戶的主要資訊渠道。PNR企業通過廣告、面向第三方的流量輸出以及付費服務等盈利模式,實現了用戶流量的變現。為了維持競爭優勢,PNR企業在內容來源和技術能力方面進行再投資,以不斷吸引優質內容創作者,并提高內容分發技術水平。同時,由于PNR的快速發展及其對傳統媒介形態的巨大沖擊,新的傳播、技術和管理等問題也不斷顯現,PNR企業主動開始謀求與政、學、研的合作,例如騰訊與北京大學的合作[28]、一點資訊與南京大學的合作等[29],這些舉措客觀上促進了PNR信息生態的良性運行,在多方共同努力下,網絡新聞行業管理成效逐漸顯現,內容生產效率得到顯著提升。
PNR賴以發展的信息技術和新興產業正在發生著日新月異的變革,數據技術、智能技術的進步以及服務模式的革新促使PNR在服務質量、服務形態和服務內容方面快速發展。
(一)PNR數據廣泛融合
PNR的主要功能是向新聞用戶提供定制化內容,出于盈利需求,PNR不可避免地會與其他互聯網服務進行融合。PNR企業通過研發多元化信息產品、與其他互聯網企業的產品合作或者是通過資本推動戰略合作等形式,新聞推薦與其他互聯網產品和服務的推薦實現了綁定,如澎湃新聞推出的“海貝商城”閱讀獎勵項目,今日頭條推出的“值點”電商項目,這種綁定的背后是圍繞移動互聯網用戶數據的深度融合,這種融合的趨勢已十分明顯,并且正在加快,多元數據融合實現了更加精準的用戶畫像。
5G的普及將使“萬物互聯”成為現實。根據ABI Research估計,從2017年到2022年,可穿戴設備的年復合增長率將達到16.4%,發貨量從2017年的2.03億件,到2022年的4.34億件[30]。用戶數據終端將從PC和手機拓展到更多智能化電子設備,線上和線下的邊界將被進一步打破,PNR用戶將作為數字化單元融入智能社會,泛在信息環境將從理念和實驗室走向現實和商業化。更加深入的用戶了解,將使PNR更全面感知用戶信息環境,情境感知技術將在數據來源的拓展以及傳輸和計算能力提升的基礎上得以快速發展,用戶客觀狀態信息需求得以更全面的滿足,新聞內容將根據用戶的主觀和客觀需求實現無限細分,從而有望從技術角度解決當前PNR信息窄化及其在公共性和專業性等方面問題,新聞傳播將從大眾傳播到分眾傳播到群體傳播,再到真正意義上的個性化傳播。
(二)PNR服務更加精準
在云計算、大數據和網絡技術日趨成熟的情況下,數據的計算、存儲和傳輸等人工智能發展的基礎設施逐漸完善,數據來源成為人工智能發展最核心的要素,數據渠道的拓寬和多元數據的融合將加速智能化技術的進步。
首先是PNR前端的新聞生產環節的全面智能化。當前,媒體智能化變革進程正在不斷加快,新華社的媒體大腦、《人民日報》的“中央廚房”、美聯社的智能寫作機器人、《紐約時報》的Blossomblot等人工智能產品已投入到實際新聞業務中,并在加快重塑新聞業務鏈。從新聞線索的發現到內容組織編輯,從傳播報道到反饋評價,人工智能將全面覆蓋新聞業務鏈。人工智能助力下的人機協同將成為主流的新聞生產方式,媒體智能化的普及將極大提升新聞生產效率和質量,成為媒體變革的核心推動力。其次,新聞生產模式也將在人工智能的推動下發生變革,內容生產將實現按需定制。用戶主觀和客觀需求的全面感知,為PNR實現按需定制提供了數據基礎,PNR個性化分發的邏輯也將從傳播環節提前到生產環節,新聞的定題、生產將更加具有針對性,其傳播效率和傳播效果也將更有保障。再次,生產模式的變革和新聞業務鏈的重塑將根據新聞用戶需求實現新聞內容的無限細分,更加細粒度的內容劃分將實現更為精準的個性化傳播。
(三)PNR使用場景更加多元
通信技術、人工智能技術和數字版權技術將推動媒介加快融合,媒介成為人類更多功能的延伸,不同媒介之間由于融合的加速而使相互之間的邊界更加模糊。同時,媒體業務不斷拓寬,新聞的媒介渠道將從集中化走向泛在化,用戶將不再主要依賴手機讀、聽、看新聞,PNR服務終端將根據用戶的使用習慣向更加多元化的方向發展,同時虛擬現實和增強現實技術也不斷提升PNR用戶體驗,PNR的使用場景也將隨之更加多樣。
(四)從內容對接到全面對接
媒體融合正在不斷推進宣傳與服務功能的整合,服務功能也將成為媒體智能化的必備功能[31]。數據的融合將推動PNR的功能和價值從傳播向服務滲透,PNR在精準提供新聞內容的基礎上,針對用戶個性化需求將提供包括教育、醫療、政務、社交、電子商務等一系列線上個性化服務,實現用戶與新聞生產者、服務提供者、產品生產者的精準對接,進而成為各種類型服務和商品的入口。這種趨勢反過來將為PNR提供更加完善的用戶畫像,以提供更加精準的個性化新聞內容,從而實現信息生態的良性運轉和循環躍遷。
(五)“個性化—隱私悖論”問題越發凸顯
豐富的數據終端和多元的數據融合為個性化服務帶來了數據驅動力,但同時,用戶數據的暴露也面臨更大的隱私風險,“個性化—隱私悖論”(Personalization-PrivacyParadox)將越發凸顯。由于用戶數據是驅動PNR不斷進步的核心動力,這在根本上導致了個性化與隱私存在不可調和的矛盾,數據安全技術的不斷進步在解決這一矛盾所帶來的問題方面可以發揮一定作用,但是更多需要從法律法規、制度設計等方面進行規范,相關問題的研究也會隨著PNR不斷發展得以深入。
用戶信息需求、信息技術發展和PNR服務的產業化成為推動PNR發展的三股核心動力,然而技術水平和數據來源的限制,導致客觀信息需求在PNR服務中出現缺失,也間接造成了PNR發展過程中出現的一系列問題。移動互聯網技術、感知和推薦技術、大數據和云計算等技術的發展,將繼續推動更加廣泛的數據融合和推薦技術的進步,提升推薦系統對用戶環境的感知,進而滿足用戶客觀信息需求,為解決PNR當前存在的問題不斷提供技術方案,促進PNR生態良性發展。
[本文為國家自然科學基金重點項目“新媒體發展管理理論與政策研究”(71633001)的部分成果]
參考文獻:
[1]極光.2019年新聞資訊行業研究報告[R].深圳:2020.
[2]NEGROPONTE N.Toward a Theory of Architecture Machines[J].Journal of Architectural Education(1947-1974),1969,23(2):9-12.
[3]NEGROPONTE N.數字化生存[M].胡泳,范海燕,譯.海口:海南出版社,1996.
[4]CHESNAIS P R,MUCKLO M J,SHEENA J A.The FishwrapPersonalized News System:IEEE,1995.
[5]柯青.基于RSS技術的個性化信息服務新方式:由雅虎看RSS在搜索引擎中的應用[J].情報理論與實踐,2005(5):537-541.
[6]王斌,李峰.平臺型媒體的運營模式分析:以新聞聚合網站Buzz Fed為例[J].新聞戰線,2015(15):52-55.
[7]DAILYMEI.DailyMeLaunchesNewUser-CentricNews Destination[Z].NewYork:BusinessWire,Inc,2008.
[8]曾海芳.美國報業的數字化發展研究[D].上海:上海大學,2011.
[9]謝新洲.新媒體給社會生活帶來巨大變革社會網絡化信息數字化交互實時化[J].新聞傳播,2015(22):1.
[10]國秋華.個性化新聞推薦對注意力市場的建構[J].出版發行研究,2019(2):62-65.
[11]王卓軒.基于受眾視角看個性化新聞推薦[J].中國報業,2019(6):14-15.
[12]胡昌平.信息服務與用戶[M].武漢:武漢大學出版社,2008.
[13]HOEFFLINGERMIKE.回歸商業常識[M].黃延峰,譯.北京:中信出版集團,2019.
[14]RENY,CHICR,ZHANGJT.AReviewofContext-BasedPersonalizedRecommendationResearch [M]//XuZ,ChooK,DehghantanhaA,etal.AdvancesinIntelligentSystems andComputing.CHAM:SPRINGERINTERNATIONALPUBLISHINGAG,2020:1222-1227.
[15]文軍,張思峰,李濤柱.移動互聯網技術發展現狀及趨勢綜述[J].通信技術,2014,47(9):977-984.
[16]中國互聯網絡信息中心.中國互聯網絡發展狀況統計報告[R].北京:2020.
[17]新浪微博數據中心.2018微博用戶發展報告[R].北京:新浪微博數據中心,2019.
[18]中國互聯網絡信息中心.中國互聯網絡發展狀況統計報告[R].北京:中國互聯網絡信息中心,2014.
[19]中國互聯網絡信息中心.中國手機網民娛樂行為報告[R].北京:中國互聯網絡信息中心,2013.
[20]王偉軍,孫晶.Web2.0的研究與應用綜述[J].情報科學,2007(12):1907-1913.
[21]劉甲學.Web2.0環境下個性化信息服務探析[J].情報科學,2008(09):1336-1339.
[22]ZHOUX,XUY,LIY,etal.TheState-Of-The-ArtIn PersonalizedRecommenderSystemsForSocialNetworking [J]. ARTIFICIALINTELLIGENCEREVIEW,2012,37(2):119-132.
[23]OMARCOLOMBO -MENDOZAL,VALENCIA -GARCIA R,RODRIGUEZ-GONZALEZA,etal.Recommetz:AContext-Aware Knowledge -BasedMobileRecommenderSystemForMovie Showtimes[J].EXPERTSYSTEMSWITHAPPLICATIONS,2015,42(3):1202-1222.
[24]REINSELD,GANTZJ,RYDNINGJ.DataAge2025-TheDigitizationoftheWorldFromEdgetoCore[EB/OL].[2020-02-25].https://www.seagate.com/files/www-content/our-story/trend s/files/idc-seagate-dataage-whitepaper.pdf.
[25]雷鋒網.今日頭條超大數據中心亮相,與英特爾共同發力AI與大數據[EB/OL].[2020-3-6].www.sohu.com/a/255020949_114877.
[26]朱夏,宋愛波,東方,等.云計算環境下基于協同過濾的個性化推薦機制[J].計算機研究與發展,2014,51(10):2255-2269.
[27]國秋華.個性化新聞推薦對注意力市場的建構[J].出版發行研究,2019(2):62-65.
[28]騰訊大數據.騰訊公司與北京大學共建協同創新實驗室[EB/ OL].[2020-2-26].https://cloud.tencent.com/developer/article/1031103.
[29]馮棟.自媒體“火種”播撒高校一點資訊“百校萬人計劃”落地南京大學[EB/OL].[2020-3-6].http://www.xinhuanet.com/itown/2017-11/ 09/c_136739321.htm.
[30]王宇峰,余珞,MUDESIRABDURAZAK,等.5G時代十大應用場景白皮書[R].深圳:華為技術有限公司,2017.
[31]謝新洲.縣級融媒體中心建設的四梁八柱:融合、創新、引導、服務[J].新聞戰線,2019(3):45-47.
(謝新洲為北京大學新媒體研究院院長,教授,博士生導師;王強為北京大學新媒體研究院博士生,北京市科學技術情報研究所副研究員)
編校:董方曉