摘要:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,新聞媒體的傳播方式和用戶的閱讀習(xí)慣都發(fā)生了巨大的變化。個(gè)性化新聞推薦指利用大數(shù)據(jù)分析和人工智能技術(shù),根據(jù)用戶的個(gè)人特征、興趣偏好、瀏覽歷史等數(shù)據(jù),為不同用戶推薦不同的新聞內(nèi)容,使新聞信息服務(wù)精準(zhǔn)化和個(gè)性化。相較于傳統(tǒng)的人工推薦或統(tǒng)一推薦,個(gè)性化新聞推薦更加準(zhǔn)確、主動(dòng)、智能化。文章介紹個(gè)性化新聞推薦的算法基礎(chǔ),包括協(xié)同過(guò)濾算法、內(nèi)容推薦算法和混合推薦算法,并分析各算法的工作原理,發(fā)現(xiàn)協(xié)同過(guò)濾依賴用戶行為數(shù)據(jù),內(nèi)容推薦依賴新聞文本數(shù)據(jù),但是兩者都存在冷啟動(dòng)和稀疏性問(wèn)題,因此混合推薦算法應(yīng)運(yùn)而生。文章指出個(gè)性化新聞推薦面臨的三大挑戰(zhàn):用戶隱私與數(shù)據(jù)安全問(wèn)題、信息繭房效應(yīng)、“黑箱”操作與透明度問(wèn)題。大數(shù)據(jù)時(shí)代,用戶信息高度易感,算法過(guò)濾容易導(dǎo)致信息同質(zhì)化,“黑箱”操作也容易引發(fā)用戶質(zhì)疑。對(duì)此,文章提出優(yōu)化策略:引入多樣性指標(biāo),增強(qiáng)結(jié)果差異性;健全用戶反饋機(jī)制,持續(xù)優(yōu)化算法;提高算法透明度和可解釋性,增強(qiáng)用戶信任感。具體做法包括:調(diào)整相似度計(jì)算、設(shè)置反饋入口、采用可視化技術(shù)等。文章旨在為個(gè)性化新聞推薦提供借鑒和參考。
關(guān)鍵詞:個(gè)性化新聞推薦;算法把關(guān);信息繭房;“黑箱”操作;優(yōu)化策略
中圖分類號(hào):G210.7 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-8883(2024)05-0005-03
基金項(xiàng)目:本論文為2018年度江西科技學(xué)院人文社科項(xiàng)目“個(gè)性化新聞推薦的算法把關(guān)研究”主要成果,項(xiàng)目編號(hào):RW1808;2023年度南昌市“十四五”社科規(guī)劃課題“網(wǎng)絡(luò)治理視域下南昌縣級(jí)融媒體參與社會(huì)基層治理研究”階段性成果,項(xiàng)目編號(hào):XW202304
新聞是人類社會(huì)的重要信息源,它不僅能夠反映社會(huì)的現(xiàn)狀和變化,還能夠影響人們的認(rèn)知和行為。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,新聞媒體的傳播方式和用戶的閱讀習(xí)慣都發(fā)生了巨大的變化。根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第52次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2023年6月,我國(guó)網(wǎng)民規(guī)模達(dá)10.79億人,較2022年12月增長(zhǎng)1109萬(wàn)人,互聯(lián)網(wǎng)普及率達(dá)76.4%。網(wǎng)民規(guī)模不斷增長(zhǎng)的同時(shí),網(wǎng)民對(duì)新聞信息的需求也越來(lái)越多樣化和個(gè)性化,他們希望根據(jù)自己的興趣偏好,獲取更加符合自己需求的新聞內(nèi)容[1]。
個(gè)性化新聞是指通過(guò)算法把關(guān)、個(gè)性化推薦、協(xié)同過(guò)濾等方式推送給受眾的新聞內(nèi)容。平臺(tái)結(jié)合大數(shù)據(jù)對(duì)用戶閱讀習(xí)慣的捕捉,對(duì)用戶閱讀興趣進(jìn)行預(yù)測(cè)和推斷,為其推送更符合需求的新聞內(nèi)容。簡(jiǎn)而言之,個(gè)性化新聞就是基于“用戶洞察”的個(gè)性化信息智能匹配,根據(jù)個(gè)性化需求聚合相關(guān)的信息和應(yīng)用,以滿足用戶需求的個(gè)性化內(nèi)容。因此,個(gè)性化需求改變了傳統(tǒng)媒體時(shí)代用戶主動(dòng)尋找信息的情況,平臺(tái)利用推薦的形式為內(nèi)容找到與其相匹配的用戶。
為了滿足網(wǎng)民的個(gè)性化新聞需求,各大新聞平臺(tái)紛紛采用個(gè)性化新聞推薦系統(tǒng),其能有效解決信息過(guò)載的問(wèn)題,提高用戶的滿意度和忠誠(chéng)度,延長(zhǎng)用戶的停留時(shí)間,從而為新聞平臺(tái)帶來(lái)更多的流量和收益。根據(jù)中華全國(guó)新聞工作者協(xié)會(huì)發(fā)布的《中國(guó)新聞事業(yè)發(fā)展報(bào)告》,2022年,中國(guó)傳媒產(chǎn)業(yè)規(guī)模呈恢復(fù)性增長(zhǎng)態(tài)勢(shì),總產(chǎn)值達(dá)29710.3億元,增長(zhǎng)率從上一年的8.40%提升至13.54%,恢復(fù)到2019年兩位數(shù)的增長(zhǎng)水平。當(dāng)前,個(gè)性化新聞推薦已經(jīng)成為新聞資訊行業(yè)的主流模式[2],但個(gè)性化新聞推薦系統(tǒng)也面臨一些挑戰(zhàn)。因此,個(gè)性化新聞推薦的算法把關(guān)顯得尤為重要。
(一)協(xié)同過(guò)濾算法
協(xié)同過(guò)濾算法是個(gè)性化推薦領(lǐng)域的經(jīng)典方法之一。它基于用戶的歷史行為數(shù)據(jù),通過(guò)計(jì)算用戶之間的相似性來(lái)預(yù)測(cè)用戶的興趣偏好。在新聞推薦中,協(xié)同過(guò)濾算法能夠發(fā)現(xiàn)具有相似閱讀習(xí)慣的用戶群體,并根據(jù)這些相似用戶的喜好為用戶推薦新聞內(nèi)容。其優(yōu)點(diǎn)在于能夠自動(dòng)發(fā)現(xiàn)用戶之間的關(guān)聯(lián),不需要對(duì)新聞內(nèi)容進(jìn)行深入分析。然而,協(xié)同過(guò)濾算法也面臨一些挑戰(zhàn),如冷啟動(dòng)問(wèn)題和數(shù)據(jù)稀疏性問(wèn)題。冷啟動(dòng)問(wèn)題指對(duì)新用戶或者新加入的新聞,由于缺乏足夠的歷史數(shù)據(jù),算法難以準(zhǔn)確推薦。數(shù)據(jù)稀疏性問(wèn)題指由于每個(gè)用戶閱讀過(guò)的新聞只占很小一部分,“用戶—新聞”矩陣非常稀疏,影響了推薦的準(zhǔn)確性[3]。
(二)內(nèi)容推薦算法
與協(xié)同過(guò)濾算法不同,內(nèi)容推薦算法更注重對(duì)新聞內(nèi)容本身的分析。它通過(guò)分析新聞文本的特征和用戶的歷史偏好,為用戶推薦與其興趣相關(guān)的新聞。內(nèi)容推薦算法通常基于自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù),能夠深入挖掘新聞內(nèi)容的語(yǔ)義信息,從而更準(zhǔn)確地理解用戶的興趣和需求[4]。在內(nèi)容推薦算法中,關(guān)鍵詞提取、主題模型、深度學(xué)習(xí)等技術(shù)被廣泛應(yīng)用。例如,通過(guò)提取新聞的關(guān)鍵詞和主題信息,可以構(gòu)建用戶的興趣模型;利用深度學(xué)習(xí)技術(shù)對(duì)新聞文本進(jìn)行深度學(xué)習(xí),可以捕捉更豐富的語(yǔ)義信息。這些技術(shù)的應(yīng)用使得內(nèi)容推薦算法在理解用戶興趣和需求方面取得了顯著的效果。然而,內(nèi)容推薦算法也存在一定的局限性。它對(duì)新聞文本的依賴性較強(qiáng),如果新聞文本的質(zhì)量不高或者存在偏見(jiàn),推薦的準(zhǔn)確性會(huì)受到影響[5]。
(三)混合推薦算法
為了充分發(fā)揮協(xié)同過(guò)濾和內(nèi)容推薦的優(yōu)勢(shì)并克服各自的局限性,研究者提出了混合推薦算法。混合推薦算法結(jié)合協(xié)同過(guò)濾和內(nèi)容推薦的優(yōu)點(diǎn),通過(guò)融合多種推薦策略來(lái)提高推薦的準(zhǔn)確性和多樣性。在混合推薦算法中,常用的融合方法包括加權(quán)融合、串聯(lián)融合和并聯(lián)融合等,其可以根據(jù)具體的應(yīng)用場(chǎng)景和需求選擇不同的融合方式和權(quán)重分配策略,從而使新聞推薦服務(wù)更加個(gè)性化[6]。
(一)數(shù)據(jù)隱私與安全問(wèn)題
個(gè)性化新聞推薦的核心在于對(duì)用戶數(shù)據(jù)進(jìn)行深入分析和挖掘。用戶的瀏覽歷史、閱讀習(xí)慣、興趣偏好等信息是推薦算法進(jìn)行精準(zhǔn)推送的關(guān)鍵。然而,在收集、存儲(chǔ)和使用數(shù)據(jù)的過(guò)程中存在隱私和安全問(wèn)題。近年來(lái),大型互聯(lián)網(wǎng)公司數(shù)據(jù)泄露事件頻發(fā),引發(fā)了公眾對(duì)個(gè)人信息安全的擔(dān)憂。例如,犯罪分子通過(guò)自己開(kāi)發(fā)軟件爬取淘寶客戶的數(shù)字ID、昵稱、手機(jī)號(hào)碼等信息近12億條,導(dǎo)致大量用戶信息被非法獲取并用于惡意營(yíng)銷,嚴(yán)重侵犯了用戶的合法權(quán)益[7]。因此,如何在確保推薦準(zhǔn)確性的同時(shí)保護(hù)用戶隱私,成為個(gè)性化新聞推薦算法亟待解決的問(wèn)題。
(二)信息繭房效應(yīng)
信息繭房效應(yīng)是指用戶在接收信息時(shí),由于算法的過(guò)濾和推薦,逐漸陷入信息閉環(huán),導(dǎo)致視野受限、思維僵化。個(gè)性化新聞推薦算法在提供精準(zhǔn)內(nèi)容的同時(shí),也可能加劇這一效應(yīng)[8]。近日,中國(guó)青年報(bào)社社會(huì)調(diào)查中心聯(lián)合問(wèn)卷網(wǎng),對(duì)1501名受訪者進(jìn)行的一項(xiàng)調(diào)查顯示,62.2%的受訪者認(rèn)為,“大數(shù)據(jù)+算法”的精準(zhǔn)推送方式,讓自己陷入了信息繭房。長(zhǎng)期來(lái)看,這不僅會(huì)限制用戶的認(rèn)知范圍,還可能引發(fā)社會(huì)偏見(jiàn)和分裂。因此,個(gè)性化新聞推薦算法需要在追求精準(zhǔn)性的同時(shí),考慮信息的多樣性和平衡性,以避免信息繭房效應(yīng)帶來(lái)的負(fù)面影響。
(三)“黑箱”操作與透明度問(wèn)題
個(gè)性化新聞推薦算法的決策過(guò)程對(duì)大多數(shù)用戶來(lái)說(shuō)是“黑箱”操作。用戶只能看到推薦的結(jié)果,而無(wú)法了解算法是如何做出推薦決策的。這種缺乏透明度的做法容易引發(fā)用戶對(duì)算法公平性和可信度的質(zhì)疑。例如,一些用戶在多次收到與自己興趣不符的新聞推薦后,懷疑算法存在偏見(jiàn)或錯(cuò)誤。個(gè)性化新聞推薦算法需要提高決策過(guò)程的透明度,讓用戶了解算法是如何工作的以及為何會(huì)推薦某些內(nèi)容[9]。這可以通過(guò)提供詳細(xì)的推薦解釋、展示推薦依據(jù)的權(quán)重分配等方式來(lái)實(shí)現(xiàn),從而提高用戶對(duì)算法的信任度和接受度。
(一)引入多樣性指標(biāo)
為解決信息繭房問(wèn)題,個(gè)性化新聞推薦算法需要引入多樣性指標(biāo)。多樣性指標(biāo)能夠衡量推薦列表中新聞的來(lái)源、主題和觀點(diǎn)的多樣性,從而鼓勵(lì)算法為用戶提供更加多元化的內(nèi)容。提升新聞的多樣性,可以幫助用戶打破信息繭房,使他們接觸到更廣泛的信息和觀點(diǎn),進(jìn)而提升他們的認(rèn)知水平和思維能力[10]。
在實(shí)際應(yīng)用中,可以通過(guò)調(diào)整推薦算法中的相似度計(jì)算方法、增加對(duì)冷門新聞的推薦權(quán)重等手段,實(shí)現(xiàn)對(duì)多樣性指標(biāo)的引入。例如,澎湃新聞平臺(tái)在其算法中引入了基于主題模型的多樣性指標(biāo),通過(guò)計(jì)算新聞主題的相似度,確保推薦列表中的新聞具有多樣性。該策略實(shí)施后,用戶對(duì)該平臺(tái)的滿意度提高,黏性增強(qiáng)[11]。
(二)健全用戶反饋機(jī)制
用戶反饋是個(gè)性化新聞推薦算法優(yōu)化的重要依據(jù)。收集用戶對(duì)推薦新聞的滿意度、點(diǎn)擊率、閱讀時(shí)長(zhǎng)等數(shù)據(jù),可以了解用戶對(duì)推薦內(nèi)容的偏好和需求,進(jìn)而對(duì)算法進(jìn)行針對(duì)性的優(yōu)化。同時(shí),用戶反饋還可以幫助平臺(tái)發(fā)現(xiàn)算法中存在的問(wèn)題和偏差,及時(shí)進(jìn)行修正和調(diào)整。要健全用戶反饋機(jī)制,可以在新聞推薦平臺(tái)上設(shè)置明確的反饋入口和選項(xiàng),鼓勵(lì)用戶提供真實(shí)的反饋意見(jiàn)[12]。此外,還可以采用激勵(lì)機(jī)制,如給予積分獎(jiǎng)勵(lì)、提升用戶等級(jí)等,鼓勵(lì)用戶參與反饋[13]。例如,騰訊新聞在其應(yīng)用中設(shè)置了用戶滿意度調(diào)查功能,通過(guò)收集用戶對(duì)推薦新聞的評(píng)分和評(píng)論了解用戶的反饋意見(jiàn)。該平臺(tái)還定期對(duì)用戶反饋進(jìn)行分析和總結(jié),將結(jié)果應(yīng)用于算法優(yōu)化中,從而不斷提升推薦質(zhì)量,優(yōu)化用戶體驗(yàn)[14]。
(三)提高算法透明度與可解釋性
提高算法的透明度和可解釋性,是提高用戶對(duì)個(gè)性化新聞推薦算法信任度的重要途徑。透明度要求算法能夠向用戶展示其決策過(guò)程和依據(jù),而可解釋性則要求算法能夠提供易于理解的決策理由和依據(jù)[15]。提高算法的透明度和可解釋性,可以讓用戶更加了解算法的運(yùn)作方式和決策依據(jù),從而提高他們對(duì)算法的信任度和接受度。在實(shí)際操作中,可以通過(guò)可視化技術(shù)向用戶展示推薦算法的決策過(guò)程,包括新聞篩選、排序、推薦等環(huán)節(jié)的具體操作。還可以在推薦結(jié)果中附帶相應(yīng)的解釋信息,如基于用戶的哪些歷史行為和興趣偏好進(jìn)行了推薦、推薦的新聞與用戶的哪些需求相關(guān)等。例如,搜狐新聞在其應(yīng)用中增加了“為什么推薦”功能,以簡(jiǎn)明扼要的文字向用戶解釋每條新聞推薦的依據(jù),從而提高用戶對(duì)算法的信任度和滿意度。
個(gè)性化新聞推薦的發(fā)展充分體現(xiàn)了互聯(lián)網(wǎng)技術(shù)是如何變革傳統(tǒng)新聞業(yè),使新聞內(nèi)容的推送方式從被動(dòng)轉(zhuǎn)向主動(dòng),從粗放轉(zhuǎn)向精準(zhǔn)的。它帶來(lái)的定制化新聞體驗(yàn),無(wú)疑更貼近當(dāng)代公眾的信息需求。然而,也要清醒地看到,個(gè)性化新聞推薦算法的應(yīng)用引發(fā)了一些負(fù)面問(wèn)題,數(shù)據(jù)隱私、信息繭房、算法不透明等風(fēng)險(xiǎn)日漸凸顯。如果任由其演化,可能導(dǎo)致公共討論碎片化和觀點(diǎn)極端化。因此,有必要把雙刃劍用好,防止其傷人。在繼續(xù)增強(qiáng)算法效果的同時(shí),要注重用戶權(quán)益的保護(hù)、結(jié)果的多元化和過(guò)程的透明化,還要完善監(jiān)管,建立第三方審計(jì)與評(píng)估體系,在技術(shù)創(chuàng)新與社會(huì)責(zé)任之間找到平衡,提升算法的可解釋性、公平性與安全性,讓其健康可持續(xù)地服務(wù)用戶和社會(huì)。
參考文獻(xiàn):
[1] 熊亞光.新聞個(gè)性化推薦的影響因素分析[J].傳媒論壇,2023,6(23):27-29.
[2] 王茹楠.電視新聞節(jié)目主持人實(shí)現(xiàn)個(gè)性化表達(dá)的路徑[J].西部廣播電視,2023,44(16):188-190.
[3] 孟祥福,霍紅錦,張霄雁,等.個(gè)性化新聞推薦方法研究綜述[J].計(jì)算機(jī)科學(xué)與探索,2023,17(12):2840-2860.
[4] 李云霞,李偉.基于用戶角度的新聞內(nèi)容個(gè)性化推薦研究[J].新聞研究導(dǎo)刊,2023,14(7):87-89.
[5] 周帥,都云程,張仰森.個(gè)性化新聞推薦研究進(jìn)展[J].計(jì)算機(jī)技術(shù)與發(fā)展,2023,33(2):1-8.
[6] 徐茜茜.融合傳播下時(shí)政新聞“語(yǔ)言+視覺(jué)+文本”的個(gè)性化解讀[J].采寫編,2023(1):6-8.
[7] 喻玲.個(gè)性化推薦、公共性貶損與數(shù)字新聞市場(chǎng)反壟斷[J].法學(xué),2022(11):154-173.
[8] 夏艷.新聞評(píng)論的個(gè)性化表達(dá)探討[J].西部廣播電視,2022,43(19):58-60.
[9] 趙懷智.個(gè)性化新聞的推送:弊端及解決措施[J].湖北科技學(xué)院學(xué)報(bào),2022,42(4):90-96.
[10] 胡箐妍.個(gè)性化新聞推薦技術(shù)研究[J].中國(guó)傳媒科技,2022(7):137-139,143.
[11] 公沛然.個(gè)性化新聞推送的影響[J].中國(guó)地市報(bào)人,2022(6):68-69.
[12] 蒲岍岍,雷航,李貞昊,等.增強(qiáng)列表信息和用戶興趣的個(gè)性化新聞推薦算法[J].計(jì)算機(jī)科學(xué),2022,49(6):142-148.
[13] 楊浩琛.新聞評(píng)論的個(gè)性化表達(dá)探討[J].新聞傳播,2022(3):101-102.
[14] 牛琛琛.個(gè)性化新聞推送對(duì)新聞業(yè)務(wù)鏈的重塑[J].西部廣播電視,2021,42(20):16-18.
[15] 丁正祁,彭余輝,孫剛.基于改進(jìn)LDA主題模型的個(gè)性化新聞推薦算法[J].赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2021,37(6):28-32.
作者簡(jiǎn)介 范蕾蕾,講師,研究方向:新媒體傳播。