999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”模型*
——微博推薦流的運(yùn)作機(jī)制探析

2022-08-12 06:03:20陳逸君
關(guān)鍵詞:內(nèi)容用戶

—陳逸君—

近年來,Google、Facebook、微博和今日頭條等技術(shù)公司轉(zhuǎn)型而來的“平臺(tái)媒體”①(platish?ers)正在成為用戶獲取資訊的重要渠道。面對(duì)海量信息,即便平臺(tái)媒體也無法將全部?jī)?nèi)容提供給所有用戶,技術(shù)公司轉(zhuǎn)而通過算法完成對(duì)內(nèi)容的取舍與適配。然而,比起傳統(tǒng)媒體時(shí)代以記者編輯為代表的“把關(guān)人”嚴(yán)格遵循組織機(jī)構(gòu)一套章程標(biāo)準(zhǔn)②,平臺(tái)媒體對(duì)信息的處理更像一個(gè)不可接近的“黑箱”③,商業(yè)秘密保護(hù)和防止惡意入侵是此類科技公司拒絕公布“把關(guān)”過程的常見做法。④

如若不能及時(shí)打開“黑箱”,也就無法對(duì)平臺(tái)媒體的價(jià)值標(biāo)準(zhǔn)予以修正。目前,對(duì)Face?book、Twitter等西方平臺(tái)媒體的運(yùn)作機(jī)制,學(xué)界已積累了較為豐富的研究成果,而非西方語境下除少數(shù)面向今日頭條⑤、微博熱搜⑥的實(shí)證分析外,對(duì)平臺(tái)媒體的解讀大多基于主觀判斷,較少采用量化或田野調(diào)查的方式進(jìn)行驗(yàn)證。本文選取微博“推薦流”作為平臺(tái)媒體的代表,通過98名微博活躍用戶的近10萬條數(shù)據(jù)結(jié)合他們的問卷調(diào)查結(jié)果,揭示微博推薦流的核心運(yùn)作機(jī)制。微博是中國(guó)社交媒體的超級(jí)平臺(tái)之一,2021年微博月活躍用戶達(dá)5.73億,日活躍用戶2.49億⑦,網(wǎng)民通過微博獲取新聞的比例達(dá)35.6%⑧,高于新聞客戶端獲取新聞的比例。作為中國(guó)輿論風(fēng)向標(biāo)的社交媒體,微博引入內(nèi)容推薦的時(shí)間較早,其算法核心產(chǎn)品——微博“推薦流”,在經(jīng)歷數(shù)次代碼迭代后也相對(duì)走向成熟。

一、算法推斷:搭建從用戶興趣到內(nèi)容呈現(xiàn)的新路徑

如今人們身處高度可選擇的媒介環(huán)境之中,用戶擁有自由獲取感興趣內(nèi)容的權(quán)利。相關(guān)研究也證明,興趣主導(dǎo)了用戶的信息選擇⑨,網(wǎng)絡(luò)化媒介為用戶搭建起一個(gè)“興趣決定內(nèi)容”的信息世界(見圖1的“直接模型”部分)。

圖1 “用戶興趣—內(nèi)容呈現(xiàn)”的直接模型和“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”的間接模型

隨著平臺(tái)媒體在訊息分配過程中占據(jù)主導(dǎo)地位,不具備預(yù)先獲取用戶喜好能力的平臺(tái)媒體只能依托算法根據(jù)各類可挖掘、可計(jì)算和可測(cè)量的“數(shù)字痕跡”(digital trace data)對(duì)用戶興趣作判斷。筆者將上述環(huán)節(jié)稱為算法推斷,并假設(shè)算法推斷扮演了介于用戶興趣與內(nèi)容呈現(xiàn)之間的角色。據(jù)此,構(gòu)建“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”的間接模型,用戶從原來“主動(dòng)獲取感興趣內(nèi)容”變?yōu)楸粍?dòng)接收由“算法推斷用戶可能感興趣的內(nèi)容”(見圖1中“間接模型”部分)。

傳統(tǒng)觀點(diǎn)認(rèn)為,在信息自治的環(huán)境中,個(gè)人選擇對(duì)內(nèi)容呈現(xiàn)起決定作用,因此用戶對(duì)什么感興趣就會(huì)獲取怎樣的內(nèi)容。平臺(tái)媒體打破這一格局,伴隨算法推斷過程的介入,用戶興趣不再由用戶的天然屬性決定,而是外化為轉(zhuǎn)評(píng)贊、停留時(shí)長(zhǎng)等一系列可能被算法標(biāo)記為有效計(jì)數(shù)的表征向量。那么此時(shí)算法判斷的用戶興趣與用戶的真實(shí)興趣是否保持一致?如不一致,用戶興趣與算法推斷誰決定了內(nèi)容推薦?回答上述問題是“開箱”平臺(tái)媒體運(yùn)作機(jī)制的前提。

二、算法推斷的影響因素

根據(jù)間接模型假設(shè),決定內(nèi)容呈現(xiàn)的未必是用戶興趣,而是算法推斷的用戶興趣,那么又有哪些因素決定了算法推斷?

用戶的發(fā)布/轉(zhuǎn)發(fā)、收藏和點(diǎn)贊行為數(shù)據(jù)是后臺(tái)最易獲取且可能被解讀為用戶對(duì)該內(nèi)容感興趣的信號(hào)。本文將上述用戶產(chǎn)生的行為數(shù)據(jù)統(tǒng)稱為用戶自主行為,并猜測(cè)用戶自主行為是算法推斷用戶興趣的重要依據(jù)。

大量研究表明,個(gè)體傾向與那些具有相同社會(huì)人口特征⑩、行為/價(jià)值觀的人交往并保持聯(lián)系。根據(jù)用戶好友的興趣反推用戶興趣,這一思路已經(jīng)證實(shí)被多個(gè)平臺(tái)媒體所采納,如一項(xiàng)針對(duì)Facebook公開專利的文本分析顯示,其系統(tǒng)會(huì)從用戶朋友發(fā)布的動(dòng)態(tài)以及朋友的興趣出發(fā)推斷用戶興趣所在。同樣作為社交媒體的微博,曾經(jīng)在多個(gè)公開場(chǎng)合強(qiáng)調(diào)社交關(guān)系對(duì)于算法推薦的重要性。微博AI Lab資深算法專家張俊林表示,“親密的社交關(guān)系往往蘊(yùn)涵著潛在的興趣關(guān)聯(lián)”。本研究猜測(cè)社交關(guān)系是算法推斷的另一個(gè)重要依據(jù)。

綜上,筆者搭建了微博“推薦流”運(yùn)作機(jī)制的完整模型(如圖2所示)。首先是“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”部分(H1—H3),由于用戶通過微博展現(xiàn)自我興趣的空間有限、算法存在錯(cuò)誤描繪用戶肖像的幾率,可能出現(xiàn)用戶的真實(shí)興趣與算法推斷的用戶興趣不符的情況,因此提出:

圖2 “用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”完整模型

H1.用戶的真實(shí)興趣與算法推斷的用戶興趣并非在所有興趣領(lǐng)域都呈現(xiàn)顯著相關(guān)。

根據(jù)間接模型,算法參照“數(shù)字痕跡”對(duì)用戶興趣作判斷后,“推薦流”依托算法推斷而非用戶的真實(shí)興趣進(jìn)行內(nèi)容推薦,因此提出:

H2.算法推斷某領(lǐng)域用戶興趣與某領(lǐng)域的內(nèi)容呈現(xiàn)存在顯著相關(guān)性;

H3.用戶真實(shí)興趣與內(nèi)容推薦并非在所有興趣領(lǐng)域都呈現(xiàn)顯著相關(guān)性。

其次是算法推斷的影響因素部分(H4—H6),猜測(cè)影響算法推斷的第一個(gè)因素是用戶自主行為,提出:

H4.用戶對(duì)某領(lǐng)域內(nèi)容進(jìn)行的發(fā)布/轉(zhuǎn)發(fā)、點(diǎn)贊和收藏,與算法推斷用戶對(duì)某領(lǐng)域的興趣存在顯著相關(guān)性。

猜測(cè)第二個(gè)影響因素是“社交關(guān)系”。格蘭諾維特(Granovetter)將社交關(guān)系劃分為“強(qiáng)關(guān)系”和“弱關(guān)系”,認(rèn)為用戶的關(guān)系強(qiáng)度體現(xiàn)在用戶間的親密程度和接觸頻率。本研究將微博中與用戶相互關(guān)注的好友視作“強(qiáng)關(guān)系”,與用戶呈現(xiàn)單向關(guān)注的大V則更符合“弱關(guān)系”,同時(shí)考察“強(qiáng)關(guān)系”與“弱關(guān)系”對(duì)算法推斷的影響提出研究假設(shè):

H5.與用戶呈“弱關(guān)系”的人對(duì)某領(lǐng)域的興趣情況,會(huì)顯著影響算法推斷該用戶對(duì)相關(guān)領(lǐng)域的興趣;

H6.與用戶呈“強(qiáng)關(guān)系”的人對(duì)某領(lǐng)域的興趣情況,會(huì)顯著影響算法推斷該用戶對(duì)相關(guān)領(lǐng)域的興趣。

三、研究方法

(一)數(shù)據(jù)與樣本描述

本研究采用深度訪談、問卷調(diào)查與抓取98名微博用戶的99476條數(shù)據(jù)相結(jié)合的方式,共同揭示微博推薦流的運(yùn)作機(jī)制。出于數(shù)據(jù)隱私保護(hù),微博不會(huì)向他人或機(jī)構(gòu)展示任何用戶的后臺(tái)數(shù)據(jù),盡管用戶發(fā)布的內(nèi)容、關(guān)注列表、點(diǎn)贊等信息作為公開數(shù)據(jù)可被直接獲取,但本研究中最為關(guān)鍵的內(nèi)容呈現(xiàn)即微博為用戶推薦了什么是除用戶外,任何人都無法獲取的。面對(duì)內(nèi)容呈現(xiàn)的采集困難,有學(xué)者采用問卷調(diào)查通過受訪者“自我報(bào)告”(self?report)過去一周在平臺(tái)媒體上看到有關(guān)某領(lǐng)域話題的頻率(1=從不,5=經(jīng)常)得到內(nèi)容推薦的情況。鑒于不同受訪者對(duì)頻率的認(rèn)知差異,這一形式易受主觀因素干擾。本研究在征得用戶知情同意的基礎(chǔ)上獲取他們的微博賬號(hào)及密碼,經(jīng)由用戶注冊(cè)時(shí)綁定的手機(jī)驗(yàn)證后登錄,通過八爪魚抓取“推薦流”的實(shí)時(shí)內(nèi)容,較好地避免了用戶主觀作答帶來的不準(zhǔn)確性。

自2020年10月至11月,筆者發(fā)動(dòng)親友并依托“滾雪球”的方式共征集108個(gè)微博賬號(hào),在排除非活躍用戶后得到98名活躍用戶的微博賬號(hào)使用權(quán)(n=98)。分別于10月31日、11月1日、11月28日(三日均無重大事件,排除該時(shí)間段內(nèi)微博集中推薦某類特定內(nèi)容)登錄賬號(hào),并對(duì)每個(gè)賬號(hào)抓取包括:推薦廣告(不少于50條)、熱門推薦(不少于400條)、推薦關(guān)注的人列表(不少于100位)、轉(zhuǎn)發(fā)/發(fā)布的微博(全部或不少于100條)、點(diǎn)贊(全部或不少于100條)、收藏(全部或不少于100條)和關(guān)注的人所發(fā)布的微博(不少于100條)。98個(gè)賬號(hào)共抓取廣告4971條、熱門推薦38755條、關(guān)注的人15822位(其中與用戶呈現(xiàn)“弱關(guān)系”11352人)、轉(zhuǎn)發(fā)/發(fā)布的微博9561條、點(diǎn)贊4999條、收藏2569條、關(guān)注的人發(fā)布的微博11447條,共獲得有效數(shù)據(jù)99476條。此外,所有用戶完成一份問卷星平臺(tái)的調(diào)查問卷。

在“推薦流”中大部分推薦內(nèi)容和博主的興趣領(lǐng)域都被微博打上了自帶標(biāo)簽,筆者對(duì)微博中所有出現(xiàn)的標(biāo)簽進(jìn)行記錄,一共52類興趣標(biāo)簽,按相同主題合并同類項(xiàng)后劃分為9大類別(1=新聞消息類,2=金融科技類,3=教育衛(wèi)生類,4=人文藝術(shù)類,5=娛樂明星類,6=娛樂產(chǎn)業(yè)類,7=體育競(jìng)技類,8=日常生活類,9=時(shí)尚美妝類)(見表1)。參照內(nèi)容編碼表對(duì)所抓取的98名用戶數(shù)據(jù)進(jìn)行編碼后,按四分位數(shù)法將連續(xù)數(shù)據(jù)轉(zhuǎn)換為等級(jí)資料,通過有序Lo?gistic回歸分析證明各變量間的關(guān)系。

表1 微博內(nèi)容編碼表

(二)測(cè)量

1.問卷部分

(1)人口統(tǒng)計(jì)學(xué)

本研究調(diào)查樣本來自98名微博用戶,受訪者中男性占48%,女性占52%。受訪者的年齡段集中于26—30歲(SD=0.0774),受教育程度中位值為“碩士”。受訪者主要為在校學(xué)生(37.7%)、專業(yè)技術(shù)人員(20.4%)和企業(yè)管理人員(19.3%)。

(2)用戶興趣

為測(cè)量用戶對(duì)某領(lǐng)域的真實(shí)興趣,調(diào)查問卷要求受訪者對(duì)時(shí)事、社會(huì)、財(cái)經(jīng)等不同領(lǐng)域的興趣進(jìn)行評(píng)分(采用五級(jí)量表測(cè)量,1=完全不感興趣,5=非常感興趣)。參照編碼表將問卷中涉及的領(lǐng)域合并為9個(gè)類別,按四分位數(shù)法換為等級(jí)資料,從而得到98名用戶對(duì)9個(gè)類別的真實(shí)興趣情況。9個(gè)類別問卷Cronbach′sα系數(shù)值分別為0.82,0.76,0.68,0.84,0.67,0.81,0.75,0.82,0.84及總體量表的Cronbach′sα系數(shù)值為0.94。

2.用戶數(shù)據(jù)部分

(1)算法推斷

算法推斷的過程與結(jié)果被嚴(yán)格保密,雖然無法從科技公司手中獲取后臺(tái)為不同用戶打上的興趣標(biāo)簽,但我們可以從其他途徑得到啟發(fā)。一項(xiàng)公開專利指出,為幫助廣告商精準(zhǔn)尋求潛在買主,擴(kuò)大社交媒體的商業(yè)價(jià)值,微博主要根據(jù)當(dāng)前系統(tǒng)為用戶標(biāo)識(shí)的興趣標(biāo)簽來確定他們的廣告主題。微博會(huì)把算法推斷的結(jié)果用于廣告投放,因此通過觀察用戶接收的廣告類型,可逆向判斷該用戶被后臺(tái)打上了什么興趣標(biāo)簽。抓取用戶的推薦內(nèi)容并從中篩選出廣告部分進(jìn)行分類。

除了考察廣告,“可能感興趣的人”(后改名為“推薦關(guān)注”)是反映算法推斷用戶興趣的另一途徑。由于其推薦依據(jù)是“用戶可能感興趣”,因此通過觀察“推薦關(guān)注”的類型,也可逆向判斷該用戶被后臺(tái)打上什么興趣標(biāo)簽。抓取每位用戶的“推薦關(guān)注”并進(jìn)行分類。

(2)內(nèi)容呈現(xiàn)

內(nèi)容推薦是微博“推薦流”在某個(gè)時(shí)刻呈現(xiàn)給用戶的內(nèi)容,抓取用戶推薦流中的內(nèi)容并進(jìn)行分類。

(3)用戶自主行為

微博可直接獲取的用戶自主行為包括:點(diǎn)贊、收藏和該用戶發(fā)布/轉(zhuǎn)發(fā)的內(nèi)容,分別來自微博中“我的贊”“我的收藏”和“我的微博”。抓取上述內(nèi)容進(jìn)行分類。

(4)社交關(guān)系

本研究將與用戶相互關(guān)注的人定義為與用戶存在“強(qiáng)關(guān)系”。筆者在對(duì)98名用戶匿名編號(hào)后隨機(jī)抽取13名用戶,登錄其微博賬號(hào)并手動(dòng)記錄每一位與該用戶存在相互關(guān)注關(guān)系的好友的興趣領(lǐng)域。微博會(huì)自動(dòng)根據(jù)用戶好友的關(guān)注列表生成一張他的興趣領(lǐng)域分布圖(見圖3)。對(duì)每位用戶所有好友的興趣領(lǐng)域進(jìn)行分類統(tǒng)計(jì)。

圖3 微博為每位用戶好友標(biāo)識(shí)的興趣領(lǐng)域

接著,筆者抓取每位用戶的“關(guān)注的人”所發(fā)布的微博,手動(dòng)排除非大V賬號(hào)(轉(zhuǎn)評(píng)贊數(shù)量均<5,粉絲數(shù)量<5000,且經(jīng)驗(yàn)證不帶大V認(rèn)證的用戶)后,獲取的就是與該用戶存在“弱關(guān)系”的博主發(fā)布的內(nèi)容,同樣對(duì)其進(jìn)行分類處理。

四、研究結(jié)果

本研究旨在探討微博“推薦流”的運(yùn)作機(jī)制,并猜測(cè)它與互聯(lián)網(wǎng)為用戶搭建的“興趣決定內(nèi)容”這一高度自由的信息環(huán)境不同,用戶從原來主動(dòng)獲取感興趣的內(nèi)容變?yōu)楸粍?dòng)接收由算法推斷用戶可能感興趣的內(nèi)容。鑒于此,筆者在“用戶興趣—內(nèi)容呈現(xiàn)”這一直接模型的基礎(chǔ)上,建立了“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”的間接模型。本文首先對(duì)間接模型的猜想進(jìn)行論證,其次探索哪些因素會(huì)對(duì)算法推斷產(chǎn)生影響。

(一)“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”部分的論證

1.用戶興趣與內(nèi)容呈現(xiàn)

問卷調(diào)查顯示,41.8%的受訪者表示“微博經(jīng)常會(huì)推送一些用戶不感興趣的內(nèi)容”。從受訪者的主觀作答中,可明顯感知“用戶興趣”與“內(nèi)容呈現(xiàn)”之間存在斷裂。筆者以“用戶興趣”(即通過問卷獲取的用戶真實(shí)興趣)為自變量,“熱門推薦”作為因變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):9個(gè)類別中只有金融科技類(β=0.690,p<0.001)、娛樂明星類(β=0.945,p=0.009)和體育競(jìng)技類(β=0.912,p<0.001)的用戶興趣與內(nèi)容呈現(xiàn)存在顯著正相關(guān)性,其余6類的用戶興趣均與內(nèi)容呈現(xiàn)之間不存在顯著相關(guān)關(guān)系(如表2所示)。用戶對(duì)某領(lǐng)域的真實(shí)興趣與該領(lǐng)域的內(nèi)容呈現(xiàn)不存在必然聯(lián)系,H3得到驗(yàn)證。

2.用戶興趣與算法推斷

如前所述,算法推斷的測(cè)量方式有兩種:一是根據(jù)用戶的廣告推送類別推測(cè)算法對(duì)用戶興趣的判斷,二是根據(jù)微博“推薦關(guān)注”的分類來反映算法對(duì)用戶興趣的判斷。筆者對(duì)這兩種途徑都進(jìn)行了檢驗(yàn)。在廣告抓取過程中我們發(fā)現(xiàn):第一,同一用戶的廣告內(nèi)容存在大量重復(fù),去重后每位用戶收到的廣告種類有限,現(xiàn)有廣告類型不能全面地反映用戶特征;第二,同一時(shí)段內(nèi)不同用戶都收到如“鉑金鉆戒”“蘭蔻粉水”“防脫生發(fā)”等無差別廣告投放,與原先設(shè)想的精準(zhǔn)投放有所出入。

推薦流的非個(gè)性化廣告投放也得到了多數(shù)受訪者的驗(yàn)證。問卷調(diào)查顯示,63.3%的受訪者表示微博廣告推送不太符合個(gè)人需求。統(tǒng)計(jì)結(jié)果也佐證了這一觀點(diǎn),以“用戶興趣”為自變量,受訪者接收的廣告作為代表算法推斷的因變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):在用戶接收的廣告類型中,除金融科技類(β=0.563,p=0.003)和時(shí)尚美妝類(β=-1.461,p=0.007)外,其他7個(gè)類別的廣告推送均與用戶的真實(shí)興趣無顯著相關(guān)性。其中時(shí)尚美妝類的回歸系數(shù)為負(fù),說明即便對(duì)時(shí)尚美妝不感興趣的用戶,也同樣可能會(huì)被投放化妝品、潮流服飾等廣告,消費(fèi)單品類廣告已經(jīng)成為推薦流中的普遍現(xiàn)象(見表3)。上述結(jié)果說明,用戶的真實(shí)興趣與廣告推送的關(guān)聯(lián)性不強(qiáng)。

表3 有序Logistic回歸:用戶興趣與算法推斷

為何會(huì)出現(xiàn)這一現(xiàn)象?在對(duì)新浪首席信息官王巍的訪談中,他承認(rèn)“微博存在廣告競(jìng)價(jià)”(2020年10月28日),廣告的投放量與廣告商的投入密切相關(guān),這是造成無差別廣告的重要原因之一。更微妙的是,2019年微博向美國(guó)證券交易委員會(huì)遞交的財(cái)報(bào)顯示,阿里巴巴目前作為微博的第二大股東,持股30.2%且擁有15.8%的投票權(quán)。因此不排除具有高度話語權(quán)的阿里系在廣告投放過程中對(duì)微博施壓。

一方面是微博“推薦流”并未完全根據(jù)用戶特征來確定廣告主題,另一方面目前所能收集到的廣告類型十分有限,難以描繪用戶完整的興趣維度。鑒于上述原因,我們認(rèn)為用戶的廣告分類并不適用于衡量算法推斷,因此在本研究中筆者以“推薦關(guān)注”的分類情況作為反映算法推斷的變量。“推薦關(guān)注的人”本質(zhì)上就是基于算法推斷的用戶興趣的結(jié)果,王巍也承認(rèn)“用戶(興趣)標(biāo)簽是作為‘推薦關(guān)注’最為重要的依據(jù)(2020年12月15日)”。以用戶興趣為自變量,算法推斷(推薦關(guān)注的人)作為因變量進(jìn)行Logistic回歸分析后發(fā)現(xiàn):只有在體育競(jìng)技類(β=1.020,p<0.001)和時(shí)尚美妝類(β=0.735,p=0.022)中用戶興趣與算法推斷之間存在顯著正相關(guān)關(guān)系,其余7個(gè)類別均未表現(xiàn)出顯著相關(guān)性(見表3)。這一結(jié)果說明,用戶的真實(shí)興趣與算法推斷的用戶興趣之間存在一定的“間隙”,算法在判斷用戶偏好時(shí)可能出現(xiàn)誤判,H1得到驗(yàn)證。

為何會(huì)產(chǎn)生誤判?筆者根據(jù)問卷梳理了一些可能造成用戶真實(shí)興趣與算法推斷用戶興趣差異的原因:人情面子(51.9%的受訪者表示,更傾向?yàn)g覽或?yàn)椤芭c自己密切相關(guān)的人,如親人或好友發(fā)布的微博”點(diǎn)贊)、微博的類型(54.1%的受訪者對(duì)“娛樂八卦類的軟資訊都不太點(diǎn)贊”;43.9%的受訪者在看到體現(xiàn)社會(huì)價(jià)值、人生意義的微博時(shí)會(huì)轉(zhuǎn)發(fā)點(diǎn)贊)和微博的實(shí)際效用(34.7%的受訪者表示“看到教育培訓(xùn)相關(guān)的資訊會(huì)瀏覽收藏,以更好地應(yīng)對(duì)升學(xué)和職場(chǎng)”;39.8%的受訪者“會(huì)收藏深度好文以增加談資”)都可能成為自身興趣之外,用戶轉(zhuǎn)評(píng)贊等行為產(chǎn)生的原因,而正是通過“解讀”這些行為,微博對(duì)用戶興趣的判斷產(chǎn)生了偏差。

3.算法推斷與內(nèi)容呈現(xiàn)

在對(duì)算法推斷和內(nèi)容呈現(xiàn)進(jìn)行Logistic回歸分析后發(fā)現(xiàn):所有9個(gè)類別即新聞消息類(β=0.422,p<0.001)、金融科技類(β=0.487,p<0.001)、教育衛(wèi)生類(β=0.425,p<0.001)、人文藝術(shù)類(β=0.331,p=0.007)、娛樂明星類(β=0.523,p<0.001)、娛樂產(chǎn)業(yè)類(β=0.407,p=0.001)、體育競(jìng)技類(β=0.859,p<0.001)、日常生活類(β=0.616,p=0.002)和時(shí)尚美妝類(β=1.032,p<0.001)的算法推斷均與內(nèi)容呈現(xiàn)之間存在顯著正相關(guān)關(guān)系(見表2),提示算法一旦判斷用戶對(duì)某領(lǐng)域感興趣,那么用戶將看到更多有關(guān)該領(lǐng)域的內(nèi)容推薦,H2得到驗(yàn)證。

綜上,筆者搭建了微博“推薦流”的“用戶興趣—算法推斷—內(nèi)容呈現(xiàn)”間接模型:用戶的真實(shí)興趣與算法推斷的用戶興趣之間存在“間隙”(H1成立),算法推斷某領(lǐng)域用戶的興趣與某領(lǐng)域的內(nèi)容呈現(xiàn)存在顯著正相關(guān)性(H2成立),用戶的真實(shí)興趣與內(nèi)容呈現(xiàn)不存在必然聯(lián)系(H3成立)。該模型說明,“推薦流”打破了“興趣決定內(nèi)容”這一傳統(tǒng)認(rèn)知,最終決定內(nèi)容推薦的不是用戶的真實(shí)興趣,而是算法所推斷的用戶興趣,并且“微博認(rèn)識(shí)的你”與“你認(rèn)識(shí)的你”之間存在差異。

(二)算法推斷影響因素部分的論證

以算法推斷為因變量,發(fā)布/轉(zhuǎn)發(fā)、收藏、點(diǎn)贊三種用戶自主行為作為自變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):所有9個(gè)類別中,除日常生活類(p=0.447)外,其他8個(gè)類別即新聞消息類(p=0.003)、金融科技類(p=0.001)、教育衛(wèi)生類(p<0.001)、人文藝術(shù)類(p=0.001)、娛樂明星類(p<0.001)、娛樂產(chǎn)業(yè)類(p=0.003)、體育競(jìng)技類(p<0.001)和時(shí)尚美妝類(p=0.001)的用戶自主行為均與算法推斷呈現(xiàn)顯著相關(guān)性(見表4),提示用戶對(duì)某領(lǐng)域的發(fā)布/轉(zhuǎn)發(fā)、收藏和點(diǎn)贊行為會(huì)影響算法判斷用戶對(duì)該領(lǐng)域的興趣,證明用戶自主行為是微博“推薦流”進(jìn)行用戶興趣推斷的重要依據(jù),H4得到驗(yàn)證。

以“弱關(guān)系”為自變量,“算法推斷”作為因變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):在與用戶呈現(xiàn)“弱關(guān)系”的人發(fā)布的微博內(nèi)容中,所有9個(gè)類別即新聞消息類(β=0.811,p<0.001)、金融科技類(β=0.527,p<0.001)、教育衛(wèi)生類(β=0.395,p=0.003)、人文藝術(shù)類(β=0.415,p=0.001)、娛樂明星類(β=0.475,p=0.011)、娛樂產(chǎn)業(yè)類(β=0.646,p<0.001)、體育競(jìng)技類(β=1.075,p<0.001)、日常生活類(β=0.467,p=0.002)和時(shí)尚美妝類(β=0.635,p<0.001)與算法推斷均存在顯著正相關(guān)性(如表4所示)。可見當(dāng)用戶關(guān)注的大V發(fā)布越多有關(guān)某領(lǐng)域的內(nèi)容時(shí),算法越傾向于判斷該用戶也會(huì)對(duì)這一領(lǐng)域感興趣,由此證明“弱關(guān)系”也是微博推薦流進(jìn)行用戶興趣推斷的重要依據(jù),H5得到驗(yàn)證。

表4 有序Logistic回歸:用戶自主行為、弱關(guān)系與算法推斷

最后考察“強(qiáng)關(guān)系”對(duì)算法推斷的影響。在對(duì)98名用戶進(jìn)行匿名編號(hào)后,隨機(jī)抽取其中13名作為樣本(編號(hào):11、26、27、28、30、31、32、39、41、42、46、51、53)。記錄13個(gè)賬號(hào)中每一位與用戶存在“相互關(guān)注”的好友的興趣領(lǐng)域。取每行頻率最高的類別,組成該用戶所有好友最感興趣的項(xiàng)目列表。根據(jù)編碼表將項(xiàng)目合并同類項(xiàng),得到該用戶所有好友在9個(gè)類別中最感興趣的項(xiàng)目列表。重復(fù)此操作,獲得13名用戶的所有好友在9個(gè)類別中最感興趣的項(xiàng)目情況并將其百分比化(如表5所示)。

表5 用戶好友的最感興趣項(xiàng)目百分比統(tǒng)計(jì)表(%)

將用戶好友最感興趣的項(xiàng)目分類結(jié)果與算法推斷進(jìn)行相關(guān)性分析,結(jié)果顯示:在與用戶呈現(xiàn)“強(qiáng)關(guān)系”的人所最感興趣的項(xiàng)目類別中,大部分類別與算法推斷無顯著相關(guān)性,只有人文藝術(shù)類(r=0.71,p=0.007)、娛樂明星類(r=0.63,p=0.022)和時(shí)尚美妝類(r=0.71,p=0.006)的用戶好友最感興趣的項(xiàng)目與算法推斷存在顯著正相關(guān)關(guān)系。此外,娛樂產(chǎn)業(yè)類(r=-0.56,p=0.048)中的用戶好友興趣與算法推斷呈現(xiàn)顯著負(fù)相關(guān)關(guān)系,說明即便用戶好友對(duì)娛樂產(chǎn)業(yè)不感興趣,系統(tǒng)仍然可能判定該用戶對(duì)娛樂產(chǎn)業(yè)感興趣(如圖4所示)。可見,用戶好友的興趣與算法推斷僅呈現(xiàn)部分相關(guān)性,H6不成立。

圖4 用戶好友(強(qiáng)關(guān)系)最感興趣類別與算法推斷的相關(guān)性分析

五、總結(jié)

本研究旨在考察微博“推薦流”的運(yùn)作機(jī)制,在明確提出算法推斷這一中間步驟的同時(shí),對(duì)影響算法推斷的各類因素進(jìn)行了探究。根據(jù)分析結(jié)果可知。第一,微博“推薦流”打破了“興趣決定內(nèi)容”這一傳統(tǒng)認(rèn)知,決定內(nèi)容推薦的不是用戶的真實(shí)興趣,而是算法所推斷的用戶興趣。算法在判斷用戶偏好時(shí)可能出現(xiàn)誤判,“微博認(rèn)識(shí)的你”與“真實(shí)的你”之間存在差異。

第二,算法推斷作為影響推薦流內(nèi)容呈現(xiàn)的核心要素,同時(shí)受到社交關(guān)系和用戶自主行為的影響。值得注意的是,在社交關(guān)系維度中與用戶呈現(xiàn)“強(qiáng)關(guān)系”的親友群組對(duì)于內(nèi)容類別的喜好并未顯著地影響算法推斷,相反由大V構(gòu)成的“弱關(guān)系”群組成為決定微博推薦流如何判定用戶興趣的關(guān)鍵。在微博眼中,那些具有較高領(lǐng)域權(quán)威的明星、名人、機(jī)構(gòu)企業(yè)比起與用戶關(guān)系密切的好友或大部分普通用戶而言,更能影響甚至最終主導(dǎo)用戶所接收到的內(nèi)容。當(dāng)領(lǐng)域權(quán)威成為用戶獲取內(nèi)容推薦的重要參考指標(biāo)時(shí),“身份”“資本”和“權(quán)力”等現(xiàn)實(shí)社會(huì)中的劃分方式,在平臺(tái)媒體中被重新加以實(shí)踐。這種基于“關(guān)鍵少數(shù)法則”(vital few rule)所進(jìn)行的算法推斷可能會(huì)進(jìn)一步造成網(wǎng)絡(luò)空間中對(duì)弱小聲音、新聲音的抹除。

需指出,由于微博賬號(hào)的獲取難度較大,本研究以98名用戶和抽樣的“強(qiáng)關(guān)系”作為研究樣本,研究結(jié)果的代表性可能有限,更為確切的結(jié)論需要更大規(guī)模的樣本予以支撐。

注釋:

① Glick,J.Rise of the Platishers.http://www.recode.net/2014/2/7/11623214/rise?of?the?platishers.2014-2-7.

② Gieber,W.News Is What Newspapermen Make It.In A.Lewis&D.M.White,(Eds.),People,Society and Mass Communication.New York:The Free Press.1964.pp.160-172.

③ Diakopoulos,N.Algorithmic Accountability Reporting:On the Investigation of Black Boxes.Tow Center for Digital Journalism.https://academiccom?mons.columbia.edu/doi/10.7916/D8ZK5TW2.2014-2-12.

④ Pasquale,F(xiàn).A.Restoring Transparency to Automated Authority.Journal on Telecommunications and High Technology Law,vol.9,2011.pp.235-256.

⑤ 王茜:《打開算法分發(fā)的“黑箱”——基于今日頭條新聞推送的量化研究》,《新聞?dòng)浾摺罚?017年第9期,第7-14頁。

⑥ 王茜:《批判算法研究視角下微博“熱搜”的把關(guān)標(biāo)準(zhǔn)考察》,《國(guó)際新聞界》,2020年第7期,第26-48頁。

⑦ 每日經(jīng)濟(jì)新聞:《微博發(fā)布Q4及全年業(yè)績(jī):2021營(yíng)收22.6億美元 同比增長(zhǎng)34%》。https://weibo.com/ttarticle/p/show?id=230940474 3007546245214.2022年3月3日。

⑧ 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心:《2016年中國(guó)互聯(lián)網(wǎng)新聞市場(chǎng)研究報(bào)告》,http://www.cac.gov.cn/2017-01/12/c_1121534556.htm.2017年1月12日。

⑨ Str?mb?ck,J.,Djerf-Pierre,M.,Shehata,A.The Dynamics of Political Interest and Newsmedia Consumption:ALongitudinal Perspective.International Journal of Public OpinionResearch,vol.25,no.4,2013.pp.414-435.

⑩ McPherson,M.,Smith?Lovin,L.,Cook,J.M.Birds of a Feather:Homophily in Social Networks.Annual Review of Sociology,vol.27,no.1,2001.pp.415-444.

猜你喜歡
內(nèi)容用戶
內(nèi)容回顧溫故知新
內(nèi)容回顧 溫故知新
內(nèi)容回顧溫故知新
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內(nèi)容
臺(tái)聲(2016年2期)2016-09-16 01:06:53
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
100萬用戶
如何獲取一億海外用戶
主站蜘蛛池模板: 999国内精品视频免费| 真人免费一级毛片一区二区| 国产99精品久久| 国产九九精品视频| 中文字幕有乳无码| 熟女成人国产精品视频| 国产资源站| 欧美天堂在线| 91色老久久精品偷偷蜜臀| 亚洲天堂区| 免费AV在线播放观看18禁强制| 区国产精品搜索视频| 国产欧美日韩视频怡春院| 日本精品中文字幕在线不卡 | 国产精品视频公开费视频| 日韩高清成人| 亚洲狠狠婷婷综合久久久久| 在线观看的黄网| 亚洲乱亚洲乱妇24p| 国产精品极品美女自在线网站| 露脸一二三区国语对白| 在线精品自拍| 欧美笫一页| 波多野结衣一区二区三区88| 精品人妻一区二区三区蜜桃AⅤ| 欧美亚洲国产一区| 国产流白浆视频| 婷婷亚洲天堂| 亚洲精品日产精品乱码不卡| 亚洲日本www| 伊人久综合| 色综合五月| 精品亚洲国产成人AV| 国产欧美精品专区一区二区| 精品自拍视频在线观看| 在线免费观看a视频| 乱人伦视频中文字幕在线| 久久免费看片| 国产精品欧美激情| 日韩a级片视频| 久久久久人妻一区精品| 亚洲首页国产精品丝袜| 国产成人免费高清AⅤ| 精品国产aⅴ一区二区三区| 正在播放久久| 国产精品偷伦在线观看| 香蕉精品在线| 亚洲Aⅴ无码专区在线观看q| 国产欧美日韩另类精彩视频| 国内精品视频| 日韩在线第三页| 欧美性久久久久| 黄色网址免费在线| 99久久人妻精品免费二区| 国产精品极品美女自在线网站| 亚洲国产日韩一区| 亚洲va在线∨a天堂va欧美va| 欧美日韩一区二区在线免费观看| 亚洲国产成人精品一二区| 国产成人综合在线视频| 青青青视频蜜桃一区二区| 高清久久精品亚洲日韩Av| 国产成人一区| 日本在线欧美在线| 国产大片黄在线观看| 亚洲男人的天堂网| 亚洲有无码中文网| 熟妇无码人妻| 久青草免费视频| 亚洲一本大道在线| 亚洲视频影院| 色综合中文字幕| 午夜福利免费视频| 在线免费看片a| 免费a级毛片视频| 精品国产香蕉在线播出| aaa国产一级毛片| 九九热精品视频在线| 国产在线观看91精品亚瑟| 精品国产一二三区| 亚洲一区二区三区香蕉| 日韩在线观看网站|