樓建坤 陳澤璽 國秋華
摘要 以今日頭條App為代表的聚合類新聞客戶端,依靠技術驅動,沒有記者編輯,整個內容分發過程都由計算機操作。然而,這并不意味著這類媒介缺乏把關。文章在研究相關文獻和觀察體驗的基礎上,提出了“算法把關”的概念,得出了今日頭條是由算法進行把關的結論,并結合計算機科學知識,介紹了相關技術應用情況,闡述了算法把關的實現形式和過程,并深入分析了依靠計算機算法進行把關產生的問題與隱憂。
關鍵詞 算法;把關;今日頭條
1問題緣起與文獻綜述
在手機新聞客戶端市場激烈競爭的今天,以“今日頭條”為代表的聚合類新聞客戶端引人關注。不同于人民日報、網易新聞、騰訊新聞等傳統媒體或門戶網站延伸至手機建立的客戶端,這類客戶端不依托于原有媒體,而是直接通過技術手段聚合新聞,做大規模的內容分發,它們是移動互聯網之下的直接產物?;谟脩襞d趣實現個性化推薦,是聚合類新聞客戶端的最大特點,“今日頭條”既是此類產品的先行者,也是領跑者。值得注意的是,“今日頭條”的技術特色隨后被其他手機新聞客戶端所廣泛借鑒,基于大數據的新聞推薦已成為“標配”,目前主流新聞客戶端基本都能通過大數據挖掘信息,為用戶精準推送新聞。
然而,這類技術驅動的新聞客戶端,在沒有記者、編輯的情況下,只依靠計算機進行信息分發,是否缺乏對信息的把關呢?如果存在把關,又是什么在把關呢?這些問題,值得我們關注。
把關理論是新聞傳播學科最重要的理論之一。“把關人”的概念是美國社會心理學家、傳播學奠基人之一庫爾特·盧因提出來的,他認為把關人在對信息進行篩選的時具有主觀性。隨后,把關人理論的發展經歷了一個從微觀到宏觀,從單一到復雜的過程,把關行為中越來越多的客觀因素被考慮在內,從而打破了當初個人心理因素的單一視角,最終轉為對媒介系統與社會系統關系、社會系統模式的研究。隨著新媒體的發展,學界掀起了網絡和新媒體環境下把關人的研究,焦點則集中在探討把關人角色的擅變上。
隨著媒介形態的迅速發展和媒介技術的更新,傳統的把關理論不可能觸及到所有新領域,對于聚合類新聞客戶端的把關行為進行研究的相關文獻不多。靳戈認為,“把關人”的形態在網絡時代發生了重大變化。負責為用戶篩選新聞、調整順序的不是現實中的人,而是程序背后的算法邏輯。王成軍試圖從技術層面分析今日頭條的傳播機制和相關原理,對數據新聞、網絡爬蟲技術、聚合媒體平臺及個性化信息推薦系統進行了介紹。他指出,算法或計算機把關有損新聞價值取向。陳瀅在“使用與滿足”的理論框架下討論“今日頭條”用戶的需求滿足情況。她認為,個性化新聞推薦在滿足用戶需求方面,仍存在一些問題,譬如信息繭房、信息無人把關等。
傳統的把關理論認為把關是媒體的一種特有權利,然而隨著新媒體的發展和新技術的應用,把關的權利已經得到下放,有著成為一種社會化權利的趨勢。而且隨著宏觀研究的拓展,關于最終實現把關的微觀領域被研究者所忽視。本文則是考察技術驅動的新聞客戶端中的把關模式,考慮用戶在把觀眾的作用,并重新回歸把關研究的微觀領域。
2今日頭條:誰是把關人
傳統大眾傳媒,記者采集新聞,確定內容范圍,編輯對哪些稿件入選做出取舍選擇,由記者加編輯實現把關,這一模式十分清晰。網絡媒體雖然在之前一直未獲得采編權,但網絡編輯同樣存在,他們編輯稿件并選擇取舍,在網絡媒體中充當著把關人角色。反觀“今日頭條”,它本身不生產內容,而是一個新聞聚合平臺,所以也就不需要記者。初始運營階段,“今日頭條”靠網絡爬蟲技術抓取新聞資訊,變為自己的內容,做十足的“新聞搬運工”;在之后出現版權問題后,“今日頭條”與傳統媒體及各大網站變對抗為合作,建立頭條號,邀請各大媒體、自媒體、機構等入駐,從而獲得內容來源。無論怎樣獲得內容,都不需要親自采集。同時,作為一個科技公司,“今日頭條”也沒有編輯存在,這個公司有的只是工程師、程序員和運營人員。沒有記者編輯,“今日頭條”是否缺乏把關人呢?筆者發現,針對每個用戶的興趣做個性化推薦,每個用戶接收到的信息各不相同,在決定哪些信息被推薦給用戶的過程中,其信息確實存在一個選擇過濾的過程。由此可見,廣泛存在于媒體中的把關現象,在“今日頭條”的信息分發中也是存在的。那么,一個既沒有記者又沒有編輯的新聞客戶端,一個對外宣稱不是媒體的科技公司,是誰在把關呢?
首先,“今日頭條”的運營人員在資訊分發的過程中確實起到了一定作用,如今日頭條會用人工方式對敏感文章進行審核過濾,但這并非主要的把關形式,所以運營人員不是我們所認為的主要把關人。毫無疑問,不是人在把關,就只能是工程師所控制的機器在把關,因為最終的信息分發和推薦,都是通過計算機來實現的。而是什么組成計算機程序呢?是算法加數據結構。算法,是解決問題的一系列方法和步驟,這是個數學里的概念,也是計算機科學里的概念。算法是計算機程序的靈魂,也是組成各種不同技術的基礎。
所以,歸根結底,是計算機中的算法在把關,算法所起的作用才是最類似于把關人的,具體到聚合類新聞App或“今日頭條”來說,是個性化推薦算法。雖然以往的傳播學著作中從未提到過算法把關的概念,但通過觀察與分析發現,在“今日頭條”這類App中,計算機的“算法”,確實代替人起到了信息把關的作用,實現了最終的把關,并且對每個用戶產生影響。
當然,在推薦算法進行把關的過程中,用戶起到了極大作用。因為用戶對新聞資訊的選擇,其閱讀、點贊、評論、收藏等行為都是主動為之的,用戶的不同興趣,是算法實現個性化推薦的基礎。但我們發現,沒有算法做出的把關行為的存在,整個用戶興趣發現的過程也就沒有意義,個性化推薦也就無法實現,其結果是不會發生信息分發行為。所以,算法把關雖然裹挾了用戶的“個人把關”,但卻是占主導地位的把關行為。
總之,以今日頭條為代表的聚合類新聞客戶端,不是把關缺失的媒介形態,而是通過算法實現了信息把關,進行個性化推薦。
3算法把關的技術分析與實現過程
3.1算法把關的技術運用
算法把關是一種新型的把關模式。我們具體來探討算法把關的實現方式。簡單地說,算法把關的過程,是由不同算法組成的不同技術共同作用的結果。正如今日頭條總裁張一鳴的介紹:“今日頭條是一款基于數據挖掘的推薦引擎產品,結合了搜索引擎、數據挖掘、機器學習等技術。”
所謂機器學習,就是機器通過自己學習,并用學到的知識形成判斷。機器學習與數據挖掘、大數據、推薦引擎有很多交叉之處,機器學習更加基礎,被較多應用于其他技術中。
數據挖掘,就是利用計算機的強大計算能力,通過分析海量的原始數據,從中揭示出隱含的、先前未知的并有潛在價值的信息和規律的技術。數據挖掘是一門交叉性很強的學科,可以用到機器學習算法以及傳統統計的方法,最終的目的是要從數據中挖掘到為我所用的知識,從而指導人們的活動,如阿里巴巴從大量的淘寶交易數據中找出有需求有能力的高質量小額貸款客戶,就是利用了這一技術。當然,隨著大數據時代的到來,數據挖掘要更多的適應大數據環境,“今日頭條”的大數據挖掘,在業界是領先的。
搜索引擎技術則更好理解,我們已經習慣了有問題“百度一下”。其實“今日頭條”可以看作移動設備中的百度,用戶的閱讀行為所展現的興趣需求就是搜索的關鍵字,而推薦的內容則是搜索結果。然而“今日頭條”更像是一個由算法實現把關的“推薦引擎”,而機器學習、數據挖掘、搜索引擎等技術的結合,共同實現了這一點。
3.2算法把關的實現過程
通過這些技術的組合,就可以進行個性化推薦了,算法就在這個過程中實現把關。頭條號和其他合作媒體會源源不斷的將內容發布到聚合平臺上,獲取大量內容之后,算法便開始起作用,即對信息進行大數據分析,通過分析,計算機對信息的屬性做出判斷,進行各種標簽化分類,得出當下的熱門資訊,從而為下一步推送做準備。
用戶在使用“今日頭條”的過程中,每觀看一條新聞內容,每一次點擊、瀏覽、收藏、評論等行為,甚至閱讀這條信息的時間長短等都會產生數據。另外,用戶在利用QQ、微博、微信等社交賬號登錄時,個人社交網絡的信息也隨之被記錄。所有這些數據都被后臺識別、判斷并記憶,形成大數據。通過機器學習技術進行大數據分析,則可判斷出用戶對于哪些類別的新聞資訊感興趣,進而形成包含了該用戶興趣的龐大數據。
將上述兩個過程結合起來,“今日頭條”根據計算出的每個用戶的興趣,選擇已分類的相關內容進行個性化推送,從而實現了信息把關。根據用戶日后的使用情況,若分析發現用戶并非對某類內容感興趣,機器就會對個人興趣圖譜進行完善和更新,并迅速對推送內容進行適當調整。所以,用戶閱讀的時間越長,次數越多,越能清晰地展現自己的興趣,“今日頭條”對用戶的信息推送也就更精準。這種基于用戶興趣判斷推送的信息內容,更能契合用戶的信息需求,降低了信噪比,從而提高了用戶獲取所需信息的效率。
4算法把關的問題與隱憂
通過算法實現把關的“今日頭條”改變了用戶獲取信息的方式,是新媒體環境下技術賦權的有力證據,它使媒介權利不再是支配性的,而是普遍化的,不再是專有權利,而是社會性權利。而這種信息的精準推送,滿足了用戶對信息的個性化需求,提高了用戶獲得有效信息的效率,從而使用戶獲得了良好的使用體驗。在艾媒咨詢所做的2015年手機新聞客戶端用戶滿意度調查中,今日頭條以8.7的評分位居第三,成為僅次于網易新聞和搜狐新聞的用戶最滿意客戶端。但機器終歸與人不同,機器能否代替編輯還值得商榷。算法把關的出現,依然存在著很多問題,必須引起我們的警惕。
4.1價值判斷的缺失
信息也是有優劣好壞之分的。算法只能判斷信息是否符合用戶的興趣需要,但無法分出信息的優劣,也無法做出價值判斷,這是機器無法代替編輯的鮮明例證。機器只會抓取熱門的新聞,但卻不會按照某種價值觀或是內容標準采錄?;蛘哒f,之前媒體的標準在這里不復存在,有的只是算法所捕捉到的用戶的好惡,這成為了“今日頭條”的把關標準?!敖袢疹^條”通過算法將信息推薦給用戶,無論好壞,只求契合需要。這就很容易陷入“唯用戶論”的漩渦。用戶在獲取信息后,需要自己去判斷優劣,這個過程極易受到不良信息的侵擾,色情兇殺暴力的內容,娛樂化的內容在所難免,這對用戶的媒介素養是個考驗。尤其是現階段我國網民出現低學歷化趨勢,價值判斷的問題可能更加嚴重。
4.2信息繭房的憂慮
用戶在利用今日頭條的過程中,不斷地被算法推薦自己感興趣的內容,但獲得的這些內容,就是最好的嗎?答案是不一定。如果只是一味的接受自己喜歡的信息,其他一些重要的信息可能就會因為是自己不感興趣的內容而被忽略,信息偶遇行為也就不存在。因為不感興趣,也就不會有相應的對該方面內容的閱讀行為,機器也就不會捕捉到你的興趣。長此以往,用戶的信息結構會變得越來越單一,只關注幾個方面甚至一個方面內容,自己給自己織造了一個“信息繭房”,將自己與其他信息隔絕,知識窄化的傾向在所難免。另外,通過觀察發現,不僅內容,觀點越近似的文章也越容易繼續推薦,用戶看得多了,很容易形成對某一問題看法的單一視角,誤以為這就是主流,從而以偏概全。從根本上說,這是算法中構建的相似性矩陣太機械、不夠科學合理造成的,這個問題有待進一步改進。
4.3內容生產的扭曲
由于算法把關實現的機器推薦對何為優質內容不能形成判斷,許多內容生產者會尋求通過“標題黨”等機器推薦中出現的漏洞,獲得閱讀量、轉發率、點贊量。這種算法選擇的傾向就對傳統的內容生產造成了扭曲,它破壞了原有的價值標準。如此,“標題黨”、越來越多打擦邊球的內容將會出現,娛樂化、黃色新聞的泛濫也就在所難免。
5結束語
在今日頭條App中,存在典型的算法把關模式,這種把關不同于傳統大眾傳媒的記者編輯把關,而是通過算法支撐的計算機技術實現。算法把關在一定程度上是一種進步,通過不同算法不同技術的組合,計算機代替人來執行把關操作,從而節省了人力,且推薦的內容因為能滿足用戶的個性化需求,深受用戶喜愛。但算法把關的實現,依然帶來很多問題,價值判斷的缺失、信息繭房的憂慮、內容生產的扭曲,都將制約其自身發展,并給用戶帶來不良影響。如何解決這些問題,只靠算法把關是否足夠,是否將機器與編輯相結合才是更好的模式?這些問題值得我們深思。