文/嚴宇橋 張蔚坪
隨著智媒時代的到來,以算法型信息分發技術滲透到了各個媒體當中。算法推送帶來的收益和效果正在影響各行各業,也引起了媒介研究的興趣。算法與傳媒業的深度融合,不斷形塑著傳媒業的實踐,同時也給傳播倫理造成了相當大的影響。本文在分析算法型信息分發的主要推薦機制基礎上,指出了在實際的研究中,算法推薦的準確率如何衡量的一種方法,并結合了協同過濾和文本分析兩種主流推薦機制設計了基于復合型推薦算法的模擬個性化信息推薦系統。
對于推薦系統,最重要的任務是連接信息和用戶之間的關系。該系統應幫助用戶找到對他們有價值的信息,同時讓該信息在感興趣的用戶面前顯示和推薦,從而達到信息消費與生產雙贏的局面。當前,推薦系統主要有三種推薦模式:基于協同過濾的推薦,基于關聯規則的推薦和基于文本的推薦。
對于協同過濾推薦來說,最基本的策略是計算用戶之間的相似度,例如余弦相似度。根據相似度排序,設置相似度閾值或設置最近鄰閾值,選擇一定數量的用戶,并讓這些用戶評估的產品形成候選集,對這些項目進行加權以計算分數,最后排序,向用戶推薦評分最高的項目。

公式(1)余弦相似度計算方法
但是,基于內存的協同過濾推薦的問題在于它們過于依賴歷史數據庫。歷史數據庫是系統中整個推薦功能的原始資料。當缺乏數據資料時,將出現一系列的問題,諸如冷啟動結果不令人滿意,以及推薦的準確性降低等。
基于內容的推薦是基于用戶歷史項提取,過濾和生成文本信息特征模型,并最終向用戶推薦類似于歷史瀏覽文本內容的信息。該算法在提取和分析文本信息的特征方面比較擅長,但是在非結構化數據的分析能力方面存在缺陷?;陉P聯規則的推薦基于用戶的歷史資料,以挖掘用戶數據背后的相關關聯,從而為用戶的潛在需求分析提供推薦。
綜上所述,這三種方法都有一定程度的局限性,每種方法都有一些難以解決的問題。目前,商業算法處理方法使用復合推薦方法進行推薦。
伴隨信息量的激增和網絡技術的日益普及,每個人對于關注的話題都可以自主選擇。桑斯坦認為,這種技術趨勢將導致“信息繭房”的問題,導致觀念封閉甚至兩極分化,這將造成非理性的極端主義。在傳統媒體時代,媒體組織向大眾傳播新聞,受眾意識不強?;谒惴ㄍ扑]的內容分發以用戶的個人特征為標準在技術層面上篩選信息,并向用戶推薦與其價值觀,偏好和個人興趣相匹配的信息,形成了``一千個人就有一千個哈姆雷特的''內容消費形式。近年來相關專家學者對于“信息繭房”的討論越來越激烈。傳統媒介倫理和媒介道德的鼓吹者認為,算法推送導致的用戶接受信息的窄化是導致近年來群體極化的罪魁禍首,而愈演愈烈的輿論極端化事件和輿論反轉現象就是他們的佐證。然而以喻國明為主要代表的技術樂觀主義者則堅持稱,信息偏食現象從傳播現象開始時就有,并非算法推送帶來的問題。
如果需要從研究方面解決目前關于“信息繭房”的爭論,就需要研究“算法推薦的進步”這個變量會對用戶產生何種效果。對于因果關系的證明,最有效的方法是通過實驗室控制變量的實驗來解決。從目前的研究中相關性研究居多而缺乏因果關系的討論來看,這個問題還缺乏一個切實有效的研究工具。二戰以來,效果研究都是心理學、傳播學等主流社會科學研究的議題,因此并不缺少該問題的因變量操作工具。但是,因此人們無法將“算法推薦”這個自變量進行量化,由此來看,如何將算法推薦作出有效的量化計算,是研究該問題的關鍵。因此,本研究就圍繞著這一問題設計了能夠有效將該變量操作化的工具。
信息推薦水平如何去測量和評價,是評測工具上的技術難點。比如,在用戶數量遠大于產品數量的系統上,基于協同過濾算法的用戶反饋很高;否則,它很低。相關的影響因素還包括評分量表和稀疏性,以及評估數據集其他特征的目的。但是,大多數推薦系統可以使用準確性來評估推薦算法的級別。假設用戶可以檢查所有產品的信息,并可以根據其對產品的偏好對產品分類,則準確度可以定義為推薦算法的預測排名與用戶的實際排名的接近程度。包含準確率和召回率的分類準確度指標在計算機領域應用最為廣泛。其具體計算方法采用Billsusd的邏輯,Billsusd也是率先準確度與召回率引入到推薦系統的評價中的學者。
例如,整個平臺中所有的產品數量為N,被推薦給用戶產品的總數為Ns,其中Ns=Nrs+Nis,Nrs和Nis分別為在被推薦產品中,用戶喜歡的產品數量與不喜歡的產品數量。相應地,Nrn和Nin分別為未被推薦產品中用戶喜歡和不喜歡的產品數。
綜上所述,準確率的計算就應當是:P=N(用戶喜歡的產品數量)/N(所有向用戶呈現的產品的數量)。
也就是說,對于一個算法推送式的平臺,可以將個性化水平也就是準確率分解成:(準確率=用戶喜好的信息條數/用戶看到的信息總條數)
因此,本研究的自變量和因變量分解就是:
自變量:個性化推送的準確率
因變量:點贊數、轉發數、轉發情況(數量、關系等)
因此,本程序使用java環境進行開發,設置出可調節準確率的用戶文本庫??傮w來說程序設計思路是:輸入用戶興趣的關鍵詞語,進行文本匹配以及協同過濾生成偏好關鍵詞,根據關鍵詞在微博進行搜索并爬取文本或圖片信息,制作成信息庫。最終用戶瀏覽信息庫文本、并利用虛擬按鍵統計用戶的行為。在本系統中,操作信息推薦水平只需要操作:相關信息與無關信息的比例即可。
如圖1,首先以python為開發語言,在以Google Crome瀏覽器中進行的微博搜索中嵌套了一個用戶頭部信息的儲存機制,實現用戶信息的“冷啟動”。第二步是整個程序設計的關鍵一步,也就是基于用戶個人偏好數據的挖掘和主體實驗材料的生成。主體流程就是:根據興趣標簽、搜索歷史、點開的鏈接等進行個性化特征采集,形成基于協同過濾和文本匹配的用戶特征,再在全網文本上采集與該特征相符合的信息。在此之后,隨機在網上采集排除掉相關特征的信息,然后二者按比例混合,生成不同準確率下根據個人興趣愛好的可操作實驗資料庫。第三步是總體的實驗界面。第一步測過的用戶依次再次進入實驗室,這次就讓他們查看已經根據他們之前的用戶習慣編好的資料庫,然后不計時,只統計下不同比例的資料庫中,被試的傳播行為和傳播偏向。
最后將這三個步驟統一起來,展示的界面能夠查看視頻和圖片,并且可以實時進行關鍵詞聯想,最終整合成為一個在線測試系統呈現給被試,如圖2。
經過與《被試情感傾向量表》、《批判性思維量表》等因變量研究工具結合,本系統已經得到驗證可以平穩進行并準確記錄行為數據。該系統可以通過控制推薦信息的準確率,來將算法推薦水平做出量化操作,可以以此為自變量觀測用戶的行為數據、認知數據和用戶態度的改變等。同時該系統可以對接大多數心理學和用戶體驗量表,使得研究者能夠在實驗室環境測量算法推薦的準確率造成的用戶效果上的影響,從而為解決技術倫理層面爭論多年的“信息繭房”命題提供了一種可用的研究工具。

圖1:程序設計邏輯示意圖

圖2:用戶界面與操作設計