閆子琪
摘 要 隨著網絡的不斷普及,人們在網絡中獲取消息的渠道也不斷擴增,這也促進了網絡上各種技術的不斷發展。視頻推薦算法就是這其中的一個,它的主要作用是通過一些數學上的算法,將網友在某社交網站上的喜好行為做出相應的歸納總結,再對該用戶進行相關的視頻推薦。因此,視頻推薦算法是一個以數學理論為基礎,應用于互聯網,服務于全體網友的技術。文章先對視頻推薦算法的發展歷程做簡要介紹,并就微博上的視頻推薦算法進行介紹和相關優缺點的分析。
關鍵詞 視頻推薦算法;微博視頻推薦;用戶喜好;統計分析
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)224-0148-02
當今社會,是一個信息爆炸的時代,獲取信息的方式日益多樣。微博作為當代社會一個巨大的公眾交流平臺,每時每刻都會產生無數的新信息,而它產出消息的精準和快速,也讓微博從眾多社交媒體中脫穎而出,成為人們獲取信息的主要渠道。它具備了從海量信息中瞬間提取出我們喜好的強大功能。比如我們通常在刷微博的過程中會收到一些視頻的推薦,而這些視頻往往和我們的興趣點不謀而合,所以出于好奇心人們就會點開視頻。微博能夠以視頻的形式抓住用戶的眼球,同時引發擁有相同興趣的用戶間的頭腦風暴。這一技術應用的就是視頻推薦算法。本文就是以微博作為例子來闡釋社交網站中的視頻推薦算法。
1 推薦系統的發展歷程
推薦系統,顧名思義,是能給用戶推薦相關信息的系統。主要目的是在現在這個互聯網信息呈指數增長的時代里,解決信息過載的弊端,帶給網友更加優質的網絡體驗,讓人們能輕松了解到自己所感興趣的信息。隨著科技的不斷進步,推薦系統也發展的愈加完善。
1.1 初步研究期(20世紀90年代初期)
我們一般認為,推薦系統的發現與研究,始于1994年明尼蘇達大學,當時GroupLens研究組所推出的GroupLens系統。那是最早將協同過濾算法融入到推薦算法中的系統。應用到了一些數學和統計學上的知識,巧妙地把數學算法和計算機技術聯系到了一起,為視頻推薦算法的開啟和研究奠定了基礎,也使處于起步階段的互聯網技術遠離單調死板。本文后續將會就協同過濾算法展開研究。
1.2 發展期(20世紀90年代末)
推薦算法作為當時新興的一種技術,能與協同過濾算法進行聯系,無疑受到了不少人的關注。緊接著,1995年,就由卡內基梅隆大學的Robert? Armstrong等人開發了全新的系統。該系統能協助互聯網進行信息查找,同時進行個性化推薦。將剛起步的推薦算法進行優化,在原有的基礎上擴大了其功能。同年,麻省理工學院和斯坦福大學也對此技術進行了相關的研究和發現。1997年,隨著研究的不斷推進,美國計算機協會就此發起會議,逐漸把對于推薦系統的研究推向高潮。
1.3 成熟期(21世紀)
21世紀,是互聯網高度普及的時代。隨著科技的不斷發展,推薦系統也得到了相應的完善。就我國的網絡現狀而言,目前推薦系統已遍布各種App,像微博搜索欄下的視頻推薦系統、優酷愛奇藝等視頻播放平臺的興趣推薦系統、淘寶中的“猜你喜歡”等。這些我們常用的軟件,隨著科技的發展,都漸漸地將推薦技術的原理應用其中,說明推薦系統已不再是人們觸不可及的高端科技,漸漸變成了人們網絡生活中一項必不可少的功能。
2 微博中的視頻推薦算法原理
關于微博中的視頻推薦算法,現在最常用的有3種,分別是:基于內容的推薦算法、基于協同過濾的推薦算法和基于社交網絡的推薦算法。這三種算法通過對用戶的發帖內容、轉發點贊和搜索等進行一系列的分析和評估,從而篩選出最符合用戶喜好的視頻并進行推薦。下面就這3種方法進行詳細介紹。
1)基于內容的推薦算法。基于內容的推薦算法是通過搜集用戶的個人喜好,來對用戶的搜索行為和興趣進行建模,然后通過計算用戶喜好和文本內容的相似度來匹配視頻的一種方法。簡單點說就是將用戶微博內提及的內容進行總結,再聯系出現相應關鍵詞的視頻文本,進行用戶的興趣視頻推薦。關于提取用戶文本里的關鍵詞,我們通常用到的算法叫做“TF-IDF”。這種算法能將用戶發布的微博中的“關鍵詞”的“特征權重”進行計算分析,來衡量這個關鍵詞在該用戶喜好行為中的重要程度。“TF”是根據一個特征詞在文本中出現的頻率越高就越重要的原理計算的,而“IDF”則是說明一個特征詞多次出現在不同文本里,這個詞就不具備較強的區分性,就不能代表用戶的喜好。兩者的結合則高度的證明了一個用戶在網絡體驗中的喜好。這種算法在某種程度上能使用戶的興趣和視頻內容出現很大比重的重合。
2)基于協同過濾的推薦算法。協同過濾算法是通過分析該用戶在微博上的喜好,同時在廣大用戶群中篩選出同樣喜好的用戶,并對這些用戶對某一信息的評價進行整合評估,自動形成該用戶對于這個關鍵詞喜好程度的預測。比如說一個用戶喜歡搜索關于娛樂方面的社會熱點新聞,那么微博后臺就會將所有這方面的愛好用戶匯總,評估出這個用戶在所有用戶中對這方面的喜愛程度,得出用戶對此內容喜愛度在廣大網友中的排名,了解你在相應圈子里的位置,并進行相關視頻推薦。
3)基于社交網絡的推薦算法。這一算法,是基于上面兩種算法進行的補充,可以用來解決一個用戶特征不明確的問題。它的原理主要是利用微博上一個用戶和另外用戶的鏈接關系進行相關特征的預測。具體方法是通過分析這個用戶的關注以及粉絲的特征取向,將它們共同的特征進行匯總,反映到這個用戶的特征上。好友圈就是一個能很好應用這種算法的場所。兩個互相關注的用戶一定有著相類似的喜好,因此通過分析好友圈里各個用戶的喜好可以更大程度的反應一個用戶的喜好。如果說兩人近期都搜索過某一綜藝節目,那么微博后臺自然就會推薦相應的節目花絮給此用戶。
3 社交網站中的視頻推薦算法短板及優勢
隨著時代的進步,越來越多的人選擇通過微博來獲取信息。但這一技術目前還沒有發展到一個完善的階段,微博平臺中的視頻推薦仍存在以下幾點問題:
1)對于該視頻搜索量的統計存在疏漏。使用目前微博里面的視頻推薦算法來推薦視頻,在某種程度上對其商業影響力造成影響。由于許多品牌是會對用戶在搜索欄的搜索量進行數據的統計,因此搜索量的好壞可以直接影響到該品牌對于這一視頻內容商業上的重視程度。微博熱搜榜就是這一原理的良好體現。里面總結了當下時段搜索量最高的一些內容。品牌商官方微博的統計形式和熱搜榜實則大同小異。而微博中推薦的視頻是無法算作搜索量的,而搜索量對于一個品牌來說,是非常重要的參考數據。所以在搜索量統計這一方面,微博的視頻推薦技術存在一定的弊端。
2)推薦方式存在局限。微博視頻推薦技術只能針對完整播放和互動率高的視頻進行二次推薦。假如一個用戶看到他不感興趣的視頻,可能就會瀏覽幾秒鐘,那么微博系統就很難再次將這個視頻推薦給其他用戶。因此初始的完播率和互動率對于一個視頻來說尤為重要。
現在的社會,各種各樣的媒體層出不窮,但推送的內容實則大同小異。而新浪微博的這種視頻推送技術,則是根據每個用戶當下的“即時興趣”進行分析在推送的。在海量的信息時代里尊重用戶的差異化愛好,進行精準的個性化推薦。個性化即時推送技術打破了固有的概念和模板,進行了全新的嘗試。這在個性化傳播技術上無疑是一種巨大的飛躍。所以總體來說,微博視頻推薦技術對互聯網的影響,還是利大于弊的。以下是幾個顯著的優點。
1)微博視頻推薦技術能較好的滿足用戶的個性化需求,不再一味的灌輸相同的信息。有些用戶常年在互聯網上看到的信息都是千篇一律的。而微博視頻推送的出現,能讓許多用戶的個性化需求得以滿足,從而逃離固有的“繭房”,享受網絡帶來的樂趣。
2)推薦算法將不斷地與新媒體技術進行融合,并在某種程度上促進同行新媒體技術的創新發展。至今,網絡出現也已經很長一段時間了。隨著人們眼界的不斷開闊和信息的不斷轟炸,固有的傳媒技術已經進入了一個瓶頸期。而微博視頻推薦技術的出現,不僅滿足了用戶需求,還滿足了媒體平臺,給他們帶來了很多流量。因此促進了當代網絡新媒體技術的轉型和升級,促使各個平臺廣泛普及這項視頻推薦技術,從而實現更多的創新。
4 結論
本文對推薦算法的發展進行了簡要概述,并就微博中視頻推薦算法的原理、短板及優勢進行了簡單的研究和介紹。從20世紀90年代開始,推薦算法從無到有,逐漸地被科學家們重視,并且發展為今天這樣能夠為人們所用的技術。這一切都離不開科技和人們思維的發展。發展的同時也暴露了相關的問題,比如網絡時代的個人信息泄露等。但總的來說,時代還是在進步,人們的思想也在進步。到現在,人們還在不斷嘗試著怎么才能讓推薦算法更加便利地為廣大網友所用,帶給人們更加貼心的網絡體驗。
參考文獻
[1]尚松濤,石民勇,尚文倩,等.基于大數據的微視頻推薦算法研究[J].中國傳媒大學學報(自然科學版),2017,24(2):38-45.
[2]劉聰.論媒體個性化推薦模式對“信息繭房”的影響——以新浪新聞“即時推”功能為例[J].新聞研究導刊,2017(23).
[3]李鵬飛.視頻網站中混合模型推薦算法的優化[D].北京:北京交通大學,2014.
[4]李斌.推薦系統研究綜述[J].現代計算機(專業版),2014(3):7-10.