胡細玲++付達杰
摘 要:為了確實提高網絡新聞,特別是移動互聯網新聞的推薦過程質量,該研究以移動互聯網新聞特點為研究切入點,開展了的個性化新聞推薦算法的研究。在研究中利用LDA模型與協調過濾模型技術的實踐應用過程,開展了實踐研究工作,為移動互聯網中個性化新聞推薦算法的推進提供有力支持。
關鍵詞:移動互聯網 個性化 新聞推薦 算法
中圖分類號:TP393 文獻識別碼:A 文章編號:1672-3791(2014)08(c)-0021-02
在當前的社會發展過程中,計算機網絡技術的應用對于新聞事業的發展起到了極大的促進作用。特別是在新聞推薦過程中,網絡技術的應用發揮了極大的作用。所以做好網絡平臺中,新聞推薦研究促進新聞事業發展就成為了重要的研究內容。在實際的研究過程中,研究者發現以手機、平板電腦為代表的移動互聯網平臺的出現,對于新聞推薦算法的質量,特別是個性化質量的提升有著重要的促進作用。所以在移動互聯網模式下,做好個性化新聞推薦算法的研究工作,既能保證新聞推薦算法質量提升,同時對于新聞事業中網絡技術應用的開展提供有效的幫助。
1 移動互聯網下的新聞特點分析
在新型的移動互聯網技術模式下,新聞工作整體出現了較為多樣化特點的變化。這種多樣化特點的變化,對于新聞推薦算法有著較為重要的影響。
1.1 主題的標簽化特點
在當前的網絡新聞環境特別是移動互聯網平臺中,新聞搜索工作主要依靠主題搜索的方式完成的。而這種主題的搜索中,標簽化的特點極為明確。這種標簽可以分為人物標簽、事件標簽以及情景標簽等多種形式。人物標簽主要是以人物為特點標簽形式,如前一段時間以諾貝爾獎獲得者屠呦呦為標簽的新聞搜索就較為集中。事件標簽則集中在事件本身主題展開搜索,如北京奧運會、世界杯等新聞就是這類標簽的代表。而情景標簽較為集中在時間、地點、環境等新聞主題的搜索中,如2008北京、2012年倫敦等都屬于情景標簽內容。這種新聞推薦中的標簽化特點,在互聯網發展中得到了較大的體現。
1.2 新聞內容實時播報特點
在互聯網技術模式下,新聞發展出現了實時化播報的特點。這主要是因為移動互聯網平臺可以為新聞服務提供以下支持。一是新聞線索的實時性。在移動互聯網支持下,每個移動互聯網用戶都可以通過無線網絡平臺,將身邊發生的各類新聞線索與內容,通過微博、微信、手機QQ等平臺進行發布。這就使的新聞工作者可以獲得實時性的新聞內容線索,提高了新聞發布的時效性。二是新聞受眾的時效性。在移動網絡支持下,手機、平板電腦等移動網絡用戶可以通過移動網絡,在網絡范圍內第一時間進行新聞的閱讀與評論,提高了新聞閱讀的實施有效性。
1.3 新聞的圍觀性特點
在移動互聯網的新聞平臺中,網絡圍觀性特點是其新聞平臺的主要特點。特別是在網絡新聞熱點話題的討論中,圍觀現象主要表現在以下兩點。一是對于事件的圍觀。在社會心理中,大多數社會人群具有從眾心理,進而對社會討論較多的社會事件等產生圍觀現象。如在2014年的馬航失聯事件成為了社會重點話題,進而引發了大規模的網絡圍觀。二是對于政策的圍觀。在社會生活中,社會群體對于國家政策特別是民生政策新聞的圍觀現象,是網絡圍觀的重要內容。如國家生育政策變化,就是社會網絡圍觀中重要的關注要點。
2 個性化新聞推薦算法研究
對移動互聯網平臺下的新聞工作有了充分了解,對于開展個性化新聞推薦算法的研究有了更加良好的保障作用。在實踐工作中,個性化新聞推薦算法包括了以下模式。
2.1 LDA模型支持下的新聞文檔摘要算法
在移動互聯網絡新聞平臺中,新聞內容一般分為了整體新聞與新聞摘要兩種形式。在手機、平板電腦等新聞平臺中,受到內容儲量、閱讀界面等問題影響,新聞摘要成為了新聞推薦的重要形式。所以做好新聞文檔內容的摘要算法,是個性化新聞推薦算法的重要組成部分。在網絡新聞文檔摘要的實踐過程中,LDA技術支持下的抽取式摘要方式,是較為常用的工作方法。在實際的算法應用過程中LDA技術支持下的文檔摘要算法,主要是通過對LDA模型,對新聞文檔中的內容進行內容通過概率分布與句子概率等基本性的特效,利用模型方式將其重要內容進行分析摘要,最終在新聞文檔中形成文檔的摘要工作。其主要過程包括了以下內容。
首先是LDA模型的建立。在LDA模型技術支持下的文檔摘要算法中,首先需要做好LDA模型的建立工作。LDA模型技術是一項較為常用的摘要模型技術,其主要原理是利用模型方式,對文檔中不考慮詞匯與語法順序,只考慮詞匯出現概率,將詞匯出現概率較高的詞匯與句子進行分析摘要,形成摘要的過程。這一過程中,LDA模型的建立起到了重要的作用。其主要摘要過程包括了兩個方面的程序。一方面其摘要生產的順序為:文檔→主題分布→主題→關鍵詞。這種關鍵詞摘要的產生,成為了摘要產生的主要內容。另一方面,對于摘要完成的關鍵詞,在原文檔中詞分布摘要檢查,提取出文檔中的摘要內容。這種模型的產生,是LDA技術的主要模式。
其次是自動摘要的形成。在完成了文檔LDA模型的后,將文檔放入模型進行分析摘要。其摘要過程中,需要進行句子基本特征、主題概率特征以及關鍵詞抽取三個過程。(1)句子特征分析。在摘要形成中,首先需要對文檔內的句子基本特征開展分析。如對句子長度、位置以及相似度進行綜合分析。其分析結果是開展算法的重要基礎。特別需要注意的是,新聞文檔在實際應用中,其首句及開頭段落具有明顯的提示性特點,在分析中具有明顯的指示性特點。(2)主題概率特征分析與抽取。在完成了句子特征分析后,我們通過模型協助將其中的主題概率進行分析與初步的抽取工作,將其中的主題內容按照概率進行抽取。3、文檔中的關鍵詞抽取。在完成了以上的工作后,對于主題中抽取的主題內容進行關鍵詞的抽取,完成新聞文檔的摘要工作。
在實際工作中研究者發現,這種基于LDA模型支持下的新聞摘要推薦技術,較之傳統的文件摘要技術,其推薦效果較為明顯。特別是在移動互聯網環境下,這種摘要推薦算法的應用具有良好的優勢作用。
2.2 新聞標簽與興趣模型下的協同過濾算法
在移動互聯網模式下,新聞標簽與興趣內容是其新聞平臺的重要特征。在這一情況下,以新聞標簽與興趣為模型,利用協同過濾算法進行新聞推薦工作,是較為先進的新聞推薦算法。這種算法的使用,包括了以下的過程。
首先是興趣模型的形成。在協調過濾算法的應用中,首先需要根據網絡中的新聞標簽,組合成新聞的興趣模型。如將網絡新聞中較為受人們的重視的“2008”、北京等情景標簽,奧運會、比賽等事件標簽,比賽冠軍等人物標簽進行統和,形成一個新聞推薦模型,為協同過濾的開展提供支持。
其次是新聞協調過濾算法過程。在完成了興趣模型后,利用標簽組成的興趣模型進行新聞內容的過濾工作,將興趣內容形成新聞的摘要進行推薦,保證新聞推薦質量的提升。這種利用新聞標簽、興趣模型進行的新聞推薦算法,在實際應用中采用較為普遍。
3 結語
在當前的新聞推薦過程中,以移動互聯網新聞為基礎的個性化新聞推薦算法的研究,是網絡新聞推薦研究中重要內容。在實際的技術研究中,技術人員針對移動網絡新聞的主要特點,開展了推薦算法的研究工作,利用LDA模型與協調過濾模型技術,做好個性化新聞推薦算法研究。
參考文獻
[1] 吳登能.面向移動互聯網的個性化新聞推薦算法研究[D].杭州:杭州師范大學,2013.
[2] 何永春.移動網絡中個性化新聞推薦服務系統的設計和實現[D].北京:北京郵電大學,2006.