天津工業大學計算機科學與軟件學院 梁 宇
移動互聯網用戶的增加,將給移動互聯網企業帶來更大的利潤空間,隨之而來的是更多的移動互聯網企業的出現,更多移動互聯網信息載體的出現。Internet上的個性化信息推薦已經得到了很好的應用,國內外都有一些應用中的個性化推薦系統,而在移動網絡上進行個性化推薦還處于起步階段,還沒有成熟的產品投入使用。
個性化推薦系統是應用知識發現技術,在與用戶互動的過程中為用戶提供個性化的信息,產品與服務。個性化推薦系統主要融合了用戶建模技術,數據庫中的知識發現,Web挖掘技術等。個性化推薦技術主要分為三類:基于規則的推薦,基于內容分類的推薦和基于協同過濾技術的推薦。
基于規則的推薦主要根據用戶歷史瀏覽記錄,采取一定的方法,分析出信息之間的潛在的關聯關系,根據這種關聯關系建立規則庫,在其他用戶再次訪問某信息條目I時,在規則庫中查找與條目I對應規則,根據這些規則決定向用戶推薦的信息集。于規則的推薦結構簡單,易于應用。主要缺點是:規則的數量隨著數據量的增大急劇增加;規則集的確定依賴于支持度-可信度模型,而支持度、可信度的確定并沒有確定的標準,支持度或可信度的改變對規則集的大小影響較大;對用戶的推薦是根據當前已有的規則,并不能發現新的用戶偏好
基于內容分類的推薦(Content-based Recommendation)是建立在信息內容的基礎上,而不需要依據用戶對信息的評價,主要采用機器學習的方法將信息進行分類。并且根據用戶提供的定制信息類型或者用戶的興趣模型,將同類信息或者與用戶模型最為相似的信息條目推薦給用戶。基于內容的推薦是建立在信息內容的基礎之上的,因此基于內容的推薦技術比較適用于機器容易識別的信息載體,如文本,而不適用與音頻,視頻等信息內容不容易獲取的信息載體。基于內容的推薦系統的另外一個關鍵技術是文本特征的提取,基于內容的推薦技術是根據文本的特征與用戶的興趣模型進行匹配的程度來決定是否向用戶推薦該文本信息。因此文本的特征選擇在基于內容的推薦算法中尤為重要,特征選取的優劣決定了個性化推薦的質量。
協同過濾推薦建立在群體性和多數原則的基礎之上,由于人具有社會屬性,因此個人的行為一定是包含了某類群體行為的表現,在此假設基礎之上協同過濾推薦才會有意義。協同過濾推薦主要分為基于用戶的推薦(Userbased),基于項目的推薦(Item-based),基于模型的推薦(Model-based)三類。當前協同過濾推薦已經廣泛的應用到電子商務網站,某些社會化網絡中。比較成功的應用主要有亞馬遜,當用戶購買某本書籍時系統會向用戶推薦可能喜歡的書籍列表。還有一些如豆瓣,一些視頻音樂網站等也都應用了協同過濾推薦技術,基于協同過濾的個性化推薦也應用到了博客、微博等網絡產品上。
協同過濾技術較基于規則與基于內容的推薦優點:(1)能夠過濾機器難以進行自動內容分析的信息類型,如音樂,視頻等;(2)應用統計學原理,對大量的歷史記錄進行分析,推薦的精確度更高;(3)可以發現用戶興趣的變化,并且獲得用戶的新興趣;(4)利用了用戶的反饋信息,可以即時修正推薦集。但是,協同過濾也不是完美無缺的,比如它存在冷啟動,歷史記錄稀疏性,新項目推薦失效等問題,這需要在具體的推薦算法實現中去解決。
移動網絡較傳統Internet具有更多的特殊性,因此移動網絡上的個性化信息推薦質量不但受到推薦算法本身的影響,也會受到移動網絡資源的影響,本節將介紹影響移動網絡個性化信息推薦質量的關鍵因素。
個性化推薦技術需要一定的歷史信息作為依據來對用戶進行推薦,個性化推薦技術是建立在歷史信息記錄的基礎之上的,或是用戶顯性輸入的信息,或是通過機器學習分析出來的信息。而信息具有時效性和時滯性,信息在一定時間內是有效的信息,一旦超過了一定的期限它就沒有意義,此時就是無效信息。信息本身從信息源產生到需要該信息的宿主都需要一定的時間,因此信息又具有時滯性。因此時間的價值隨時間的流逝而變得越來越小,因此歷史信息在產生用戶推薦集的過程中發揮的作用是不盡相同的,如何使各個歷史階段的信息發揮不同的作用是移動網絡個性化推薦系統要考慮的問題之一。
系統初始化時由于系統積累的用戶信息或者瀏覽記錄信息不足,造成不能產生用戶推薦集,或者推薦集不準確,這個問題被稱為推薦系統的冷啟動問題。冷啟動在大多數軟件系統都存在,由于信息的積累需要一定的時間,因此在系統剛剛發布運行時不能產生正確的結果集。個性化推薦系統是建立在大量事實信息基礎之上的,因此要產生比較滿意的推薦結果需要積累大量的事實信息。因此如何解決推薦系統的冷啟動問題是改進推薦質量的又一關鍵問題。
移動終端的私有性可以保證用戶獲取到有效的用戶信息需求。但是移動終端設備在內存,處理能力方面比較有限,決定了移動終端設備不能處理復雜的人機交互功能,因此移動網絡信息推薦系統不能像傳統的Internet信息推薦系統那樣在客戶端運行監控用戶行為特征的程序。移動終端屏幕大小的限制,以及操控能力的限制決定了移動終端在顯示能力方面的不足,它不可能像PC上以圖文并茂的方式進行信息顯示以及動態的輸入客戶端請求。移動設備的電源以及數據存儲能力方面的限制,決定了移動推薦系統不能不間斷的向終端用戶推薦信息。因此,針對移動終端設備的種種不足,對移動個性化推薦系統的推薦準確性,推薦信息類型,推薦方式以及終端的顯示與信息反饋形式都提出了新的要求。
移動網絡具有移動性,靈活性,使得人們獲取網絡信息不再約束在固定的位置上。移動網絡質量受到自身帶寬,地理位置等因素的限制,傳輸能力不能與傳統的有線網絡相比。因此移動網絡上進行信息傳遞需要考慮更多的問題,比如傳遞信息的格式,信息文件的大小,降低網絡延時等。移動網絡的個性化信息推薦對推薦的準確度,系統響應速度,獲取用戶信息反饋等方面都提出了新的要求。因此一個高效的移動個性化推薦系統應該具有運行簡單,響應速度快,推薦準確及時的特點。當前移動終端的計算能力相對有限,為了提高用戶的使用體驗,移動客戶端程序應該盡量減少計算數據量。
移動互聯網的迅速發展,勢必會使移動互聯網獲取有價值信息變得越困難,移動個性化推薦成為今后解決移動互聯網信息膨脹的主要方式。文章主要論述了與移動網絡中應用個性化信息推薦技術相關的技術,以及影響移動網絡個性化信息推薦的主要因素分析。
[1]劉枚蓮,叢曉琪,楊懷珍.改進鄰居集合的個性化推薦算法[J].計算機工程,2009(11).
[2]張瑞華,周延年,王樅,李蕾.移動終端離線瀏覽系統的新聞推薦研究[J].北京郵電大學學報,2006,12(6).