溫 雪
(青島酒店管理職業技術學院 山東 青島 266100)
由于流媒體的興起以及數字媒體的宣傳工作落實不到位,極易導致數字媒體的宣傳出現閉環。在這一過程中,對用戶給予個性化信息的主動推薦,不僅可以幫助用戶發現社會中更有價值的信息,還可以提高數字媒體的關注度[1-2]。本文在已有研究的基礎上,對該系統展開進一步設計,根據系統功能需求選擇合適的處理服務器和個性化的推薦引擎,運用大數據和關聯規則采集用戶日常行為數據,然后根據用戶的行為習慣來實現數字媒體主動且精準的推薦,滿足受眾群體對數字媒體資源的需求,以此解決現有數字媒體推薦不準確的問題,提高推薦資源與用戶需求之間的匹配度。
為確保開發的系統在應用中具有主動推薦數字資源的良好性能,應在設計系統功能前,進行系統硬件結構的規劃[3]。具體設計見圖1。
從圖1可以看出,本次開發的系統主要由智能化處理端、數據源端、個性化推薦引擎、用戶端等部分構成,并且每個終端在系統中發揮的作用是不同的。例如,智能化處理端主要用于處理網絡信息,通過網絡爬蟲技術獲取用戶信息并進行信息積累,當積累到一定程度后,通過對信息的集中整理,掌握用戶瀏覽數字媒體的行為習慣、用戶檢索數字媒體網站的偏好度等核心信息。將處理后的信息通過源端進行傳輸,使用個性化推薦引擎進行深度分析,最終實現為用戶推薦個性化的數字媒體資源。
在規劃好本文推薦系統的硬件結構后,為了確保系統穩定運行,所以選用ST584-89640型號的處理器,該型號處理服務器的性能參數見表1。

表1 ST584-89640型號處理器性能參數對照表
ST584-89640型號處理器不僅空間占用量小,而且運行狀態下噪音低,非常適用于本文設計的推薦系統。ST584-89640型號處理器中的CPU采用G5420雙核四線程3.8 G hz,內部含有4個內存插槽,并且支持DDR4 ECC/8 GB/16 GB,其中DDR4 ECC內存能夠在標準的工作負載下有效降低功耗,提升系統整體能效,實現對更多數字媒體信息的高效存儲[4]。ST584-89640型號處理器支持機械盤和固態硬盤的多種選擇,是一種能夠適用于企業的高容量驅動裝置,同時在該型號處理器上應用RID備份功能,能夠進一步提升本文推薦系統對數字媒體數據讀寫的效率和安全。
為了給不同需求的用戶推薦其合適的信息資源,需要對用戶行為進行分析,并應用合適的推薦引擎進行信息推薦。此次選用SN74CBTLV3245ADGVR芯片作為推薦引擎。SN74CBTLV3245ADGVR芯片的導通電阻為7O hms;傳播延遲為250 ps;工作電源電壓為2.3~3.6 V;安裝風格為SMD/SMT;工作溫度范圍在-25~85 ℃之間;封裝/箱體為TVSOP-20;運行中的電源電流最大值為20 μA;位數為8 bit。將該芯片應用到本文推薦系統當中,用于實現本文系統為不同用戶的數字媒體資源個性化推薦提供分析依據。將該芯片作為個性化推薦引擎能夠進一步提高推薦系統的運行效率,在保證推薦精度的同時,使系統的運行更具時效性。
軟件部分首先進行用戶瀏覽數據的導入,輸入用戶的瀏覽請求,Jena API即可根據持久化功能,將本體瀏覽信息存儲在系統數據庫中,并記錄對應的數據庫訪問接口,便于后期查詢與檢索。Jena API可以有效構建語義網應用程序,在Java框架下可以為RDF等提供良好的編程環境,有利于規則化推理引擎,而API則可以借助應用代碼實現不同機制的轉換。根據用戶數據性質構建不同數據集,如member.txt、tiezi.txt、bankui.txt等,用于集合用戶的瀏覽信息。部分用戶瀏覽數據導入代碼見圖2。
用戶瀏覽數據導入后存儲至數據庫中,數據庫存儲信息不僅包括數據信息,還包括節點、圖像等信息,因此使用Cypher語言對數據庫內的待存儲信息進行模式匹配。Cypher可以以一種標識符號給數據屬性命名,也可同時執行查詢、創建、刪除節點等指令。數據庫內數據類型見表2。

表2 數據庫數據類型
為實現對數字媒體資源的智能化推薦,應在完成對該系統硬件結構的設計后,獲取數字媒體推薦項目分布信息,掌握數字媒體資源在網絡中的分布。并且可以使用大數據技術與關聯規則,進行用戶行為與特征的匹配,建立一個數字媒體資源推薦的訓練樣本,根據樣本在網絡空間中的分布,將其表示為(x,y),對應的樣本表達式:{(x1,y1) ,(x2,y2),L ,(xn,yn)},將現有資源中,與用戶偏好度較為匹配的數字媒體資源表示為(xi,yi),用(xi,yi)∈Rn代表資源歷史推薦內容[5]。
在此基礎上,根據數字媒體資源在網絡中的空間分布,進行資源的語義重構,得到一個針對資源的個性化演化目標函數,函數表達式如下。
公式(1)中:min表示為數字媒體資源的個性化演化目標函數表達式;w′表示為資源語義偏好度;b表示為語義重構與演化過程。
采用對演化信息進行協同過濾的方式,進行數字媒體推薦項目分布信息的關聯,檢測關聯信息的特征,建立一個數字媒體資源在網絡中分布的核函數,函數表達式如下。
公式(2)中:Kmin表示為數字媒體資源在網絡中分布的核函數表達式;β表示為演化分布特征;Kpoly表示為用戶歷史檢索行為特征;Krbf表示為用戶對該資源的下載率[6]。通過提取映射函數中關聯信息,按照關聯度進行資源類目輸出,以此實現對數字媒體推薦項目分布信息的采集。
目前,對用戶行為進行建模的技術已經被應用到了市場的各個領域,所獲取的用戶行為信息越多就對用戶行為模型的勾勒越清晰。考慮到用戶個人信息中存在隱私信息,因此無法構建與用戶100%匹配的行為模型,只能把基礎數據與歷史行為數據庫中的場景數據,作為用戶行為基礎模型的基礎數據,對不同渠道獲取的用戶行為信息進行匯總。這些數據大多為顯性數據,為了對用戶行為模型刻畫得更加精準,因此建立針對用戶行為的隱性數據模型,對數據進行單維度表示,表達式如下。
公式(3)中:Siuation表示為用戶行為隱性數據模型;Sxn表示為隱性行為特性。集成用戶行為數據中的隱性數據與顯性數據,對用戶行為進行畫像,按照此種方式,即可構建用戶數字媒體瀏覽行為模型[7-9]。
對數字媒體資源主動推薦模塊引進LDA技術,并且采用均值聚類的方式,對用戶進行行為特征與資源的匹配。對匹配度較高的數據進行聚類,聯合信息熵值的分布時間序列,進行數字媒體資源的主動推薦[10]。計算推薦資源在空間中的聯合分布概率,函數計算表達式如下。
公式(4)中:E表示為推薦資源在空間中的聯合分cv布概率; 表示為推薦信息模糊度; 表示為資源隸屬度;Arec表示為資源與用戶行為的關聯度。按照上述計算公式,可以掌握用戶偏好資源與其行為的關聯度,根據兩者的關聯度系數,即可實現對媒體資源的主動推薦,當兩者的關聯度較低時,根據資源在網絡中的分布類目,自動進行下一資源的跳轉,以此完成基于用戶行為的數字媒體推薦系統設計。
為保證實驗測試結果的真實性與可靠性,此次所選的測試集合為國內公開研究的Movie-Lens據庫中的基準數據信息。該數據庫中的有效存儲數據集合的網絡資源占比為1.0 M,最早由美國蘇達大學創立,庫內的多個集成性表格中存儲了8 000.0多名數字媒體用戶信息、上萬條數字媒體行業發布的信息與數10萬條用戶評價數據。其中用戶評價數據由一星到五星構成。實驗將數據庫中的數據集合按照數值稀疏度,劃分為5組,每組數據都可以作為此次實驗的測試集合,并將剩余數據隨機分組,作為實驗過程中的測試集合與訓練集合。
實驗前,將本文設計系統安裝在Windows10系統中,系統處理器為英特爾R酷睿TMI9-8500處理器。為避免單次輸入量過大對終端設備運行造成負擔,選擇運行內存為8.0 GB的CPU,系統中對應軟件程序的編譯環境為MATLAB T2020AV9.8.0。實驗中,選擇基于Apriori改進算法的推薦系統作為傳統系統,對同一批用戶,分別使用兩種系統對其進行資源主動推薦。完成對終端用戶數字媒體資源的推薦后,使用平均絕對值差進行不同用戶群體的推薦內容與需求內容匹配度的計算,將絕對值平均誤差表示為MAE,對MAE的計算可用下述公式表示。
公式(5)中:MAE表示為系統推薦內容與用戶需求內容的匹配度;N表示為用戶行為維度;I表示為參與此次實驗的用戶數量;P表示為用戶對推薦數字媒體資源的評價;r表示為數字媒體資源的社會價值度。按照上述公式,計算MAE的具體結果,設定MAE的有效取值在1~10之間,MAE的取值越高,說明系統為用戶推薦的資源與用戶需求匹配度越高,MAE的取值越低,說明系統為用戶推薦的資源與用戶需求匹配度越低。
對系統推薦內容與用戶需求內容進行匹配,將匹配的結果繪制成圖3。
由圖3可知,本文系統為用戶推薦的數字媒體資源與用戶需求的匹配度明顯高于傳統系統。由此可以得出實驗結論:相比傳統系統,本文設計的推薦系統可以為用戶推薦其個人需求的資源,為數字媒體網站保有更多的用戶。
現代化社會中,數字化技術與多媒體技術高速發展,信息資源以碎片化方式呈現在網絡中,越來越多的用戶開始通過互聯網獲取信息。為了給我國數字媒體行業的發展提供進一步的支撐,本文在完成了對系統硬件設備的規劃與部署后,從數字媒體推薦項目分布信息獲取、建立用戶數字媒體瀏覽行為模型、基于LDA技術的數字媒體資源主動推薦3個方面,對基于用戶行為的數字媒體推薦系統的軟件功能進行了優化。并通過對比實驗證明了此次開發的系統在實際應用中具有一定可行性,可以代替傳統的推薦系統在數字媒體行業中的推廣應用。