武斌 李金成 郭毅

【摘 ?要】為響應“互聯網+”戰略思想,同時保證物資采購的公平公正,提升采購的效率,對物資電商化采購進行了持續的創新探索。本文通過基于拉普拉斯等距映射優化算法,對電商平臺商品推薦功能進行重新設計實現,和傳統協同過濾算法相比,提升了推薦效率,尤其在大數據處理方面。
【關鍵詞】大數據處理;電力;電子商務;互聯網+;拉普拉斯等距映射
1.集體企業設計的政策背景
工業互聯網平臺可實現產品、機器、數據、人的全面互聯互通和綜合集成,正成為國家工業新基礎設施。近十年來,公司不斷探索互聯網采購業務創新,推進采購模式創新,進而實現多元化的采購模式。通過國網商城采購專區,對于公開透明程度非常高,且非必須公開招標的物資,突破傳統思維定式,破除固有的“需求計劃預測與集中報送—確定采購品牌和參數—談判評審確定供應商及其產品價格—部署固化商品目錄—采購結果匹配與執行”的流程,把物資采購過程在國網商城物資電商化采購專區上實現,實現“實時商品選購-下單-形成采購訂單-審批-支付”全過程電子化;同時,針對集體企業采購特點,采購專區期望提供授權代理、平臺模式、委托簽約等多種業務運營模式,支持先款后貨、先貨后款、限額采購等付款模式。最終實現多元化采購模式,踐行國網商城物資采購模式多方面創新思想,深化和完善公司物資采購業務,進一步提高公司發展質量、拓寬發展領域。
2.商品推薦模塊的詳細設計
2.1拉普拉斯等距映射的主要思路
隨著數據慢慢變大,我們為了實驗結果的準確性,要采用數據降維來使數據便于計算和可視化,其更深層次的意義在于有效信息的提取綜合及無用信息的刪除。
本實驗中采用的方法是非線性降維中的流性學習LE(拉普拉斯等距映射)算法來進行數據降維。拉普拉斯特征映射(Laplacian Eigenmaps)是一種不常見的降維算法。它從與普通降維算法不同的角度來看問題。它從本地角度構建數據之間的關系。也許這是抽象的。具體而言,拉普拉斯特征映射是基于圖的降維算法。它希望相關的點(圖中連接的點)在尺寸減小的空間中盡可能接近,以便在減小尺寸后保持原始數據結構。
拉普拉斯特征映射通過構造其鄰接矩陣為W的圖來重建數據流形的局部結構特征(參見此處的鄰接矩陣的定義)。主要思想是如果兩個數據實例i和j非常相似,那么在維數減少之后,i和j應該在目標子空間中盡可能接近。設數據實例的數量為n*n,目標子空間的維度,即最終的降維目標,為 m。定義n * m大小的矩陣Y,其中每個行向量yT i是目標m 維子空間(即,簡化數據實例i)中的數據實例i的向量表示。我們的目標是在降維后保持類似的數據樣本i和j盡可能接近目標子空間。
具體步驟為:
第1步:構建圖表
首先將所有的原始數據變成一個圖,例如使用KNN算法將每個點的最近K點連接到頂部,即生產最小生成樹。
2.2算法實際應用
集體企業項目主要圍繞供應商統一管理、尋源管理、合同管理、供應商準備、下單選購、配送發貨、支付結算、發票管理、履約支付這九個部分的需求展開建設實施,以實現集體企業平臺模式、授權代理模式兩種業務模式,一二三級專區依照管理需求部署,具備先款后貨、先貨后款、限額采購多種采購方式的業務需求;其中采購中心請購單2個二級模塊、訂單中心3個二級模塊、付款單2個二級模塊、采購額度1個二級模塊、站內信2個二級模塊、設置3個二級模塊。
本次算法優化主要應用于采購專區的相關商品推薦模塊。原先項目中采用的是傳統協同過濾算法,直接進行商品推薦,采用余弦相似度作為相似度標準進行個體相似性數據化標準。此算法可以較為合理的進行相關推薦,但是在大數據的背景下,數據量越來越大,每條數據的維度也越來越多,整體算法的執行效率也越來越低。在調研了目前的大數據處理技術,最終選用拉普拉斯等距映射作為本次算法優化的技術基礎。
拉普拉斯等距映射本質是將多維坐標系內的點,保持其之間的相對關系,同時將他們映射到一個低維甚至是二維空間,但數據變成低維數據后,算法的執行效率就得到了大幅提升。
在確定了算法的基本思路之后,還要進行算法可行性分析,利用目前比較流行的UserBehavior數據集,將數據集按照4:1分為數據組和測試組,按照算法思路對數據組進行分析,預測測試組結果,對測試結果和實際結果進行卡方檢驗,經測試,卡方值小于0.05,具有統計學意義,也就是說,算法預測結果較為可靠。
3.項目設計優勢與未來展望
3.1項目設計總結
隨著互聯網+概念不斷的深入人心,互聯網也為物資采購提供了公開透明、便捷管理的大環境。物資集中化采購能夠及時、準確地制定集團采購計劃,實現按需采購;同時方便集團進行物資采購價格的有效分析,進一步優化集中采購物資的談判定價工作;還能夠有效對集中采購物資供應商進行科學、及時、準備的評估,最終使集團集中采購的優勢得到有效發揮,達到降低采購成本、提高采購作業整體效率的作用;也實現了集團對下屬單位物資采購的有效跟蹤,建立有效的跟蹤監督機制;為集團領導者進行采購決策提供及時、可靠的信息。集體企業物資采購,在對同類企業進行相關深入調研的基礎上,以體系化、透明化的采購制度和監督要求出發,結合自身特點,優化設計采購流程,用創新的物資采購和管理模式,進行集體企業物資采購管理,真正實現公平、透明、陽光采購。
3.2未來展望
未來的集體企項目還會有很多可以發展的空間,代碼方面的簡潔合理,安全方面如何做到更加可靠,算法方面如何達到更好的執行效率,項目架構如何更好的適應大并發要求等。在保證開發進度的基礎上,也會更加注重這些優化問題。為實現多元化采購模式,加快采購模式創新貢獻自己的力量。
參考文獻:
[1]黃啟宏,劉釗.流形學習中非線性維數約簡方法概述[J].計算機應用研究,2007,24(11):19-25.
[2]劉愛萍.等距特征映射算法的改進及其應用[D].常州大學,2011.
[3]流形學習方法在圖像處理中的應用研究[D].北京交通大學,2009.
[4]Belkin M,Niyogi P.Laplacian Eigenmaps for Dimensionality Reduction and Data Representation[J].Neural Computation,2014,15(6):1373-1396.
(作者單位:國網電子商務有限公司)