張寧
[摘 要] 深度學習在機器學習中占據著非常重要的地位,也是近些年來備受關注的科學研究領域。有學者稱深度學習算法是當前“人工智能皇冠上的明珠”,通過深層神經網絡(DNN)模型的運用,深度學習已成為目前最接近人腦的智能學習方法,不僅Google、百度等國內外搜索和社交公司為之瘋狂,電商巨頭京東、阿里等也已經加入競爭。本文介紹了中國電商對深度學習的理解、應用現狀以及未來的應用趨勢。
[關鍵詞] 深度學習;機器學習;電商;應用
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 01. 083
[中圖分類號] TP181 [文獻標識碼] A [文章編號] 1673 - 0194(2017)01- 0149- 02
1 大數據下的深度學習
深度學習是模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋和處理各種數據,包括文本數據、圖像數據和語音數據等。
人工神經網絡具有良好的學習能力和解決問題的能力,但傳統神經網絡一般只有兩三層的神經網絡,其有限的參數和計算單元,對復雜函數的表示能力有限,學習能力受到制約,特征的開發和篩選也極為耗費人力。目前深度學習推廣的條件已經成熟。一方面,傳統神經網絡在大數據量的學習上性能較差,不符合大數據所需的時效性。另一方面,大數據的演進催生了軟硬件系統的進步,分布式架構的產生,使得算法的性能已經不是瓶頸,并行化框架和訓練加速方法,讓深度學習的前景變得光明。同時,大數據也會讓深度學習的效果越來越好。所以,從某種意義上說,深度學習是大數據的最佳拍檔。
2 電商企業研究深度學習的初衷
客服對電商發展的重要性毋庸置疑。近幾年發展迅速的“雙十一”“雙十二”“周年慶”等電商活動層出不群,大量的客服團隊也很難應付這樣的活動。各家電商開始籌劃成立智能客服團隊,通過一些機器算法模擬人的思維,達到客服和用戶交流的效果。隨著深度學習技術的風靡,加深了電商對智能客服團隊的開發。近兩年,通過神經網絡、知識層次、異構計算等新興領域的研究和應用來確保智能客服團隊技術的領先性,大幅提高了其智能性及其應用的廣泛性。
深度學習技術固然有很大的應用價值,但隨著IBM Watson、百度大腦等平臺的開放,這種能力的獲得并不困難,產品化的好壞才是直接影響客戶服務能力的因素。而各家電商選擇在這個領域投入更多的陣容自主研發,深度學習和數據挖掘技術已經被電商企業視為核心競爭力,各家爭取自己掌握核心技術,讓數據更好地服務于自己。
3 電商企業中深度學習的應用
深度學習的應用現狀。電商企業基于其人工客服和用戶交互產生的上億條數據對智能服務團隊進行訓練,模擬每一個用戶場景。智能服務團隊的應用在“雙十一”等活動期間接待客戶,有效緩解了人工客服的壓力。
從實際效果來說,智能服務團隊在一定程度上能夠讓不解內情的用戶單從對話無法區分對方是智能機器人還是人工客服。不過,電商企業以用戶滿意度提升、用戶體驗的提升、用戶愿意使用、服務占比提高等指標是來衡量其技術的好壞或者應用的效果,在每個課題上,都有識別的準確性、評判分類的準確性的不同標準。在這些標準下,我國電商企業內部對智能服務團隊現階段的服務效果較為滿意。
4 電商企業DNN Lab的研發方向
DNN Lab主要進行如下4個方面的研發。
(1)意圖識別。針對用戶輸入的文本,通過意圖識別之后對應到訂單、售后、商品、閑聊等不同的類別。意圖識別對智能服務團隊非常重要,用戶的每一句問話,智能服務團隊首先要判斷他的意圖,到底說的是訂單問題、商品咨詢還是售后問題,抑或單純的閑聊,才會給出更好的反饋。
(2)命名實體識別。先對用戶輸入的文本進行識別,在對識別后的命名實體進行抽取,對應到人名、地名、商品名、機構名等不同類別,更好地理解用戶的語言。所以,命名實體識別其實也是用戶意圖識別的必須步驟。
(3)自動問答。在明確用戶的意圖之后,通過自動問答系統匹配答案,抽取和排序候選答案,給用戶反饋最佳答案和建議。通過深度學習的算法,可以提高自動問答的準確率。與此同時,京東還開發了一個知識庫,讓智能服務團隊能夠通過深度學習算法識別用戶使用不同的詞語背后的各種情緒,從而提供有針對性的回答。
(4)用戶畫像。通過用戶各個維度的數據,比如性別、能力、身高,歷史瀏覽記錄,購物記錄,是不是有小孩,最近購物傾向是什么,關注什么商品,對用戶做很細的刻度,分成很多維度的畫像,標注土豪還是屌絲,用戶價值維度是高是低還是中等,用戶是什么類別、性質的,是理性保守型還是購物沖動型的,根據這種細粒度的畫像提供個性化的服務。
電商企業對深度學習算法的主要預期,將在產品銷量預測、互聯網金融、智能硬件、商品搜索/推薦/廣告等方面。
主要參考文獻
[1]余凱,賈磊,等.深度學習的昨天、今天和明天 [J].計算機研究與發展,2013,50(9):1799-1804.
[2]孫志軍,薛磊,等.深度學習研究綜述 [J].計算機應用研究,2012,29(8):2806-2810.