王嬋娟
摘 要:本文首先介紹了淘寶寶貝標題分詞的意義和常用方法,然后闡述了深度學習的分詞技術,通過深度學習的分詞技術提高寶貝標題分詞的準確性,最后通過對相似的熱銷寶貝的標題分詞對比,進一步提高寶貝標題的搜索有效性。
關鍵詞:深度學習;分詞技術;標題優化
一、深度學習分詞技術介紹
深度學習的概念源于人工神經網絡的研究。人工神經網絡思想來源于大腦機制的探索,即對大腦思維能力的研究和模仿。神經網絡理論與相關技術就是為了實現思維的認識機能而發展出來的,長久以來,它都是這門學科的基本任務。
自2006年以來,Geoffrey Hinton在深度學習上獲得了重大突破,他與他的深度學習理論將人工智能帶入了一個新的時代:認知計算。認知計算的目標不再是尋求顯示問題的最優解或在給定的數據結構上進一步提高搜索性能,而是把算法領域擴展到了探索大腦的深度機制—認知機制方面。
含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。
深度學習是機器學習中一種基于對數據進行表征學習的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人臉識別或面部表情識別)。……