朱國進 沈盼宇



摘 要:隨著互聯網技術的快速發展,人類已經習慣于從網絡上獲取知識,然而伴隨著網絡資源爆炸式增長,網絡資源內容多樣,人們使用瀏覽器獲取知識的方法卻停滯不前,因此需要一種工具來幫助人們從網絡中高效的獲取和發現新知識。由于網絡資源文本并不是完全結構化的數據,還包括一些自由文本等復雜的無結構數據,這種文本信息雖然方便人們自由表達概念以及事件等,但是同時也為機器搜索、統計分析等制造了障礙。因此,為了在文本上更方便地進行知識分析和挖掘,本文提出一種基于深度學習的算法知識實體識別與發現的方法,應用于算法知識領域來解決上述問題。通過創建算法知識專家庫[1],訓練詞向量,建立深度神經網絡模型,從算法知識文本中識別和發現算法知識名稱。實驗結果表明,該深度神經網絡模型識別算法知識的準確率高達98%,并有效發現了專家庫以外的新知識點,實現了預期實驗需求。
關鍵詞:知識實體;命名實體識別;深度學習;知識發現
中圖分類號:TP391 文獻標識碼:A