程俊濤 李健博
摘 要 智能問答系統發展至今經歷了三個階段:基于結構化數據的發展階段,基于自由文本數據的發展階段,基于問題答案對數據的發展階段。而第一個階段又分為人工智能階段和計算機語言學階段。無論是日常生活中的查閱資料,還是在科學研究、商業金融等領域的應用都有智能問答的參與,所以智能問答的發展與管理將是人們不可忽視的研究方向。
關鍵詞 智能問答;自然語言處理;知識庫;金融領域;sector
1 智能問答的發展歷史
智能問答的歷史可以追溯到70年前,計算機科學之父阿蘭·圖靈早在1950年就指出了一種驗證機器是否具有智能的方法——圖靈測試。在此之后的20年里,這項研究沒有取得任何進展。
后來計算機科學家開始用計算機算法描述自然語言的語法規則。但是人類的語言十分復雜,而且人類的語言不一定符合語法,所以科學家不可能描述所有的語法規則。而且自然語言中存在著大量的一詞多義以及常識性問題,計算機無法處理。例如計算機科學家明斯基曾經指出的兩個句子,“The pen is in the box.”和“the box is in the pen.”。因為人們有常識,盒子不可能在鋼筆里面,所以很容易理解第一個pen指的是鋼筆,第二個pen指的是圍欄。然而這會讓計算機很“困惑”。
20世紀70年代后,計算機科學家首次用數學和統計的方法研究自然語言,取得了巨大進步。簡單來說用統計語言模型判斷一個句子是否合理,就是判斷其出現的可能性大小。顯然統計全世界每句話出現的概論是不可能實現的,所以俄國數學家馬爾科夫提出了馬爾科夫假設,后人將其完善稱為N-1階馬爾科夫假設。簡單來說文中某個詞出現的概論只與其前N-1個詞有關,這樣既簡化了實際問題,使計算每個詞出現的概論成為可能,又保證了模型的準確度[1]。
20世紀90年代,隨著計算機運算速度的提升和獲取大量數據的便捷性,又誕生了基于機器學習的自然語言處理,這是一種不依賴于規則設計的數據學習算法,通過數據學習構建分析系統,不依賴明確的構建規則。機器學習事先不給出任何假設,一個預測模型中假設越少,預測效果越好。
2 智能問答系統的成果
如今智能問答系統蓬勃發展,取得了很大的突破,普遍應用于人們的日常生活之中。市場上的智能問答的產品大致分成三類:第一類是以各大電商為首的智能客服機器人,主要用于回答顧客購買商品相關疑問,解決普遍的問題。第二類主要是以完成用戶指令,輔助用戶完成任務為目的的產品,用戶可以命令它們打開應用程序,為自己設置日程提醒,查詢天氣等。第三類是像微軟小冰這樣的產品,微軟賦予它自我學習能力,賦予了人工智能創造的能力。
第一類問答系統并不具有智能,完全依靠大量的人力去維護它,更新它的知識庫才能使用。第二類智能問答系統基于機器學習和人工智能,專注于完成用戶的命令,有一定的學習能力,但是在理解人類語言,與人類友好交互的方面存在不足。第三類智能問答系統的優勢正是有好的交互性,以微軟小冰為例,恰好是與人類聊天,進行情感交流,使對話進行下去而不是盡快結束對話。
3 智能問答在金融領域的應用
在金融領域,投資者往往想最快速度的捕獲信息,并進行信息的提取和分析,而且投資決策往往是非常復雜的,把金融解釋成“速度的游戲”其實也不為過,所以金融領域的智能問答更偏向于投資顧問+智能問答這兩者的結合,這是一種對于企業基礎業務的分析,提取觀點,挖掘知識,從而輔助決策。更加具體地說就是把智能問答作為基礎,在這個基礎上加以框架和數據進行智能分析與解答。所以總的來看在技術層面就包括了兩個部分,第一個是對于知識數據庫的搭建,由于現在互聯網產業發達,信息量大,所以對于有效信息的知識數據庫的構建就顯得尤為重要,搭建知識數據庫,可以在相關材料收集之后的基礎上進行整合。第二個部分就是用戶如何能夠使用智能問答系統,首先就是對問題的解析,然后根據系統的分析給出想要的結果。這種方式不僅可以給用戶節約大量的收集信息的時間,而且還能提供系統分析的數據供用戶參考。
在金融領域,智能問答的發展可以說是相當迅速的,在如今這個大數據時代,大量數據所帶來的也可以是巨大的知識庫,這就為問答技術提供了數據知識基礎,與其說是新的技術,也可以解釋成一種新的產業,所以當今的智能問答,不止于此。
4 結束語
在互聯網產業飛速增長和數據爆發的大背景下,當我們想讓大量數據快速轉換成有用信息的時候,我們往往需要一種智能的模式來滿足我們的需求,而對于乘著互聯網浪潮的智能問答系統,正是用戶所需要的。與其說智能問答是一種技術,不如說是一種模式,給用戶更好的體驗,讓繁雜的數據變成有效的信息,進一步轉化成智慧,正是智能問答所能夠完成的,也是我們所期待的智能系統。
參考文獻
[1] 吳軍.數學之美.第2版[M].北京:人民郵電出版社,2014:207.
作者簡介
程俊濤(1998-),男,河南人;首都經濟貿易大學信息學院16級信管。
李健博(1998-),男,北京人;首都經濟貿易大學信息學院16級信管。