技術宅
現在Al技術在各個領域的應用不斷擴展,當然這其中也出現了一些惡意應用,比如央視2019年3·15晚會上曝光的Al騷擾電話,就是典型的反例。在晚會的視頻展示中,其中一家提供外呼系統的科技公司經理告訴記者,在過去的一年多時間里,他們撥打出去的電話多達40億個(圖1)。

這些騷擾電話的背后,竟然應用了很多新的科技技術,比如用戶號碼的獲取是通過“探針盒子”來完成。當用戶手機的無線局域網處于打開狀態,這個信號被探針盒子發現后,就能迅速識別并采集到戶手機的WLANMAC(無線局域網)地址,接下來將MAC地址轉換為IMEI號,然后再將lM El號轉換成用戶的手機號碼。其中從用戶的WLANMAC到手機號碼識別,就使用了大數據識別技術(圖2)。

在獲取到用戶的號碼后,Al語音識別技術就派上用場了。通過人工對話學習,這些Al騷擾電話溝通仿真能力相當逼真,對話語言流暢自然,讓你根本想不到是在和冰冷的機器人對話。
如上所述,現在Al騷擾電話具有很高的智能性,幾乎讓我們無法識別。那么如何應對這些智能騷擾呢?阿里Al實驗室近日開發的防騷擾電話技術給出了一個解決方案,通過Al來應付騷擾電話。實際上這個技術是一種“智能聊天”概念,是Al語音技術在目前反騷擾領域中的一項應用。智能聊天需要理解用戶的請求,用強大的知識圖譜生成知識點,在對話中將知識點“輸出”給用戶,同時用基于深度強化學習的對話策略引導對方的問題,從而將聊天進行下去(圖3)。

要讓一套語音輸出系統能夠和人類(或者Al騷擾者)對話,科學家們首先需要解決的是讓系統能夠理解用戶的請求,就像我們日常和朋友打電話,在發出語音請求給對方后,要讓對方明白你要表達什么意思。為了能夠讓機器人理解語音對話的含義,—方面阿里Al實驗室提出一個聊天機器人人機協作框架CoChat,通過這個框架,使得人機對話系統能夠從標注過的對話日志、人類工作者的反饋以及用戶的反饋中學習,由此使對話質量獲得持續改進(圖4)。

另一方面,由于人類的語言系統豐富多變,為了讓機器人迅速對人類提出的新問題(原來數據庫所沒有的)作出回應,阿里Al實驗室開發者引入了對話管理器模型MemHRNN。這套系統首先將對話歷史、語言理解結果和API調用結果等外部信息組合起來作為輸入,然后輸出所有動作的概率分布以用于動作選擇。這樣當出現新動作時,該HRNN的架構可以相應地改變,而不會丟失在之前的學習過程中積累的知識,從而讓這套人機系統自主學習很多新知識,能夠實現和人類正常的溝通對話。
比如在實際測試中,這套對話系統和人類推銷員通話時,它不但會主動向女銷售咨詢“北京能不能貸款?”“最多能貸多少錢?”等問題,甚至還在對話中“調戲”對方:“你之前給我打過電話吧,聽起來挺耳熟的?”這些對話就像是真的人在和推銷員對話,對方根本沒有察覺到她實際上是和機器人“二哈”在深入聊天(圖5)。

隨著Al技術的發展,我們遇到的騷擾也將越來越多、越來越智能,類似“二哈”的系統將給我們防止騷擾帶來更多的便利。
一方面,如果將這套系統和手機通話功能整合起來,那么以后只要有類似的騷擾電話,就可以直接交給“二哈”們去打理,省去我們每天被無數騷擾電話打擾。另—方面,“二哈”系統實質上是智能聊天應用,這套系統可以理解我們的對話,因此把它作為人機對話也是一個很好的應用,比如可以用在心理疏導、景點服務介紹、Al導購等領域,讓Al更好地為我們的生活服務。
其實智能聊天并不是什么全新的概念,它的本質是Al語音識別技術。我們在iPhone上使用的Siri語音助理、微軟推出的Al小冰,這些都是語音智能聊天的代表。隨著Al技術的發展,期望更多的語音智能產品為我們服務(圖6)。
