管昊
摘 要:人工智能算法不斷發展創新,學習層級也不斷增加,在金融、醫療、電商零售、教育、語音識別等眾多領域得到應用。
關鍵詞:智能算法
近年人工智能算法在不斷創新,取得一次次進步,由原來簡單的邏輯回歸算法、線性回歸算法等簡單數理統計算法發展為CNN等復雜的智能算法。隨著算法的不斷復雜化,其應用前景也越來越廣,眾多算法已經在語音識別、金融、醫療等領域應用。
1 算法最新進展
1.1 FSMN改善語音實時交互延時問題
雙向RNN算法作為當前在語音識別系統廣泛應用的主流算法,在語音信息處理工程中面臨一個較大瓶頸:要成功利用未來信息,需要獲得完整語音段,導致在語音實時交互過程中存在較長時延,不能及時滿足語音實時交互需求。
前饋型序列記憶網絡,由輸入層、隱含層、記憶模塊和輸出層構成,較傳統的深度神經網絡算法不同之處在于在隱含層旁新增“記憶模塊”。該“記憶模塊”用于存儲對判斷當前語音有用的歷史信息和未來信息。較傳統的循環反饋的RNN,該記憶模塊通過前饋反饋結構實現記憶功能。它的記憶模塊其優勢在于:
傳統雙向RNN算法對當前語音幀的判斷需待語音輸入結束后才能開始,而它對未來信息的記憶,僅需延遲有限時長即可實現記憶。而該算法在訓練過程會出現指數衰減的梯度消失現象,而這將導致其對信息記憶量十分有限,而它基于前饋時序展開結構的記憶網絡,在訓練過程中梯度沿著記憶模塊與隱含層的連接權重往回傳給各個時刻即可解決簡單RNN的梯度消失問題,達到長時記憶能力;
1.2 DFCNN讓卷積神經網絡“聽得更多”
卷積神經網絡算法當前廣泛用于圖像識別領域,但由于其所用卷積層數較少,導致“表達能力”受限,在其他應用領域運用較小,如語音識別領域。而它作為CNN的特殊形式,通過使用大量卷積層直接對整句語音信號建模,克服傳統算法無法解讀較長語言和表達能力有限的弱點,更好地表達語言的長時相關性。
它對語音識別的處理,首先通過每幀語音進行傅里葉變換,再將時間和頻率作為圖像的兩個維度,然后通過一定數量的卷積層和池化層的組合,對整句語音進行建模,輸出單元直接與最終的識別結果相對,較目前RNN-CTC系統實現了15%的性能提升。
1.3 遷移學習擴寬深度學習算法應用邊界
近年,國內外研究者在訓練深度神經網絡、學習輸入到輸出的精準映射上取得長足進步。但監督學習算法在某一領域或某一特定問題上建立起的模型是基于一定的時長和大量已標記數據的前提下實現的。當在缺乏大量標記數據的情況下,或者遷移到某一新領域情況下,監督學習的算法表現一般,要么無法得出可靠模型,要么需要較長時間和大量已標記數據來建模。
遷移學習目標在于將某一環境中學到的知識用來幫助新環境中的學習任務,即通過將原先學到的知識應用到新的環境里,而在新環境下僅需少量新的標記數據,建立起高效可靠的新模型,從而提升當前深度學習算法的泛化能力。遷移學習的眾多優點,可推動監督學習算法在未來商業得到更為廣泛的應用。
2 算法最新應用
2.1 智能算法在云計算領域應用
谷歌致力于更瘦、更綠的云計算數據平臺。在14年,它通過安裝智能溫度和照明控制以及采用先進的冷卻技術而非機械冷卻器,最小化能量損失,使其數據中心的耗電量比全球數據中心平均水平低50%。對比自身,它現在的數據處理性能是5年前的3.5倍,而能耗保持原有水平。
通過18個月的模型研發與測試,Deep Mind聯合谷歌云的研發團隊成功為數據中心節省了40%的冷卻能耗,其中一個試點已經達到了PUE的最低點,未來該技術可應用于提高發電轉換效率、減少半導體生產的能量和用水量。
2.2 智能算法在電商零售領域應用
目前,國內零售業現約有40余家人工智能創業公司,針對電商領域實現的功能主要有客服、實時定價促銷、搜索、銷售預測等。
客服機器人是京東自主研發的人工智能系統,它通過自然語言處理、深度神經網絡、用戶畫像等技術,能夠完成全天候、無限量的用戶服務,涵蓋售前咨詢、售后服務等電子商務的各個環節。它在部分品類的售前咨詢滿意度甚至超過了人工客服,16年全年節省成本超過億元。它不僅是人工智能的前瞻應用,更是打破了傳統客服固有模式。
2.3 智能算法在教育領域應用
人工智能在教育領域的應用同樣值得關注,AI將改變在線教育的場景,使得在線教育在形式上更貼近不同用戶的個性化需求。
智學網是科大訊飛面向學校日常作業、考試及學習評價需求推出的個性化教育系統化。系統基于科大訊飛全球領先的人工智能核心技術,能夠實現教與學全場景動態數據的采集與分析,深度挖掘數據價值,幫助教育管理者高效決策、教師針對性教育、學生個性化學習,實現家校互聯,幫助家長實時了解孩子的學習情況。
2.4 智能算法在智能呼叫中心服務領域的應用
智能呼叫中心系統完全通過自然交互的形式工作,更人性化也更節約時間,據統計國內智能IVR市場規模達150億。
Salesforce將AI應用于呼叫中心服務。它的呼叫中心解決方案是一款能夠讓企業為每一位客戶提供全天候、更快捷、多渠道支持的企業服務產品。作為CRM巨頭,公司在近期公開了產品的一系列性能,它將通過基于上下文的案例背景和以前的通信服務代理列表響應,來提高工具生產力,幫助呼叫中心平臺用戶更好地為顧客服務。
2.5 智能算法在語音識別領域的應用
語音識別技術將語音中包含的文字信息“提取”出來,相當于給機器安裝上“耳朵”,使其具備“能聽”的功能。目前商用化的智能語音助手包括了谷歌、蘋果、科大訊飛的開放平臺等,各大語音助手呈現出與其背后商業生態體系相對應的特點。endprint
曉譯翻譯機—科大訊飛的第一款同聲翻譯機。它基于深度神經網絡算法上的創新和突破,搭載語音合成與識別引擎、口語翻譯引擎等功能模塊,翻譯機具有易用性、穩定性、安全性等特點。翻譯機不僅通曉英文,還精通我國少數民族的語言,目前,它已在新疆“大展身手”,擁有漢維翻譯的能力。未來,翻譯機還將拓展更多語種的應用場景,包含漢藏、漢蒙、中日等其他小語種。它目前正處于前期試點階段,該項產品還有望應用于外交領域。
2.6 智能算法在金融風控領域的應用
算法交易是指通過電腦程序按照指定規則進行證券交易的方法。這些交易規則通過超越人類速度、頻率及認知范圍獲得超額收益。隨著人工智能技術的進步,算法交易從簡單的技術指標分析方法演變為復雜的綜合體系分析方法。
算法通過用戶畫像、輿情分析和預測等交易模型,以神經網絡算法、聚類算法、增強算法和傳統回歸算法為底層算法,分別實現了機器視覺聽覺、降維分析、自然語言處理和模式識別等人工智能功能。
輿情分析技術是一門利用機器學習和自然語言分析技術對海量互聯網信息進行感情色彩分析的技術。帶有輿情分析功能的AI輔助交易系統往往可以在接收到新聞的瞬間做出較快判斷,為交易贏得寶貴時間。
Capital打造選股機器人Krystal。它是一個可以在海量金融數據流中甄別微小非隨機模式的數學模型。通過8年的研究與開發,它學習了69個月的金融數據,進行了一萬兩千余次模擬交易和一千余次實盤交易,交易結果證明其在實盤運用中的有效性。13年底KFL發布AI基金,截至16年3月總回報為-7.1%,低于納斯達克的22%回報率。目前該基金資產規模為220萬美元。
2.7 智能算法在醫療領域應用
IBM認知智能的核心在于對非結構化數據的理解,即醫囑、圖像等信息。而醫療行業中的非結構化數據包含了絕大多數的信息量。它在醫療方面的應用主要為癌癥的診斷和治療,同時正逐步加強與高校和科研機構的研究發展,大力發展大數據在腫瘤藥物和精準醫療的應用。16年它健康應用還涵蓋了很多其他的領域:糖尿病等慢病、大健康、醫療影像、體外檢測、精準醫療、機器人、疾病研究治療。
參考文獻:
[1]智能投資研究院.深度學習在語音技術的前沿應用[J].
[2]陳秋喜.16年認知計算業Watson分析報告[J].endprint