文/陳功文
人工智能中的語義分析是進行自然語言的處理技術,其中包括自然語言、計算語言、認知語言等很多學科。人工智能中的語義分析技術發展迅速,尤其是深度學習技術更是發展迅猛,圍棋對弈、圖像識別、自動駕駛、語音識別等都進行了應用,并得到了突破性進展。語義分析的目標是進行模型和系統的有效建立,做到各個語言單位自動語義分析,進而對文本語義更好的理解。
語義分析基礎技術包括詞語級、句子級和篇章級的語義分析技術。
(1)詞語級語義分析是進行詞匯含義理解,有詞義消歧和詞義表示兩個方面。詞義消歧是結合多義詞在文本環境理解和確定詞語含義。其中有詞典當中詞義和語料中詞義消歧。要進行詞典構建和上下文建模。詞義表示是同義詞網絡中的路徑信息,也是思路數字化。如今機器學習算法的不斷進步和發展,詞義表示方式詞向量或詞嵌入。其思路是利用訓練把語言當中的每個詞進行映射形成固定維數向量,讓這些向量形成詞向量空間,每個向量被看做空間中的點,同時引入距離,利用這個詞間的距離進行詞相似性的判斷。
(2)句子級語義分析,這是結合句中詞的含義、句子句法結構等信息,進行推導句子含義的表述形式。包括淺層語義分析和深層語義分析。淺層語義分析是進行語義角色標注。利用SRL找出句子核心語義角色。如今SRL是根據句法實施結果分析,就是對某個句子得出句法分析結果,再根據這個句法分析結果實現SRL。深層語義分析是把整個句子進行轉化,形成形式化表示,需要知識庫的支持,在知識庫當中,進行實體及關系、屬性進行預先定義。
(3)篇章級語義分析。是給定文本,進行自動識別篇章結構,明確其中的連接詞、論元、篇章關系類別等。篇章結構可分為顯式和隱式兩種關系式,顯式篇章連接詞體現在文本當中,隱式篇章連接詞不在文本中體現,能夠結合上下文的語言環境進行推導。
DINFO-OEC平臺是進行非結構化大數據信息分析,具有挖掘能力,也是企業進行大數據發展戰略的有效工具。大多數大數據是非結構化大數據,其業務對象和對象間關系等存在于文本中,文本內容有很多來源,有各種靈活的表達方式,具有很大歧義性,所以,不能應用BI工具等有效分析,不能對業務實施無法直接服務,體現業務的作用。非結構化大數據是進行大數據處理的重點和難點。DINFOOEC平臺可以和自然語言處理相結合,實施深度學習等進行文本挖掘,多維度業務建模能力,以智能語義感知技術為基礎,給非結構化大數據提供自動化處理和智能理解的能力,進行文本知識業務標簽標記,實施非結構化信息轉換。
DINFO-OEC平臺可以實施與主流Hadoop、Spark等各大數據平臺對接,以分布式存儲和計算能力,挖掘復雜、大量的大數據分析,進行大量數據實時分析計算,發揮以海量歷史數據為基礎的交互式搜索作用。DINFO-OEC平臺可以和常用商業智能系統結合,進行挖掘結構化及非結構化數據的結合分析,實施挖掘大數據分析情況下的業務創新。
業務建模技術是進行業務與語言的不同層次建模,是根據本體論中心,進行合理規劃業務知識,實施業務規則建模配置,建立形式化的業務規則。業務建模技術可以進行分離業務和非結構化數據語言表達,對業務和語言兩層次實施區分建模。業務層次可以實施業務本體構建,發現和配置業務要素;語言層次實施維護和構建語言概念,建設同義詞庫和常用詞庫。
2.3.1 面向非結構化數據建模能力
INDO-OEC業務建模,可以把各種業務規則與多樣的語言表達實施統一建模,要在本體、要素、概念等三個維度實施分析挖掘模型建設,進行分離語言表達和業務描述,讓業務人員對自己擅長的業務要求和業務規則實施建模,而不對自然語言的表達復雜性、歧義性、多樣性等進行表達。
2.3.2 非結構化數據分析挖掘能力
平臺可以進行智慧語義的感知,進行強大自然語言理解的相關算法,其中有內容分類、主題分析、實體識別、推薦引擎、聚類、語義分析、啟發式搜索引擎、摘要引擎等。平臺產品可以實施多種分析挖掘算法,有C計算,其中包括進行抽取概念、挖掘概念表達形式、匹配算法的概念表達式;S計算,這里有經常應用的統計挖掘算法,其中有KNN、SVM、決策樹等各種算法;R計算,提供概念關聯發現算法。
2.3.3 支持多語言分析挖掘能力
系統內置了各種語言分析挖掘算法。以相應的算法流程,支持多種語言,具有很好的語種擴展性好。增加新的語種,不需要進行算法修改。有進行多語種有效復能力。平臺對多語種業務規則可以保持一致。維護業務規則,也就是對系統本體樹的維護,只進行中文簡體版本的維護,不對其他語種本提樹實施維護,進而降低了維護本體樹的工作量。有跨語種的建模能力。平臺可以實施中文簡體版應用,進行其他語種本體樹書寫規則。進行本體樹類別維護和修改,不用對其他語種進行掌握。
2.3.4 實施大數據技術和存儲平臺集成能力
平臺支持主流Hadoop、Map/Reduce批量計算、Spark實時計算、HDFS、Hbase、kafka等進行存取。Hadoop平臺有相應的Apache Hadoop、華 為FusionInsights、IBM BigInsights、EMC Pivotal HD。可是進行架構SOA集群,和Oracle、Mysql、DB2等各種主力數據庫的各種產品進行集成。
人工智能技術在快速發展,讓機器可以進行人的功能實施有效模擬,可以對客戶實施批量個性化、人性化服務,進而對金融行業有重要影響,人工智能是進行銀行客戶溝通、客戶金融需求發現的重要影響因素。它會進行新的金融產品、服務方式和渠道、授信融資、風險管理、投資決策等深入改革和創新。人工智能技術能夠進行客戶,可以進行各類金融交易、支持授信、金融分析決策,還會應用到風險防控、監督上,會對金融現有格局進行大幅度改革,相應的金融服務,包括銀行、理財、保險、投資、借貸、投資等各方面的智能化和個性化發展。證券研報大數據云服務,是對證券業、基金業發等研究人員、分析師實施的大數據云服務。相應的系統具有SaaS服務,能夠全網采集公告、研報,并實施各種事件結構化的分析,進行研報一站式的智能搜索,并挖掘以時間軸、信息錨點為基礎的大數據分析。系統可以對分析師進行幫助,使其大數據角度分析研究,有效提升工作質量和效率。
全國三線以上城市的各級政府每年發布產業政策4萬項以上,其中一線城市每年發布政策2000項以上。對于企業來說,通過智能化匹配政策無疑可以有效地解決信息不對稱、成本效率等問題;對于科技服務機構來說,通過智能化匹配及信息化工具的使用,可以有效地解決向互聯網+專業服務轉型面臨的各種問題;政府部門通過智能匹配可以實現精準扶持、智慧決策。研發政策匹配項目是以云服務為基礎給企業、政府、組織開發的互聯網平臺。這個系統數據采集模塊有自動去重、可配置和過濾垃圾等功能,以智慧語義識別技術應用到系統分析挖掘功能中,確保準確實施語義分析,從而使得政策實施定向更準。此外,系統能夠結合客戶需求實施政策匹配、政策定制等。
客服行業是勞動密集行業,一些大公司需要很高的成本。應用智能機器人客服能夠對重復性、簡單性工作進行有效解決??梢越o企業節省成本和人工費用,有效提高運營效率。神州泰岳應用的小富機器人4.0是智能客服機器人,可以進行全媒體時代智能客服。
(1)是業務場景機器人??头?、營銷、外呼等各種業務具有不同場景,具有不同業務邏輯。小富4.0機器人設置了各種場景模式,實施區分設計相應知識類型及交互方式,提供具有針對性和專業性的智能化服務。
(2)實施整體業務建模,有相應的延展性。以具體場景業務理解為基礎實施整體建模,有完整業務邏輯,增強了機器人可復用性和思維延展性,提高應答效率。
(3)知識類型表達系統具有差異化,實施智能引導各種會話,不是進行反復跳轉預設問題。這種機器人具有知識性,有記憶能力,能夠以業務邏輯為基礎實施自創問答邏輯,進行進行自然。親切的交換。
(4)知識碎片化智能加工,能夠直接得到準確答案,不是得到答案范圍。智能機器人有各種知識加工方式,能夠對結構化、非結構化知識實施碎片化智能建立文檔。可以直接對客戶提問進行回饋。
綜上所述,人工智能中的語義分析技術是現代的先進的大數據技術,是進行自然語言處理的技術,可以在各個行業中有效應用,提供工作質量和效果,實現人工智能新體驗,促進各行業的不斷發展和進步。