當前,我國人工智能技術研究已進入新階段,在自然語言處理、計算機視覺、語音識別、數據挖掘等領域取得了巨大的成功。在此發展背景下,作為新一代人工智能技術之一的跨媒體感知與分析技術應運而生,以提高人類智力活動能力為主要目標,為經濟社會發展的方方面面提供技術引領和支撐。跨媒體感知與分析技術將各類應用場景中產生的大量數據,通過多源、互補、多模態方式記錄網絡世界與物理世界,進行學習、推理、理解和認知。在這一過程中,對各類信息進行精準定位與理解并將其轉化為自然語言來實現語義表達,已成為跨媒體感知與分析技術當下亟需突破的瓶頸之一。自然語言處理技術作為人工智能技術之一,在其較為漫長的發展過程中,不斷融入其他技術,實現自身的成長。近年來,自然語言處理技術結合深度學習,提升處理數據、分析、表達語義的精準度,對分析處理多態信息的準確性也有所提高。因此,基于自然語言處理技術的精準性,跨媒體感知與分析技術也能進一步使人工智能的語義理解與表達更精確。由此可見,基于自然語言處理技術的跨媒體感知與分析技術實施路徑研究,極具現實意義。
自然語言處理技術是指同計算機對感知和獲取到的自然語言各型態信息進行處理,主要運用于機器翻譯、語音合成、語音識別等人工智能功能領域。具體來講,自然語言處理技術能夠使計算機獲取、理解、學習自然語言的特征,再根據指令對語言進行再處理,從而實現人機間的信息交流。


多年來,自然語言處理技術不斷發展,在機器學習、大數據和人工智能等領域的應用越來越廣泛。例如,在機器學習領域,大數據領域、人工智能領域等。而在這些領域智能化發展過程中,需要通過跨媒體感知與分析技術搜集并分析圖片、語音等非文本數據,并通過自然語言處理技術進行處理與解釋,實現各行業的智能化應用與學習。綜上所述,自然語言處理技術作為一項非常重要和前沿的科技發展,可以協助跨媒體感知與分析技術處理數據,為各行業發展賦能。
(一)自然語言處理技術推動跨媒體感知技術精準采集語言信息
在開放式網絡環境下,跨媒體感知技術需在分析研究數據前面對大量低價值的數據。為過濾低價值信息、使信息緊致化,自然語言處理技術可以利用自身精準搜索關鍵數據的能力,短時間內利用以關鍵信息索引找到目標信息,使跨媒體感知技術準確搜集到有效數據。同時,因果推理技術作為自然語言處理技術重要組成部分之一,能夠甄別數據關聯中數據偏差問題,從而減少數據的虛假關聯,促進跨媒體感知技術實現特征提取和表達的無偏性、穩定性和可解釋性。
(二)自然語言處理技術推動跨媒體分析技術解析語言信息
跨媒體感知與分析技術能夠對不同類別的媒體數據進行跨模態分析與理解,從而對多種媒體形態所表達的相同或相似語義進行識別與整合,充分建立不同模態間的語義關聯。自然語言處理技術作為一項處理語義信息的技術,能發揮自身解析語義的能力,助力跨媒體分析技術更好的理解與分析多模態的語言信息。
(三)自然語言處理技術助力多模態統一表達整合語言信息

多模態數據的統一表達是對跨媒體信息進行分析推理的先決條件,能夠融合不同模態的語義信息,更全面分析及利用不同形態的信息理解與表達,優于單個模態信息的方法。這一過程中,自然語言處理技術能夠通過自身語言分析整合能力,剔除多模態信息間的冗余信息,以跨媒體感知與分析技術的跨模態轉化能力來實現多模態信息統一表達,從而獲取更全面的語義特征。
首先,加強智能芯片創新研發力度。跨媒體感知與分析技術能夠促使計算機對外界的感知與信息進行轉化分析,形成對信息的內部整合與統一理解,從而將所理解內容進行統一表征,使各類信息系統能夠實現智能化對答。為實現這一技術在現有計算平臺上的應用,科研人員應以跨媒體感知與分析技術的能力為模型,構造模擬和超越生物感知的智能芯片和系統,進一步推動人工智能實現機器感知。
其次,構建應用跨媒體感知與分析技術的智能引擎。為實現人工智能的高效表達,研究人員可以構建獨特感知機制跨媒體智能引擎,建立從視頻、圖像等復雜數據中快速搜索興趣目標的理論、模型和算法,實現具備自適應、自學習能力的智能感知系統。例如,研究超越人類感知能力的視覺、聽覺感知系統,以及突破真實自然交互環境中的言語感知系統。
最后,推動跨媒體感知與分析技術在各行業的應用。跨媒體感知與分析技術能推進企業智能制造轉型,推動中國制造業核心競爭力發生著前所未有的變化,促進我國智能產業沿著 “共融機器人”的路徑演進。“共融機器人”基于跨媒體感知與分析技術產生,可用于構建能適應不同環境,且能夠更好地理解人行為意圖,在一定的規則下實現人機、機器人群體間的自然交互與協同。隨著智能科技不斷發展并滲透至各行各業,跨媒體感知與分析技術的應用在醫療、教育、智能家居等行業已獲得卓越成果,在未來將逐漸參與更多行業的發展,為我國經濟社會發展提供動力。
作者單位:廣州鐵路職業技術學院 信息工程學院
基金項目:廣東省部級教育部高校學生司供需對接就業育人項目“數字媒體與虛擬現實技術校內就業實習基地”(項目編號:20230106263)。