5月21日,中工互聯(lián)(北京)科技集團(tuán)有限公司董事長智振對(duì)《服務(wù)外包》雜志表示,從功能層面看,與GPT 4.0相比,GPT-4o同時(shí)具備了文本、語音、圖像三種模態(tài)的理解能力,在性能表現(xiàn)、多任務(wù)學(xué)習(xí)、人機(jī)交互等方面具備顯著優(yōu)勢(shì),可以處理文本、音頻和圖像任意組合的輸入,并生成對(duì)應(yīng)的任意組合輸出。
在人機(jī)體驗(yàn)方面,GPT-4o能看、能聽、能說會(huì)唱,還能帶著情緒和人聊天,幾乎超越當(dāng)下所有的語音助手,能夠在短時(shí)間內(nèi)響應(yīng)音頻輸入,類似于人類的對(duì)話響應(yīng)時(shí)間。在多語言處理上有顯著改進(jìn),尤其在非英文語言的文本生成方面表現(xiàn)突出。
在商業(yè)模式方面,GPT-4o免費(fèi)的商業(yè)模式體現(xiàn)出OpenAI對(duì)C端用戶的爭(zhēng)取與重視,在與眾多同業(yè)巨頭的競(jìng)爭(zhēng)中,加速用戶群積累,在人工智能應(yīng)用爆發(fā)的市場(chǎng)中具有明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。此外,GPT-4o也存在一些不足和局限性,如模型架構(gòu)創(chuàng)新不足、內(nèi)存及資源消耗瓶頸以及多語言支持等方面。
在智振看來,GPT-4o作為OpenAI的新一代旗艦?zāi)P停m然在多模態(tài)輸入輸出、快速響應(yīng)、語音交互體驗(yàn)、視覺識(shí)別能力以及更自然的人機(jī)交互等方面有顯著優(yōu)勢(shì),作為24年繼“Sora”后OpenAI公司的又一“王炸”級(jí)產(chǎn)品,豐富了人工智能領(lǐng)域的應(yīng)用。
智振認(rèn)為,GPT-4o在多模態(tài)輸入輸出、快速響應(yīng)、語音交互體驗(yàn)、視覺識(shí)別方面的特征和能力十分突出,對(duì)國內(nèi)人工智能應(yīng)用市場(chǎng)帶來了一定的啟發(fā),從一定程度上將影響國內(nèi)人工智能企業(yè)的市場(chǎng)布局和產(chǎn)品研發(fā)方向。GPT-4o的基礎(chǔ)能力值得相關(guān)企業(yè)進(jìn)一步深入研究和學(xué)習(xí),縮短在大模型底層技術(shù)研發(fā)方面與國外先進(jìn)水平的差距。
GPT-4o對(duì)工業(yè)領(lǐng)域影響較為明顯,聚焦到工業(yè)領(lǐng)域,GPT-4o的諸多特長可以得到充分應(yīng)用,如多模態(tài)能力的應(yīng)用,集成視覺、聲音和傳感器數(shù)據(jù),優(yōu)化生產(chǎn)流程,實(shí)現(xiàn)智能監(jiān)控和預(yù)測(cè)性維護(hù),通過分析圖像和視頻數(shù)據(jù),進(jìn)行產(chǎn)品缺陷檢測(cè),提高質(zhì)量控制的準(zhǔn)確性和效率;如人機(jī)交互方面的應(yīng)用,可以作為現(xiàn)場(chǎng)生產(chǎn)人員的智能助手,實(shí)現(xiàn)操作指導(dǎo)、安裝指引、交互式專家問答等,提升對(duì)于生產(chǎn)專業(yè)知識(shí)和經(jīng)驗(yàn)的高效傳遞。
但是,工業(yè)領(lǐng)域區(qū)別于其他行業(yè),對(duì)專業(yè)知識(shí)、準(zhǔn)確性和可靠性方面提出了更高要求,GPT-4o作為通用大模型在工業(yè)領(lǐng)域的應(yīng)用還面臨一些挑戰(zhàn),如工業(yè)專業(yè)知識(shí)的缺乏、細(xì)分專業(yè)任務(wù)預(yù)訓(xùn)練難度大、處理工業(yè)場(chǎng)景復(fù)雜任務(wù)能力缺失以及模型自身的準(zhǔn)確性和可靠性等。
一是工業(yè)領(lǐng)域通常需要非常專業(yè)的知識(shí)和技能,而GPT-4o作為一個(gè)通用模型,可能缺乏對(duì)特定工業(yè)場(chǎng)景深入理解的能力。

二是GPT-4o的訓(xùn)練數(shù)據(jù)可能不足以覆蓋工業(yè)領(lǐng)域的所有專業(yè)場(chǎng)景和特定需求,這可能限制了它在工業(yè)應(yīng)用中的有效性。
三是在實(shí)時(shí)性和準(zhǔn)確性層面,盡管GPT-4o在響應(yīng)速度上有所提升,但在工業(yè)環(huán)境中,對(duì)實(shí)時(shí)性和準(zhǔn)確性的要求極高,GPT-4o可能需要進(jìn)一步優(yōu)化以滿足這些要求。同時(shí),部分工業(yè)應(yīng)用場(chǎng)景下,大模型的應(yīng)用還存在諸多客觀要求和限制,如私有化部署要求、離線化應(yīng)用限制以及投資回報(bào)周期考核等,導(dǎo)致通用大模型很難在工業(yè)場(chǎng)景落地。
智振表示,目前,工業(yè)領(lǐng)域的大模型應(yīng)用已經(jīng)深入展開,中工互聯(lián)主要從三個(gè)方向在推動(dòng)落地嘗試。
一是工業(yè)軟件方面,與大模型融合打造工業(yè)人工智能創(chuàng)新應(yīng)用。工業(yè)軟件是工業(yè)智能化的基礎(chǔ)層,大模型要在工業(yè)領(lǐng)域使用的前提是要與工業(yè)軟件結(jié)合,將大模型能力融合到現(xiàn)有工業(yè)軟件體系中,這是最基礎(chǔ)也是最直接有效的落地途徑。
二是AI大模型技術(shù)的工業(yè)場(chǎng)景應(yīng)用創(chuàng)新。工業(yè)場(chǎng)景復(fù)雜多元,能使用人工智能進(jìn)行優(yōu)化創(chuàng)新的著力點(diǎn)也非常多。大模型作為一種新型技術(shù),其根本內(nèi)涵是具備生產(chǎn)力工具的屬性,結(jié)合原有的工業(yè)互聯(lián)網(wǎng)技術(shù)以及其他新興技術(shù)進(jìn)行場(chǎng)景創(chuàng)新就是接下來一段時(shí)間的重點(diǎn)工作,比如中工互聯(lián)就在嘗試基于大模型技術(shù)的技能預(yù)測(cè)優(yōu)化、基于時(shí)序數(shù)據(jù)大模型的操作優(yōu)化以及仿真、基于大模型技術(shù)的設(shè)計(jì)輔助等等場(chǎng)景創(chuàng)新。
三是大模型賦能產(chǎn)業(yè)發(fā)展。大模型技術(shù)的底層邏輯是對(duì)知識(shí)的存儲(chǔ)和提取,核心形態(tài)是一種知識(shí)引擎。對(duì)于原有的產(chǎn)業(yè)鏈,使用大模型技術(shù)打通產(chǎn)業(yè)上下游的設(shè)計(jì)、生產(chǎn)、物流、運(yùn)維具備極大的市場(chǎng)發(fā)展空間。中工互聯(lián)在這方面也有廣泛的嘗試、在高端裝備制造、軌道交通等領(lǐng)域已經(jīng)開展了深入工作。
在他看來,中工互聯(lián)的落地探索優(yōu)勢(shì)明顯。中工互聯(lián)基于自有的工業(yè)大模型底座開發(fā)出來的標(biāo)準(zhǔn)化產(chǎn)品,新一代知識(shí)引擎——智工知語,解決企業(yè)海量專業(yè)知識(shí)搜索與問答需求,它具備模塊化知識(shí)庫管理與交互能力,能夠高效處理各類問答需求,提供精準(zhǔn)、可溯源的解決方案,具有高度靈活性和可擴(kuò)展性。
智工知語的技術(shù)優(yōu)勢(shì)源于中工互聯(lián)與復(fù)旦自然語言處理實(shí)驗(yàn)室的聯(lián)合研發(fā)成果,提供了國際領(lǐng)先的PDF深度解析技術(shù),使智工知語具備精準(zhǔn)拆分、抽取和推理文本、表格、圖像等關(guān)鍵能力。同時(shí),智工知語采用反向課程強(qiáng)化學(xué)習(xí)技術(shù),確保了知識(shí)解析的精確率和速度。
在部署形態(tài)方面,智工知語可快速集成到第三方業(yè)務(wù)系統(tǒng),所有操作均具備API能力,方便ERP或OA廠商封裝使用。
同時(shí),智工知語支持私有化部署,通過MOE架構(gòu)降低成本,僅需少量顯卡即可部署,保障企業(yè)數(shù)據(jù)安全。另外,智工知語還支持國產(chǎn)芯片,適用于垂直領(lǐng)域的多樣化需求,為企業(yè)提供安全、經(jīng)濟(jì)的文檔管理、知識(shí)問答和數(shù)據(jù)分析解決方案,助力企業(yè)數(shù)字化和智能化升級(jí)。
中工互聯(lián)在項(xiàng)目落地過程中主要從兩個(gè)方面為客戶提供智能化解決方案,聚焦于效率提升和能力提升兩個(gè)關(guān)鍵方面。效率提升是生產(chǎn)力提升的根本,在智工·工業(yè)大模型的加持下,傳統(tǒng)工業(yè)領(lǐng)域由數(shù)據(jù)賦能升級(jí)到AI賦能,工業(yè)大模型可以實(shí)現(xiàn)對(duì)大量信息數(shù)據(jù)的捕捉、分析和處理,再根據(jù)結(jié)果進(jìn)行仿真、模擬、預(yù)測(cè)從而形成優(yōu)化指令,極大地降低人員的參與程度,提高生產(chǎn)管理水平,并減少了人為因素帶來的誤差,大幅度降低生產(chǎn)成本。能力提升可以促進(jìn)企業(yè)形成“飛輪效應(yīng)”,工業(yè)大模型 “預(yù)訓(xùn)練+精調(diào)”范式?jīng)Q定了其自身具備強(qiáng)大的學(xué)習(xí)能力,可以實(shí)現(xiàn)生產(chǎn)知識(shí)與人工經(jīng)驗(yàn)的歸納、沉淀和有序組織,并形成交互式的生產(chǎn)指導(dǎo)模式,使得生產(chǎn)知識(shí)組織效率的高度簡(jiǎn)化與充分泛化,形成有效的知識(shí)傳遞,在面向企業(yè)內(nèi)部形成統(tǒng)一的能力中心。總之,工業(yè)大模型的落地應(yīng)用能夠全面加速推進(jìn)新型工業(yè)化的變革進(jìn)程,推動(dòng)工業(yè)生產(chǎn)的效率提升和能力提升。