龔惠群,鄭婷玉
(南京信息工程大學管理工程學院,江蘇南京 210044)
ChatGPT(Chat Generative Pre-trained Transformer)是美國人工智能研究實驗室OpenAI 新推出的一種人工智能技術驅動的自然語言處理工具。從誕生之日起,ChatGPT 就引起了轟動和世人關注,Sardana等[1]將其評價為顛覆性創新。首先,它在許多自然語言處理任務中表現出色,例如王麗等[2]認為在優化提問的背景下,ChatGPT 生成的回復更具組織性、解釋性和針對性;汪民安[3]指出ChatGPT 具有能夠無限放大文本的能力等。其次,它能夠像一個真實的對話伙伴一樣與用戶進行交互,因此在各種應用場景中有很高的實用價值,例如在法律領域,王祿生[4]強調ChatGPT 能表現出更加優秀的法言法語的理解,以及法律意圖的識別和邏輯推理等能力;在教育領域,姜華等[5]提出ChatGPT 在助力教師、賦能學生、重塑教育環境等方面潛力巨大。再次,ChatGPT 涉及到技術和領域眾多,宋士杰等[6]和Trachet[7]提出ChatGPT 借助于自然語言理解與推理、深度學習、語言模型、神經網絡等技術,已經對很多產業產生了重要影響。例如,劉明等[8]、戴嶺等[9]認為ChatGPT 能在學、教、管、評等諸多教學場景發揮巨大作用,包括加強閱讀理解能力、賦能高階思維培養、提升寫作與數學解題水平等;萬廣華等[10]指出ChatGPT 能以低廉的價格提供極其豐富的產品和服務,大幅提高生產效率。同時,ChatGPT 還會帶來新的研究方向和思路,激發更多人投入到語言模型的探索中,并研究將其應用到更多產業領域中,例如王茜等[11]指出ChatGPT 可以為生物醫藥領域提供更高效、精確的可編程、可破譯的信息處理,支持生物醫藥知識的發現與調用等;李揚等[12]認為ChatGPT 將會帶來媒體全生產鏈條中傳播主體、用戶、渠道、內容及反饋等方面的變革。鑒于ChatGPT 目前已經在各類現實應用中彰顯出強大的價值效用,將成為經濟與社會領域的關系重構(人機共生)、結構重組(虛實交互)等功能性變革的重要驅動[13],并由于其具有巨大的應用價值和發展潛力,使其已成為學術研究的焦點[14]。因此,本文通過分析ChatGPT 相關領域的技術發展脈絡,以期更全面地了解這一流行新技術和產品,有助于發現這些技術在不同領域的應用場景,能對國內大模型技術及相關產業領域的發展有所啟示。
現有文獻大多從某領域具體應用或綜述角度對ChatGPT 的發展趨勢進行研究,例如劉學博等[15]、張熙等[16]、張偉男等[17]研究以ChatGPT 為代表探索生成式大模型、生成式人工智能、通用人工智能等技術的研究現狀和發展趨勢,主要以技術歸納為主;周洪宇等[18]、劉瑋等[19]、沈立力等[20]、Ray[21]主要探索了ChatGPT 技術在高等教育、政務服務、圖書館、農業等眾多應用領域的發展圖景。目前尚缺乏對ChatGPT從統計學角度的技術發展趨勢研究。研究產業領域技術發展趨勢的常見工具主要有文獻計量方法和專利分析法[22],其中從文獻計量分析資料可發現,發表文獻的機構一般都是高校科研機構[23],企業對ChatGPT 相關領域的研究主要是體現在專利方面,而非論文[24],因此文獻計量研究更多反映出的是高校教育機構對ChatGPT 相關領域的研究情況,對企業、公司等機構的研究情況分析較少,使得研究結論會存在一定的局限性。因此,為更為系統和全面地對ChatGPT 相關領域進行發展趨勢分析,本文運用專利分析法從專利角度對此領域的專利數據進行分析,研究結果對于今后更好地利用ChatGPT 相關技術具有重要意義。此外,分析專利的研究熱點,也將為今后ChatGPT 相關領域的發展提供現實價值,明確我國ChatGPT 相關領域的開發水平及國際地位,清晰看出我國企業在這個領域的研發方向、技術水平、發展趨勢等技術情報,為企業、政府的決策提供有力支持。
本文將通過對ChatGPT 相關領域的專利數量趨勢、專利申請人、合作申請分析、專利地域分布、IPC 分類號、專利地圖、專利引證、創新詞云、熱點演進等角度對ChatGPT 相關領域和產業的發展前景及趨勢進行綜合分析,進而對我國ChatGPT 相關領域和產業的技術布局、技術和應用發展方向、存在的問題等方面提出建議,推動ChatGPT 與各產業的深度融合。
本文將ChatGPT 技術演進納入檢索策略,與之相關的領域主要包括自然語言處理、人機對話、大模型、預訓練語言模型等[25],因此本研究的檢索關鍵詞采用“自然語言理解”“自然語言生成”“大型語言模型”“人機對話”“預訓練”等,以及英文機器翻譯結果“Natural-language understanding”“Natural language generation”“Large language model”“Man machine dialogue”“Pre training”“language model”為檢索詞。以智慧芽專利數據庫為來源數據庫,在標題/摘要中檢索,檢索近10 年的相關專利(2014 年—2023 年),技術主題為計算機科學,然后選取與ChatGPT 相近的12種IPC 分類號。最后,利用檢索式“TAC:(自然語言理解 OR 自然語言生成 OR 大型語言模型 OR 人機對話 OR 預訓練 OR Natural-language understanding OR Natural language generation OR Large language model OR Man machine dialogue OR Pre training OR language model)”對全球ChatGPT 相關領域技術進行專利檢索,通過去重處理后,共檢索到93 284 條數據。
圖1 為2014 年—2023 年中國與全球ChatGPT相關領域專利申請量與增長率。從圖1 中可看出,中國與全球的申請量增長趨勢基本相同,整體增長率高于全球。從專利申請趨勢上可分為2014 年至2017 年、2017 年 至2020 年 和2020 年 至2023 年3個階段,其中在2014 年至2017 年期間,中國與全球的專利申請增長率趨勢皆增長較快,但中國的專利絕對數總量偏低,全球平均年申請量約為中國的5.14 倍。

圖1 2014—2023 年全球與中國ChatGPT 相關領域專利申請量與增長率
其次,從2017 年至2020 年,中國類似于全球趨勢,專利申請總量開始呈現急劇增加,尤其是2018 年還出現“井噴”現象(其中,全球申請增長率保持在20%以上的高增長,中國申請增長率也處于99.7%的歷史最高位)。原因可能源于在這個時期ChatGPT 在2017 年首次被提出,并在2018 年得到廣泛應用和推廣。最后,從2020 年至2023 年,ChatGPT相關領域專利申請增長率呈快速下降趨勢,2022年全球增長率為-50.2%,中國增長率為-39.4%。由于2023 年的數據截止于2023 年6 月,因此未加入比較。分析原因,一方面可能是由于專利申請周期較長,一般來說,實用新型和外觀設計專利從申請到專利授權需要18 個月,而發明專利需要3 年,因此最近3 年的專利數量會呈現下降趨勢。另一方面,2020 年后由于疫情和經濟發展原因,全球專利數量都有所下降。
2.2.1 全球前10 位專利申請人占比
本文通過對2014—2023 年全球ChatGPT 相關領域專利申請人進行統計分析,圖2 為全球前10位專利申請人占比。

圖2 全球ChatGPT 相關領域前10 位專利申請人占比
從圖2 可見排名第1 位的是美國國際商業機器公司(即IBM),其在前10 名專利申請人的專利申請數量中占比28%。此外,從圖2 中可見全球排名前10 機構中有6 家企業皆為美國企業,分別為:國際商業機器公司(排名第1)、谷歌有限責任公司(排名第2)、微軟技術許可有限責任公司(排名第3)、亞馬遜科技公司(排名第6)、蘋果公司(排名第7)、甲骨文國際公司(排名第10),皆為享譽全球的著名大型科技公司。這說明ChatGPT 相關領域一直以來都受到這些大型科技公司的青睞,美國的大型科技企業在ChatGPT 相關領域的專利申請方面處于領先地位。除此之外,這也反映了美國在人工智能研究和創新方面的領先地位。
從圖2 中也可發現,排名第5、第9 的企業皆為中國企業,分別為北京百度網訊科技有限公司(排名第5)和騰訊科技有限公司(排名第9)。這說明我國也在加大對人工智能研究和創新的投入,以形成全球科技競爭的多極格局。這兩家企業在全球專利數量排名中居于領先地位,也反映了中國人工智能產業的迅猛發展。其中,北京百度網訊科技有限公司是ChatGPT 相關領域全球專利數量排名中目前中國最高的企業,是國內自然語言處理領域專利申請量最多的企業,也是國內人工智能專利申請量和授權數量領先的企業,涉及的領域包括搜索引擎、自然語言處理、圖像識別、語音識別等。
2.2.2 中國前10 位專利申請人占比
進行2014—2023 年中國ChatGPT 相關領域申請人的統計分析,圖3 為中國前10 位專利申請人占比。

圖3 中國ChatGPT 相關領域前10 位專利申請人占比
從圖3 中可發現,中國排名前10 的機構除排名第10 位的浙江大學,其余皆為企業。其中排名第1的北京百度網訊科技有限公司和排名第4 的百度在線網絡技術(北京)有限公司都是百度公司的子公司或關聯公司,其在業務上有所區別。百度公司在前10 名專利申請人的專利申請數量中占比35%,遙遙領先排名第2 的騰訊科技有限公司。此外,排名第2 的騰訊公司也在不斷加強在ChatGPT 相關領域的研發和布局,以提高人工智能技術的水平和應用能力。此外,浙江大學在中國ChatGPT 相關領域的專利排名中位列第10,是唯一一個非企業的高校機構。這說明浙江大學在ChatGPT 相關領域的研究和開發具有相當的實力和水平。同時,這也表明了企業和學術界皆對ChatGPT 有重視和關注。
2.3.1 全球專利地域分析
圖4 為全球前10 位專利地域排名。從圖4 可見,截止到2023 年,美國是ChatGPT 相關領域專利數量最多的國家,大約是位居第2 的中國專利數量的1.9倍,而兩者的專利數量都遙遙領先于排名第3 的日本。

圖4 全球ChatGPT 相關領域專利數量的地域分布前10 位
這一現象可以從多個角度解釋。首先,美國在人工智能和自然語言處理等領域的研發和創新一直處于全球領先地位,擁有眾多世界級的大型科技公司和研究機構,如IBM、谷歌、微軟、蘋果等,這為技術研發和專利申請提供了堅實的基礎。其次,美國的創新生態系統鼓勵了大規模的研發投資,以及在人工智能領域擁有廣泛的人才儲備。最后,美國在科技產業的發展和商業化方面也具有明顯的優勢。
從圖4 還可見,中國的專利數量位居全球第二,中國的ChatGPT 研發實力也已經相當強大。中國在人工智能和自然語言處理等領域的研發和創新近年來發展迅速,擁有眾多的研究機構和科技公司,如百度、騰訊、阿里巴巴等。這反映出了政府支持、市場需求增長、企業研發投入、教育培養等多方面的進步。但是,綜合圖2 和圖4 也可以發現我國機構在ChatGPT 相關領域研發存在的問題,就是雖然我國專利總數已經位居全球第2,但是機構申請ChatGPT 相關領域的專利數量排名前10 的機構占比絕大多數仍是美國機構,6 家美國企業占比為75%,而排名前10 中我國的企業僅有2 家,總占比僅為11%,差距仍較大。
2.3.2 中國專利地域分析
國內ChatGPT 相關領域專利的地域排名前10 位見圖5 可。由此圖可以發現不同地區技術創新活躍程度和能力的差異以及持有專利技術的企業機構主要分布在哪些地區。
從圖5 可見專利申請數量排名前3 的是北京市、廣東省、江蘇省,可知北京市在人工智能和自然語言處理領域的創新和研發能力相對較強。
需要強調的是,企業的發展為當地ChatGPT 相關領域的發展提供了重要的支持。例如,深圳的騰訊公司、上海的圖靈機器人、上海的出門問問、江蘇智慧云圖信息科技有限公司、南京紫金山實驗室、南京鯨準數據科技有限公司、杭州云棲數智科技有限公司、浙江省計算技術研究院、杭州曠視科技有限公司等,它們為廣州、江蘇、浙江、上海等地區在ChatGPT 相領域的專利數量增長提供了重要的支持。總的來說,從圖5 可以發現目前我國大致可以分為3 個梯隊,北京市和廣東省位于第一梯隊,江蘇省、浙江省、上海市位于第二梯隊,山東、四川、陜西、湖北和安徽省等位于第三梯隊。
過濾選擇法律狀態為“授權、實質審查、公開”,合作申請分析圖由數據庫自動生成,如圖6 所示。

圖6 全球ChatGPT 相關領域合作申請專利的群體分析
由圖6 可見全球在ChatGPT 相關領域存在有主要的4 個合作機構群體,分別是以IBM 公司為核心的合作網絡、以谷歌公司為核心的合作網絡、以騰訊公司為核心的合作網絡、以三星集團為核心的合作網絡。其中,美國的IBM 公司與外部企業紐昂斯通訊公司有合作,也有與伊利諾伊大學、麻省理工學院、利默里克大學、密歇根大學等的合作,基本在1~2 個之間。美國的谷歌公司沒有與高校機構的合作,有少量與企業的合作,如盧克數據科學公司、Trimble(天寶)公司。中國的騰訊公司的合作對象主要是大學、研究所,合作專利數量基本在1~4個之間。韓國的三星集團除了和自己的子公司合作以外,還有少量與科學院、高校的合作,合作專利數量基本在2~3 個之間。但是,從圖6 還可見我國專利數量最多的百度公司在ChatGPT 相關領域沒有和其他機構合作的現象,其原因可能有以下幾個方面:(1)技術保密;(2)競爭壓力;(3)獨立研發更能體現公司戰略需求;(4)合作難度大等。這種機構獨立研發的現象,在亞馬遜、微軟、元平臺公司中也存在,它們的領域專利都較多,但是也都沒有存在與外界的合作研發。綜上所述,從圖6可看出不同機構在合作研發方面采取著不同的策略,具有不同的文化和合作意識。
本文采用智慧芽專利數據庫自帶的專利地圖生成工具,對智慧教育領域人工智能專利進行分析得到全球有效發明專利技術的專利地圖如圖7 所示。其中,亮白色表示專利文獻最密集的部分,即涉及該技術主題的專利申請量最多,是研發中的熱點技術;而黑色則表示專利文獻相對較少或密集程度較低的區域。此外,專利地圖中的距離遠近可以顯示不同主題間的相關程度。

圖7 全球ChatGPT 相關領域的專利地圖
從圖7 可知,可將全球ChatGPT 相關領域專利的重點領域分為12 個,這些領域基本涵蓋了領域的所有重點內容,技術體系較為完善。“眼睛、虛擬現實、增強現實、觸覺、頭戴式”等7 個領域專利申請數量較多,專利分布多而密,是技術比較成熟的研究熱點,技術資源較豐富,其設計技術范圍也較廣,反映ChatGPT 相關領域行業專利實際應用與轉化的方向。此外,“區塊鏈、容器、內容管理系統、擴展性、同步”“攝像機、眼睛、增強現實、圖像捕獲設備、頭戴式”這2 個領域也占有一定的比例。最后,還有少部分有效專利分布于“語音交互、語音數據、智能機器人、語義識別、語音信息”等3個領域也是ChatGPT相關領域專利布局的一個方向,目前專利技術的研究比較少,可能是技術盲點或者未來的潛在機會領域,屬于待開拓的區域。
除此之外,本研究還分別利用智慧芽系統生成中國和美國在ChatGPT 相關領域的專利地圖,這是全球在ChatGPT相關領域專利最為突出的兩個國家,分析結果分別如圖8、圖9 所示。從圖8 和圖9 的中國和美國專利地圖可以看出,兩個國家在不同的ChatGPT 相關領域專利方面都有各自領先的領域。

圖8 中國ChatGPT 相關領域技術的專利地圖

圖9 美國ChatGPT 相關領域技術的專利地圖
從圖8 可見,中國與全球在ChatGPT 相關領域的專利技術上相似,技術體系較為豐富,主要涵蓋了人臉識別、醫學、語義文本分析和交通等多方面領域應用,硬件方面的專利技術偏少。在“語音交互、語音數據、語音控制、喚醒詞、智能機器人”等5個領域的專利排名也在世界前列,技術成熟,這5個領域都是我國ChatGPT 相關領域專利實際應用的方向與轉化的現狀。此外,還有一些偏文本應用的專利領域,如“文本分類、中文分詞、雙語、短文本、圖像描述”等,同時這些領域相對來說專利較少,可能是技術盲點或者未來的潛在機會領域。
從圖9 的美國專利地圖可以看出,而美國與全球在ChatGPT 相關領域的專利技術上更為相似,技術體系較為完善,基本涵蓋了領域的硬件開發和軟件應用等多方面。在“虛擬對象、頭戴式、眼睛跟蹤、穿戴設備、手勢控制”等4 個領域分布的專利最多,專利布局具有優勢,技術資源豐富。除此之外,在“強化學習、卷積、迭代、梯度、神經元”等4 個領域的專利排名也在世界前列,技術成熟,這8 個領域都是美國ChatGPT 相關領域專利實際應用的方向與轉化的現狀。此外,還有較多的專利領域,如“攝像機、頭戴式、穿戴設備、視頻內容、成像”等領域相對來說專利較少,可能是技術盲點或者未來的潛在機會領域。
對比分析圖7、圖8 和圖9 之后可以發現,我國在ChatGPT 相關領域的研究相對偏軟件應用,專利技術主要集中于人臉識別、交通、網頁內容查詢和分析等方面,但是在智能設備、ChatGPT 領域理論深度學習等方面相比于國際、美國的專利布局和研發實力還有很大的欠缺。我國在ChatGPT 相關領域專利分布上更偏重于應用范圍,但是在研究深度上可以看出不夠深入,這也反映出中國ChatGPT 相關領域專利技術的劣勢。而美國在ChatGPT 相關領域一直積極投資和研發,尤其在硬件和理論方面有相當的專利數量和質量。他們注重于底層理論和技術的創新,并努力推動ChatGPT 相關技術與人工智能設備的結合。
通過對全球專利的引證情況進行排名和分析,可以識別出哪些專利技術具有重要影響力,已被廣泛借鑒,以及了解該技術領域的核心創新技術。
2.6.1 全球高被引專利技術排名
過濾選擇法律狀態為“授權、實質審查、公開”,可以發現全球ChatGPT 相關領域排名前十的高被引專利皆為美國專利,可見雖然中國在ChatGPT 相關領域的專利數量已經位居全球第2 位,但是其專利的質量和創新性還有待提高。全球高被引專利排名第1 的是南坦智財控股有限責任公司的專利“Healthcare transaction validation via blockchain proofof-work,systems and methods”,這個專利主要涉及醫療保健交易驗證系統和方法,被引用量是810 次,說明這項技術在該領域具有重要的影響力和價值。這可能源于其在醫療保健行業中解決了一些重要的問題,如交易的安全性、隱私保護、數據管理等方面的挑戰。
此外,還可發現全球高被引專利中前10 位中有5 個都與裝置、設備有關,如排名第2 位的專利“Methods and apparatus to change a feature set on data collection devices”、排名第4 位的專利“System and method for generating and updating location check digits”、排名第5 位的專利“Extramissive spatial imaging digital eye glass apparatuses,methods and systems for virtual or augmediated vision,manipulation,creation,or interaction with objects,materials,or other entities”、排名第6 位的專利“Device arbitration for listening devices”、排名第9 位的專利“Hand held bar code readers or mobile computers with cloud”。涉及到多種設備和裝置,如數據收集設備、位置生成檢查數據的裝置、增強現實的感測和顯示設備、收聽喚醒短語和語音命令的電子設備、數據解碼系統等等。可見目前國際上在ChatGPT 相關領域的研究對智能設備和裝置的關注度很高。這可能反映了在這一領域中,設備的創新和技術集成對于推動人機交互和ChatGPT 應用的發展至關重要。此外,不同的設備集成可以適用于不同的行業和應用場景,一些專利可能專注于特定領域,如醫療、教育、娛樂等,以實現更專業化的效果。
2.6.2 全球高被引專利IPC 技術分布
接下來對全球ChatGPT 相關領域高被引專利的前10 名專利進行IPC 分類分析,具體見圖10 所示。其 中G06F、G06Q、G06K、G06N、A61B、G06T、G07C、G10L、H04L 均為IPC 技術分類號。

圖10 ChatGPT 相關領域全球高被引專利前10 位的IPC 分類
由圖10 可見,其中G06F(電數字數據處理)出現在7 個專利中,占35%,G06Q(專門適用于行政、商業、金融、管理或監督目的的信息和通信技術)出現在4 個專利中,占20%,說明這些領域受關注度高,而且受關注領域也非常集中。這些專利主要涉及到自動分析、語義分析、語法分析、信息檢索、聚類、分類、自然語言、查詢、查詢公式、數據庫結構等方面。此外,全球高被引專利技術排名前10的專利中有7 個專利皆涉及到G06F,這在一定程度上可說明G06F 和G06Q 這2 個主題為全球ChatGPT相關領域專利技術研發的主要趨勢和核心,也是領域的研究熱點,在ChatGPT 相關領域專利技術也大多以引用這些專利技術為基礎來進行研究和發展。
2.6.3 中國高被引專利技術排名
過濾選擇法律狀態為“授權、實質審查、公開”,可發現中國高被引專利中排名第1 的是百度在線網絡技術(北京)有限公司的專利“基于人工智能的人機交互方法和系統”,被引用量是437,說明該專利的技術和創新具有重要性,這表明人機交互在人工智能領域中具有重要地位,同時也表明百度公司在ChatGPT 相關領域具有重要影響力。根據該專利的高被引次數,可以推測其他企業可能比較關注以下方面:(1)人工智能技術;(2)人機交互;(3)語音識別與合成技術;(4)情感分析與情感識別;(5)自然語言處理與對話生成;(6)多模態交互:人機交互不僅僅局限于文字和語音,還可以涵蓋圖像、視頻和其他形式的交互。因此,企業可能會探索多模態交互技術,以提供更多樣化、豐富的交互方式。
此外,還可發現中國高被引專利中前10 位全部都是提出了某種方法,涉及到系統的有4 個,涉及到裝置和設備的有1 個。中國在ChatGPT 相關領域的高被引專利前10 名中10 個專利全都是與某種方法有關,而前10 名中只有一個涉及到設備裝置,這可能反映了在中國目前方法和算法的創新在推動ChatGPT 技術的發展和應用方面占據主導地位。一般在初期階段,研究人員和企業可能更關注在核心技術方面進行創新,以實現更智能、更自然的對話交流。因此,中國的高被引專利主要涉及到方法和算法的創新。在推動方法和算法的發展之后,可能會逐漸涉及到如何將ChatGPT 技術與具體設備相結合,以實現更全面、更智能化的人機交互體驗,這可能是一個后續的發展方向。
2.6.4 中國高被引專利IPC 技術分布
接下來對中國ChatGPT 相關領域高被引專利的前10 名專利進行IPC 分類分析,可以指導中國的高被引專利的技術主題主要集中在哪些領域,具體見圖11 所示。

圖11 ChatGPT 相關領域中國高被引專利前10 位的IPC 分類分布
由圖11 可見,中國高被引專利前10 名的IPC分類主要涉及到的IPC 技術僅4 種,非常集中。這些專利主要涉及到圖像處理、計算機科學和人工智能領域。這意味著在這些領域里中國在高被引專利方面表現得相當出色,有著豐富的人才和技術資源,同時也反映出中國在這些技術領域取得了顯著的研究成果和創新。此外,另一方面也反映出中國在這個領域的研究范圍相對較窄。其中G06K 作為主分類號,出現在6 個專利中,占40%,G06F 作為主分類號出現在4 個專利中,占27%,說明這些領域受關注度高,而且受關注領域也非常集中。這些專利主要涉及到車型識別方法、端到端的車輛檢測和識別的框架、汽車駕駛場景目標檢測方法、人臉檢索方法、人臉識別方法、裝置、系統及設備等方面,主要集中在汽車自動駕駛、人臉識別等領域,可以說是中國ChatGPT 相關領域專利技術發展的基礎,也可看出中國ChatGPT 相關的重點研究領域。
通過應用領域分析可以知道這個領域的技術開發方向,從而幫助指導目標市場的確定。對全球ChatGPT相關領域專利檢索數據進行應用領域分析,如圖12 所示。

圖12 全球ChatGPT 相關專利的應用領域分布
從圖12 中可發現,全球ChatGPT 相關研究的應用領域分布最多的是特殊數據處理應用領域,共有37 841 件專利,占比為17%,以及字符和模式識別領域,共有36 864 件專利,占比也接近17%。可見這兩個領域是全球ChatGPT 相關研究的重點關注領域。此外,生物學模型、數字數據信息檢索這兩個領域的專利占比也較高,皆為13%。除此之外,圖像分析、圖像增強、機器學習、自然語言數據處理、數據處理的輸入/輸出過程、基于知識的模式的計算機系統等也都是研究常見的應用領域。從圖12 中的數據可以發現,全球ChatGPT 相關研究的專利應用領域分布最多的是特殊數據處理應用領域和字符和模式識別領域,而不是自然語言數據處理領域。
圖13 對全球引用前10 的專利應用領域分布進行分析,以發現最受專業研究人員關注的應用領域。

圖13 全球ChatGPT 相關研究引用前10 位專利的應用領域分布
從圖13 中可見特殊數據處理應用、數字數據信息檢索、商業這3 個領域是全球ChatGPT 相關研究引用前10 的重點關注領域。與圖12 相比,數字數據信息檢索的受關注程度在研究人員中較高,而且研發人員更為關注如何將這些專利進行商用,獲得實際效益。
由圖13 的數據和結論,可以說明ChatGPT 在以下方面有著重要的應用前景:(1)特殊數據處理應用:如語音識別、自然語言理解、圖像識別等。這種跨領域的特性使得ChatGPT 在特殊數據處理方面的應用越來越受到關注。(2)數字數據信息檢索:用于實現智能問答系統和信息檢索系統,能夠根據用戶的問題或需求,快速準確地提供相關信息。這種能力在數字數據信息檢索領域具有重要的應用價值。(3)商業:應用于商業領域的多種場景,例如客戶服務中心、智能客服、廣告投放等。其能夠通過自然語言交互和個性化推薦等技術,提高客戶服務水平和營銷效果。這3 個領域都是當前人工智能研究和應用的最受關注方向,ChatGPT 在這些領域的應用前景廣闊,也預示著其在未來的發展潛力。
圖14 對中國引用前10 專利應用領域分布進行分析,以發現最受中國專業研究人員關注的應用領域。

圖14 中國ChatGPT 相關研究引用前10 位專利的應用領域分布
從圖14 中可見字符和模式識別、特殊數據處理應用、生物學模型這3 個領域是中國ChatGPT 相關研究引用前10 的重點關注領域。與圖12 相比,在中國研究人員中字符和模式識別的受關注程度比特殊數據處理應用更高,而且研發人員更為關注生物學模型領域的應用。
由圖14 的數據和結論,可以說明在中國ChatGPT 有著以下方面重要的應用前景和研究價值:(1)可以通過分析和識別字符和模式,幫助人們更好地理解和利用這些信息,有助于文本分析和自然語言處理任務。例如,在社交媒體分析中,ChatGPT可以識別用戶情感和言論趨勢,為企業和政府提供有關公眾看法的重要洞察。(2)可以根據不同行業的需求,進行個性化的數據處理,從金融分析到醫療診斷,都有可能受益于它的應用。這種靈活性為ChatGPT 在不同領域的應用打開了新的可能性。(3)可以用于構建生物學模型,模擬生物系統的行為,分析遺傳數據等,幫助科學家理解生命的奧秘。例如,它可以分析基因組數據,預測蛋白質結構,甚至輔助藥物研發,為醫學科研提供有力支持。
2.8.1 全球專利創新詞云分析
通過創新詞云可以了解ChatGPT 相關領域內最熱門的技術主題詞,幫助分析ChatGPT 相關領域內最新的重點研發主題。通過提取最近5 000 條專利中最常見的關鍵詞,得到的創新詞云如下圖15 所示。其中,不同的顏色深淺和大小表示不同級別的相對重要性,字體越大越顯眼,則表示對應詞匯被提及的頻率越高。

圖15 ChatGPT 相關領域創新詞云
首先,預訓練、人工智能、神經網絡、深度學習等關鍵詞的頻次表明了ChatGPT 在現代技術和科學中扮演的關鍵角色。這些技術驅動了ChatGPT 的能力,使其能夠理解和生成自然語言。深度學習和神經網絡的應用使得ChatGPT 能夠從大量數據中學習規律,進而提供高質量的輸出。其次,與自然語言處理相關的詞匯,如語言模型、上下文、訓練方法等,突顯了ChatGPT 在處理文本和語言數據方面的優勢,能夠理解和生成各種類型的文本信息。最后,在應用方面的關鍵詞,如機器翻譯、醫學圖像、情感分析等,暗示了ChatGPT 在實際場景中的多樣應用。它不僅可以用于文本生成,還可以在醫學、情感分析等領域提供支持。可見,ChatGPT 的多功能性和潛在應用范圍之廣,能在各種領域的應用中都發揮積極作用。
2.8.2 全球專利熱點演進分析
記錄2019 年至2023 年最近5 年的全球ChatGPT相關領域專利數據的研究熱點,得出熱點演進的規律。具體情況如下表1 所示,其中熱點熱度順序為從左至右。

表1 2019—2023 年全球ChatGPT 相關領域研究熱點演進分析
由表1 可知從2019 到2023 年全球ChatGPT 相關領域的熱點研究在不斷演進變化。首先,神經網絡在這幾年中一直保持著高度的關注,表明其在ChatGPT 相關領域中的核心地位。這種持續的熱度可能反映了神經網絡在處理自然語言、圖像和其他數據類型時的有效性和靈活性。其次,數據集在各年中都占據了重要位置。這反映了數據在訓練和評估機器學習模型時的至關重要性。隨著時間推移,研究者和開發人員可能越來越意識到數據質量、多樣性和規模對于構建強大的ChatGPT 模型的影響。再次,深度學習的持續熱度也是一個顯著現象,其在自然語言處理、圖像處理等領域都有廣泛應用。另一個值得注意的現象是,自然語言和語音的關注度逐漸增加。這可能反映了ChatGPT 越來越多地應用于語言理解和生成任務,以及語音識別和處理領域。此外,網絡模型和訓練方法的熱度也在逐漸上升。這可能意味著研究者們正在不斷優化模型和算法,探索更高效的模型結構和訓練策略,以提高ChatGPT 的性能和效率。最后,問答系統和特征提取在近年來逐漸受到關注。這可能反映了ChatGPT在與用戶進行交互和回答問題方面的應用正在日益受到更多關注,以及在從大規模數據中提取關鍵特征以支持模型訓練方面的重要性在提升。
(1)美國在ChatGPT 相關領域人工智能研究和創新方面居于領先地位,同時我國也在加大對人工智能研究和創新的投入,形成全球科技競爭的多極格局。其中,美國在ChatGPT 相關領域的專利技術體系較為完善,如“攝像機、頭戴式、穿戴設備、視頻內容、成像”“自動駕駛、車道、攝像機、道路、物體檢測”“手勢輸入、話語、語音輸入、虛擬助手、言語”“非語言、智能插頭、音頻輸入、智能助理、活躍度”等可能是未來的潛在機會領域。中國在ChatGPT 相關領域的專利主要涵蓋了人臉識別、醫學、語義文本分析和交通等應用,但是硬件方面的專利技術偏少,“文本分類、中文分詞、雙語、短文本、圖像描述”“語義表示、話術、語法、法律、訓練文本”“微博、篇章、中文分詞、短文本、文本分類”等可能是技術盲點。
(2)我國在ChatGPT 相關領域的研究實力大致可以分為3 個梯隊,北京市和廣東省位于第一梯隊,江蘇省、浙江省、上海市位于第二梯隊,其中北京市的領域技術創新能力和活躍程度最高。在當前初期階段,方法和算法創新在推動中國ChatGPT 技術的發展和應用方面占據主導地位。
(3)在ChatGPT 相關領域全球主要存在4 個合作機構群體,分別是以IBM 公司、谷歌公司、騰訊公司和三星集團為核心的合作網絡。
(4)目前國際上在ChatGPT 相關領域的研究對智能設備和裝置的關注度很高,其中“語音交互、語音數據、智能機器人、語義識別、語音信息”“虛擬助理、用戶簡檔、帖子、虛擬助手、知識圖”“識別方法、目標檢測、深度網絡、高分辨、高分辨率”這3 個領域可能是未來的潛在機會領域。神經網絡處于ChatGPT 相關領域中的核心地位,數據集的選擇和準備、深度學習的持續熱度也是一個顯著現象。特殊數據處理應用、數字數據信息檢索、商業這3個領域是全球重點關注領域,G06F 和G06Q 這2 個主題為全球ChatGPT 相關領域專利技術研發的主要趨勢和核心。
(5)G06K、G06F、G06N、G06T 這4 個主題是中國ChatGPT相關領域專利技術研發的研究熱點,字符和模式識別、特殊數據處理應用、生物學模型這3 個領域是中國的重點關注領域。
(6)ChatGPT 相關領域內最熱門的技術主題詞包括:預訓練、人工智能、神經網絡、深度學習、電子設備、計算機、自然語言處理、機器學習等。此外,應用主題詞包括:機器翻譯、醫學圖像、情感分析、自然語言理解、閱讀理解、缺陷檢測、分類器、語音識別、圖像處理、計算機視覺、人機對話等。
(1)盡管我國在人臉識別、交通、網頁內容查詢和分析等應用領域有一定的專利技術積累,但在ChatGPT 領域的理論深度和智能設備方面的創新上還存在不足。因此,建議增加對人工智能和深度學習基礎研究的投入,鼓勵學術界和企業界合作,共同推進相關領域的技術進步。
(2)我國在ChatGPT 領域的研究主要偏重于軟件應用,但在硬件方面的創新相對較少。為了全面提升技術實力,需要注重硬件與軟件的協同發展,鼓勵在芯片、傳感器等硬件方面的創新研究,以提升整體技術水平。
(3)盡管我國在某些應用領域已有一定的專利技術積累,但可以考慮進一步拓展應用領域,如智能制造、智能家居、智慧醫療等,以推動ChatGPT技術在更多領域的應用和發展。針對不同行業和應用場景,開發定制化的ChatGPT 解決方案,如智能客服、廣告投放、創意作品生成、自動翻譯、編程輔助等。
(4)面對國際ChatGPT 領域的專利布局和研發實力,我國可以通過加強國際合作,共享技術資源,共同推進技術進步。同時,應積極培育豐富的創業生態系統以及風險投資網絡,為技術創新提供了強大的資金支持,并加速技術的商業化進程,同時提升人才儲備,吸引全球各地的科學家、工程師和研究人員聚集,為創新提供強大的動力。
(5)基于ChatGPT 相關技術盲點和未來潛在機會的分析,我國應加強對虛擬助理、智能機器人、語音交互、穿戴設備、手勢輸入、語音輸入和音頻輸入等技術的研發,特別是提高識別精度、降低延遲、增強用戶體驗等方面,探索如何將ChatGPT 技術更好地與這些設備和應用結合,實現更自然、高效人機交互。
(6)鼓勵跨行業合作,如將ChatGPT 技術與醫療、養老、教育、娛樂等行業結合,開發適用于這些領域的專業化應用;并與硬件廠商合作,共同研發集成ChatGPT 技術的智能設備,如智能家居設備、可穿戴設備等。