中圖分類號:TP18 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2025043
AbstractAgainstthebackdropof intensifyingglobalartificial intelligence (AI)competition,frequentfluctuations in national ankings across evaluation indices not onlyreflect shifts in nationalcapabilities but also reveal how index design logic influences and shapes assessment outcomes.To interrogate this phenomenon,this paper first selected nine mainstreamAI evaluation indicesas research samples basedon five principles:representativeness,professionalism,relevance, transparency,and timelinessUsing the TF-IDFalgorithm for taxonomiccategorizationoforiginal indicators,five thematicdimensionswereidentified:ataIrastructure,TlentPol,amp;Dapacity,Ivestmentamp;eplomentdtrat egyamp;Governance.Employing this framework,weconducted cross-sectional comparisons ofscoresacrossthese dimensions forl5leading nationsand longitudinal trackingof theirrank variationsacross indices and time periods.Keyfindings indicate that: Ranking volatility stems primarily from adjustments in indicator weighting schemas and scoring granularity,withindicesembedding distincttechnological prioritiesandvalueorientations;TheStrategyamp;Governance dimensionexhibits high reactivity topolicysignals,whileotherdimensions demonstrate greater temporal stability.This research proposes a standardized five-dimensional evaluationarchitecture incorporating dynamic weightcalibration and anannual rolling revision mechanism.This approach achieves dynamic equilibrium between international comparability andcontextualadaptation,providing methodologicalscaffoldingforconstructingversatileyetresponsiveAIassessment frameworks.
Keywords artificial intelligence;index evaluation; evaluation outcomes; evaluation indicators;scientometrics
人工智能(Artificial Intelligence,AI)作為重塑經濟、社會和軍事版圖的戰略性技術,已成為衡量國家間相對實力與國際權力分配的重要變量[]。近年來,世界主要國家和經濟體密集發布人工智能相關戰略規劃,圍繞人工智能的基礎研究、技術開發、產業應用、倫理框架等方面加強系統性部署,以期在科技競爭中搶占先機。科學評估全球人工智能創新水平并研判其發展趨勢,是各國制定人工智能戰略的前提,也是實現長期有效布局的重要參考。
指數(Index)是反映事物相對變化程度的統計量2,因其橫向可比、縱向可追蹤的特點,被廣泛應用于人工智能評價。2016年,美國斯坦福大學發起“人工智能百年研究\"(AI100)計劃,提出以百年為尺度追蹤人工智能的發展及其對人類社會的影響[3],全球范圍內的著名國際組織和研究機構相繼建立了20余套人工智能相關的評價指數。作為AI100的分支,美國斯坦福大學“以人為本”人工智能研究院(Institute forHuman Centered Artificial Intelligence,HAI)自2017年起,每年發布人工智能指數(AIIndex,AII)報告,截至2025年,已連續出版8份報告。英國TortoiseMedia于2019年推出全球人工智能指數(Global AI Index,GAII),牛津洞察(Oxford Insight)同年發布政府人工智能就緒指數(GovernmentAIReadinessIndex,GARI),兩者均持續更新。此后,國際貨幣基金組織(International Monetary Fund,IMF)、塔夫茨大學等陸續發布人工智能準備指數(AIPre-paredness Index,AIPI)、頂級人工智能國家指數(TopRankedAINations,TRAIN)等多項評價指數,馬可波羅智庫(MacroPolo)的全球人工智能人才追蹤器(TheGlobalAITalentTracker)、清華大學AMiner團隊的AI2000榜單等專項評價亦層出不窮。
各評價指數的測評結果按得分高低列出參評國家的位次,同時在關鍵評價維度體現出強弱差異,不同年份各國位次的升降變化,往往與體系新增指標、權重調整或評分粒度變化關系密切,因此評價結果既是各國人工智能發展現狀的寫照,也揭示了各指數在維度與權重設定上的具體偏好。由此,本文回顧并整合多項權威人工智能指數的排名結果,提煉各指數評價體系的重疊維度,比較各國在不同維度的得分差異與位次變化,反向檢視各指數在指標取舍、權重設置及數據來源上的側重,為構建科學合理的人工智能評估框架提供參考。
1指數選擇與研究方法
1.1 研究樣本的選擇
為從國際人工智能評價指數的結果透視評價指標的設計要點與計算方式,本文遵循代表性、專業性、相關性、透明性、時效性五項原則[4]選取研究樣本:
(1)代表性:樣本的評價對象應以國家為評價主體并涵蓋全球主要經濟體,便于各指數間進行有效對照與橫向比較,支撐可靠的跨國對比分析。
(2)專業性:指標體系應由專職研究團隊負責維護與更新,并經過同行評審或獲得引用認可。
(3)相關性:樣本的評價目標應與人工智能發展及應用場景高度契合,評價維度精準反映AI領域的關鍵要素。
(4)透明性:各指數在維度劃分、計算方法與數據口徑上應保持透明與可溯源,方可將國家間得分差異歸因于體系設計而非統計偏差。
(5)時效性:樣本的最新版成果應在近兩個年度內發布,保證研究結果緊跟技術前沿與政策動態。
現有人工智能評價指數的研究大致分為兩類:一類是綜合類人工智能指數,其特點在于覆蓋數據、人才、研究、投資、治理等與人工智能創新發展高度相關的要素,通過系統性指標體系對各國人工智能總體實力與演變趨勢進行全景式評估,從而呈現“面\"的廣度。另一類是專題類人工智能指數,其特點在于關注某一特定議題,如人才流動、投資潛力等,以高度聚焦的指標深入剖析各國在具體維度上的差異與特征,因而具備深度刻畫“點”的優勢。兩類評價指數相輔相成,共同勾勒出全球人工智能競爭的全景圖,構成了多視角、多尺度的全球AI評價生態。根據上述原則,本文遴選出綜合類人工智能指數6項,專題類人工智能指數3項,共計9項主流人工智能評價指數進行研究。
綜合類人工智能指數包括AII、GAII、GARI、OECD人工智能觀測站(OECDAIObservatory)、AI-PI、TRAIN。其中,AII早期評價維度聚焦領域活力與技術性能,領域活力展示了人工智能領域的“量”,如學術領域的發表情況、產業領域的投資額、GitHub開源熱度等;技術性能體現了人工智能領域“質”的一面,如計算機在理解圖像和證明數學定理方面的能力[5。最新版本的評價維度擴展為研究與開發、技術性能、負責任AI、經濟、科學與醫學、政策、教育、公眾觀點等8大板塊,含百余項具體量化指標。AII未設綜合排名,匯集經嚴格核驗、來源可追溯的全球數據,為政策與研究提供客觀、可復現的事實基準。GAII始終圍繞\"實施、創新、投資\"三大維度展開評估,并在每輪更新中優化測量指標,2024年版細化為122項具體指標,用以衡量各國在人才儲備、基礎設施、研發生態、商業投資與政府戰略等方面的表現[。作為首個對國家人工智能綜合實力進行排名的指數,GAII每年依據指標的相關性、貢獻度與數據可得性3項原則對權重進行微調,參評國家已由首版的56個增至2024年的83個。GARI旨在評估各國政府在公共服務方面引入人工智能的準備程度,評價框架由政府、技術部門、數據與基礎設施三大支柱構成。2020年起,量化指標由11項擴展至33項,并依據熱點議題及數據可得性逐年進行調整。2019年首版即覆蓋全部194個聯合國成員國,此后參評國家數量保持穩定。GARI對所有維度、指標均實行等權重處理,最終得分為三大支柱得分的算術平均值。2020年,經濟合作與發展組織(Organization forEconomic Co-operation and Development,OECD)啟動OECDAIObservatory,對120余個國家的人工智能發展進行持續跟蹤和實時評估,其監測的維度涵蓋AI學術研究、AI教育、AI風險投資、AI模型與數據集等9,為成員國共享數據與政策經驗提供實時平臺。2023年,IMF開發的AIPI包含數字化基礎設施、人力資本、創新生態系統以及治理框架四個關鍵維度,采用均權法評估174個國家的人工智能就緒水平[0]。隨著全球對人工智能領導地位的競爭白熱化,美國塔夫茨大學同年發布了TRAIN,從數據、規則、資本、創新四個維度定位25個領先的人工智能創新國家在全球AI競逐中的位勢[]。
專題類人工智能指數包括圍繞人才議題的全球人工智能人才追蹤器、AI2000榜單以及針對投資指向的人工智能投資潛力指數(AIInvestmentPo-tentialIndex,AIIPI)。其中,全球人工智能人才追蹤器以NeurIPS會議錄用論文的作者數據為樣本,評估全球頂尖人工智能研究人員的分布與流動[],先后于2020年和2024年發布兩版報告。AI2000榜單基于過去10年AI領域研究成果的引用數據評選全球頂尖學者[13]。法國開發署(FrenchDevelopment
Agency,AFD)推出的AIIPI考慮經濟環境、人力資本、基礎設施韌性等關鍵因素,結合統計建模和熵權法,從193個參評國家中識別出人工智能投資方面具有未開發潛力的國家[14],該指數于2024年和2025年連續發布兩年。
1.2 研究方法
盡管各類人工智能指數在發布周期、細分指標、數據來源與計算方法上各異,但仍存在共性特征:
(1從評價思路來看,各評價指數普遍將人工智能視為國家層面的戰略性創新活動,并以國家創新系統理論[15]作為評價的核心思想。
(2)從評價對象來看,參評國家數量從數十個到近兩百個不等,但幾乎所有指數都把美國、中國、英國、以色列、新加坡等主要“人工智能強國\"列為核心樣本,地域上集中于亞洲、北美與歐洲。
(3)從評價維度來看,研究樣本大多為具有清晰指標層級體系的指數,但各指數對維度的命名與粒度不一致,在具體量化指標設置上也名目繁多,導致直接可比性受限。由于專題類人工智能指數已有明確的指向性,無須再作額外維度歸類,本文將著重對6項綜合類人工智能指數進行維度解析。首先,利用TF-IDF算法提取原始指標名稱中的關鍵術語,再結合各指數中預定義的一級維度類別,實現指標到多個維度的半自動分類。其次,基于上述分類結果,統計各維度內指標的出現頻次,選取指標占比最多的五個共性特征維度,以各指數中最小的可量化指標為計數單元,對這些共性維度進行量化分析。分析各指數在不同維度上的分布情況,并繪制成圖(見圖1)。可以看出,數據、人才、研究與開發、投資、戰略五維指標在綜合類指數中占據主導,反映了這些維度在人工智能評價中的核心作用。
上述共性特征為本文融合多源指數分析全球人工智能創新發展態勢提供了基本的框架,下文將基于數據、人才、研究與開發、投資、戰略這五個量化維度,對不同指數的最新排名結果進行系統梳理與比較分析。本文所使用的數據主要來自2023年-2025年間發布的指數結果,這一時段的指數評價不僅在指標體系上趨于成熟,而且保證了結論的時效性。分析以GAII和GARI的結果為核心依托,兩者不僅提供了連貫、完整的排名序列,而且在關鍵評價維度上保持框架穩定,不同的賦權方法又為同一維度帶來多元視角。同時,對于GARI未給出具體排名的維度,引入AII、AIPI、TRAIN等權威來源的交叉數據與案例,用以驗證主體指數的結論并填補空白。
圖1各指數的指標分類圖

2多維度的評價結果及分析
考慮到數據可得性與政策啟示性,本文選取中國與美國、加拿大、英國、法國、德國、意大利、荷蘭、瑞士、俄羅斯、日本、韓國、以色列、新加坡、澳大利亞等14個重要科技創新國家作為研究對象,其中既包括OECD主要成員國(美國、加拿大、英國、法國、德國、意大利、荷蘭、瑞士、日本、韓國、以色列、澳大利亞),也涵蓋“一帶一路\"沿線部分國家(韓國、新加坡、俄羅斯、意大利),這些國家的AI投入強度領先且數據披露相對充分。
2.1數據維度的評價結果及分析
數據維度測量的是人工智能系統研發、部署與規模化應用所依賴的數據與基礎設施的支撐水平,具體而言,該維度包括算力供給、網絡連接、數據資源以及數字底座等多個關鍵要素。GAII的基礎設施指標、GARI的數據與基礎設施維度、TRAIN的數據維度以及AIPI的數字化基礎設施維度均據此展開評估,分別對應并量化上述一個或多個要素,子指標雖在不同指數中有所差異,但同屬數據維度的測量方向。
2.1.1數據維度的評價結果
將GAII與GARI在數據維度的國家得分排名進行對比(見表1),其中“排名變化”一列為各國2024年位次相較2023年的升降情況。
美國、新加坡在GAII和GARI均保持前三,美國更在GAII以滿分100持續領跑,并與第2名中國的差距由2023年的8分擴大至2024年的34分。中國在GAII仍居第二,卻在GARI由第29位下滑至第34位。澳大利亞則在GAII提升5位,而在GARI下降6位;英國在GAII上升7位,在GARI卻下降7位。荷蘭、意大利等在GAⅡI的排名有明顯上升,韓國、加拿大則在兩項指數同時前移。俄羅斯在兩項指數同步下滑,在GAII驟降25位、在GARI下降5位。
2.1.2數據維度的結果分析
各國得分排名的變化反映出兩套指數在權重與指標設置上的取向差異,GAⅡ側重“算力 + 連接”的硬件承載力,GARI則強調“數據質量與代表性”的軟件供給力。GAⅡI的實施維度下,基礎設施指標被界定為互聯網接入與帶寬基線、高性能計算資源可及性,以及先進半導體的制造或獲取能力。GAII2024新增“半導體制造”與“英偉達GPU可得性\"相關測量指標后,美國依托本土先進制程與出口管制優勢繼續擴大領先,中國因高端芯片受限得分降低,俄羅斯則因芯片斷供排名大幅下滑。歐盟通過歐洲高性能計算聯合項目(EuroHPC)投資15億歐元在歐洲各國建立7家AI工廠,在一定程度上帶動荷蘭、英國、意大利、瑞士等國GAII的排名集體上升[16]。
表1各國數據維度得分排名情況

注:各國得分保留整數,下同。
GARI的數據與基礎設施維度不僅包含把數據轉化為算力和服務的物理條件,還將數據質量納入考量:既要求數據可用性,即足夠規模、高質量、可機讀的數據供給,又強調數據代表性,數據應能真實反映本國特征,避免算法偏見[17]。新加坡“智慧國2025\"計劃通過一體化數字基礎設施與數據平臺,顯著提升了數據治理與算力共享效率,在GAII與GARI兩項榜單上均保持領先。
盡管澳大利亞在不同評價體系中升降互逆,卻在GARI中躋身前列,而在GAII中相對靠后,這與中國的表現截然不同,顯示了數據治理取向對排名的影響:澳大利亞在開放數據政策的推動上表現積極,中國則更加注重數據安全和隱私保護。這兩種治理路徑并無優劣之分,前者通過數據共享刺激創新,后者以安全可控換取公民的長期信任,實質體現了各國對數據利用優先級的差異。此外,AII2025報告指出公共數據資源正在萎縮[6,2023年-2024年間大量網站更新協議限制數據的抓取,可用于AI模型訓練的公開數據量明顯下降,合成內容與版權爭議成為新的挑戰。這一趨勢意味著,未來數據維度的競爭將不僅關乎算力與開放度,更取決于各國在可持續數據供給與合規利用之間的平衡能力。
2.2 人才維度的評價結果及分析
人才維度衡量能夠將人工智能技術應用于特定問題,并具備管理和實施技術系統能力的人才儲備與培養水平,GAⅡI的人才維度分列科學家、專業工程師及開發者3個子項,TRAIN定義人才維度為可用AI人才的質量和數量,AIPI的人力資本維度關注教育技能和勞動市場彈性,全球人工智能人才追蹤器與AI2000榜單追蹤頂級人工智能研究人員的學術表現,各評價指數從不同角度對主要人才群體及其社會支持體系進行測評。
2.2.1人才維度的評價結果
對比各國在不同指數人才維度的得分排名情況(見表2)可以發現,各指數中排名靠前的國家都呈現出一定的穩定性。在GAII及TRAIN中,美國均以顯著優勢位列榜首,德國、英國、瑞士等國在多項指數上位列前茅。中國在GAII中排名第9,較2023年上升11位。日本在GAII中的排名出現較大波動,由2023年的第11位下降至2024年的第23位,排名下滑12位;俄羅斯在GAII中的排名更是由2023年的第28位大幅下降至2024年的第58位,排名下降30位。新加坡和以色列在GAII和AIPI的排名均靠前且相對穩定,分別位列GAII的第6位和第7位,以及AIPI的第1位和第12位。
表2各國人才維度得分排名情況

2.2.2人才維度的結果分析
根據現有指數評價的操作化路徑,人才維度可細分為三類人群:一是頂級人才,全球人工智能人才追蹤器和AI2000榜單均通過頂級會議或期刊論文的作者信息計算各國的活躍學者數量及其被引表現,衡量“頭部科研力量”;二是專業人才,TRAIN、GAII等指數借助Seekout、LinkedIn等招聘平臺的公開數據,統計現職AI工程師、算法科學家等崗位人數;三是后備人才,來源包括聯合國教科文組織、各國教育部門的學位授予數據,如GAII2023計算給定國家的IT、STEM專業的年度畢業生數量。此外,還有部分指數從更廣泛的教育角度量化人工智能人才,對高校與中小學開設的人工智能和計算機科學相關課程及專業數量和強度進行評價。如AIPI將教育與數字化技能視為人力資本的組成要素;AⅡI的K-12階段計算機及人工智能教育指標則量化中小學開設計算機及人工智能課程學校的普及程度。
GAII2024擴充了人才維度的口徑,原先的GitHub提交量、IT與STEM畢業生規模被替換為更能反映職業生涯全周期的指標一早期、中期和晚期的AI科學家數量,以及主流就業平臺上活躍的AI開發者人數,兩項占到 11% 的權重。這一調整使得美國憑借其在頂尖科研人才和產業人才上的優勢繼續穩居第一。盡管頭部聚集效應讓各個國家排名變化有限,中國在GAII中的排名仍取得了明顯的進步,顯示出國家戰略與政策不斷加碼本土人才培養,同時頂尖研究者的國際流動性下降,越來越多高水平學者選擇留在本國工作。全球人工智能人才追蹤器2.0也顯示,2022年全球最頂尖AI研究者中 57% 就職于美國,中國( 12% 與英國 (8% 緊隨其后[12]。相比之下,日本和俄羅斯在GAII中的排名均出現了明顯下滑。日本經濟產業省預測,到2030年日本將面臨約78.9萬名軟件工程師缺口,人口老齡化和高校相關專業畢業生規模不足共同削弱了人才供給[18],直接拉低了該國在人才維度的綜合得分。對于俄羅斯而言,經濟與國際環境的不確定性可能導致部分人工智能人才外流,同時國內資源投入受到影響,造成排名下降。
AII2025報告顯示,2024年人工智能人才占本國勞動力比例最高的國家是以色列 (2.0% )和新加坡(1.6% ,這雖與兩國勞動力基數小和數據覆蓋范圍有關,卻也真實反映了它們在AI人才密度上的優勢。根據OECDAIObservatory的公開數據,2023年,測評國家AI工程師中女性平均占比為 26.8% ,新加坡則以 35% 居首[19],表明其AI領域性別結構也更為均衡。盡管這些國家在地理和人口規模上相對較小,但在培養人工智能人才方面表現突出。企業對員工技能發展的投資以及政府促進持續學習的政策,都為人才的發展提供了有力支持。同時,越來越多的專業人士從其他領域轉型到人工智能領域。如新加坡有 56% 的領英用戶從非人工智能背景轉行到人工智能崗位[19]。隨著不同背景的專業人士紛紛進入人工智能領域,創造便捷的培訓機會和清晰的職業發展路徑對于有效利用這一人才庫至關重要。
2.3研究與開發維度的評價結果及分析
研究與開發維度集中評估一國在人工智能領域“從科研到落地”的創新活動,既包括基礎研究、技術突破,也涵蓋應用創新與跨學科協作。GAII的研究維度覆蓋從理論探索到技術應用的各個環節,GARI的技術部門維度強調人工智能技術轉化與應用的綜合能力,AII的研究與開發章節通過報告成果數據客觀記錄技術創新活動的產出效率,三者均屬于研究與開發維度的評估范疇。
2.3.1研究與開發維度的評價結果
將GAII與GARI在研究與開發維度的國家得分排名情況對比(見表3后發現,GAII排名前五的美國、中國、新加坡、英國、瑞士在2023年-2024年間,位次幾乎未發生變化,顯示出這些國家的領先地位。GARI中,多數國家排名發生變化。法國在GAII中的排名上升9位,躍居至第6位,同時在GARI中也實現了6位的提升,達到第5位。韓國在GARI中的排名實現了13位的大幅躍升,攀升至第8位。以色列的情況則表現出一定的差異,在GAII中其排名上升4位至第7位,但在GARI中卻下降了7位至第10位。
2.3.2研究與開發維度的結果分析
相關指數評價體系通常以學術論文發表與被引反映知識前沿,技術專利申請與授權量揭示產業轉化,開源代碼活躍度體現社區生態。GAII將研究水平細化為對AI基礎研究、AI應用研究、大模型新架構的貢獻度以及高校有關專業的教學質量等測量指標。GARI把視角放在技術部門的成熟度,政府能否獲得先進AI工具取決于本國企業、高校與研發機構的創新能力,以及配套的商業環境與研發資金流,由于涉及要素較多,國家排名更易出現波動。AII系列則在歷年“研究與開發\"章節報告論文、專利、標志性模型和開源軟件的年度數據,形成清晰的技術演進曲線。
在GAII2024中,研究維度由原先的AI論文、機器學習系統相關統計指標升級為AI基礎與應用研究貢獻、重要AI模型及其計算資源等,把“模型研究\"列為一項權重高達 8% 的核心指標,在該維度內已超過傳統論文指標的權重,更直接地聚焦當前人工智能的技術制高點。前五位國家位次穩定表明其研發體系與前沿技術保持了同步迭代。法國的排名由第15名提升了9名,源于其標志性AI模型的突出表現,AII2024與AII2025報告數據顯示,2023年-2024年全球標志性AI模型數量始終由美國、中國、法國占據前三[6.20];針對生成式人工智能的迅猛發展,法國國家人工智能學會及時出臺指導方針,加速國家人工智能戰略的推進[21]。GARI的技術部門維度保持原有框架,仍側重研發機構協同度與商業環境成熟度。其中韓國提升最快,由第21位升至第8位,得益于《AI及數字化創新增長戰略》將大模型引入制造與服務場景,以及Naver等企業正與三星電子積極結盟,這些舉措契合了GARI對商業環境與協同能力的考核重點,從而推動韓國排名顯著提升。GAII中以色列的排名上升得益于其科研機構在基礎模型方面的高產,而在產業協同的短板造成其在GARI中排名下滑。
表3各國研究與開發維度得分排名情況

AII自2023年起就著眼于大語言與多模態模型的參數規模、訓練成本[22],并在2024、2025兩版報告中發布詳盡的基礎模型統計數據,AII2025更以整章篇幅對比了不同模型在生成、推理等任務上的測試表現。面對指數權重向“大模型\"傾斜的現實,可量化的模型性能、成本與合規指標將是研發維度的新標準。
2.4投資維度的評價結果及分析
投資維度衡量的是政府、企業與金融資本在人工智能領域投入的規模、結構與效率,包括公共預算、企業研發支出、風險投資、融資及并購等全部資金來源。GAII的商業維度以市場主體規模與并購活躍度衡量市場熱度,TRAIN的投資維度由資金流向跟蹤人工智能及關聯領域的直接投資動態,AII的創新與經濟一體化維度則將投資置于區域經濟一體化框架內評估,這些指數對投資情況的評價各有側重。
2.4.1投資維度的評價結果
對比各國在不同指數投資維度的得分排名情況(見表4)可以發現,GAII和TRAIN的排名整體趨同,如美國、中國、英國、加拿大等國在兩個指數中均位列前十,AIPI則呈現差異化趨勢,中國盡管在TRAIN和GAII中表現強勁,但在AIPI排名較低。從時序變化來看,美國、中國、以色列、新加坡、英國包攬GAI的前五名且排名無變化,中上游國家競爭激烈,部分國家排名波動較大,瑞士和意大利排名下跌明顯,俄羅斯雖然得分仍較低,但排名提升12位。
2.4.2投資維度的結果分析
GAII的商業維度統計AI企業的數量、規模與融資總額,反映產業資本對產能擴張的拉動作用。TRAIN的投資維度考察流向AI和新興技術的投資。兩者都關注實際資金投入與商業化進展,因此排名表現出較強一致性。AIPI出于經濟一體化視角,納入關稅稅率、資本自由流動等宏觀經濟指標,所以歐盟成員國在AIPI中普遍排名更高,而非歐盟國家(如中國、俄羅斯)因政策差異排名靠后。與此同時,AII與GAII均列出初創AI企業相關數據以捕捉早期創新活力;AI還追蹤企業部署AI后的成本降幅、收入增量及對勞動力結構的影響,從而完整呈現從資本投入到經濟回報的過程
表4各國投資維度得分排名情況

根據各項指數的國別表現來看,GAII2024在原有公司數量、融資總額之外新增“收購AI公司數量與價值”相關指標后,美國憑借并購活躍度繼續滿分領先,頭部梯隊次序基本不變。不論是2024年當年的時點數據,還是由2024年回溯至2013年的累計時段數據,AII報告均顯示人工智能領域的私人投資排名高度穩定:2024年前三甲由美國、中國、英國包攬;2013-2024年的投資累計值排名則與GAII幾乎一致,美國4,709億美元居首,中國1,193億美元次之,英國282億美元第三,以色列(150億美元)與新加坡(73億美元)緊隨其后[。這一長期不變的排序表明,全球AI資本流向始終高度集中。值得注意的是,美國與其他國家及地區的差距正在拉大:2023年以來,中國私人AI投資小幅下降 1.9% ,歐洲整體增長 60% ,而美國增幅高達 50.7% ,且2022年以來,美國和歐洲的新設AI企業顯著增加,中國則連續兩年回落。中上游國家的排名變動尤為顯著,如日本、韓國等排名的快速上升以及瑞士和意大利等排名下滑,反映了在AI投資維度“不進則退\"的激烈競爭態勢。
此外, AII2024 指出,全球AI投資在2021年達到3,374億美元的高點后連續兩年回落,2023年降至1,892億美元,較峰值縮水約 44% ;其中并購交易額跌幅最大( -53% ,私人投資下滑 27%[20] 。2024年總額回升至2,523億美元,同比增長 26% ,私人投資領漲 45% ,并購交易增長 12%[6] 。雖然全球人工智能投資有所放緩,但對生成式人工智能的投資卻不降反升。2024年該領域吸引投資達339億美元,較2023年增長 19% ,是2022年投資額的8.5倍以上,并占當年全球AI私人投資總額的 20% 以上[,顯示資本對該賽道的長期信心與投向的日趨精準。
2.5 戰略維度的評價結果及分析
戰略維度關注的是各國為引導人工智能技術研發、應用與治理而制定的系統性、長期性的規劃和政策框架該維度主要考察戰略規劃體系、治理框架設計和資源保障機制等政策要素。GAⅡI的政府戰略指標反映政策系統性、實施可操作性和財政投入力度,GARI的政府維度關注治理體系的適應性和規范性,TRAIN的規則維度側重于數據治理政策,AII的政策章節從立法進程和公共投人等指標體現各國對人工智能戰略的關注度,上述指數共同構成規劃-治理-執行的完整政策評估鏈條。
2.5.1戰略維度的評價結果
對比各國在GAII與GARI戰略維度的得分排名情況(見表5)后發現,美國從GAII2023的第8位升至第2位,GARI也升至第2位,雙線并進。新加坡保持GARI第1位,在GAII中則上升6位至第10位,穩居前列。中國與德國在GAII中小幅下滑,卻在GARI中大幅后退。荷蘭、以色列的排名均有所上升,其中以色列在GAII中升15位、在GARI中猛升44位。俄羅斯、瑞士在兩項指數的排名同時下跌,俄羅斯在GAII中跌14位、在GARI中跌11位,澳大利亞則在GAII中驟降28位,在GARI中僅微升3位。縱覽上述各維度,多數國家升降幅度普遍在1-6位之間,而戰略維度下各國變動幅度普遍更大。
2.5.2戰略維度的結果分析
GAII的政府戰略指標評估各國人工智能戰略的全面性、及時性,重點考察政府是否發布專門的AI戰略、目標是否量化、路線圖是否完整,GAII2024新增了政府為AI訓練提供計算設施、公共數據集以及基礎模型投入等具體測量指標,聚焦算力、數據、算法等人工智能配套要素投入的同步程度,放大了政府資源承諾與實際落地的差距。美國在兩項指數中的排名上升與政府充足的AI投入密切相關,AII2025的數據顯示2023年,美國在人工智能公共投資方面居全球首位[。澳大利亞、俄羅斯的排名大幅下降則源于指數的戰略量化要求和時效性標準提高。
表5各國戰略維度得分排名情況

GARI以愿景清晰度、治理與倫理框架完備度、政府適應性等評分,評估政府能否在響應創新的同時,通過監管約束降低潛在風險,注重政策細節與合規程度。GARI2024與之前的框架相比并無太大變化,但將多個子項指標的評分由原來的“有/無”二分法改為“100-50-0”三檔,如“是否有國家倫理框架”一項,已采用OECD人工智能原則或與OECD價值觀一致的獨立框架得100分,僅有草案或正與OECD協調得50分,無采納證據得0分,評分粒度更細。中國、德國、日本、俄羅斯排名后退的可能原因是原有框架下的優勢項目在新三檔評分中降級,而以色列的超常規上升則受益于符合該評分方法的重點,如該國已正式采納OECD人工智能原則。
當前形勢下,各國都十分重視人工智能戰略的制定和實施,且表現出越來越高的系統化程度和競爭意識。AII2025提供的數據顯示全球立法程序中,“人工智能”一詞的年提及次數由2023年的1557次到2024年增長至1889次[,增幅達 21.3% ,越來越多的監管機構將注意力轉向人工智能,綜合運用多層次政策工具確保技術的發展符合社會整體利益。戰略維度的排名變化對各國政策調整和實施效果極為敏感,GAII2024對算力、數據和算法的重視,以及GARI2024對子項指標評分標準的細化,共同導致了各國排名在戰略維度的明顯變化。
3結語
目前,國內外多家專業機構采用“指標體系 + 指數方法\"的研究范式,通過構建覆蓋投資、人才、技術、研究等維度的評價指數,連續多年量化測度各國人工智能創新水平,形成對全球人工智能發展態勢的系統刻畫。基于代表性、專業性、相關性、透明性、時效性五項原則,本文選取9項符合要求的人工智能評價指數作為研究樣本,而后借助TF-IDF算法提取6項綜合類人工智能指數的指標關鍵詞,將原始指標歸類到數據、人才、研究與開發、投資、戰略五大維度。隨后,橫向比較不同國家在各個維度的表現,縱向追蹤同一國家在不同年份、不同指數中的得分差異與位次變化,結合配套事實數據反向梳理出指標變動對排名結果的影響。
研究發現,國家實力變化固然是影響排名的因素,但排名波動更多與指標設計緊密相關:同一國家在不同體系中的升降互逆現象,清晰映射了指數價值取向的異質性;指標體系歷年的新增變量與權重調整一定程度上體現了指數發起方的技術關切與治理范式;戰略維度成為各維度中“政策敏感度”最高的觀測窗口,其他維度受產業周期與技術積累影響,變化相對平緩。未來構建人工智能評估框架時,可共用五大核心評價維度,根據本國發展階段與安全需求,靈活調整子項指標權重。同時,引入年度滾動評分機制,實時吸納政策落地與技術躍遷的新信號,輸出既服務本土戰略又具有國際影響力的動態評價指數。
參考文獻:
[1]余南平.通用人工智能時代的國際權力重塑[J].中國社會科學,2025(4):41-59,205.
[2]李金林,趙中秋,馬寶龍.管理統計學[M].:清華大學出版社,2016.
[3]PeterS,RodneyB,ErikB,etal.ArtificalinteligenceandlifeinO3R].Stanford,CA:StanfordUniversity,16.
[4]王晨琳,王楚涵.國際人工智能評價體系的變化及其啟示[J].信息資源管理學報,2025,15(3):93-107.
[5]YoavS,RaymondP,Erik B,etal.TheAIIndex 2017AnnualReportR].Stanford,CA:AIIndex CommiteeoftheOne Hundred Year Study on Artificial Intelligence(AI1oO),Stanford University,2017.
[6]NestorM,LorednaF,RaymondP,etal.TheAIndex225AnualReportR].Stanford,CA:AIndexSteeringCo,I stitute for Human-Centered AI,Stanford University,2025.
[7]AlexiM,SerenaC,JoeWTheGlobalArtifcialInteligenceIndex224[EB/L].22-06-23]htps://ww.tortdia. com/2024/O9/19/the-global-artificial-intelligence-index-2024.
[8]EleanorS,RichardS,WalterP.GovernmentAReadines Index 22R/OL].2025-06-23].htps://xfordinsights.com/wpcontent/uploads/2023/11/AIReadinessReport.pdf.
[9]OECD.OECDAI Observatory[EB/OL].[2025-06-23].https://bservatory.oecdai.org/dashboards/AI/In-dex.
[10]InternationalMonetaryFund.AIPreparedness IndexEB/OL].2025-06-23].hps://ww.imf.org/exter-nal/dataapper/ AIPINote.pdf.
[11]BhaskarC,AjayB,RaviSC.ChartingtheEmergingGeographyofAI[EB/OL].2025-06-23].hps://br.org/2023/12/charting-the-emerging-geography-of-ai.
[12]MacroPolo.TheGlobalAITalentTracker2.0EB/OL].2025-6-23].htps:/archivemacro-poloorg/interactive/digital-projects/the-global-ai-talent-tracker/.
[13]AMiner.AI2000全球人工智能學者排名[EB/OL].[2025-06-23].https://www.aminer.cn/ai2000.
[14]Peter MA,Thomas M,Anastesia T.AInvestmentPotentialIndex 2025R/OL].2025-06-23].htps://w.afd.fr/sites/default/files/2025-02-10-13-23/PR342_VA_Web.pdf.
[15]Freman C.The“NationalSystemofInnovation”inhistoricalperspectiveJ].CambridgeJouralofEconomics,995,19: 5-24.
[16]European High-Performance Computing JointUndertaking.Selectionof theFirstSevenAIFactoriestoDriveEurope's LeadershipinAI[EBOL].2025-06-23].htps:/eurohpc-ju.europa.eu/selection-firstseven-ai-factories-drive-europes-leadership-ai-2024-12-10_en.
[17]PabloFN,Emma H,RichardS.GovermentAIReadines Index2024R/OL].[2025-06-23].htps://xfordinsights.com/wpcontent/uploads/2025/06/2024-Government-AI-Readiness-Index.
[18]AudreyW.WhyJapanislging behind ingenerativeAIandhowitcancreate itsownlargelanguagemodels[EB/OL].2025- 06-23].htps://www.cnbc.com/2023/07/07/why-japan-is-lagging-behind-in-generative-ai-and-creation-of-llms.html.
[19]Rosie H,Benedicte R,LuciaR,etal.2O23 LinkedIndataonOECD.AI:Definitions forAIocupationsare more specificwomen inmore AIjobsascarertransitions toAIgrow[EB/OL].2025-06-23].https://ecd.ai/en/wonk/2023-linkedin-data.
[20]NestorM,LoredanaF,RaymondP,etalTheAIIndex2O24AnualReportR].Stanford,CA:AIIndex SteeringCoiee, Institute for Human-CenteredAI,Stanford University,2024.
[21]MinisteredEconomieetdesFances.LastratégiefrangaiseenintellgencearificielleEB/L].--]tps://en seignementsup-recherche.gouv.fr/fr/la-strategie-francaise-en-inte-ligence-artificielle-49166.
[22]NestorM,LoredanaF,ErikB,etalTeAIIdex 223AnualReportR].Stanford,CA:AIIndexSteringCommiee,Istitute forHuman-CenteredAI,Stanford University,2023.
作者簡介:王楚涵,女,博士研究生;李廣建,男,教授,博士生導師;陳沫,女,助理研究員。