Stanford HAI:2026年人工智能指数报告

图丨Pexels
近日,斯坦福以人为本人工智能研究院(Stanford HAI)发布《2026年人工智能指数报告》(The 2026 AI Index Report)。
该报告指出,人工智能对社会的影响从未如此显著,其有望成为21世纪最具变革性的技术。但除非审慎地引导其发展,否则它的益处将无法公平分配。人工智能指数提供了对人工智能最全面、以数据驱动的视角之一。作为被全球媒体、政府和领先企业认可的可信资源,人工智能指数为政策制定者、商业领袖和公众提供了关于人工智能技术进步、经济影响和社会影响的严谨客观的洞察。
该报告的关键发现包括:
1. 人工智能的能力并未停滞不前,而是在加速发展,并比以往触及到更多的人。
2025年,业界产出了超过90%的知名前沿模型,其中部分模型在博士级科学问题、多模态推理和竞赛数学等方面的表现,已达到或超越人类基准。在关键的编程基准测试——SWE-bench Verified上,模型性能在一年内从60%提升至接近100%。组织机构的人工智能采用率达到88%,五分之四的大学生目前在使用生成式人工智能。
2. 美国与中国在人工智能模型性能上的差距已基本消除。
自2025年初以来,美国和中国模型已多次交替领先。2025年2月,DeepSeek-R1匹敌美国顶尖模型,截至2026年3月,Anthropic的顶尖模型仅领先2.7%。美国产出了更多的顶级人工智能模型和更高影响力的专利,中国在论文发表数量、引用量、专利产出以及工业机器人安装量上处于领先。韩国在创新密度方面表现突出,人均人工智能专利数量居世界首位。
3. 美国拥有最多的人工智能数据中心,其数据中心所用芯片大多由一家台湾代工厂制造。
美国拥有5427个数据中心,数量是其他任何国家的10倍以上,其消耗的能源也超过其他任何国家。台积电这一家公司制造了几乎所有领先的人工智能芯片,使得全球人工智能硬件供应链依赖于台湾的这一家代工厂,尽管台积电在美国的扩建项目已于2025年投产。
4. 人工智能模型可以在国际数学奥林匹克竞赛中斩获金牌,却无法可靠地读取时间,这体现了研究人员所称的人工智能“锯齿状前沿”。
Gemini Deep Think在国际数学奥林匹克竞赛中获得了金牌,然而即便是顶尖模型,准确读取模拟时钟的比率也仅为50.1%。人工智能智能体在OSWorld基准测试中的任务成功率从12%跃升至约66%(该测试衡量智能体跨操作系统完成真实计算机任务的能力),但在结构化基准测试中,它们仍有大约三分之一的尝试会失败。
5. 负责任的AI未能跟上AI能力发展的步伐,安全基准滞后,事故数量急剧上升。
几乎所有领先的前沿人工智能模型开发者都会报告能力基准测试的结果,但在负责任的AI基准测试上的报告仍然参差不齐。记录在案的人工智能事故从2024年的233起增至362起。更严峻的是,近期研究发现,改善负责任的AI的一个维度(如安全性)可能会损害另一个维度(如准确性)。
6. 美国在人工智能投资上领先,但吸引全球人才的能力正在下降。
2025年,美国私人人工智能投资达到2859亿美元。美国在创业活动上也处于领先,2025年新获得融资的人工智能公司达到1953家,是第二名国家的10倍多。然而,移居美国的人工智能研究人员和开发者的数量自2017年以来下降了89%,仅过去一年就下降了80%。
7. 人工智能的普及正以前所未有的速度扩散,而消费者正从通常可免费使用的工具中获得巨大价值。
生成式人工智能在三年内的人口采用率达到53%,速度超过个人电脑或互联网,尽管这一速度因国家而异,并与人均国内生产总值密切相关。一些国家表现出高于预期的采用率,如新加坡(61%)和阿拉伯联合酋长国(54%),而美国以28.3%的采用率排在第24位。截至2026年初,生成式人工智能工具对美国消费者的年估算价值达到1720亿美元。
8. 正规教育落后于人工智能的发展,但人们正在人生的各个阶段学习人工智能技能。
目前,超过80%的美国高中生和大学生将人工智能用于学业相关任务,但只有一半的初中和高中制定了人工智能政策,且仅有6%的教师表示这些政策是明确的。在课堂之外,人工智能工程技能的增速在阿拉伯联合酋长国、智利和南非最为迅猛。2022年至2024年,美国和加拿大的新晋人工智能博士数量增加了22%,而这一增量所对应的博士毕业生选择了学术界的岗位,而非产业界。
9. 人工智能主权正成为国家政策的一个决定性特征,但能力分布仍然不均,即便开源发展有助于重新分配参与格局。
各国的国家人工智能战略正在扩展,尤其是在发展中经济体;同时,国家对人工智能超级计算的投资也在同步增加,这标志着各国对国内人工智能生态系统控制权的雄心日益增长。然而,模型生产仍然集中在美国和中国。开源发展正开始重新分配参与格局,来自世界其他地区的贡献已在GitHub上超过欧洲,并接近美国,从而催生了更多语言多样化的模型和基准测试。
10. 人工智能专家和公众对该技术未来的看法截然不同,全球范围内对机构管理AI的信任也呈分化态势。
在人工智能如何影响人们工作方式的问题上,73%的专家预期会产生积极影响,而公众中仅有23%持此看法,差距高达50个百分点。对经济和医疗保健影响方面的看法也存在类似分歧。全球范围内,对各政府监管人工智能的信任度各不相同。在所调查的国家中,美国民众对其本国政府监管人工智能的信任度最低,仅为31%。在全球范围,相较于美国,人们更信任欧盟能够有效监管人工智能。
资料来源丨Stanford HAI
本文由生物安全情报网编译,仅用于学术分享,转载请注明出处
阅读原文献请点击“阅读原文”
