2025-04-14 21:14:45
斯坦福 2025 年 AI 指数报告 人工智能对社会的影响从未如此深远。 在斯坦福大学以人为本人工智能研究院(HAI),我们相信人工智能将成为21世纪最具颠覆性的技术。然而,要确保AI带来的好处能公平分配,我们必须谨慎引导其发展。AI指数报告提供了全球范围内最全面、最权威的数据洞察,已成为各国政府、全球媒体和行业巨头广泛信赖的资源。它为决策者、企业家和公众提供严谨客观的分析,阐明人工智能的技术进步、经济影响和社会作用。 核心观点与发现 1. AI在高难度测试中的表现持续提升 2023年,研究人员推出了MMMU、GPQA、SWE-bench三个新的基准测试,以检验先进AI系统的极限。一年后,这些测试的表现显著提升,分别提高了18.8个百分点、48.9个百分点和67.3个百分点。此外,AI在生成高质量视频方面取得重大突破,在某些编程任务中,即使时间受限,AI代理的表现甚至超过了人类。 2. AI日益融入日常生活 从医疗到交通,人工智能正迅速从实验室走进人们的生活。2023年,美国食品药品监督管理局(FDA)批准了223种AI医疗设备,而2015年只有6种。在道路交通领域,自动驾驶汽车不再是实验性产物:美国Waymo每周提供超过15万次无人驾驶服务;中国百度Apollo Go自动驾驶出租车正以更亲民的价格在多个城市提供服务。 3. 企业纷纷布局AI,投资和应用热情高涨,研究表明生产力大幅提高 2024年,美国私营部门对AI的投资达到1091亿美元,接近中国93亿美元投资的12倍,英国45亿美元的24倍。其中生成式AI尤其受到追捧,全球吸引投资339亿美元,同比上升18.7%。AI在企业中的普及率迅速上升,2024年高达78%的企业已应用AI,而2023年这一比例仅为55%。同时,大量研究证实AI提高了生产效率,并帮助缩小了劳动力技能差距。 4. 美国AI模型数量仍居首位,但中国快速缩小性能差距 2024年,美国机构推出了40个值得关注的AI模型,大幅领先于中国(15个)和欧洲(3个)。尽管美国仍领先于数量,中国模型在性能方面已迅速追赶,主要测试如MMLU和HumanEval上的表现差距由2023年的两位数缩小至2024年接近平齐。同时,中国仍在AI学术论文发表量与专利申请方面保持领先,此外中东、拉美和东南亚地区也纷纷涌现出值得关注的模型。 5. 负责任AI生态逐渐成熟,但发展不均衡 与AI相关的事故显著增加,但主流企业对负责任AI(Responsible AI, RAI)的评估仍不普遍。不过,HELM Safety、AIR-Bench、FACTS等新兴基准为评估AI安全性和事实准确性提供了有效工具。企业在RAI领域的行动与认识仍存在差距,但各国政府表现出更高的积极性:2024年,包括OECD、欧盟、联合国和非盟在内的国际组织,纷纷推出透明性和可信度等负责任AI核心原则框架。 6. 全球对AI的乐观态度上升,但地区间差异明显 在中国(83%)、印尼(80%)、泰国(77%)等国,大多数人认为AI利大于弊;而在加拿大(40%)、美国(39%)、荷兰(36%)等地,这一比例仍然较低。不过,相比2022年,许多曾经较为悲观的国家,乐观情绪明显增强,其中德国和法国增长了10%,加拿大和英国增长了8%,美国增长了4%。 7. AI日益高效、经济和易于使用 得益于性能逐渐强大的小型模型,从2022年11月至2024年10月,达到GPT-3.5同等表现的AI推理成本下降了超过280倍。在硬件方面,每年成本降低约30%,能效每年提升40%。同时,开源模型与闭源模型间的性能差距也迅速缩小,一年内从8%下降到1.7%。种种趋势正迅速降低人们使用高端AI的门槛。 8. 各国政府加强AI监管与投资 2024年,美国联邦机构出台了59项AI相关法规,较2023年翻了一倍以上,涉及的机构数量也增加了一倍。全球75个国家提及AI的立法数量自2023年增加了21.3%,自2016年以来增加了九倍。同时,各国政府在AI领域的投资规模显著:加拿大承诺投入24亿美元;中国推出475亿美元半导体专项资金;法国宣布投资1090亿欧元;印度承诺投资12.5亿美元;沙特的“超越计划”(Project Transcendence)投资高达1000亿美元。 9. AI与计算机科学教育迅速扩展,但普及与准备不足问题依然存在 全球有三分之二的国家已提供或计划提供中小学阶段计算机科学(CS)教育,较2019年增加了一倍,其中非洲和拉丁美洲的进展最快。美国计算机学科的本科毕业生人数在过去10年增长了22%。不过,非洲许多国家受基础设施如电力供应不足的限制,教育普及仍困难重重。在美国,81%的中小学计算机教师认为AI应纳入基础教育,但真正具备教学能力的不足一半。 10. AI产业高速发展,但领先优势缩小 2024年,近90%的重要AI模型由企业发布,远超2023年的60%,而高引用率的学术研究仍以学术界为主。模型规模仍在快速增长:训练算力每5个月翻一倍,数据集规模每8个月翻一倍,能源使用量每年翻一倍。然而,排名前列模型之间的性能差距不断缩小,排名第一与第十名的分数差距从11.9%缩减到5.4%,而前两名之间仅差0.7%。AI技术前沿竞争日益激烈,也日趋拥挤。 11. AI因对科学领域的影响而获重要奖项 AI在科学领域的重要性逐步获得认可:诺贝尔物理奖与化学奖分别表彰了深度学习领域的开创性工作及蛋白质折叠领域的AI应用,而图灵奖则奖励了强化学习的突破性成果。 12. AI仍难以解决复杂推理问题 尽管AI模型在国际数学奥林匹克竞赛类任务表现突出,但在PlanBench等复杂推理基准测试中仍表现欠佳。即便存在理论上的正确解法,模型通常无法稳定解决逻辑推理问题,限制了其在高风险、高精准要求环境下的有效性。
2025-04-14 21:14:45
2025-04-13 22:13:52
2025-04-13 14:27:57
2025-04-13 07:26:45