2026年5月3日 AI动态日报

01

大模型AI产业

ARC-AGI-3测试打脸GPT-5.5与Opus 4.7：两款最强模型合计不足1分，人类满分100

ARC Prize公布ARC-AGI-3基准测试结果，GPT-5.5和Claude Opus 4.7均得分低于1%，而人类首次接触即达100%满分，引发AI是否真正智能的大讨论。

02

具身智能AI产业

Meta于5月1日完成对Assured Robot Intelligence的收购，该公司专注为机器人开发AI模型，使机器人能在复杂动态环境中理解和适应人类行为。

03

具身智能产业

2026具身智能与人形机器人大会揭示产业落地三条主线：硬件开源+软件订阅、交钥匙生态、灵巧手/触觉/关节三大底层技术独立成赛道。

04

具身智能大模型

字节/美团/阿里/小米联合投资的自变量机器人将于5月25日发布基于世界统一模型WUM架构的WALL-B，首次让机器人无预编程完成复杂家庭任务。

05

AI Coding产业

本周GitHub周榜前10名有一半是围绕Claude Code开发的外挂工具和扩展项目，显示AI Coding工具生态正从「工具本身」转向「工具的工具」。

06

具身智能产业

国家电网《2026年具身智能发展规划》计划采购8500台、投资68亿元，聚焦电力巡检/带电作业/应急救援/仓储四大场景，具身智能B端市场正式起量。

07

AI Coding大模型

ARC-AGI-3失败事件引发深度反思：SOTA模型在SWE-bench等代码基准上的高分，更多依赖训练数据中的模式记忆而非真正推理，AI Coding能力存在高估风险。

08

大模型产业

国产AI芯片一季报集中发布：寒武纪亏损同比收窄，海光信息营收同比增60%，沐曦/摩尔线程多款产品规模出货，国产算力替代DeepSeek V4切换效应持续显现。