🤖 大模型
📡 AI 动态日报 · 第 N 期

2026年5月3日 AI 动态日报

📅 2026年5月3日 周日 📰 共 8 条精选
大模型具身智能AI Coding
01
大模型AI产业

ARC-AGI-3测试打脸GPT-5.5与Opus 4.7:两款最强模型合计不足1分,人类满分100

ARC Prize公布ARC-AGI-3基准测试结果,GPT-5.5和Claude Opus 4.7均得分低于1%,而人类首次接触即达100%满分,引发AI是否真正智能的大讨论。

02
具身智能AI产业

Meta完成收购机器人AI初创Assured Robot Intelligence,华人创始人领衔,加速人形机器人底层布局

Meta于5月1日完成对Assured Robot Intelligence的收购,该公司专注为机器人开发AI模型,使机器人能在复杂动态环境中理解和适应人类行为。

03
具身智能产业

人形机器人进入商业落地拐点:GEIA Asia大会揭示三大主线,硬件开源+软件订阅成主流

2026具身智能与人形机器人大会揭示产业落地三条主线:硬件开源+软件订阅、交钥匙生态、灵巧手/触觉/关节三大底层技术独立成赛道。

04
具身智能大模型

自变量5月25日发布全球首款世界统一模型机器人WALL-B,四大厂联合押注家庭具身智能

字节/美团/阿里/小米联合投资的自变量机器人将于5月25日发布基于世界统一模型WUM架构的WALL-B,首次让机器人无预编程完成复杂家庭任务。

05
AI Coding产业

GitHub周榜:Claude Code外挂工具霸榜前十,AI Coding生态进入「装配」时代

本周GitHub周榜前10名有一半是围绕Claude Code开发的外挂工具和扩展项目,显示AI Coding工具生态正从「工具本身」转向「工具的工具」。

06
具身智能产业

国家电网68亿采购8500台机器人,具身智能「B端特种场景」进入百亿市场

国家电网《2026年具身智能发展规划》计划采购8500台、投资68亿元,聚焦电力巡检/带电作业/应急救援/仓储四大场景,具身智能B端市场正式起量。

07
AI Coding大模型

ARC-AGI-3引出AI编程真相:SWE-bench刷榜靠模式记忆,真正泛化能力仍是鸿沟

ARC-AGI-3失败事件引发深度反思:SOTA模型在SWE-bench等代码基准上的高分,更多依赖训练数据中的模式记忆而非真正推理,AI Coding能力存在高估风险。

08
大模型产业

国产AI芯片Q1业绩密集出炉:寒武纪亏损收窄,海光信息营收增60%,「去CUDA化」加速

国产AI芯片一季报集中发布:寒武纪亏损同比收窄,海光信息营收同比增60%,沐曦/摩尔线程多款产品规模出货,国产算力替代DeepSeek V4切换效应持续显现。