ARC-AGI-3测试打脸GPT-5.5与Opus 4.7:两款最强模型合计不足1分,人类满分100
ARC Prize公布ARC-AGI-3基准测试结果,GPT-5.5和Claude Opus 4.7均得分低于1%,而人类首次接触即达100%满分,引发AI是否真正智能的大讨论。
ARC Prize公布ARC-AGI-3基准测试结果,GPT-5.5和Claude Opus 4.7均得分低于1%,而人类首次接触即达100%满分,引发AI是否真正智能的大讨论。
Meta于5月1日完成对Assured Robot Intelligence的收购,该公司专注为机器人开发AI模型,使机器人能在复杂动态环境中理解和适应人类行为。
2026具身智能与人形机器人大会揭示产业落地三条主线:硬件开源+软件订阅、交钥匙生态、灵巧手/触觉/关节三大底层技术独立成赛道。
字节/美团/阿里/小米联合投资的自变量机器人将于5月25日发布基于世界统一模型WUM架构的WALL-B,首次让机器人无预编程完成复杂家庭任务。
本周GitHub周榜前10名有一半是围绕Claude Code开发的外挂工具和扩展项目,显示AI Coding工具生态正从「工具本身」转向「工具的工具」。
国家电网《2026年具身智能发展规划》计划采购8500台、投资68亿元,聚焦电力巡检/带电作业/应急救援/仓储四大场景,具身智能B端市场正式起量。
ARC-AGI-3失败事件引发深度反思:SOTA模型在SWE-bench等代码基准上的高分,更多依赖训练数据中的模式记忆而非真正推理,AI Coding能力存在高估风险。
国产AI芯片一季报集中发布:寒武纪亏损同比收窄,海光信息营收同比增60%,沐曦/摩尔线程多款产品规模出货,国产算力替代DeepSeek V4切换效应持续显现。