🤖 GPT-5.5 发布、Anthropic 算力大扩张、斯坦福年度报告揭示 AI 安全鸿沟

OpenAI 与 Anthropic 周决战升级；AI Agent 从实验走向规模化；斯坦福年度报告揭示"锯齿状智能"新概念

2026-05-18 00:00:00 +0000

大模型

OpenAI 发布 GPT-5.5 与 ChatGPT Images 2.0，Codex 覆盖超 400 万用户

来源: Tibor Blaho (X/Twitter), TechCrunch, The New York Times

产业合作

来源: Tibor Blaho (X/Twitter), Anthropic Official Blog

行业报告

报告用"锯齿状智能（Sawtooth Intelligence）"形容 AI 能力的不均衡分布：谷歌 Gemini 在奥数金牌35分，但顶尖模型读指针时钟正确率仅50.1%（人类90.1%）
AI 智能体完成现实计算机任务成功率从 12% 跃升至 66%，距人类水平差 6 个百分点；网络安全任务成功率从 15% 飙升至 93%
模型透明度断崖式下滑：基础模型透明度指数平均分从 58 分骤降至 40 分；xAI Grok 和 Midjourney 仅得 14 分（满分100），能力最强的模型披露却最少

来源: 斯坦福大学以人为本人工智能研究所（HAI）《2026 AI 指数报告》，新华网

AI Agent

OpenClaw 案例引发行业关注：3名员工管理100个AI Agent，月消耗130万美元，OpenAI买单——证明AI Agent在软件工程领域的规模化应用潜力
GitHub 开源项目 academic-research-skills（ARS）用 Claude Code 写论文全套流水线星标破 6.4k，涵盖文献检索到论文撰写全流程
AICon 上海站分享下一代 Agent 中枢架构，聚焦"最后一公里"问题：本地执行与全场景硬件接入，使 Agent 从建议者向自主执行者演进

来源: AICon 上海站，GitHub, Juejin AI 新闻