🤖 GPT-5.5 发布、Anthropic 算力大扩张、斯坦福年度报告揭示 AI 安全鸿沟

OpenAI 与 Anthropic 周决战升级;AI Agent 从实验走向规模化;斯坦福年度报告揭示"锯齿状智能"新概念
2026-05-18 00:00:00 +0000
大模型

OpenAI 发布 GPT-5.5 与 ChatGPT Images 2.0,Codex 覆盖超 400 万用户

核心要点

  • OpenAI 正式发布 GPT-5.5 和 GPT-5.5 Pro,扩展 Codex 编程能力,并将其推广至移动端,用户可直接在手机上调用 AI 生成代码
  • ChatGPT Images 2.0 上线"思考模式",Workspace Agents 开启研究预览,Codex Chronicle 支持屏幕上下文记忆
  • Codex 已扩展至 NVIDIA 全公司部署,周活跃用户超 400 万,OpenAI 还开源了 Privacy Filter 模型
来源: Tibor Blaho (X/Twitter), TechCrunch, The New York Times
产业合作

Anthropic 联手亚马逊建 5GW 超算集群,宣布 NEC 合作与 STEM Fellows 计划

核心要点

  • Anthropic 将与亚马逊的合作扩展至最高 5GW(5000兆瓦)算力规模,成为当前 AI 行业最大规模的算力投资之一
  • 宣布与日本 NEC 达成合作,同时启动 STEM Fellows 计划培养下一代 AI 安全人才
  • 在 Claude Code 中新增 /ultrareview 指令、内置记忆功能、Managed Agents 记忆支持,并确认对新专业用户启动小规模定价测试
来源: Tibor Blaho (X/Twitter), Anthropic Official Blog
行业报告

斯坦福 HAI 发布《2026 AI 指数报告》:AI 能赢得奥赛金牌,却读不懂时钟

核心要点

  • 报告用"锯齿状智能(Sawtooth Intelligence)"形容 AI 能力的不均衡分布:谷歌 Gemini 在奥数金牌35分,但顶尖模型读指针时钟正确率仅50.1%(人类90.1%)
  • AI 智能体完成现实计算机任务成功率从 12% 跃升至 66%,距人类水平差 6 个百分点;网络安全任务成功率从 15% 飙升至 93%
  • 模型透明度断崖式下滑:基础模型透明度指数平均分从 58 分骤降至 40 分;xAI Grok 和 Midjourney 仅得 14 分(满分100),能力最强的模型披露却最少
来源: 斯坦福大学以人为本人工智能研究所(HAI)《2026 AI 指数报告》,新华网
AI Agent

AI Agent 规模化:从"3人管100个Agent"到学术论文自动化流水线

核心要点

  • OpenClaw 案例引发行业关注:3名员工管理100个AI Agent,月消耗130万美元,OpenAI买单——证明AI Agent在软件工程领域的规模化应用潜力
  • GitHub 开源项目 academic-research-skills(ARS)用 Claude Code 写论文全套流水线星标破 6.4k,涵盖文献检索到论文撰写全流程
  • AICon 上海站分享下一代 Agent 中枢架构,聚焦"最后一公里"问题:本地执行与全场景硬件接入,使 Agent 从建议者向自主执行者演进
来源: AICon 上海站,GitHub, Juejin AI 新闻