🤖 GPT-5.5 发布、Anthropic 算力大扩张、斯坦福年度报告揭示 AI 安全鸿沟
OpenAI 与 Anthropic 周决战升级;AI Agent 从实验走向规模化;斯坦福年度报告揭示"锯齿状智能"新概念
2026-05-18 00:00:00 +0000
使用 ← → 键或点击屏幕左右翻页
大模型
OpenAI 发布 GPT-5.5 与 ChatGPT Images 2.0,Codex 覆盖超 400 万用户
核心要点
OpenAI 正式发布 GPT-5.5 和 GPT-5.5 Pro,扩展 Codex 编程能力,并将其推广至移动端,用户可直接在手机上调用 AI 生成代码
ChatGPT Images 2.0 上线"思考模式",Workspace Agents 开启研究预览,Codex Chronicle 支持屏幕上下文记忆
Codex 已扩展至 NVIDIA 全公司部署,周活跃用户超 400 万,OpenAI 还开源了 Privacy Filter 模型
来源:
Tibor Blaho (X/Twitter), TechCrunch, The New York Times
产业合作
Anthropic 联手亚马逊建 5GW 超算集群,宣布 NEC 合作与 STEM Fellows 计划
核心要点
Anthropic 将与亚马逊的合作扩展至最高 5GW(5000兆瓦)算力规模,成为当前 AI 行业最大规模的算力投资之一
宣布与日本 NEC 达成合作,同时启动 STEM Fellows 计划培养下一代 AI 安全人才
在 Claude Code 中新增 /ultrareview 指令、内置记忆功能、Managed Agents 记忆支持,并确认对新专业用户启动小规模定价测试
来源:
Tibor Blaho (X/Twitter), Anthropic Official Blog
行业报告
斯坦福 HAI 发布《2026 AI 指数报告》:AI 能赢得奥赛金牌,却读不懂时钟
核心要点
报告用"锯齿状智能(Sawtooth Intelligence)"形容 AI 能力的不均衡分布:谷歌 Gemini 在奥数金牌35分,但顶尖模型读指针时钟正确率仅50.1%(人类90.1%)
AI 智能体完成现实计算机任务成功率从 12% 跃升至 66%,距人类水平差 6 个百分点;网络安全任务成功率从 15% 飙升至 93%
模型透明度断崖式下滑:基础模型透明度指数平均分从 58 分骤降至 40 分;xAI Grok 和 Midjourney 仅得 14 分(满分100),能力最强的模型披露却最少
来源:
斯坦福大学以人为本人工智能研究所(HAI)《2026 AI 指数报告》,新华网
AI Agent
AI Agent 规模化:从"3人管100个Agent"到学术论文自动化流水线
核心要点
OpenClaw 案例引发行业关注:3名员工管理100个AI Agent,月消耗130万美元,OpenAI买单——证明AI Agent在软件工程领域的规模化应用潜力
GitHub 开源项目 academic-research-skills(ARS)用 Claude Code 写论文全套流水线星标破 6.4k,涵盖文献检索到论文撰写全流程
AICon 上海站分享下一代 Agent 中枢架构,聚焦"最后一公里"问题:本地执行与全场景硬件接入,使 Agent 从建议者向自主执行者演进
来源:
AICon 上海站,GitHub, Juejin AI 新闻