Daily Digest - 2026-05-10

⚠️ 自动采集全部超时（GitHub/HN/arXiv 均 60s+ timeout），通过 Web 搜索补充。筛选 12 条高信号。本周核心主题：Microsoft Build + Google I/O 双驱动发布潮；MCP 成为工具调用标准共识；context engineering 正式替代 prompt engineering 话语权。

今日高信号

1. GitHub Copilot Agent Mode GA — 编码 agent 进入亿级用户

来源：https://github.blog/news-insights/product-news/github-copilot-agent-mode-ga-build-2026/
摘要：GitHub Copilot 的 Agent Mode 在 Microsoft Build 2026 正式 GA。支持自主规划、多文件编辑、测试迭代、MCP 工具连接。VS Code 原生集成。
为什么值得看：这是 coding agent 从 CLI/IDE 插件走向"亿级开发者默认体验"的标志事件。Agent Mode GA 意味着自主编码不再是实验性功能，而是生产力工具标准配置。对整个 coding agent 竞争格局有重塑效应。

2. Google Jules Coding Agent — 公开 Beta

来源：https://developers.googleblog.com/en/jules-coding-agent-public-beta/
摘要：Google Jules 异步 coding agent 从 waitlist 进入公开 beta。在 GitHub repo 内自动处理 issue、实现 feature，生成带完整上下文感知的 PR。
为什么值得看：Google 对 Devin/SWE-agent 的直接回应。异步工作模式（非实时对话）代表了 coding agent 的另一条产品路线——agent 作为后台 worker 而非交互式助手。

3. Codex CLI v0.9.5 — MCP Server 原生支持

来源：https://github.com/openai/codex/releases/tag/v0.9.5
摘要：OpenAI 开源 Codex CLI 新增原生 MCP Server 集成，允许连接外部工具服务器获取上下文和执行操作。同时改进沙箱安全。
为什么值得看：OpenAI 走向 MCP 验证了该协议的生态势头。三大 coding agent（Claude Code、Cursor、Codex）现在全部支持 MCP，工具调用标准之争基本结束。

4. Claude Code v1.0.37 — 记忆 + Hooks + 多 Workspace

来源：https://github.com/anthropics/claude-code/releases/tag/v1.0.37
摘要：Claude Code 新增持久化跨会话记忆（CLAUDE.md 自动加载）、生命周期 hooks（自定义动作触发）、多 root workspace 处理、大文件 diff 编辑优化。
为什么值得看：Memory + Hooks 是 coding agent 从"无状态工具"到"有状态的长期队友"的关键跃迁。与 Hermes 的 memory/skill 概念高度对齐，值得对比设计。

5. Anthropic "Building Effective Agents" — 官方架构指南

来源：https://www.anthropic.com/engineering/building-effective-agents
摘要：Anthropic 发布综合性 agent 架构工程指南，覆盖编排模式、工具使用设计、安全护栏、何时用 agent vs 简单 workflow。含 Claude Code 真实案例。
为什么值得看：来自 agent 平台方的权威架构参考。对 vibe coding agent 项目的架构决策有直接指导价值。待验证：具体编排模式和护栏设计细节。

6. Context Engineering 博文走红 — "AI 时代的核心技能"

来源：https://www.phillipding.com/blog/context-engineering
摘要：广泛传播的博文论证 context engineering 正在取代 prompt engineering 成为 AI 工程核心技能。覆盖检索策略、上下文窗口经济学和实用模式。
为什么值得看：CE 从学术概念到社区共识的转折点。与 Context Engineering wiki 页面高度相关，值得追踪引用和反驳。

7. LangGraph v0.4 — 流式 + 持久化 + 多 Agent 改进

来源：https://github.com/langchain-ai/langgraph/releases/tag/v0.4.0
摘要：LangGraph 大版本更新：一阶流式支持、Redis/Postgres 持久化后端、动态 agent 生成改进、多 agent 编排原语增强。
为什么值得看：LangGraph 仍是最流行的开源 agent 框架之一。v0.4 解决了状态管理和流式的核心痛点，值得评估是否适合 another-rule-engine 的编排层。

8. OpenAI Agents SDK v0.3 — Tracing + Handoffs + Guardrails

来源：https://github.com/openai/openai-agents-python/releases/tag/v0.3.0
摘要：OpenAI Agents SDK 新增分布式 tracing（本地 dashboard）、agent 间 handoff 模式改进、安全合规 guardrails 配置。
为什么值得看：SDK 正在逼近 LangGraph 的功能覆盖面，与 OpenAI 平台更紧密集成。Tracing 和 Guardrails 是生产部署的刚需。

9. Google ADK (Agent Development Kit) 开源

来源：https://github.com/google/adk-python
摘要：Google 开源 Agent Development Kit，Python 框架，原生支持 Gemini 模型，内置评估 harness 和 Google Cloud 部署。
为什么值得看：三大云厂商（Microsoft/GCP/Anthropic）现在各有 agent 框架。Google ADK 的评估 harness 设计值得关注，对 Coding Agent Evaluation 有参考价值。

10. OpenAI Red Teaming Agent — 自动化安全评估

来源：https://github.com/openai/red-teaming-agent
摘要：OpenAI 开源红队 agent，自动探测其他 AI agent 的安全漏洞、越狱路径和失败模式。含可配置攻击策略和报告生成。
为什么值得看：agent 越自主，安全评估越关键。这是第一个通用 agent 安全评估工具，与 Agent Safety 页面的 agent-airlock 互补——airlock 做防御，red-teaming 做进攻。

11. AgentSafetyBench — Agent 安全基准论文

来源：https://arxiv.org/abs/2505.06398
摘要：新基准评估 LLM agent 在 13 个安全关键场景的表现，包括工具滥用、数据泄露、对抗性操控。结果显示当前 agent 仍难以应对对抗操控。
为什么值得看：提供了 agent 安全的量化测量框架。与 OpenAI Red Teaming Agent 配合使用，一个测、一个攻。

12. MCP 官方 Servers 新增 Linear/Notion/Supabase 集成

来源：https://github.com/modelcontextprotocol/servers
摘要：MCP 官方 servers monorepo 48 小时内合并多个社区贡献：Linear（项目管理）、Notion（知识库）、Supabase（数据库/Auth）。
为什么值得看：MCP 工具生态在加速。Linear + Notion 意味着 coding agent 可以直接操作项目管理和文档系统，Supabase 则覆盖了数据库交互。三个都是 vibe coding agent 的常用工具链。

观察清单

Google I/O agent 相关发布：Jules + ADK 双发，Google 正式押注 agent 赛道
Microsoft Build agent 相关发布：Copilot Agent Mode GA 是本周最大新闻
"Context Engineering" 概念扩散：多个独立信源同时讨论，已成为 AI 工程社区共识词汇
MCP 标准化进程：Codex CLI 采纳 MCP 后，三大 coding agent 全部支持 MCP 协议