Agent Learning Digest — 2026-05-01
采集 94 条。5 月 1 日 09:00 的 Hermes cron 已启动,但模型调用返回“访问量过大”,未写入 vault;本次为手动补跑采集后整理。筛选 12 条高信号。
今日高信号
1. openai/codex — 终端里的轻量 Coding Agent
- 来源:https://github.com/openai/codex
- 规模:⭐79217 · Rust
- 摘要:OpenAI 的轻量级 coding agent,运行在 terminal 中。它代表 coding agent 从 IDE 插件走向 CLI/本地开发循环的主流方向。
- 为什么值得看:Codex 的形态适合拆解 coding agent 的最小闭环:读仓库、规划、编辑、执行命令、测试、回滚。
2. NousResearch/hermes-agent — 本地长期运行 Agent
3. stagewise — 面向 Web 开发的浏览器内 Coding Agent
4. deepagents — LangGraph Agent Harness
- 来源:https://github.com/langchain-ai/deepagents
- 规模:⭐22076 · Python
- 摘要:LangChain/LangGraph 的 agent harness,内置 planning tool、filesystem backend 和 subagent 生成能力。
- 为什么值得看:它把复杂任务需要的 planning、文件系统状态、subagent 编排变成框架级能力,是 LangGraph 生态的重要参考。
5. get-shit-done — Context Engineering + Spec-Driven Development
- 来源:https://github.com/gsd-build/get-shit-done
- 规模:⭐59087 · JavaScript
- 摘要:Claude Code 的 meta-prompting、context engineering、spec-driven development 系统。
- 为什么值得看:它解决的是长任务不跑偏的问题:用 roadmap、phase、plan、state 等文件持续约束 agent。
6. agent-systems-handbook — Agent 系统实践手册
7. Andrej Karpathy: From Vibe Coding to Agentic Engineering
8. CARE — 三方协作的 Agent 工程方法论
- 来源:https://arxiv.org/abs/2604.28043v1
- 摘要:Collaborative Agent Reasoning Engineering,提出由领域专家、开发者、LLM helper agents 共同参与的 agent 工程方法。
- 为什么值得看:它把 agent 构建从 trial-and-error 提升到阶段化工程流程,强调行为规格、grounding、工具编排和验证。
9. Contextual Agentic Memory is a Memo, Not True Memory
10. Schema-Grounded Memory — 从非结构化回忆到系统记录
11. TDD Governance for Multi-Agent Code Generation
- 来源:https://arxiv.org/abs/2604.26615v1
- 摘要:把经典 TDD 的 Red-Green-Refactor 作为多 agent 代码生成的 prompt-level/process-level 约束,而不是把测试当辅助输入。
- 为什么值得看:适合研究 coding agent 的治理层:如何让 agent 遵守开发纪律,而不是只靠模型自觉。
12. Agentic AI in the Software Development Lifecycle
- 来源:https://arxiv.org/abs/2604.26275v1
- 摘要:综述 agentic AI 对软件开发生命周期的影响,讨论 Claude Code、OpenAI Codex CLI、Jules、Devin、OpenHands、SWE-agent、MetaGPT、ChatDev 等系统。
- 为什么值得看:这是理解 coding agent 从补全工具升级为 repo/feature/algorithm 级协作者的综述材料。
观察清单