Agent Learning Daily Digest #21 — 2026-05-20
⚠️ 自动采集 GitHub 成功(84 条),但 HN(502)和 arXiv(429)均失败。通过 HN Algolia API 手动查询 5 组关键词 + delegate_task 批量浏览器验证 15 个 URL。
今日高信号
1. Forge — Guardrails 让 8B 模型在 Agentic 任务从 53% 跃至 ~87%(HN 174 pts)
- 来源:https://github.com/antoinezambelli/forge
- ⭐205(验证),Python,86.5% 综合准确率(26 场景评估套件)
- 关键:为自托管 LLM 的 tool-calling 提供可靠层——rescue parsing、retry nudges、step enforcement、VRAM-aware context budgets、tiered compaction。最佳配置(Ministral-3 8B Instruct Q8)在完整套件上得分 86.5%。
- HN 标题声称"53%→99%",实际 README 为 86.5%(含 76% 最难层级),有营销放大但项目真实。
2. Ruflo(原 Claude Flow)— ⭐53.2k Agent 编排平台持续爆发
- 来源:https://github.com/ruvnet/ruflo
- ⭐53,200(验证),TypeScript,6,515 commits,17 分钟前有提交
- 关键:多 agent AI 编排平台 for Claude Code——100+ 专业 agent 跨机器/团队/信任边界协调。Self-learning memory、federated comms、企业安全。从 "Claude Flow" 品牌升级为 "Ruflo"。
3. GSD-2 — Context Engineering Spec-Driven Agent 升级为真实 Coding Agent(⭐7.6k)
- 来源:https://github.com/gsd-build/gsd-2
- ⭐7,600(验证),TypeScript,6,582 commits,11 分钟前有提交
- 关键:从"viral prompt framework"进化为独立 CLI coding agent,基于 Pi SDK。支持在任务间清空 context、注入精确 context、编程式 session 管理。
4. Antirez EDIT Tool — CRC 校验和替代逐字匹配(6,304 阅读)
- 来源:https://antirez.com/news/166
- 作者:Salvatore Sanfilippo(Redis 创始人),DS4 项目
- 关键:提出 tag-based EDIT tool,用 4 字符 CRC 校验和替代 LLM 输出 old text verbatim。解决 agent 编辑代码时 token 浪费和定位偏差问题。DeepSeek v4 Flash 已采用类似机制。
5. Sieve — 扫描 Cursor/Claude 聊天记录中的泄露 API Key(HN 18 pts)
- 来源:https://apps.apple.com/us/app/sieve-secret-scanner/id6767409365?mt=12
- macOS 原生应用
- 关键:扫描本地 Cursor 和 Claude Code 聊天历史中的泄露密钥、token、密码。
6. Smallcode — 4B 模型跑出 87% Benchmark(⭐710)
- 来源:https://github.com/Doorman11991/smallcode
- ⭐710(验证),Rust "RTK (Rust Token Killer)" 组件 + 多语言
- 关键:为小 LLM 优化的 coding agent,声称 87% benchmark 得分,4B 活跃参数。当前版本 v0.6.14,包含 MarrowScript(repair/summarize/policy)。
7. LiteLLM Agent Platform — 自托管 Coding Agent 沙箱(⭐433)
- 来源:https://github.com/BerriAI/litellm-agent-platform
- ⭐433(验证),TypeScript/Python,683 commits,5 分钟前有提交
- 关键:在隔离沙箱中运行 Claude Code、Codex、Hermes 的自托管平台。Credential vault 代理——agent 在 bypass-permissions 下运行但永远看不到真实密钥。
8. AgentCRM — Headless CRM for Claude Code(⭐32, HN 14 pts)
- 来源:https://github.com/cluster-software/agent-crm
- ⭐32(验证),TypeScript,200 commits,10 branches,35 tags
- 关键:专为 Claude Code 设计的 headless CRM。包含 SDK + CLI。有 CLAUDE.md 集成文件。
9. Agent Airlock — 开源 Agent 防火墙(⭐6)
- 来源:https://github.com/sattyamjjain/agent-airlock
- ⭐6(验证),Python,75 commits,2,466 tests,83% 覆盖率
- 关键:一个 decorator 实现 agent 零信任控制。验证 tool calls、剥离 ghost arguments、类型安全、PII masking、RBAC、成本跟踪、沙箱隔离。适配 LangChain、OpenAI Agents SDK、PydanticAI、CrewAI。
10. Lapdog — Datadog 的 Claude Code 可观测性工具
- 来源:https://lapdog.datadoghq.com/
- Datadog 官方产品,brew/pip/Docker 安装
- 关键:LLM Observability for Claude Code——实时监控会话、trace/span 级别的成本和时长跟踪。非 coding agent 本身,而是可观测性工具。
11. LangChain DeepAgents — 电池全包的 Agent Harness(⭐23k)
- 来源:https://github.com/langchain-ai/deepagents
- ⭐23,000(验证),Python,1,923 commits,50 分钟前有提交
- 关键:LangChain 官方的"batteries-included agent harness"。552 branches,非常活跃。
12. SkillForge MCP — 通用 Skills 加载器 for Claude Code(⭐1)
- 来源:https://github.com/lyupro/skillforge-mcp
- ⭐1(验证),TypeScript,73 commits
- 关键:folder-agnostic skill loader for Claude Code、Codex CLI、任何 MCP 客户端。同时提供 Claude Code plugin 形态。
观察清单
| 项目 | 状态 | 下次关注 |
|---|---|---|
| Ruflo/Claude Flow(⭐53.2k) | 持续爆发,品牌升级 | 3 天 |
| GSD-2(⭐7.6k) | 进化为独立 CLI agent | 3 天 |
| Forge(⭐205, HN 174 pts) | 小模型 guardrails,高 HN 关注 | 2 天 |
| Smallcode(⭐710) | 4B 模型 + RTK token 压缩 | 3 天 |
| Antirez EDIT tool | 博客发文,CRC 校验和思路 | 已读完 |
| Agent Airlock(⭐6) | 轻量防火墙,2,466 tests | 5 天 |
| LiteLLM Agent Platform(⭐433) | Hermes 支持平台,沙箱 | 3 天 |
| SkillForge MCP(⭐1) | 与 Hermes skill 理念一致 | 5 天 |