Agent Learning Daily Digest #21 — 2026-05-20

⚠️ 自动采集 GitHub 成功（84 条），但 HN（502）和 arXiv（429）均失败。通过 HN Algolia API 手动查询 5 组关键词 + delegate_task 批量浏览器验证 15 个 URL。

今日高信号

1. Forge — Guardrails 让 8B 模型在 Agentic 任务从 53% 跃至 ~87%（HN 174 pts）

来源：https://github.com/antoinezambelli/forge
⭐205（验证），Python，86.5% 综合准确率（26 场景评估套件）
关键：为自托管 LLM 的 tool-calling 提供可靠层——rescue parsing、retry nudges、step enforcement、VRAM-aware context budgets、tiered compaction。最佳配置（Ministral-3 8B Instruct Q8）在完整套件上得分 86.5%。
HN 标题声称"53%→99%"，实际 README 为 86.5%（含 76% 最难层级），有营销放大但项目真实。

2. Ruflo（原 Claude Flow）— ⭐53.2k Agent 编排平台持续爆发

来源：https://github.com/ruvnet/ruflo
⭐53,200（验证），TypeScript，6,515 commits，17 分钟前有提交
关键：多 agent AI 编排平台 for Claude Code——100+ 专业 agent 跨机器/团队/信任边界协调。Self-learning memory、federated comms、企业安全。从 "Claude Flow" 品牌升级为 "Ruflo"。

3. GSD-2 — Context Engineering Spec-Driven Agent 升级为真实 Coding Agent（⭐7.6k）

来源：https://github.com/gsd-build/gsd-2
⭐7,600（验证），TypeScript，6,582 commits，11 分钟前有提交
关键：从"viral prompt framework"进化为独立 CLI coding agent，基于 Pi SDK。支持在任务间清空 context、注入精确 context、编程式 session 管理。

4. Antirez EDIT Tool — CRC 校验和替代逐字匹配（6,304 阅读）

来源：https://antirez.com/news/166
作者：Salvatore Sanfilippo（Redis 创始人），DS4 项目
关键：提出 tag-based EDIT tool，用 4 字符 CRC 校验和替代 LLM 输出 old text verbatim。解决 agent 编辑代码时 token 浪费和定位偏差问题。DeepSeek v4 Flash 已采用类似机制。

5. Sieve — 扫描 Cursor/Claude 聊天记录中的泄露 API Key（HN 18 pts）

来源：https://apps.apple.com/us/app/sieve-secret-scanner/id6767409365?mt=12
macOS 原生应用
关键：扫描本地 Cursor 和 Claude Code 聊天历史中的泄露密钥、token、密码。

6. Smallcode — 4B 模型跑出 87% Benchmark（⭐710）

来源：https://github.com/Doorman11991/smallcode
⭐710（验证），Rust "RTK (Rust Token Killer)" 组件 + 多语言
关键：为小 LLM 优化的 coding agent，声称 87% benchmark 得分，4B 活跃参数。当前版本 v0.6.14，包含 MarrowScript（repair/summarize/policy）。

7. LiteLLM Agent Platform — 自托管 Coding Agent 沙箱（⭐433）

来源：https://github.com/BerriAI/litellm-agent-platform
⭐433（验证），TypeScript/Python，683 commits，5 分钟前有提交
关键：在隔离沙箱中运行 Claude Code、Codex、Hermes 的自托管平台。Credential vault 代理——agent 在 bypass-permissions 下运行但永远看不到真实密钥。

8. AgentCRM — Headless CRM for Claude Code（⭐32, HN 14 pts）

来源：https://github.com/cluster-software/agent-crm
⭐32（验证），TypeScript，200 commits，10 branches，35 tags
关键：专为 Claude Code 设计的 headless CRM。包含 SDK + CLI。有 CLAUDE.md 集成文件。

9. Agent Airlock — 开源 Agent 防火墙（⭐6）

来源：https://github.com/sattyamjjain/agent-airlock
⭐6（验证），Python，75 commits，2,466 tests，83% 覆盖率
关键：一个 decorator 实现 agent 零信任控制。验证 tool calls、剥离 ghost arguments、类型安全、PII masking、RBAC、成本跟踪、沙箱隔离。适配 LangChain、OpenAI Agents SDK、PydanticAI、CrewAI。

10. Lapdog — Datadog 的 Claude Code 可观测性工具

来源：https://lapdog.datadoghq.com/
Datadog 官方产品，brew/pip/Docker 安装
关键：LLM Observability for Claude Code——实时监控会话、trace/span 级别的成本和时长跟踪。非 coding agent 本身，而是可观测性工具。

11. LangChain DeepAgents — 电池全包的 Agent Harness（⭐23k）

来源：https://github.com/langchain-ai/deepagents
⭐23,000（验证），Python，1,923 commits，50 分钟前有提交
关键：LangChain 官方的"batteries-included agent harness"。552 branches，非常活跃。

12. SkillForge MCP — 通用 Skills 加载器 for Claude Code（⭐1）

来源：https://github.com/lyupro/skillforge-mcp
⭐1（验证），TypeScript，73 commits
关键：folder-agnostic skill loader for Claude Code、Codex CLI、任何 MCP 客户端。同时提供 Claude Code plugin 形态。

观察清单

项目	状态	下次关注
Ruflo/Claude Flow（⭐53.2k）	持续爆发，品牌升级	3 天
GSD-2（⭐7.6k）	进化为独立 CLI agent	3 天
Forge（⭐205, HN 174 pts）	小模型 guardrails，高 HN 关注	2 天
Smallcode（⭐710）	4B 模型 + RTK token 压缩	3 天
Antirez EDIT tool	博客发文，CRC 校验和思路	已读完
Agent Airlock（⭐6）	轻量防火墙，2,466 tests	5 天
LiteLLM Agent Platform（⭐433）	Hermes 支持平台，沙箱	3 天
SkillForge MCP（⭐1）	与 Hermes skill 理念一致	5 天