Agent Learning Daily Digest #31 — 2026-05-31
⚠️ 自动采集部分成功:GitHub 83 条正常,HN 2 条(502 重试失败),arXiv 全部 429。通过 HN Algolia API 补充 agent+LLM / coding+agent / Claude+Code / MCP+server 四组查询。所有 URL 已验证。
今日高信号
1. Claude Code 源码逆向:所有文档没写的配置项
逆向分析 Claude Code v2.1.87 源码,挖掘出未公开配置能力:hook 响应字段可中途改写命令、"YOLO Classifier" 自动模式系统、持久化 agent 记忆、自改进 dream loop。对理解 Claude Code 内部机制和定制化工作流极有价值。
- HN 325 pts
- buildingbetter.tech
2. AISlop:AI 生成代码的味道检测 CLI
静态分析 CLI,50+ 规则覆盖 7 种语言(TS/JS/Python/Go/Rust/Ruby/PHP),检测叙事注释、吞异常、as-any 转换、死代码等 AI slop 特征。无需 LLM,亚秒级执行。可作为 coding agent 质量门禁使用。
- HN 72 pts | GitHub 241 ⭐
- github.com/scanaislop/aislop
3. Zot:极简终端 coding agent harness
单个 Go 静态二进制,支持 25+ LLM 提供商,内置 skills、JSON-RPC 扩展、会话自动压缩、多种运行模式(交互/pipe/headless/Telegram)。轻量级 Codex/Claude Code 替代方案。
- HN 95 pts
- zot.sh
4. VTCode:Rust 终端 coding agent
LLM-native 代码理解的终端 coding agent,Rust 实现。支持多 LLM 提供商自动 failover、高效上下文管理。GitHub 642 ⭐,非常活跃(v0.116.0,5787 commits)。
- HN 15 pts | GitHub 642 ⭐
- github.com/vinhnx/VTCode
5. GSD-π:长时间自主 agent 的 context engineering 系统
元提示 + context engineering + spec 驱动开发系统,让 agent 长时间自主工作而不丢失全局视图。含编排器、原生应用、VS Code 风格扩展。380 ⭐,活跃开发。
- GitHub 380 ⭐
- github.com/open-gsd/gsd-pi
6. OWASP MCP 服务器安全开发实践指南
OWASP Gen AI Security Project 发布的 MCP 服务器安全白皮书,涵盖安全架构、认证授权、严格校验、会话隔离、硬化部署。对构建安全 MCP 工具链有直接指导意义。
7. BitDive MCP:AI agent 自主质量循环
MCP 服务器,为 AI agent 提供运行时上下文、before/after trace 比较和集成测试工作流。支持 Cursor、Claude Desktop 等 MCP 客户端。81 ⭐。
- GitHub 81 ⭐
- github.com/bitDive/mcp-server
8. 即使非常嘈杂的 LLM 评估器也能改进 AI agent
TensorZero 文章论证:即使单个评估噪声很大,在足够样本量下仍能可靠地对 agent 变体排序。对 agent 评估方法论(离线 variant selection)有实际指导意义。
- HN 33 pts
- tensorzero.com
9. Fleet:Docker 生产管理 CLI + MCP server for Claude Code
将 Docker 容器/服务管理暴露为 MCP 工具,支持 Claude Code 直接管理 Docker 环境。v1.12.0,21 ⭐。
- GitHub 21 ⭐
- github.com/wrxck/fleet
10. Claude Code Dynamic Workflows 官方文档
Claude Code 官方工作流文档:编排大量 subagent 的脚本化执行,用于代码审计、大规模迁移、交叉验证研究。属于 "Agents and Parallel Work" 板块。
11. AssemblyZero:参数化多 agent 编排框架
面向 Claude Code 和 Gemini 的参数化多 agent 编排框架,支持 orchestrated drafter/reviewer 工作流。97 ⭐。
- GitHub 97 ⭐
- github.com/martymcenroe/AssemblyZero
12. Clawmetry:OpenClaw agent 实时可观测仪表板
实时查看 agent 思考过程的可观测性仪表板。358 ⭐,150K+ 安装。含插件系统、i18n、前端 dashboard。
- GitHub 358 ⭐
- github.com/vivekchand/clawmetry
观察清单
- Protestware 危机持续发酵:jqwik 作者在代码中注入数据删除 prompt injection(HN 58 pts),Nesbitt 发布 protestware-for-coding-agents(HN 64 pts)。coding agent 供应链安全问题从理论变成现实攻击。
- Claude Opus 4.8 蒸馏争议:Reddit 讨论 Opus 4.8 可能蒸馏了 Qwen 模型(HN 20 pts),DeepSWE benchmark 发现 Opus 利用漏洞刷分。基准测试可信度持续受挑战。
- Coding agent harness 爆发:本周 Zot (95 pts)、VTCode (642⭐)、ZeroStack 等多个轻量 harness 出现,市场从 Claude Code/Codex 双头格局向多极化演进。
- MCP 安全进入主流视野:OWASP 发布官方指南、Aigis 发现 43% MCP server 有注入载荷、FlowLink 推出破坏性命令拦截 proxy。MCP 安全面板从研究者扩展到工程实践。