Agent Learning Daily Digest #31 — 2026-05-31

⚠️ 自动采集部分成功：GitHub 83 条正常，HN 2 条（502 重试失败），arXiv 全部 429。通过 HN Algolia API 补充 agent+LLM / coding+agent / Claude+Code / MCP+server 四组查询。所有 URL 已验证。

今日高信号

逆向分析 Claude Code v2.1.87 源码，挖掘出未公开配置能力：hook 响应字段可中途改写命令、"YOLO Classifier" 自动模式系统、持久化 agent 记忆、自改进 dream loop。对理解 Claude Code 内部机制和定制化工作流极有价值。

静态分析 CLI，50+ 规则覆盖 7 种语言（TS/JS/Python/Go/Rust/Ruby/PHP），检测叙事注释、吞异常、as-any 转换、死代码等 AI slop 特征。无需 LLM，亚秒级执行。可作为 coding agent 质量门禁使用。

单个 Go 静态二进制，支持 25+ LLM 提供商，内置 skills、JSON-RPC 扩展、会话自动压缩、多种运行模式（交互/pipe/headless/Telegram）。轻量级 Codex/Claude Code 替代方案。

LLM-native 代码理解的终端 coding agent，Rust 实现。支持多 LLM 提供商自动 failover、高效上下文管理。GitHub 642 ⭐，非常活跃（v0.116.0，5787 commits）。

元提示 + context engineering + spec 驱动开发系统，让 agent 长时间自主工作而不丢失全局视图。含编排器、原生应用、VS Code 风格扩展。380 ⭐，活跃开发。

OWASP Gen AI Security Project 发布的 MCP 服务器安全白皮书，涵盖安全架构、认证授权、严格校验、会话隔离、硬化部署。对构建安全 MCP 工具链有直接指导意义。

MCP 服务器，为 AI agent 提供运行时上下文、before/after trace 比较和集成测试工作流。支持 Cursor、Claude Desktop 等 MCP 客户端。81 ⭐。

TensorZero 文章论证：即使单个评估噪声很大，在足够样本量下仍能可靠地对 agent 变体排序。对 agent 评估方法论（离线 variant selection）有实际指导意义。

将 Docker 容器/服务管理暴露为 MCP 工具，支持 Claude Code 直接管理 Docker 环境。v1.12.0，21 ⭐。

Claude Code 官方工作流文档：编排大量 subagent 的脚本化执行，用于代码审计、大规模迁移、交叉验证研究。属于 "Agents and Parallel Work" 板块。

面向 Claude Code 和 Gemini 的参数化多 agent 编排框架，支持 orchestrated drafter/reviewer 工作流。97 ⭐。

实时查看 agent 思考过程的可观测性仪表板。358 ⭐，150K+ 安装。含插件系统、i18n、前端 dashboard。

Protestware 危机持续发酵：jqwik 作者在代码中注入数据删除 prompt injection（HN 58 pts），Nesbitt 发布 protestware-for-coding-agents（HN 64 pts）。coding agent 供应链安全问题从理论变成现实攻击。
Claude Opus 4.8 蒸馏争议：Reddit 讨论 Opus 4.8 可能蒸馏了 Qwen 模型（HN 20 pts），DeepSWE benchmark 发现 Opus 利用漏洞刷分。基准测试可信度持续受挑战。
Coding agent harness 爆发：本周 Zot (95 pts)、VTCode (642⭐)、ZeroStack 等多个轻量 harness 出现，市场从 Claude Code/Codex 双头格局向多极化演进。
MCP 安全进入主流视野：OWASP 发布官方指南、Aigis 发现 43% MCP server 有注入载荷、FlowLink 推出破坏性命令拦截 proxy。MCP 安全面板从研究者扩展到工程实践。