Agent Learning Daily Digest #32 — 2026-06-01

自动采集成功（117 条：GitHub 60 条，HN/arXiv 57 条，仅 2 条 FETCH ERROR）。同时通过 HN Algolia 补充 agent+LLM / coding+agent / Claude+Code 三组查询。delegate_task 2 批浏览器验证 12 URL，全部确认有效。

今日高信号

1. Zot — 单二进制 Go coding agent harness（166 stars，HN 101 pts）

Zot 是一个以单个静态 Go 二进制发布的终端 coding agent。支持 20+ LLM 提供商（Anthropic、OpenAI/Codex、DeepSeek、Gemini 等），提供 4 个内置工具（文件编辑、bash、glob/grep）、JSON-RPC 扩展系统、per-folder skills 和 session auto-compact。zot-answer 扩展可以让用户交互式回答 agent 的编号问题。

https://www.zot.sh
GitHub: https://github.com/patriceckhart/zot (166 stars, 275 commits)
HN 讨论: 101 pts, 78 comments

2. VTCode — Rust 终端 coding agent（655 stars，HN 16 pts）

VTCode 是用 Rust 编写的开源终端 coding agent，支持多 LLM 提供商自动 failover 和高效上下文管理。已有 5824 次 commit、436 个 release，非常成熟。有 Homebrew formula 和 shell completions。

GitHub: https://github.com/vinhnx/VTCode (655 stars)
HN: 16 pts, 4 comments

观察清单: Rust + 多提供商 failover 的架构可能在极端场景下有优势。5824 commits 的成熟度值得关注。

3. AISlop — AI 生成代码气味检测 CLI（271 stars，HN 72 pts）

AISlop 是一个确定性 CLI 工具（无需 LLM 运行时），检测 AI coding agent 留下的代码"气味"：叙事性注释、吞没的异常、as-any 类型转换、死代码、过大函数等。50+ 规则覆盖 7 种语言（TS、JS、Python、Go、Rust、Ruby、PHP）。也有 GitHub Action 和 VS Code 扩展。

GitHub: https://github.com/scanaislop/aislop (271 stars)
HN: 72 pts, 63 comments

4. Komi-learn — coding agent 持续记忆与自我改进（47 stars，HN 20 pts）

Komi-learn 为 AI coding agent 提供持续记忆和自我改进能力。自动学习用户工作方式并自动回忆，无需手动命令。支持 Claude Code 和 Codex。刚发布 v0.4.0。

GitHub: https://github.com/kurikomi-labs/komi-learn (47 stars)
HN: 20 pts

5. Claude Code Degraded Before Opus 4.8 — Marginlab SWE-Bench-Pro 监控

Marginlab 每日运行 SWE-Bench-Pro 基准测试。他们发现 Opus 4.7 在 Opus 4.8 发布前一周出现了统计学显著的 pass rate 下降（65% → 50%），恰好与 Claude Code CLI v2.1.150 安装时间吻合。工具调用激增 ~60%，输入 token 下降。v2.1.153 恢复，Opus 4.8 发布时达到 72%。

6. VS Code 官方解析 Coding Harness 架构

VS Code 团队发表博客详解 GitHub Copilot 的 coding harness 设计——LLM 与编辑器之间的中间层：上下文/提示组装、工具声明（文件编辑、终端、代码搜索、MCP 等）、工具执行和 agent loop 编排。这是 coding agent harness 架构的官方参考实现。

https://code.visualstudio.com/blogs/2026/05/15/agent-harnesses-github-copilot-vscode

7. TensorZero: 即使噪声很大的 LLM 评估器也有用于改进 agent

TensorZero 发文论证：虽然 LLM 评估器在单输出级别上噪声大且与真实结果弱相关，但在离线变体选择（选最佳 agent/prompt/model）时仍然有用——因为噪声在大量样本上会被平均掉。区分了 output-level correlation（不可靠）和 system-level correlation（可靠）。

https://www.tensorzero.com/blog/even-very-noisy-llm-evaluators-are-useful-for-improving-ai-agents/
HN: 35 pts, 9 comments

8. Thaw — 为 LLM 做 fork()（快照 + 跳过 prefill）

Thaw 可以快照一个运行中的 LLM session（权重 + KV cache + scheduler + prefix-hash）并实例化 N 个子进程，跳过 prefill。适用于 RL rollout、多 agent 推理和并行 coding agent。底层用 Rust 实现，Python 绑定。

GitHub: https://github.com/thaw-ai/thaw (5 stars)
HN: 3 pts

观察清单: "fork LLM" 概念新颖，类似操作系统 fork() 语义应用到 agent。如果成熟，可以大幅降低并行 agent 的成本。

9. Lite-Harness — 自托管 Cursor Agent（27 stars，HN 6 pts）

LiteLLM Labs 出品的统一 agent 服务器，可以同时运行 OpenCode、Claude Code、Codex 等 agent。支持 agent 记忆、Slack 集成、MCP 和 skills 系统。309 次 commit，非常活跃。

GitHub: https://github.com/LiteLLM-Labs/lite-harness (27 stars)

观察清单: "自托管 Cursor"概念值得追踪。与 Hermes 的多 agent 编排能力对比。

10. Agents CLI — 订阅制运行多个 coding agent（HN 6 pts）

Agents CLI 让用户在自己的订阅（而非 API 成本）上并行运行多个 coding agent（Claude Code、Codex、Gemini、Cursor、Copilot 等），支持账号轮换避免限额、agent pipeline 链式编排、版本固定和 MCP 同步。声称 4.3× 加速。

https://agents-cli.sh

11. Teaching tmux to Babysit Claude Code Agents

用 tmux 自定义变量 + Claude Code hooks 创建彩色状态指示器：amber = 被阻塞需关注、green = 完成、无色 = 工作中。通过 Nix/home-manager 配置。轻量级 agent 管理方案。

https://blog.angeloff.name/post/2026/05/29/teaching-tmux-to-babysit-my-claude-code-agents/

12. Autonomous LLM Agent Worms — 跨平台自主传播（arXiv）

首个系统分析文件型多 agent LLM 生态中持久蠕虫传播的框架。引入 SSCGV（自动源码图分析器）和 SRPO（抗摘要 payload 优化器）。演示了零点击自主传播和 3 跳跨平台传输。提出 RTW-A 防御机制。

https://arxiv.org/abs/2605.02812

观察清单

Agent harness 爆发期: Zot (Go)、VTCode (Rust)、ZeroStack (Rust)、Lite-Harness 等同时涌现，说明 coding agent harness 已成为独立品类
Protestware 持续发酵: jqwik 事件 (HN 63pts) 和 Nesbitt protestware (HN 72pts) 引发大量讨论，agent 安全层必须考虑供应链投毒
Claude Opus 4.8 蒸馏争议: Reddit/HN 上有讨论认为 Opus 4.8 可能蒸馏了 Qwen 模型，尚待验证
tmux 作为 agent 管理层: 轻量级 hook → 状态条模式正在流行