Agent Learning Daily Digest #36 — 2026-06-06

⚠️ 自动采集脚本超时（90s+ 无输出），通过 HN Algolia API 三组关键词（agent+LLM / coding+agent / Claude+Code）获取 120+ 条原始结果，去重筛选后 38 条入库，15 条经浏览器 URL 验证。今日以安全事件 + coding agent 架构 + 成本优化为高信号。

今日高信号

1. Miasma Worm — AI Coding Agent 供应链攻击（HN 21pts）

6 月 3 日 Miasma 蠕虫同时攻击 npm registry（57 个恶意包）和 GitHub 源仓库。攻击者向 icflorescu/mantine-datatable 等 5 个仓库推送 chore: update dependencies [skip ci] 提交，植入 .github/setup.js（4.3MB payload）。5 个触发器同时瞄准 Claude Code、Gemini CLI、Cursor、VS Code、npm test。同一指纹扩散到 120+ 仓库，包括 Microsoft Azure durabletask（1,718 stars）。攻击者使用窃取的 Microsoft 贡献者 PAT 并将提交回溯到 2020 年。

这是新的攻击类别：AI coding agent config injection。 开发者自己的工具被仓库中的恶意配置文件武器化。

🔗 https://safedep.io/miasma-worm-ai-coding-agent-config-injection/ 🏷️ #AgentSafety #SupplyChainAttack #ConfigInjection

2. CVE-Bench — LLM Agent 修复安全漏洞实测（HN 4pts）

Giovanni Gatti 用 5 个前沿模型（gpt-5.5, gpt-5.4-mini, gpt-5.4-nano, laguna-m.1, laguna-xs.2）测试修复 20 个真实 CVE。最佳解决率 50%（理想条件下 60%）。最危险的失败模式：补丁看起来正确且通过所有可见测试，但漏洞仍然存在——"规模化虚假信心"。 贵价模型与便宜替代品在统计上不可区分，成本差距最高 12 倍。覆盖 18 个 Python 项目、15 个 CWE 类别、CVSS 2.1-9.8。

🔗 https://giovannigatti.github.io/cve-bench/ 🏷️ #AgentEvaluation #SecurityBenchmark #CVE

3. Lowfat — 节省 91.8% LLM Token 的 CLI Filter（HN 131pts ⭐）

Rust CLI 工具，在命令输出喂给 LLM 之前剥离噪声。插件架构，已有 32 个版本（v0.6.8），263 stars。在 coding agent 工作流中，command output 是主要的 token 消耗源之一。Lowfat 把压缩前移到工具输出层，与 Coding Agent 成本优化直接相关。

🔗 https://github.com/zdk/lowfat 🏷️ #CostOptimization #TokenReduction #Rust

4. Lessons from Building Claude Code: How We Use Skills（Anthropic 官方）

Anthropic 官方博客，详述内部为 Claude Code 构建和扩展数百个 skills 的经验。9 个 skill 类别（library/API reference、product verification 等），强调 skills 不是"纯 Markdown 文件"——而是指令、脚本、资源的文件夹，带配置选项和动态 hooks。产品验证 skills 对输出质量的可衡量影响最大。 与 Hermes skill 系统设计直接对标。

🔗 https://claude.com/blog/lessons-from-building-claude-code-how-we-use-skills 🏷️ #ClaudeCode #Skills #AgentArchitecture

5. Sawtooth — 异步多层 Agent Memory 框架（HN 1pt）

异步分层记忆中间件，为 LLM agent 提供短/中/长期记忆管理。v0.2.0，74 commits，4 小时前仍有更新。带 benchmark、telemetry/event bus 集成、可观测性（Recall Explainability Traces）。与 Agent Memory 的多层设计方向一致。

🔗 https://github.com/HtooTayZa/sawtooth-memory 🏷️ #AgentMemory #HierarchicalMemory #Async

6. Lich — 每 Coding Agent 独立 Dev Stack 并行运行（HN 6pts）

Worktree 隔离的 dev stack 管理器，让多个 coding agent 在各自独立环境中并行工作。v0.4.0，84 commits，集成 Claude hooks、skills 系统、dashboard。多 agent 并行 + worktree 隔离正在从个人脚本变成产品形态——与 Daintree 方向类似但更轻量。

🔗 https://github.com/RPate97/lich 🏷️ #MultiAgent #WorktreeIsolation #ParallelAgents

7. Coding Agents 不需要更大 Memory，需要 Continuity（HN 1pt）

核心论点：coding agent 的问题不是记忆容量，而是连续性——跨 session 保持结构化项目状态的能力。区分 "memory items"（弱的、通用回忆）和 "continuity records"（强的、可执行交接：编辑了什么文件、跑了什么命令、结果如何、下一步做什么）。主张将连续性状态存储在代码仓库本身中。直接挑战当前 memory-based 的 agent 设计范式。

🔗 https://oldskultxo.substack.com/p/maybe-coding-agents-dont-need-a-bigger 🏷️ #AgentMemory #Continuity #SessionManagement

8. LLM Agent Performance 是分布式系统问题（HN 2pts）

FixBugs 团队将 agent 性能优化视为分布式系统工程：chunking、streaming、queues、token math、并发限制。关键洞察：TTFT（time-to-first-token）和 token throughput 是独立问题。朴素文件相关性搜索 50 个文件需要 10 分钟——必须用并行化和分布式系统思维来设计 agent 架构。

🔗 https://fixbugs.ai/blog/high-performance-ai-agents-distributed-systems 🏷️ #AgentArchitecture #DistributedSystems #Performance

9. Vibe Coding Is Dangerous, Agentic Engineering Isn't（HN 4pts）

Wes McKinney（Pandas 创始人、Apache Arrow 联合创始人）谈 agentic engineering vs vibe coding。四个维度：如何信任 AI 输出、知道什么不该建（cost-per-token）、agent 和生成代码的责任、agentic engineering 的未来。McKinney 已经运行了数千次 Claude Code / Codex / Gemini CLI session。

🔗 https://motherduck.com/blog/vibe-coding-dangerous-agentic-engineering-wes-mckinney/ 🏷️ #AgenticEngineering #VibeCoding #Philosophy

10. This Month in Agentic Coding: May 2026 Monthly Brief（HN 4pts）

全面月度总结：token 既变贵（前沿模型）又变便宜（开放权重）；5 个主要模型发布（Opus 4.8, Gemini 3.5 Flash 等）；Codex 和 Claude Code 新增 "persistence loop"；Google Antigravity 替代 Gemini CLI；Anthropic 移除 Claude Code 5 小时速率限制；Claude Code 新增 "workflows" 多 agent 编排功能；DeepSWE 新基准。人工撰写，非 AI 生成。

🔗 https://www.agenticcodingweekly.com/p/acw-monthly-brief-may-2026 🏷️ #MonthlyReview #AgenticCoding #Ecosystem

11. Relic — 面向远古系统的微型 Coding Agent（HN 2pts）

Felix Rieseberg 写的 C/C++ coding agent，目标是在古老操作系统和受限设备上运行。39 stars，含模拟器、测试、工具链。代表 coding agent 向更广泛平台扩展的趋势——不只跑在 Node/Python，也可以在 retro 环境工作。

🔗 https://github.com/felixrieseberg/relic 🏷️ #CodingAgent #RetroComputing #C++

12. Lazarus — 面向 Long-Horizon Task 的 Coding Agent（HN 1pt）

Terminal agent with persistent Python tools and carryover。关键设计：给模型一个长期存活的 Python workspace，当 token 用量过大时自动注入 carryover 注入并重置 chat history，但保持 Python 解释器存活。支持 Kimi/Moonshot、OpenAI、Anthropic、Google providers。对 Coding Agent 成本优化的 context window 管理有启发。

🔗 https://github.com/ExpressGradient/lazarus 🏷️ #LongHorizon #ContextManagement #CodingAgent

观察清单

Config Injection 成为新攻击面：Miasma Worm 证明 AI coding agent 的自动执行功能（SessionStart hooks、project rules、folder-open tasks）可被仓库级别的恶意配置武器化。安全防线必须从"运行时沙箱"扩展到"配置来源验证"。
Cost optimization 前移到工具层：Lowfat（131pts）、Cost.dev（35pts）、Headroom 都在把 token 节省从"模型总结后"移到"工具输出时"。这是 coding agent 成本控制的工程成熟信号。
Continuity vs Memory 范式辩论升温：多篇独立文章（Coding Agents Don't Need Memory、Agents Remember、PMB、Lazarus carryover）在讨论 coding agent 的跨 session 状态管理。
Agent 作为分布式系统：FixBugs 和 Stigmergy 文章都在用分布式系统概念（chunking、streaming、capability selection）重新框架 agent 架构设计。
Skills 成为 coding agent 核心原语：Anthropic 官方文章确认 skills 是 Claude Code 的核心扩展机制，与 Hermes 的 skill 系统设计高度对齐。