Agent Learning Daily Digest #18 — 2026-05-16

⚠️ 自动采集脚本超时（90s timeout，exit code 124），通过 HN Algolia API + delegate_task 浏览器验证补充。查询关键词：agent+LLM, coding+agent, MCP+context+engineering, Claude+Code, OpenAI+Codex。

今日高信号

1. Claude Code 大型代码库最佳实践（Anthropic 官方）

来源：https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start
HN：229 pts
关键内容：Anthropic 发布 "Claude Code at scale" 系列文章。核心观点：Claude Code 通过 agentic search（非 RAG）导航大型代码库。Harness 生态（CLAUDE.md、hooks、skills、plugins、MCP servers、LSP、subagents）比模型本身更重要。覆盖 C/C++/C#/Java/PHP 等非主流语言。

2. Codex 登陆 ChatGPT 移动端（OpenAI 官方）

来源：https://openai.com/index/work-with-codex-from-anywhere/
HN：467 pts（本周最高）
关键内容：Codex 已集成到 ChatGPT iOS/Android 应用，用户可以随时随地在手机上提交 coding task。同时发布 Codex Windows Sandbox 开源和 Running Codex Safely 安全白皮书。

3. Statewright — 可视化状态机护栏（⭐286）

来源：https://github.com/statewright/statewright
HN：122 pts
关键内容：用 Rust 实现的状态机 guardrails 框架，为 AI agent 提供确定性行为约束。支持 Claude 插件，有可视化编辑器。7 小时前仍在更新（80 commits）。

4. Clipboard Pattern — Agent 间结构化通信（深度论文）

来源：https://novaberg.de/papers/clipboard-pattern.html
HN：21 pts
关键内容：论证自然语言作为 agent 间通信协议是架构反模式（semantic drift、token 通胀、不可测试、审计差）。提出 Clipboard Pattern：共享 typed state object（TypedDict + LangGraph），agent 读写状态而非互发消息。

5. VS Code Coding Harness 架构（GitHub Copilot）

来源：https://code.visualstudio.com/blogs/2026/05/15/agent-harnesses-github-copilot-vscode
HN：3 pts
关键内容：VS Code 团队详解 coding harness 的三层架构——prompt assembly、tool declarations（文件编辑/终端/代码搜索）、agent loop（多轮 tool-calling 编排）。

6. Torrix — 自托管 LLM 可观测性（⭐12）

来源：https://github.com/torrix-ai/install
HN：59 pts
关键内容：自托管 LLM 可观测性平台，追踪每个 LLM request 的 token/cost/latency/全量 prompt trace。支持 16+ provider（OpenAI/Anthropic/Gemini/Groq/DeepSeek/Ollama 等）。不需要 Postgres/Redis，纯 Docker 部署。

7. Codex 迭代修复循环（OpenAI Cookbook）

来源：https://developers.openai.com/cookbook/examples/codex/build_iterative_repair_loops_with_codex
HN：6 pts
关键内容：OpenAI 官方 cookbook 教程——如何用 Codex 构建迭代修复循环（iterative repair loop）。agent 自动生成→测试→修复→再测试，直到通过。

8. LLM Browser Agent 指纹识别（arXiv）

来源：https://arxiv.org/abs/2605.14786
HN：2 pts
关键内容：论文 "Known By Their Actions: Fingerprinting LLM Browser Agents via UI Traces"。通过被动 JavaScript 捕获 agent 的 UI 操作时序，可以在 14 个前沿 LLM × 4 个 Web 环境中达到 96% F1 的模型识别准确率。

9. MCP 测试工具链（Manufact）

来源：https://manufact.com/blog/mcp-testing
HN：6 pts
关键内容：Manufact 发布 MCP 开发工具——HMR for MCP servers、Inspector with chat UI、一键 tunnel 到真实客户端（ChatGPT、claude.ai）、自动化跨客户端 browser-agent 测试。

10. Prempti — Falco 驱动的 Coding Agent 护栏（⭐46）

来源：https://github.com/falcosecurity/prempti
HN：3 pts
关键内容：基于 Falco 的 policy + visibility 层，监控 coding agent 行为。152 commits，7 小时前仍在更新。

11. Memweave — Markdown 记忆系统（⭐35）

来源：https://github.com/sachinsharma9780/memweave
HN：2 pts
关键内容：零基础设施、async-first 的 Python 库，将 agent 记忆存储为纯 Markdown 文件。在 LongMemEval-S 上达到 98% Recall-5。无需 LLM 调用，无需 API key。

12. Anthropic 将 Claude Code SDK / claude -p 移出订阅

来源：https://twitter.com/ClaudeDevs/status/2054610152817619388
HN：9 pts（相关讨论 Tell HN 10 pts）
关键内容：Anthropic 宣布从 6 月 15 日起，Claude Code 的非交互式用法（claude -p、SDK）将从订阅计划中移出，转向 API 计费。Microsoft 开始取消 Claude Code license。

观察清单

Harness 概念统一化：Anthropic（lean harness）、VS Code（coding harness）、社区（claude-code-harness ⭐866）都在用 harness 描述同一种架构——model + tool declarations + orchestration loop。
状态机护栏升温：Statewright 一周内从 ⭐87 → ⭐286，HN 122 pts，说明工程社区认可确定性约束优于 prompt guardrail。
Codex 移动端化：467 pts 是本周最高 HN 帖子，coding agent 从 CLI 扩展到手机。
Agent 记忆 Markdown 化：Memweave 和 Graft 都选择 Markdown/本地文件作为 agent 记忆载体，与我们的 Obsidian vault 方案方向一致。
Claude Code 定价变化：claude -p 移出订阅意味着自动化场景成本上升，社区反响强烈。