Agent Learning Daily Digest #40 — 2026-06-09
原始数据:271 unique items (95 GitHub + 85 HN + 46 arXiv + Reddit),仅 3 个 FETCH ERROR(GitHub 403 rate limit)。HN Algolia 补充 coding agent / Claude Code / agent LLM 关键词查询。
今日高信号
1. Headroom:LLM 上下文压缩利器(⭐ 18.8k)
GitHub Trending 第一。将 tool 输出、日志、文件、RAG chunks 压缩 60-95% 后再送入 LLM,答案质量不变。提供 library、proxy、MCP server 三种接入方式。对 vibe coding agent 项目的 token 成本优化有直接参考价值。
- 🔗 https://github.com/chopratejas/headroom
- 来源:GitHub Trending/python | ⭐ 14,272 stars this period
2. CodeGraph:预索引代码知识图谱(⭐ 44.8k)
为 Claude Code、Codex、Gemini、Cursor、OpenCode、AntiGravity、Kiro、Hermes Agent 提供本地预索引的代码知识图谱。大幅减少 token 消耗和 tool call 次数。核心思路是将代码结构预先索引为图谱,agent 只需查询图谱而非反复读取源文件。
- 🔗 https://github.com/colbymchenry/codegraph
- 来源:GitHub Trending/typescript | ⭐ 8,661 stars this period
3. Lathe:用 LLM 学习新领域,而非跳过它(HN 377 points)
HN 本周爆款。不是让 AI 替你完成工作,而是让你通过 AI 深入理解一个新领域。理念与 Claude Code 的 "See-Act-Correct" 三阶段模型高度契合。
- 🔗 https://github.com/devenjarvis/lathe
- 来源:HN Algolia: agent LLM | 377 points
4. Harness Engineering:OpenAI 官方长文(HN 295 points)
OpenAI 发布的 Harness Engineering 长文,阐述在 agent-first 世界中如何利用 Codex。讨论 agent harness(技能、工具、工作流)的工程方法论。与 Hermes 的 skill 系统理念高度一致。
- 🔗 https://openai.com/index/harness-engineering/
- 来源:HN Algolia: agent harness | 295 points, 202 comments
5. Jane Street:用 Claude Code 设计,超越 Figma(HN 307 points)
Jane Street 技术博客,作者分享已从 Figma 切换到 Claude Code 做设计。实际案例展示了 AI 辅助设计工作流的成熟度。对 agent 项目 UI 原型制作有启发。
- 🔗 https://blog.janestreet.com/i-design-with-claude-code-more-than-figma-now-index/
- 来源:HN Algolia: Claude Code | 307 points
6. MalSkillBench:首个恶意 Agent Skill 基准(arXiv)
第一个 runtime-verified 的恶意 agent skill 基准。3,944 个恶意 skill,覆盖 108 个攻击类型。发现代码注入验证率 94.5%,prompt 注入仅 75.8%。对 coding agent 安全有直接指导意义。
- 🔗 https://arxiv.org/abs/2606.07131v1
- 来源:arXiv: all:"coding agent" | 2026-06-05
7. Socratic-SWE:自进化 Coding Agent(arXiv)
闭环自进化框架:复用 agent 自身失败轨迹生成训练任务。三轮迭代后在 SWE-bench Verified 上达到 50.40%。核心贡献是将任务分布与 agent 弱点对齐,而非随机生成。
- 🔗 https://arxiv.org/abs/2606.07412v1
- 来源:arXiv: all:"coding agent" | 2026-06-05
8. RHO:回顾性 Harness 优化(arXiv)
仅用历史轨迹自监督优化 agent harness(skill + tool + workflow),无需标注数据。单轮优化将 SWE-Bench Pro 从 59% 提升到 78%。对 Hermes 的 skill 迭代机制有参考价值。
- 🔗 https://arxiv.org/abs/2606.05922v1
- 来源:arXiv: all:"AI agent" | 2026-06-04
9. ECC:Agent Harness 性能优化系统(⭐ 211k)
为 Claude Code、Codex、OpenCode、Cursor 等提供 skill、instinct、memory、security 优化。GitHub 星标数极高的 agent harness 生态项目。
- 🔗 https://github.com/affaan-m/ECC
- 来源:GitHub Trending | ⭐ 10,207 stars this period
10. Perplexity 研究:AI Agent 重塑知识工作(arXiv)
基于 Perplexity 搜索与计算机产品的生产数据。Computer 模式每会话自主工作 26 分钟 vs Search 模式 33 秒;任务完成时间从 269 分钟降至 36 分钟(87% 缩短);用户开始尝试更高阶、跨职能的复合任务。
- 🔗 https://arxiv.org/abs/2606.07489v1
- 来源:arXiv: all:"AI agent" | 2026-06-05
11. Miasma Worm 再次攻击微软:AI Coding Agent 供应链安全
Miasma 蠕虫通过 GitHub 仓库注入恶意配置攻击 AI coding agent,导致 72+ 仓库被禁用。包括 Azure Functions 在内的微软项目受到影响。对 agent 安全防护有警示意义。
- 🔗 https://www.stepsecurity.io/blog/miasma-worm-hits-microsoft-again-azure-functions-action-and-72-other-repositories-disabled-after-supply-chain-attack-targeting-ai-coding-agents
- 来源:HN Algolia: coding agent | 3 points
12. Declarative Skills 论文:自然语言 Skill 文件的实证研究(arXiv)
对比 declarative agent(skill file + LLM 自主决策)vs imperative state machine vs 无脚手架基线。发现检索质量是关键瓶颈;在高质量检索下,declarative skill 在流程任务上持续提升准确率。直接验证了 Hermes skill 系统的设计方向。
- 🔗 https://arxiv.org/abs/2606.06923v1
- 来源:arXiv: all:"AI agent" | 2026-06-05
观察清单
- Token 压缩成为新赛道:Headroom(60-95% 压缩)、CodeGraph(预索引减少 tool call)都在解决同一问题——上下文窗口的效率。未来 agent 成本竞争的核心可能不在于模型本身,而在于 harness 的 token 效率。
- Harness Engineering 概念升温:OpenAI 官方发文、RHO 论文、ECC 项目,三方同时聚焦 agent harness 的优化方法论。这不再只是社区实践,正在成为系统工程。
- Agent 安全从理论走向实战:Miasma Worm 攻击微软、MalSkillBench 基准发布、Reddit 讨论 Claude Code 后门风险——agent 供应链安全问题正在加速显现。
- "Do agents.md help coding agents?" 在 HN 引发 51 points 讨论(rasbt 发起),同时出现 arXiv 论文和 "Evolution of my AGENTS.md" Show HN。AGENTS.md 作为 agent 配置层正在被系统研究。