Agent Learning Daily Digest #53 — 2026-06-25

今日高信号:meta-harness 范式集中爆发(Omnigent、peerd、Build A Harness)、coding agent 安全维度扩展(SkillSpector、Lingering Authority、Intent-Governed Authorization)、Bayesian 控制器为工具编排引入不确定性建模、人类审查 AI 代码的习惯化效应实证。

今日高信号

1. Omnigent — 开源 AI Agent 框架与 Meta-Harness

Omnigent 是一个开源 meta-harness,可编排 Claude Code、Codex、Cursor、Pi 及自定义 agent,核心卖点是不重写 harness 即可切换、统一策略/沙箱执行、跨设备实时协作。GitHub 4.7k+ stars,活跃维护。由 Databricks 团队发布,被视为 meta-harness 范式的参考实现。

2. peerd — 浏览器原生 AI Agent Harness(HN 53 points)

peerd 是首个完全运行在浏览器内的 AI agent harness:以 Chrome/Firefox 扩展形式存在,agent loop 直接驱动浏览器标签页,可启动沙箱化计算(JS notebook、WASM Linux VM、客户端应用),构建产物通过 P2P 共享。BYOK、无后端、无遥测。设计哲学接近"浏览器即 OS for agents"。

3. HALO (context-labs/halo) — 分层 Agent Loop 优化器(HN 24 points)

HALO(Hierarchical Agent Loop Optimizer)是一个本地 agent trace 调试/优化工具,针对 agent loop 的分层优化。GitHub 971 stars,活跃开发。注意:HN 标题描述为 "RLM-based local debugger for AI agent traces",但仓库实际定位为分层 loop 优化器。

4. Bayesian Control for Coding Agents — 编排即序贯假设检验

论文提出将 coding agent 的工具调用编排形式化为 cost-sensitive sequential hypothesis testing:一个 Bayesian 控制器维护对候选正确性的 belief,动态决定是否收集更多证据、精炼候选、验证或停止。跨 6 个生成器和 9 个工具的实验表明,该框架在保持质量的同时显著降低工具成本。直接启发 coding-agent-harness 的编排层设计。

5. Strands Agents Harness SDK — 生产级 Agent Harness 端到端 SDK

AWS Strands Agents 团队的 harness-sdk,定位"构建 agent harness 并端到端控制它"。开源 SDK,支持 Python & TypeScript,any model, any cloud。GitHub 6.3k stars,极度活跃(commit 13 分钟前)。代表 harness 工程化进入 SDK 标准化阶段。

6. ESAA-Conversational — 跨 Agent 事件溯源记忆层

论文提出 ESAA-Conversational,一个事件溯源(event-sourced)记忆层,解决多 LLM coding agent 之间的"对话状态漂移"问题:当开发者在 Codex、Grok、Claude Code 等不同 agent 间切换时,目标、决策、待办和理由无法可靠传递。通过将对话持久化为事件流,实现跨 agent 的连续性、交接和策展。

7. DeepDiscovery — 工业级大仓库的任务级上下文恢复

论文提出两阶段 Location–Inference 框架,先定位高密度相关代码区域,再推理任务级上下文路径。解决了现有 RAG 方法只返回局部碎片、无法恢复完整任务上下文的问题。对 Context Engineering 中的仓库级上下文构建有直接参考价值。

8. Detecting AI Coding Agents in Open Source — 1.8 亿仓库普查

论文提出多层检测框架,整合配置文件扫描、commit message 分析、作者身份匹配和 bot 签名查找,在 World of Code(1.8 亿+ Git 仓库)中检测 AI coding agent 的痕迹。发现单一方法只能捕获一小部分活动,多方法融合必不可少。将 agent 痕迹分为四种行为类型。对理解 agent 在开源供应链中的真实渗透率有重要意义。

9. NVIDIA SkillSpector — Agent Skills 安全扫描器

NVIDIA 官方发布的 agent skills 安全扫描器,检测漏洞、恶意模式和代码安全风险。定位类似 SAST for agent skills。GitHub 10.3k stars。与 agent-skill-security 高度相关。

10. meta_skill — 本地优先的 AI Coding Agent 技能管理平台

Dicklesworthstone/meta_skill 提供本地优先的 skill 管理平台:双重 SQLite+Git 持久化、语义搜索、bandit 优化推荐、MCP 集成。GitHub 176 stars。与 Claude Code Skills 和 skill manager 项目蓝图直接相关。

11. AgentLens — 多轮 Coding Agent 的可解释安全转向

论文提出 AgentLens,通过机制可解释性子空间(mechanistic subspaces)对多轮 coding agent 进行安全转向(safety steering)。现有安全机制主要依赖外部 guardrails,难以在执行期间进行细粒度行为控制。AgentLens 在模型内部识别安全相关子空间,在不牺牲任务完成能力的前提下实现更细粒度的安全干预。包含 MAS benchmark。

12. DeusData/codebase-memory-mcp — 代码库知识图谱 MCP Server

高性能代码智能 MCP server,将代码库索引为持久化知识图谱,平均仓库毫秒级索引。支持 158 种语言、亚毫秒查询、99% token 节省。单静态二进制,零依赖。GitHub 14.1k stars。与 CodeGraph 和仓库级 Context Engineering 直接相关。

观察清单

主题 信号强度 说明
Meta-harness 范式 🔴 极强 Omnigent (4.7k★)、peerd、Strands harness-sdk (6.3k★)、Build A Harness、Theta-spec 同日涌现,meta-harness 正成为独立品类
Agent 安全与能力控制 🟡 中强 AgentLens 机制可解释性安全转向 + SkillSpector (10.3k★) 延续昨日热度
工具编排不确定性建模 🟡 中强 Bayesian control 论文将编排建模为假设检验,值得关注
跨 Agent 记忆层 🟡 中强 ESAA-Conversational 事件溯源解决多 agent 间对话状态漂移
Agent 开源渗透普查 🟡 中强 1.8 亿仓库多方法检测框架,揭示真实 agent 痕迹
仓库级上下文恢复 🟡 中强 DeepDiscovery + codebase-memory-mcp (14.1k★),仓库理解成 MCP 标准能力