Daily Digest - 2026-04-27
采集 95 条,筛选 5+3 条高信号。完整原料见 原始源。
今日高信号
1. Orca — 面向 Coding Agent 的下一代 IDE
- ⭐ 1718 · TypeScript · https://github.com/stablyai/orca
- 定位为 coding agent 原生 IDE,不再是人写代码、AI 辅助,而是 agent 驱动开发、人审查。
2. AgentOps — Coding Agent 的运维层
- ⭐ 313 · Go · https://github.com/boshu2/agentops
- 提供跨 session 的 Memory、validation、feedback loops。目标是让 coding agent 的能力在 session 之间累积。
3. CC-Viewer — Claude Code 实时上下文监控
- ⭐ 707 · JavaScript · https://github.com/weiesky/cc-viewer
- 捕获并可视化 Claude Code 的所有 API 请求/响应,实时监控 context window 使用情况。定位为 Vibe Coding 调试工具。
4. StepPO — 面向 Agentic RL 的步级策略优化
- arXiv · https://arxiv.org/abs/2604.18401v1
- 提出步级对齐的 RL 训练方法,专门针对 agent 多步工具调用场景。明确提及 OpenClaw 和 Claude Code 作为应用场景。
5. Cross-Session Threats — Agent 跨会话攻击基准
- arXiv · https://arxiv.org/abs/2604.21131v1
- 指出现有 agent 安全护栏是无状态的(单消息检测),攻击者可将 payload 分散到多个 session 中绕过检测。提出 CSTM-Bench 基准。
第二轮补充
6. cmux — AI Coding Agent 专用终端
- ⭐ 15481 · Swift · https://github.com/manaflow-ai/cmux
- 基于 Ghostty 的 macOS 终端,内置垂直标签页和 agent 通知。专为大模型 coding agent 设计的终端环境。
7. remnic — Agent 持久化记忆插件
- ⭐ 67 · TypeScript · https://github.com/joshuaswarren/remnic
- Local-first memory plugin,支持 OpenClaw、Hermes、Codex、Claude Code 等。LLM 驱动提取、纯 Markdown 存储、混合搜索(QMD)。
8. DryRUN — 公共测试在 LLM 代码生成中的作用
- arXiv · https://arxiv.org/abs/2604.21598v1
- 研究多 agent 代码生成框架如何依赖人工提供的公共测试用例来驱动调试和模拟循环。提出自动生成测试用例的方法。
9. SelfHeal — LLM Agent 的 Bug 修复模式实证研究
- arXiv · https://arxiv.org/abs/2604.17699v1
- 首个针对 LLM agent bug fix pattern 的实证研究,分析 Stack Overflow、GitHub Issues 和论坛数据。提取常见修复模式。
第三轮补充(晚间重采集)
10. SmolVM — Coding Agent 本地沙箱
- HN Show HN · https://news.ycombinator.com/item?id=47916293
- 一键启动隔离的 claude/codex 预装沙箱环境,agent 拥有完整权限但与宿主机隔离。解决 coding agent "press enter and accept changes" 的信任焦虑。
11. Dash — 六层上下文的自学习数据 Agent
- HN · https://github.com/agno-agi/dash
- 自学习数据 agent,将回答建立在 6 层上下文之上。Source: agno-agi(与 Agno 框架同源)。
12. Rethinking Scale — SLM 在 Agent 范式下的部署权衡
- arXiv · https://arxiv.org/abs/2604.19299v1
- 研究小模型(<10B 参数)在 agent 场景下的部署表现。发现 SLM 通过工具增强可部分弥补推理能力不足。