Loading...

文章背景图

Hermes Agent v0.13.0 发布:让 AI 真正把事做完

2026-05-09
1
-
- 分钟
|

Hermes Agent v0.13.0 发布:让 AI 真正把事做完

TL;DR: Hermes Agent v0.13.0(2026.5.7)一周内合并 588 个 PR、864 次提交、295 位贡献者,带来了持久化多智能体看板 /goal 目标锁定、Checkpoints v2 状态持久化重写、8 个 P0 安全修复(含 Discord CVSS 8.1 漏洞)、Google Chat 成为第 20 个平台、七语言国际化等重磅更新。

2026 年 5 月 7 日,NousResearch 发布了 Hermes Agent v0.13.0,代号 “The Tenacity Release” —— 专注于让 AI 真正完成它开始做的事。

一周之内:864 次提交 · 588 个 PR 合并 · 829 个文件变更 · 128,366 行新增代码 · 关闭 282 个 issues(其中 13 个 P0、36 个 P1)· 295 位贡献者。


1. 多智能体看板:把任务交给一个 AI 团队

这是 v0.13.0 最大的新功能模块。

Hermes Agent 一直以来都能用 delegate_task 单次委托任务,但 v0.13.0 把这件事做成了持久化的多人协作看板

核心机制:

心跳(Heartbeat)+ 回收(Reclaim)+ 僵尸检测(Zombie Detection)

Worker 进程在执行任务期间会定时发送心跳。如果一个 Worker 失联(崩溃、断连、超时),系统会自动把它"认领"的任务回收回队列,让其他 Worker 接手。僵尸检测则专门识别那些"看起来在跑但实际上已经死了"的孤儿进程。

幻觉门(Hallucination Gate)

这是最有趣的设计:当 Worker 声称自己完成了某个子任务,系统不会直接相信。它会要求 Worker 提供可验证的交付证据(文件路径、API 返回、commit hash 等),如果证据不足,任务不会被标记为完成,而是打回重做。

每个任务独立的 max_retries

之前重试次数是全局配置,v0.13.0 支持为每个卡片单独设置重试上限。

# 创建一个看板(多个 profile 协作)
hermes kanban create my-project --profiles worker-1,worker-2,orchestrator

# 在 dashboard 里拖拽卡片,或者用命令行
hermes kanban add "写 API 文档" --assign worker-1 --max-retries 2

一个进程,多个 profile,互不干扰地共同处理一个看板。官方文档称之为 “one install, many kanbans”

相关 PR:#17805、#19653、#20232、#20332、#21330、#21183、#21214


2. /goal 目标锁定:AI 不会忘记自己在做什么

你有没有过这种经历:让 AI 做一件复杂的事,中途问了一个其他问题,回来发现它已经忘了原本要做什么?

/goal 就是来解决这个问题的。

/goal 完成这个 PR 的代码审查,找出所有安全问题
# 然后你可以问任何其他问题
# AI 会一直记住这个目标,直到完成或你主动取消
/cancel_goal  # 取消目标锁定

官方把这项技术叫做 “Ralph loop”—— 以 OpenAI 研究员 Ralph Rosenberg 的工作命名,核心思想是给 LLM 一个长期的目标指令,让它在多轮对话中持续朝这个方向努力,而不是被短期上下文带偏。

一个典型的使用场景:代码审查 + 修复。AI 被锁定在"审查这个 PR"的目标上,你可以随时问它"现在审到哪了",或者让它"顺便把这些 typo 也修了",它会自己在审查主流程和临时任务之间切换。

相关 PR:#18262、#18275、#21287


3. Checkpoints v2:状态持久化重写

Hermes Agent 有状态持久化机制(会话历史、工具调用结果、上下文压缩快照),但在 v0.12.x 时期存在几个问题:

  • 孤儿 shadow repos:磁盘上残留了引用不到的 git 临时仓库

  • 无真实修剪:状态文件只增不减,长期运行后 state.db 膨胀严重

  • 缺少磁盘护栏:极端情况下(磁盘满、权限错误)没有优雅降级

Checkpoints v2 做了完整重写,核心改进:

  • 实现了真正的状态修剪(pruning),删除不再需要的旧快照

  • 增加了磁盘空间检查和权限校验

  • 解决了 shadow repo 孤儿问题

相关 PR:#20709


4. 安全大修复:8 个 P0 漏洞关闭

这是近年来最大规模的安全更新,一口气关闭了 13 个 P0 和 36 个 P1。

漏洞

严重性

说明

Discord 跨公会私信绕过

CVSS 8.1

DISCORD_ALLOWED_ROLES 限制被绕过,攻击者可向任意频道发送消息

秘密信息默认不脱敏

环境变量、API Key 等在日志中默认暴露

WhatsApp 陌生人消息未过滤

默认回复任何人,包括诈骗/骚扰消息

auth.json TOCTOU 窗口

凭证写入和读取之间存在竞态,可被恶意读取

MCP OAuth TOCTOU

OAuth 流程中凭证保存存在竞态条件

浏览器云元数据 SSRF

混合路由时未校验云平台元数据端点

hermes debug share 内容泄露

调试日志上传时未脱敏

Cron 提示词注入

定时任务的 system prompt 可被 skill 内容注入

Discord CVSS 8.1 漏洞尤其值得注意:攻击者可以通过构造特定请求,利用角色允许列表的逻辑漏洞,绕过 DISCORD_ALLOWED_ROLES 配置,向未授权频道发送消息。v0.13.0 将角色检查限定在发起请求的公会(guild)范围内,彻底关闭了这个跨公会攻击面。

相关 PR:#21193、#21241、#21291、#21176、#21194、#21228、#21350、#19318


5. Session 抗干扰:Gateway 重启后自动续接

之前如果 Gateway 在 AI 对话过程中重启,所有进行中的会话都会丢失。v0.13.0 改变了这一点:

  • /update 重启后会话自动恢复

  • 源文件重载后状态保持

  • 待处理的更新提示(/update 进度)跨重启保留

# Gateway 重启前
你好,帮我审查这个 2000 行的 PR
# [AI 正在思考中,Gateway 突然重启]
# 重启后,会话自动续上,AI 继续审查

相关 PR:#21192、#20160、#19271、#21206、#18222、#18193、#18215


6. no_agent 定时任务:纯脚本看门狗模式

之前的 cron 任务都是"派一个 AI agent 去执行",消耗 token、有延迟、有幻觉风险。

no_agent 模式让 cron 任务直接运行一个脚本,没有 AI 介入:

# cron job 配置
cron_jobs:
  - name: "监控磁盘空间"
    schedule: "*/5 * * * *"
    script: "check_disk.sh"
    no_agent: true
    deliver: "origin"  # 磁盘满时发送通知,正常时静默

关键行为:

  • 脚本 stdout 非空 → 发送通知

  • 脚本 stdout 为空 → 完全静默,不打扰

  • 非零退出码 → 错误告警

这对于基础设施监控、心跳检查、自动化巡检等场景非常有用。

相关 PR:#19709


7. Google Chat:第 20 个消息平台

v0.13.0 正式支持 Google Chat,成为 Hermes Agent 支持的第 20 个消息平台。

同时带来了通用平台插件钩子(generic platform-plugin hooks),允许第三方在不触碰核心代码的情况下开发新平台适配器。IRC 和 Microsoft Teams 已经迁移到这个新架构。

相关 PR:#21306、#21331


8. 国际化:7 个新语言

静态消息(CLI 输出、TUI、Dashboard)现在支持 7 种语言:

  • 中文(zh)

  • 日语(ja)

  • 德语(de)

  • 西班牙语(es)

  • 法语(fr)

  • 乌克兰语(uk)

  • 土耳其语(tr)

文档站点(Docusaurus)新增了 zh-Hans(简体中文) locale。

相关 PR:#20231、#20329、#20467、#20474、#20430、#20431


9. 其他重要更新

视频理解

新增 video_analyze 工具,支持 Gemini 等多模态模型直接理解视频内容。(@alt-glitch, PR #19301)

xAI 声音克隆

xAI Custom Voices 作为 TTS Provider 接入,支持声音克隆。(@alt-glitch, PR #18776)

MCP 协议升级

  • SSE 传输 + OAuth 转发

  • 图片结果正确渲染为 MEDIA 标签(之前会丢弃)

  • 管道空闲重试

  • 长生命周期等待的 keepalive

Providers 插件化

ProviderProfile ABC + plugins/model-providers/ 目录,第三方模型提供商可以像安装插件一样接入,不需要动核心代码。

[[as_document]] 指令

Skill 可以通过 [[as_document]] 强制让网关在支持的平台上以文档形式交付输出,而不是普通消息。

transform_llm_output 插件钩子

新的生命周期钩子,允许插件在 LLM 输出进入对话之前对其进行处理,可用于上下文窗口压缩或内容过滤。

Curator 新子命令

hermes curator archiveprunelist-archived,手动运行改为同步模式。

ACP /steer/queue

从 Zed、VS Code、JetBrains 可以直接 steering 在飞的 agent,或者排队后续指令。(@HenkDz, PR #18114)

TUI 改进

  • /model 选择器重新设计,支持内联认证

  • 启动 banner 可折叠(技能列表、system prompt、MCP 配置)

  • 状态栏显示上下文压缩计数

Dashboard 新功能

  • 插件管理页面(启用/禁用/认证状态)

  • Profiles 管理页面

  • 分析表格可排序列

  • default-large 新主题(18px 基准字号)

  • 支持 X-Forwarded-Prefix 反向代理

Web 工具拆分

搜索和提取分离:SearXNG 作为原生搜索后端,Web 工具现在可以为不同能力(search vs extract vs browse)选择不同后端。

6 个新可选 Skill

Shopify(Admin + Storefront GraphQL)、here.now、shop-app 个人购物助手、Anthropic 金融服务包、kanban-video-orchestrator、searxng-search。

5 个新模型

deepseek/deepseek-v4-prox-ai/grok-4.3openrouter/owl-alpha(免费)、tencent/hy3-preview、Arcee Trinity Large Thinking。


总结

v0.13.0 的代号 “Tenacity”(坚持)精准地概括了这个版本的主题:让 AI 真正完成它开始做的事

多智能体看板解决的是"任务分配后没人负责"的问题;/goal 解决的是"多轮对话中目标漂移"的问题;Checkpoints v2 解决的是"状态持久化有去无回"的问题;cron no_agent 解决的是"简单任务没必要浪费 token"的问题。

加上 8 个 P0 安全漏洞关闭、Google Chat 第 20 平台、七语言国际化,这个版本在可靠性、安全性和多语言可用性上都迈了一大步。

Stars: 139,286 · Forks: 21,513


项目

内容

作者

胡小纯

发布日期

2026-05-09

联系微信

hu–xiaochun

个人主页

https://胡小纯.cn

备用主页

https://胡小纯.cn/

技术没有捷径,但有方向

评论交流

文章目录