Hermes Agent v0.13.0 发布:让 AI 真正把事做完
TL;DR: Hermes Agent v0.13.0(2026.5.7)一周内合并 588 个 PR、864 次提交、295 位贡献者,带来了持久化多智能体看板 /goal 目标锁定、Checkpoints v2 状态持久化重写、8 个 P0 安全修复(含 Discord CVSS 8.1 漏洞)、Google Chat 成为第 20 个平台、七语言国际化等重磅更新。
2026 年 5 月 7 日,NousResearch 发布了 Hermes Agent v0.13.0,代号 “The Tenacity Release” —— 专注于让 AI 真正完成它开始做的事。
一周之内:864 次提交 · 588 个 PR 合并 · 829 个文件变更 · 128,366 行新增代码 · 关闭 282 个 issues(其中 13 个 P0、36 个 P1)· 295 位贡献者。
1. 多智能体看板:把任务交给一个 AI 团队
这是 v0.13.0 最大的新功能模块。
Hermes Agent 一直以来都能用 delegate_task 单次委托任务,但 v0.13.0 把这件事做成了持久化的多人协作看板。
核心机制:
心跳(Heartbeat)+ 回收(Reclaim)+ 僵尸检测(Zombie Detection)
Worker 进程在执行任务期间会定时发送心跳。如果一个 Worker 失联(崩溃、断连、超时),系统会自动把它"认领"的任务回收回队列,让其他 Worker 接手。僵尸检测则专门识别那些"看起来在跑但实际上已经死了"的孤儿进程。
幻觉门(Hallucination Gate)
这是最有趣的设计:当 Worker 声称自己完成了某个子任务,系统不会直接相信。它会要求 Worker 提供可验证的交付证据(文件路径、API 返回、commit hash 等),如果证据不足,任务不会被标记为完成,而是打回重做。
每个任务独立的 max_retries
之前重试次数是全局配置,v0.13.0 支持为每个卡片单独设置重试上限。
# 创建一个看板(多个 profile 协作)
hermes kanban create my-project --profiles worker-1,worker-2,orchestrator
# 在 dashboard 里拖拽卡片,或者用命令行
hermes kanban add "写 API 文档" --assign worker-1 --max-retries 2
一个进程,多个 profile,互不干扰地共同处理一个看板。官方文档称之为 “one install, many kanbans”。
相关 PR:#17805、#19653、#20232、#20332、#21330、#21183、#21214
2. /goal 目标锁定:AI 不会忘记自己在做什么
你有没有过这种经历:让 AI 做一件复杂的事,中途问了一个其他问题,回来发现它已经忘了原本要做什么?
/goal 就是来解决这个问题的。
/goal 完成这个 PR 的代码审查,找出所有安全问题
# 然后你可以问任何其他问题
# AI 会一直记住这个目标,直到完成或你主动取消
/cancel_goal # 取消目标锁定
官方把这项技术叫做 “Ralph loop”—— 以 OpenAI 研究员 Ralph Rosenberg 的工作命名,核心思想是给 LLM 一个长期的目标指令,让它在多轮对话中持续朝这个方向努力,而不是被短期上下文带偏。
一个典型的使用场景:代码审查 + 修复。AI 被锁定在"审查这个 PR"的目标上,你可以随时问它"现在审到哪了",或者让它"顺便把这些 typo 也修了",它会自己在审查主流程和临时任务之间切换。
相关 PR:#18262、#18275、#21287
3. Checkpoints v2:状态持久化重写
Hermes Agent 有状态持久化机制(会话历史、工具调用结果、上下文压缩快照),但在 v0.12.x 时期存在几个问题:
孤儿 shadow repos:磁盘上残留了引用不到的 git 临时仓库
无真实修剪:状态文件只增不减,长期运行后 state.db 膨胀严重
缺少磁盘护栏:极端情况下(磁盘满、权限错误)没有优雅降级
Checkpoints v2 做了完整重写,核心改进:
实现了真正的状态修剪(pruning),删除不再需要的旧快照
增加了磁盘空间检查和权限校验
解决了 shadow repo 孤儿问题
相关 PR:#20709
4. 安全大修复:8 个 P0 漏洞关闭
这是近年来最大规模的安全更新,一口气关闭了 13 个 P0 和 36 个 P1。
Discord CVSS 8.1 漏洞尤其值得注意:攻击者可以通过构造特定请求,利用角色允许列表的逻辑漏洞,绕过 DISCORD_ALLOWED_ROLES 配置,向未授权频道发送消息。v0.13.0 将角色检查限定在发起请求的公会(guild)范围内,彻底关闭了这个跨公会攻击面。
相关 PR:#21193、#21241、#21291、#21176、#21194、#21228、#21350、#19318
5. Session 抗干扰:Gateway 重启后自动续接
之前如果 Gateway 在 AI 对话过程中重启,所有进行中的会话都会丢失。v0.13.0 改变了这一点:
/update重启后会话自动恢复源文件重载后状态保持
待处理的更新提示(
/update进度)跨重启保留
# Gateway 重启前
你好,帮我审查这个 2000 行的 PR
# [AI 正在思考中,Gateway 突然重启]
# 重启后,会话自动续上,AI 继续审查
相关 PR:#21192、#20160、#19271、#21206、#18222、#18193、#18215
6. no_agent 定时任务:纯脚本看门狗模式
之前的 cron 任务都是"派一个 AI agent 去执行",消耗 token、有延迟、有幻觉风险。
no_agent 模式让 cron 任务直接运行一个脚本,没有 AI 介入:
# cron job 配置
cron_jobs:
- name: "监控磁盘空间"
schedule: "*/5 * * * *"
script: "check_disk.sh"
no_agent: true
deliver: "origin" # 磁盘满时发送通知,正常时静默
关键行为:
脚本 stdout 非空 → 发送通知
脚本 stdout 为空 → 完全静默,不打扰
非零退出码 → 错误告警
这对于基础设施监控、心跳检查、自动化巡检等场景非常有用。
相关 PR:#19709
7. Google Chat:第 20 个消息平台
v0.13.0 正式支持 Google Chat,成为 Hermes Agent 支持的第 20 个消息平台。
同时带来了通用平台插件钩子(generic platform-plugin hooks),允许第三方在不触碰核心代码的情况下开发新平台适配器。IRC 和 Microsoft Teams 已经迁移到这个新架构。
相关 PR:#21306、#21331
8. 国际化:7 个新语言
静态消息(CLI 输出、TUI、Dashboard)现在支持 7 种语言:
中文(zh)
日语(ja)
德语(de)
西班牙语(es)
法语(fr)
乌克兰语(uk)
土耳其语(tr)
文档站点(Docusaurus)新增了 zh-Hans(简体中文) locale。
相关 PR:#20231、#20329、#20467、#20474、#20430、#20431
9. 其他重要更新
视频理解
新增 video_analyze 工具,支持 Gemini 等多模态模型直接理解视频内容。(@alt-glitch, PR #19301)
xAI 声音克隆
xAI Custom Voices 作为 TTS Provider 接入,支持声音克隆。(@alt-glitch, PR #18776)
MCP 协议升级
SSE 传输 + OAuth 转发
图片结果正确渲染为
MEDIA标签(之前会丢弃)管道空闲重试
长生命周期等待的 keepalive
Providers 插件化
ProviderProfile ABC + plugins/model-providers/ 目录,第三方模型提供商可以像安装插件一样接入,不需要动核心代码。
[[as_document]] 指令
Skill 可以通过 [[as_document]] 强制让网关在支持的平台上以文档形式交付输出,而不是普通消息。
transform_llm_output 插件钩子
新的生命周期钩子,允许插件在 LLM 输出进入对话之前对其进行处理,可用于上下文窗口压缩或内容过滤。
Curator 新子命令
hermes curator archive、prune、list-archived,手动运行改为同步模式。
ACP /steer 和 /queue
从 Zed、VS Code、JetBrains 可以直接 steering 在飞的 agent,或者排队后续指令。(@HenkDz, PR #18114)
TUI 改进
/model选择器重新设计,支持内联认证启动 banner 可折叠(技能列表、system prompt、MCP 配置)
状态栏显示上下文压缩计数
Dashboard 新功能
插件管理页面(启用/禁用/认证状态)
Profiles 管理页面
分析表格可排序列
default-large新主题(18px 基准字号)支持
X-Forwarded-Prefix反向代理
Web 工具拆分
搜索和提取分离:SearXNG 作为原生搜索后端,Web 工具现在可以为不同能力(search vs extract vs browse)选择不同后端。
6 个新可选 Skill
Shopify(Admin + Storefront GraphQL)、here.now、shop-app 个人购物助手、Anthropic 金融服务包、kanban-video-orchestrator、searxng-search。
5 个新模型
deepseek/deepseek-v4-pro、x-ai/grok-4.3、openrouter/owl-alpha(免费)、tencent/hy3-preview、Arcee Trinity Large Thinking。
总结
v0.13.0 的代号 “Tenacity”(坚持)精准地概括了这个版本的主题:让 AI 真正完成它开始做的事。
多智能体看板解决的是"任务分配后没人负责"的问题;/goal 解决的是"多轮对话中目标漂移"的问题;Checkpoints v2 解决的是"状态持久化有去无回"的问题;cron no_agent 解决的是"简单任务没必要浪费 token"的问题。
加上 8 个 P0 安全漏洞关闭、Google Chat 第 20 平台、七语言国际化,这个版本在可靠性、安全性和多语言可用性上都迈了一大步。
Stars: 139,286 · Forks: 21,513
技术没有捷径,但有方向