Loading...

文章背景图

Hermes Agent 详解:会自我进化的 AI 助手

2026-04-22
3
-
- 分钟
|

TL;DR: Hermes Agent 是 Nous Research 出品的开源 AI 助手框架,最大特点是有内置学习循环——它会从对话中创建技能、在使用中自我改进、跨会话记住你的偏好。它不是一个聊天机器人包装,而是一个跑得越久越聪明的自主代理。支持任意 LLM 端点、飞书/微信等 15+ 消息渠道、按需休眠的部署模式,可以跑在 $5 VPS 上。


它是什么

Hermes Agent 不是又一个聊天机器人套壳。

它是 Nous Research(就是做了 Hermes、Nomos、Psyche 模型那家实验室)出品的自改进 AI 代理。核心定位是:你的 AI 助手应该会自己学习和成长,而不是每次对话都从零开始。

大多数 AI 助手——不管接了多少 API、接了什么渠道——本质上都是"你问它答"。关掉对话窗口,它就什么都不记得了。下次打开,是个全新的助手。

Hermes Agent 想解决的是这个问题:让 AI 助手在多次会话中建立持久记忆和技能,像人一样越用越熟练


核心特性一览

特性

说明

内置学习循环

自动创建技能、自我改进、持久记忆

记忆系统

FTS5 全文搜索 + LLM 摘要 + Honcho 用户建模

消息渠道

README 基础版 6 个(CLI/Telegram/Discord/Slack/WhatsApp/Signal);官方文档支持 15+ 含飞书/微信

模型支持

Nous Portal / OpenRouter(200+)/ GLM / Kimi / MiniMax / OpenAI / 任意自定义端点

部署方式

本地 / Docker / SSH / Daytona / Singularity / Modal(按需休眠)

技能系统

agentskills.io 开放标准,自动创建的技能存本地

安全机制

DM 白名单、配对码审批、审计日志

按需计费

Modal/Daytona 环境休眠时idle不收费

从 OpenClaw 迁移

✅ 官方一键迁移工具


安装:一条命令搞定

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

支持 Linux、macOS、WSL2、Android(Termux)。Windows 不原生支持,需要装 WSL2。

装完之后:

hermes              # 进入交互式 CLI
hermes model        # 选择 LLM 提供商和模型
hermes tools        # 配置启用的工具
hermes config set   # 设置配置项
hermes gateway      # 启动消息网关(接 Telegram/Discord 等)
hermes setup        # 运行完整设置向导
hermes claw migrate # 从 OpenClaw 迁移(如果你在用的话)

内置学习循环:它的核心差异化

这是 Hermes Agent 和其他框架本质不同的地方。

记忆的四个层次

第一层:每次对话的自动摘要

对话结束后,Agent 用 LLM 生成这段对话的核心内容摘要。这个摘要不是给你看的,是给未来的自己看的。下一次对话,Agent 可以检索这些摘要,理解"之前我们聊过什么"。

第二层:FTS5 全文检索

摘要存入 SQLite FTS5 数据库,支持自然语言查询。你问"上次我们讨论的那个 Python 异步问题",Agent 能搜到相关记忆并关联上下文。

第三层:自动创建技能

当你在对话中完成了一个复杂任务(配置服务器、写一个完整的脚本、搭建一个项目),Agent 会自动把操作流程存成技能(Skill)。下次遇到类似任务,它可以直接调用,甚至在调用过程中继续优化这个技能。

第四层:Honcho 用户建模

Honcho 是塑料实验室(Plastic Labs)做的一个方言式用户建模项目。它会持续学习你的偏好:你的写作风格、常用技术栈、沟通习惯、语气特点。简单说,它在建立一个越来越像你的用户模型。

技能自我改进

这是最有趣的部分。

技能(Skills)不是一次性创建的。它会在每次调用时记录效果:如果这次调用很好地解决了问题,技能得到强化;如果效果不好,Agent 会在下一次主动优化这个技能的步骤。

# 查看自动创建的技能
ls ~/.hermes/skills/autogen/
​
# 查看技能内容
cat ~/.hermes/skills/autogen/my-nginx-setup.md

记忆系统详解

文件结构

~/.hermes/
├── memory/
│   ├── index.fts5          # 全文检索索引
│   └── sessions/           # 按会话整理的记忆片段
├── skills/
│   ├── autogen/            # Agent 自动创建的技能
│   └── installed/           # 手动安装的技能
├── honcho/                 # 用户建模数据
├── config.yaml             # 配置文件
└── logs/                   # 操作日志

记忆工作流

你: "帮我搭一个 Docker + Nginx 的 Web 服务"
         │
         ▼
   ┌─────────────┐
   │  执行任务    │  ← Agent 调用工具完成部署
   └──────┬──────┘
          │
          ▼
   ┌─────────────┐
   │ 生成摘要    │  ← LLM 生成这段对话的核心内容
   └──────┬──────┘
          │
          ▼
   ┌─────────────┐
   │ 存入 FTS5   │  ← 持久化到本地数据库
   └──────┬──────┘
          │
          ▼
   ┌─────────────┐
   │ 创建技能    │  ← 操作流程被存为可复用技能
   └─────────────┘
​
下一次你说:"再搭一个,,这次用 HTTPS"
         │
         ▼
   Agent 搜到之前的记忆 + 调用 Docker-Nginx 技能
         │
         ▼
   更快地完成任务,并可能改进这个技能

记忆的局限性

需要诚实说清楚几点:

  • 记忆质量依赖底层模型:如果模型能力弱,摘要和检索的质量都会受影响

  • 自动创建的技能有时会碎片化:Agent 可能为一次性的操作创建一个技能,导致技能库膨胀

  • 黑盒程度比 OpenClaw 高:你不能直接打开文件看它记住了什么(虽然 FTS5 可以查)

  • 跨技能关联需要手动:多个技能之间的依赖关系,Agent 不会自动维护


消息渠道:15+ 平台

支持的消息平台:

CLI(默认)
├── 即时通讯:Telegram · Discord · Slack · WhatsApp · Signal
├── 邮件/短信:Email · SMS
├── 国内平台:DingTalk · Feishu(飞书)· WeCom(企业微信)
├── Apple:BlueBubbles(iMessage)
└── 智能家居:Home Assistant

飞书支持已确认——官方文档有完整的平台对比表,Feishu/Lark 的 Voice、Images、Files、Threads、Reactions、Typing、Streaming 全部打✅,集成度并不低。

⚠️ 更正:我之前写的《OpenClaw vs Hermes》对比文章里,有一处错误——说 Hermes 不支持飞书。这是错的,特此更正。Hermes 支持飞书,支持情况良好。


模型支持:真正的自由

支持的提供商

提供商

说明

Nous Portal

Nous Research 自家平台

OpenRouter

200+ 模型,按量计费

GLM(智谱)

国产模型,中文支持好

Kimi / Moonshot

月之暗面模型

MiniMax

中文模型,支持语音

OpenAI

GPT-4 / GPT-3.5

Anthropic

Claude 系列

自定义端点

任何 OpenAI-compatible API

切换模型的命令

# 交互式选择
hermes model
​
# 直接指定
hermes model openrouter:anthropic/claude-3-5-sonnet
hermes model nous:portal/gamma
hermes model kimi:moonshot-v1-128k
hermes model minimax:abab6-chat

最大的好处是:运行时切换,不需要改配置文件,不需要重启进程


部署方式

六种终端后端

后端

适用场景

本地

开发调试

Docker

生产环境隔离

SSH

远程机器

Daytona

托管环境(按需休眠)

Singularity

HPC/GPU 集群

Modal

按需计费(空闲休眠不收费)

这是 Hermes Agent 最有成本优势的地方。

传统方式:你在 VPS 上跑 AI 助手,不管有没有人问,机器都得开着,按月付租金。

Modal 方式:

空闲状态:Agent 环境完全休眠 → 不收费
收到消息:自动唤醒 Agent → 开始计费
计费方式:按实际使用时间算,精确到秒

理论上,你可以用 $5/month 的 Modal 用量跑一个全天候的 AI 助手。空闲时不产生费用,只有在处理消息时才会收费。

对于不想维持一台固定 VPS、又想 24 小时在线的人来说,这个模式很有吸引力。

最低配置需求

Modal:免费额度起步,按用量计费
VPS:$5/month 的小鸡可跑
本地:Python 3.11+,无 GPU 也行(用 API)
GPU 集群:支持,想跑本地模型也行

技能系统

技能是什么

技能(Skills)是 Agent 可以调用的一段程序化记忆。它不是 prompt,是有结构的操作步骤

# 示例:一个技能的简化结构
name: docker-nginx-deploy
description: 使用 Docker 和 Nginx 部署 Web 服务
steps:
  1. 创建 Docker network
  2. 启动 Nginx 容器
  3. 配置反向代理
  4. 申请 Let's Encrypt 证书
triggers:
  - "部署 web 服务"
  - "用 nginx 跑一个站点"

技能的来源

自动创建:Agent 在完成复杂任务后自动生成,存在 ~/.hermes/skills/autogen/

手动安装:通过 agentskills.io 开放市场安装

# 搜索技能
hermes skills search <keyword>

# 安装技能
hermes skills install <skill-name>

# 查看已安装技能
hermes skills list

从 OpenClaw 迁移

# Hermes 能识别 OpenClaw 的 skills 格式并导入
hermes claw migrate --import-skills

agentskills.io 开放标准

Hermes 支持 agentskills.io 定义的技能标准。这意味着:

  • OpenClaw 的技能可以被 Hermes 使用(格式兼容)

  • 技能可以在不同框架之间迁移

  • 社区可以共享和贡献技能


安全机制

Hermes 的安全模型围绕「不信任任何未授权用户」设计。

DM 白名单 / 配对码

默认策略:所有非白名单用户都会被拒绝。两种配置方式:

方式一:白名单

FEISHU_ALLOWED_USERS=ou_xxxxxxxx,ou_yyyyyyyy
TELEGRAM_ALLOWED_USERS=123456789,987654321

方式二:配对码审批

未授权用户首次 DM 会收到配对码,管理员审批后才放行:

hermes pairing approve telegram XKGH5N7P   # 审批
hermes pairing list                          # 查看待审批
hermes pairing revoke telegram 123456789     # 撤销权限

配对码 1 小时过期,有频率限制。

审批工作流

高风险操作可配置为需要审批:

hermes approvals list    # 查看待审批
hermes approvals approve <id>
hermes approvals deny <id>

可配置级别:

  • none:完全信任

  • tool_call:每次工具调用都审批

  • high_risk:只审批高风险操作(删除文件、发送外部请求等)

审计日志

hermes logs                    # 查看最近操作
hermes logs --filter tool      # 只看工具调用
hermes logs --export json      # 导出 JSON

日志内容:时间戳、操作类型、输入参数、执行结果、关联会话 ID。


从 OpenClaw 迁移

如果你已经在用 OpenClaw,迁移成本很低。

# 方式一:交互式迁移向导
hermes claw migrate

# 方式二:预览迁移内容(不实际执行)
hermes claw migrate --dry-run

# 方式三:只迁移用户数据,跳过密钥
hermes claw migrate --preset user-data

# 方式四:覆盖已有冲突文件
hermes claw migrate --overwrite

会迁移的内容:

内容

说明

SOUL.md

助手人格定义

MEMORY.md

长期记忆

USER.md

用户信息

Skills

用户创建的技能

消息平台配置

Telegram、Discord 等 bot token

API 密钥

可选

TTS 资产

语音相关文件

AGENTS.md

工作区指令

迁移完成后,你的 Hermes Agent 会以相似的人格和记忆启动,不需要从零开始重建。


实际使用体验

适合的场景

想让 AI 自我成长——你不想手动维护 MEMORY.md,希望 AI 自动记住你说过的重点、你的偏好、你的工作习惯。

预算敏感——你想在 $5 VPS 上跑,或者用 Modal 按需计费模式(空闲休眠不收费)。

需要灵活切换模型——你想试验不同的模型,随时切换,不想改配置重启。

在用 OpenClaw 但想要学习循环——直接迁移,零成本切换。

不适合的场景

需要飞书/微信深度集成——如果需要飞书云盘 API、微信支付这类深度功能,目前 OpenClaw 集成更深。

习惯文件透明——OpenClaw 的记忆在 .md 文件里,你可以随时打开看。Hermes 的记忆在 FTS5 数据库里,检索方便但不能直接编辑。

想要开箱即用的产品体验——OpenClaw 的 Onboarding 流程更完善,配对 App、Canvas、Control UI 这些功能是它特有的。


和 OpenClaw 的关系

Hermes Agent 明确支持从 OpenClaw 迁移,OpenClaw 是 Hermes 官方推荐的「上一代」方案。

但这两者不是替代关系,更像是互补:

OpenClaw → 你管理,文件透明,渠道覆盖广
Hermes Agent → AI 自动进化,更灵活,按需计费

你完全可以同时跑两个:

  • Hermes Agent 做主力 AI(自我学习 + 灵活模型)

  • OpenClaw 接飞书/微信(渠道独占)

  • HybridClaw 做团队层(审批流 + 审计)


总结

Hermes Agent 的核心价值是内置学习循环。它不是帮你管理助手,而是帮你养一个会成长的 AI。

当你用它的时间越长,它就越了解你。它的技能库会越来越大,记忆会越来越准,回答会越来越贴合你的风格。这在其他框架里需要你手动维护的东西,它自己在做。

代价是:比 OpenClaw 更高的黑盒程度,对模型能力的依赖,以及更陡的学习曲线(毕竟是 Python 技术栈,配置比 npm 安装复杂一点)。

如果你想认真做一个长期使用的 AI 助手,Hermes Agent 值得投入。


项目

内容

作者

胡小纯

发布日期

2026-04-14

联系微信

hu–xiaochun

个人主页

https://胡小纯.cn

备用主页

https://xn–yets91feqb.cn/

技术没有捷径,但有方向

评论交流

文章目录