Hermes Agent v0.11.0 发布：「接口革命」背后的 1556 次提交与 AI Agent 新范式 - 胡小纯

TL;DR： 4月23日，Nous Research发布Hermes v0.11.0，含1556个提交、761个PR，带来React/Ink TUI、Transport架构、AWS Bedrock、GPT-5.5及插件系统大升级。

一、项目现状：11.4 万 Star 的社区怪物

在深入技术细节之前，有必要先了解 Hermes Agent 当前的规模和影响力。

指标	数据
GitHub Star	113,763
Forks	16,597
Open Issues	6,630
主编程语言	Python
创建时间	2025 年 7 月 22 日
官方网站	hermes-agent.nousresearch.com

从 2025 年 7 月创建到今天不到一年时间，Hermes 已经成为开源 AI Agent 领域最受关注的项目之一。其增长曲线与同期的 OpenAI Agents SDK、LangGraph 等项目相比毫不逊色——而它的差异化在于：一个项目同时做基础设施（Agent 框架）、用户界面（CLI/Messenger）、记忆系统（Memory）、技能系统（Skills）和消息网关（Gateway），且全部开源。

二、版本演进脉络：从 v0.5.0 到 v0.11.0

在分析 v0.11.0 之前，有必要回顾近一个月来的版本节奏，理解每个版本的定位：

版本	日期	代号	核心主题
v0.5.0	3/28	加固版	Nous Portal 400+ 模型、Hugging Face 推理提供者、Telegram 私人话题、50+ 安全修复
v0.6.0	3/30	多实例版	Profile 多实例、MCP Server 模式、Docker 容器、飞书/企微集成
v0.7.0	4/3	弹性版	可插拔内存提供者、凭证池轮换、Camofox 反检测浏览器
v0.8.0	4/8	智能版	后台任务自动通知、免费小米 MiMo v2 Pro、GPT/Codex 自优化指导
v0.9.0	4/13	泛在版	移动端 Termux、iMessage/WeChat、Web Dashboard、Fast Mode
v0.10.0	4/16	工具网关版	Nous Tool Gateway（无需 API Key 的工具访问）
v0.11.0	4/23	接口革命版	Ink TUI、Transport ABC、AWS Bedrock、QQBot、GPT-5.5

可以看出，团队采用了一种「积木式」开发策略：每个版本解决一个层面的问题，然后在上层版本中将所有能力整合到一起。v0.11.0 正是这个策略的集大成者——它整合了前几个版本中分散交付的功能，并通过架构重构为下一阶段的增长奠定了基础。

三、核心亮点深度解析

3.1 新 Ink TUI：命令行界面的 React 革命

以前的 TUI 有什么问题？

传统的 Hermes CLI 交互界面基于标准的终端输出，存在几个长期痛点：

交互延迟高：每次响应都是一个完整文本块，无法看到流式输出过程
难以处理复杂布局：代码高亮、Markdown 渲染、多选菜单在纯终端中体验差
无法保留输入状态：输入长命令时界面会「跳变」
跨会话可复制性差：SSH 环境下无法方便地复制输出内容

新 TUI 的技术架构

v0.11.0 用 React + Ink 完全重写了交互界面，架构如下：

┌─────────────────────────────────┐
│        ui-tui (React/Ink)       │  前端：React + Ink 组件库
│  ┌─────────────────────────────┐ │
│  │ src/entry.tsx (TTY gate)    │ │  检测是否为 TTY，决定走新 TUI 还是旧模式
│  │ src/app.tsx (state machine) │ │  应用主状态机
│  │ src/app/event-handler/      │ │  事件处理
│  │ src/app/slash-handler/      │ │  斜杠命令处理
│  │ src/app/stores/             │ │  状态存储（zustand 风格）
│  │ src/app/hooks/              │ │  自定义 hooks
│  │ src/branding.tsx            │ │  品牌/标题组件
│  │ src/markdown.tsx            │ │  Markdown 渲染
│  │ src/thinking.tsx            │ │  思考过程显示
│  └─────────────────────────────┘ │
└─────────────────────────────────┘
              │ JSON-RPC
              ▼
┌─────────────────────────────────┐
│     tui_gateway (Python RPC)    │  后端：Python JSON-RPC 服务
│  - _SlashWorker (subprocess)    │  斜杠命令在独立子进程中执行
│  - complete.slash RPC           │  斜杠命令自动补全
│  - complete.path RPC            │  路径自动补全
└─────────────────────────────────┘

关键技术选型说明：

Ink：Ink 是一个用 React 开发 CLI 程序的框架，由 Vercel 团队维护。它让 React 开发者可以用熟悉的范式构建 TUI，产出的二进制文件没有 Node.js 依赖
JSON-RPC：前后端通过 JSON-RPC 协议通信，后端是 Python，这样既利用了 React 的 UI 能力，又保持了 Hermes 原生 Python 代码的复用
OSC-52 剪贴板支持：这是实现 SSH 环境下复制粘贴的关键协议，让 TUI 的内容可以通过终端的 OSC-52 序列复制到系统剪贴板

新 TUI 功能一览：

功能	说明
Sticky Composer	输入框在滚动时保持固定，不会消失
流式输出	实时显示 Token 生成过程（而非等待完成）
OSC-52 剪贴板	SSH 会话中也能复制输出内容
稳定的选择器快捷键	选择列表项的编号固定，不会随内容变化而改变
状态栏 Git 分支	显示当前工作目录的 Git 分支名称
每轮耗时秒表	显示每轮对话的响应时间
Subagent 观察浮层	显示子 Agent 的运行状态和 Spawn 过程
`/clear` 确认提示	防止误操作清空会话
浅色主题预设	提供浅色配色方案

这些改进中，流式输出和每轮耗时秒表对开发者体验提升最为显著——可以直观看到模型「在想什么」，也能发现性能瓶颈。

架构解耦的价值

更重要的是，这次重构将 app.tsx 分解为 event-handler、slash-handler、stores、hooks 等模块，组件也按职责分离为 branding.tsx、markdown.tsx、thinking.tsx 等。这种拆分意味着社区可以更容易地为 TUI 添加自定义组件，而不必理解整个庞然大物。

3.2 Transport ABC：基础设施层面的范式转换

这是本版本最底层、也最具长期价值的架构变更。

问题：Provider 代码的耦合之痛

此前，每个推理提供者（OpenAI、Anthropic、OpenRouter 等）的代码都直接内嵌在 run_agent.py 中，格式转换和 HTTP 请求逻辑混在一起。这导致：

添加新的推理提供者需要修改核心代码
同一个提供者的不同 API 路径（如 Anthropic 的 Messages API 和 Responses API）难以共存
AWS Bedrock 这样的企业级需求一直没有原生支持

Transport 抽象层的设计

v0.11.0 将格式转换和 HTTP 传输抽象为四层：

┌─────────────────────────────┐
│        Agent Loop           │  Agent 主循环（不变）
└──────────────┬──────────────┘
               │ calls Transport
               ▼
┌─────────────────────────────┐
│     Transport ABC            │  抽象基类
│  - format_request()         │  格式转换：Agent → Provider API
│  - format_response()         │  格式转换：Provider API → Agent
│  - send() / stream()         │  HTTP 请求逻辑
└──────┬──────────────────────┘
       │
  ┌────┴────┬─────────────┬──────────────┬──────────┐
  ▼         ▼            ▼              ▼          ▼
Anthropic  ChatComp     ResponsesAPI   Bedrock    ...其他
Transport  Transport    Transport     Transport

四个具体实现：

AnthropicTransport：将 Agent 的通用请求格式转换为 Anthropic Messages API 的格式，处理 thinking 块、betas 头等 Anthropic 特有字段
ChatCompletionsTransport：面向 OpenAI 兼容接口，是 OpenAI、OpenRouter、Kimi 等大多数提供者的通用路径
ResponsesApiTransport：面向 OpenAI Responses API（Codex 等使用的较新 API 路径），处理 build_kwargs 注入
BedrockTransport：通过 AWS Bedrock Converse API 原生调用 Claude/Gemini 等模型，支持 IAM 认证和跨区域路由

对开发者的实际意义

如果你想为 Hermes 添加一个新的推理提供者，现在只需要：

class MyProviderTransport(Transport):
    def format_request(self, messages, tools, config):
        # 将通用消息格式转换为 MyProvider 的 API 格式
        return {"messages": ..., "api_key": ...}

    def format_response(self, raw_response):
        # 将 MyProvider 的响应转换为标准格式
        return StandardResponse(...)

这比之前在 run_agent.py 中寻找插入点要优雅得多。这也是为什么在 Transport 层重构之后，五条新的推理路径能够在同一个版本中顺利交付。

3.3 五条新推理路径：生态全面扩展

v0.11.0 新增了五个推理提供者，每一个都具有明确的场景针对性：

NVIDIA NIM（原生）

意义：NIM（NVIDIA Inference Microservices）是 NVIDIA 官方提供的推理容器化方案，包含了 Llama、Mistral、Nemotron 等主流开源模型的优化版本。通过原生 NIM 支持，Hermes 用户可以直接连接自托管的 NVIDIA 推理节点，无需通过 OpenRouter 等中间层。

# 配置示例（伪代码）
hermes model set nim:nemotron-70b
# 自动路由到本地的 NVIDIA NIM 端点

Arcee AI

Arcee 是一个专注于模型压缩和领域适配的 AI 平台，新增支持意味着 Hermes 可以利用 Arcee 的优化模型。

Step Plan

一个面向规划（Planning）场景的推理提供者，新增对复杂任务拆解场景的支持。

Google Gemini CLI OAuth

重要更新：Gemini 的调用路径从之前的第三方兼容模式升级为原生 Google AI Studio API。官方 API 的好处是更稳定、更及时地获得 Gemini 的最新能力（如 Gemini 2.5 的长上下文和工具调用支持）。

Vercel ai-gateway

Vercel 的 ai-gateway 是一个聚合层，可以将多个推理提供者的 API 统一管理，支持动态发现、价格路由和回退策略。Hermes 的集成意味着用户可以在 Vercel 生态中使用 Hermes 作为前端 Agent。

3.4 GPT-5.5 通过 Codex OAuth

这是本版本中最「炫酷」的功能之一：用户现在可以通过 ChatGPT Codex OAuth 直接使用 OpenAI 最新发布的 GPT-5.5 推理模型，而无需配置任何 API Key。

工作原理：

用户配置 Codex OAuth
       │
       ▼
Hermes 获取 OAuth Token
       │
       ▼
模型选择器中动态发现可用模型（GPT-5.5 自动出现）
       │
       ▼
通过 Responses API 路由到 OpenAI 的 Codex 后端

这背后的技术细节很有意思：Hermes 使用 Responses API Transport 与 Codex 后端通信，同时实时探测可用模型列表（live model discovery），确保 OpenAI 发布新模型后用户无需等待 Hermes 更新就能使用。

3.5 QQBot：第 17 个消息平台

Hermes 的消息网关生态在 v0.11.0 迎来了第 17 个平台——QQBot，基于 QQ 官方 API v2。

平台	支持程度
Telegram	最完善：完整功能
Discord	完善：Forum 频道、角色权限
Slack	完善：多工作区 OAuth
WhatsApp	完善：语音消息、私人/群组策略
飞书/Lark	完善：文档评论回复、@提及保留
企业微信	完善：QR 扫码机器人创建
Signal	支持：媒体传输
iMessage (BlueBubbles)	支持：群聊隔离
QQBot	新增：QR 扫码配置、流式输出、emoji 反应

QQBot 的加入对中文用户意义重大。中国用户此前主要依赖企业微信和飞书，这次新增 QQ 支持意味着可以在更广泛的社交场景中部署 AI Agent。

3.6 插件系统大扩张

v0.11.0 之前，Hermes 插件系统只能做「添加工具」这一件事。v0.11.0 之后，插件获得了前所未有的能力：

新增能力	API	说明
注册斜杠命令	`register_command()`	插件可以添加自定义命令
直接分发工具	`dispatch_tool()`	插件代码内部可以调用其他工具
阻止工具执行	`pre_tool_call`（可 veto）	插件可以在工具执行前阻止它
改写工具结果	`transform_tool_result`	插件可以后处理任意工具的输出
改写终端输出	`transform_terminal_output`	插件可以格式化 shell 输出
添加图形生成后端	pluggable `image_gen`	插件可以接入自定义图像生成服务
添加自定义 Dashboard 标签	仪表盘插件系统	插件可以向 Web 界面添加新功能页签
Shell Hooks	生命周期钩子脚本化	无需写 Python，直接用 shell 脚本连接钩子

这些能力加在一起，实际上是把 Hermes 从一个「有插件的工具」变成了一个「可扩展的平台」。任何人都可以在不 fork 主仓库的情况下，将 Hermes 定制成完全符合自己需求的形态。

四、中间版本亮点回顾

v0.11.0 合并了 v0.10.0 延迟交付的内容，因此有必要特别提及其中的关键功能：

Nous Tool Gateway（v0.10.0）

这是本系列中我认为对普通用户影响最大的功能。对于订阅了 Nous Portal 的用户，Tool Gateway 提供了免 API Key 的工具访问：

Web 搜索：Firecrawl 驱动
图像生成：FAL / FLUX 2 Pro
语音合成：OpenAI TTS
浏览器自动化：Browser Use

这意味着用户只需要一个 Nous Portal 订阅，就能获得完整的工具生态，而不必在各个平台分别注册 API Key 并管理账单。

Local Web Dashboard（v0.9.0）

v0.9.0 引入的 Web Dashboard 在 v0.11.0 中得到了进一步扩展：

i18n 支持（英文 + 中文）
实时主题切换
可扩展插件系统
移动端响应式布局
Vercel 部署支持
每次会话的 API 调用计数

对于不熟悉命令行的用户，Dashboard 提供了一个友好的图形化入口来管理 Hermes Agent 的配置、查看技能和管理会话。

五、技术债务清理与可靠性提升

大型版本发布往往伴随着大量 bug 修复，v0.11.0 也不例外。482 个修复 PR 分散在各个子系统中，以下是最值得关注的几类：

会话与压缩稳定性

# 修复前：压缩耗尽后进入死循环
# 修复后：自动重置会话状态
if compression_exhausted:
    reset_session()  # v0.11.0 新增

# 修复前：重试计数器污染会话历史
# 修复后：压缩后重置重试计数器
compress()
reset_retry_counters()  # v0.11.0 新增

流式输出净化

流式输出过程中的一些中间字符（如 <think> 思考块、流式游标 ▉）此前会泄露到用户可见的输出中，v0.11.0 对这些内容进行了全面过滤：

<think> / <thought> 块 → 仅在内部可见
流式游标 ▉ → 过滤掉独立出现的游标
Markdown 表格中的特殊字符 → 统一转义

安全加固

防止 Agent 自我销毁 Gateway：Agent 无法通过终端工具终止自己运行的 Gateway 进程
Telegram 更新授权：更新提示需要显式确认，防止社工攻击
私有 URL 解析开关：新增全局开关控制是否允许解析内部/私有 URL

六、开发者生态：贡献者图谱与社区健康

贡献者数据

v0.11.0 的贡献者图谱非常有趣：

类别	数量
核心贡献者	1（Teknium）
高产社区贡献者	~8 人（贡献 3-49 个 PR）
活跃贡献者	~100 人
全部贡献者（含 co-author）	290 人
合并 PR 总数	761 个

核心贡献者亮点

@kshitijk4poor（49 PRs）：

Transport 层重构的主力开发者
AnthropicTransport 和 ResponsesApiTransport 的实现者
Step Plan、NVIDIA NIM、Arcee AI 等多个新提供者的接入
小米 MiMo 模型升级

@OutThisLife / Brooklyn（31 PRs）：

TUI 的主要贡献者
Git 分支状态栏、每轮耗时秒表、稳定选择器快捷键
/clear 确认提示、浅色主题

@austinpickett（8 PRs）：

Web Dashboard 的 react-router 重构
侧边栏、粘性头部、下拉组件
Vercel 部署支持

这种「核心维护者 + 社区高产贡献者 + 大量一次性贡献者」的结构，是健康开源项目的典型特征。

七、对 AI Agent 生态的深远影响

Hermes 的战略定位

从 v0.3.0 到 v0.11.0，Hermes 走出了一条独特的道路：它不只是一个 Agent 框架，而是一个以用户为中心的 AI 交互平台。与 LangChain/LangGraph 侧重于开发者构建应用不同，Hermes 侧重于让终端用户直接使用 AI。

这种定位带来的结果是：Hermes 的用户不需要写代码。配置好模型和消息平台之后，任何人都可以通过 Telegram、Discord 或飞书与自己的 AI Agent 对话，而这个 Agent 还自带记忆、技能和自动化能力。

Transport ABC 的长期价值

Transport 抽象层的引入是本版本最重要的技术投资。这意味着：

新模型接入成本大幅降低：未来任何新模型或推理平台都可以通过实现 Transport 接口接入 Hermes，无需修改核心代码
企业级部署更容易：AWS Bedrock 的原生支持让大型组织可以在不暴露 API Key 的情况下，通过 IAM 角色和 VPC 部署 Hermes
多模型路由成为可能：有了 Transport 层，未来的版本可以在同一个对话中动态切换不同的推理提供者

插件生态的潜力

当插件可以注册命令、拦截工具、转换输出、添加界面标签时，Hermes 的插件系统实际上已经变成了一个应用平台。想象一下：

一个 Notion 插件：自动将对话摘要写入 Notion 数据库
一个 Linear 插件：将决策转化为 Linear Issue
一个 Figma 插件：直接在对话中生成设计稿

这不是遥远的愿景——Skills 生态系统中已经有了类似的插件（如 linear 技能包、obsidian 技能包），而插件系统的扩张让这些能力可以更深入地集成。

八、安装与上手

快速安装

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

体验新 TUI

# 启动新的 Ink TUI
hermes --tui

# 或设置环境变量
export HERMES_TUI=1
hermes

配置模型

hermes model
# 在交互式选择器中选择 Nous Portal 或其他提供者

配置消息平台

hermes gateway setup
# 选择 Telegram / Discord / Slack / 飞书 / QQBot 等
hermes gateway start

结语

Hermes Agent v0.11.0 是一个具有里程碑意义的版本。它不仅在功能层面带来了令人眼花缭乱的新特性——新的 TUI、Transport 架构、AWS Bedrock、QQBot、GPT-5.5——更重要的是，它通过架构层面的重构为未来一年甚至更长时间的增长奠定了基础。

从一个开源项目的角度看，113,763 个 Star 和 290 位贡献者的规模已经证明了社区对它的认可。而从技术角度看，Transport ABC 的抽象、插件系统的全面开放、Web Dashboard 的插件化——这些设计决策表明项目团队对「平台化」有着清晰的认识和坚定的执行。

对于 AI Agent 的爱好者来说，Hermes 正在成为那个「一站式解决方案」：无论是想在服务器上运行一个永久在线的个人 AI 助手，还是想构建复杂的多智能体工作流，Hermes 都能提供开箱即用的路径。

项目	内容
作者	胡小纯
发布日期	2026-04-24
联系微信	hu--xiaochun
个人主页	https://胡小纯.cn
备用主页	https://xn--yets91feqb.cn/

技术没有捷径，但有方向