Loading...

文章背景图

OpenClaw 2026.4.25 发布:TTS 全面升级,插件架构重构

2026-04-27
2
-
- 分钟
|

概述

2026.4.25 是 OpenClaw 的一次重量级更新,集中在三个方向:语音能力扩张插件架构重构全链路可观测性。本次更新有大量社区贡献者参与(至少 20+ 位),是近期变动最大的一次版本迭代。


一、TTS 语音系统全面升级

这是本次更新最重磅的部分,语音回复能力得到了质的飞跃。

1.1 新增多个 TTS 提供商

版本新增了 6 个 TTS 提供商,涵盖主流云服务商的语音合成能力:

提供商

特性

Azure Speech

Speech-resource 认证、语音列表、SSML 转义、原生 Ogg/Opus 语音笔记输出、电话输出

Xiaomi MiMo

MP3/WAV 输出、语音笔记 Opus 转码

Local CLI TTS

本地命令 speech provider,文件/stdout 输入,语音笔记 Opus 转换,电话 PCM 输出

Inworld

流式 TTS 合成、语音列表、语音笔记输出、PCM 电话输出

Volcengine/BytePlus Seed

API-key 认证、原生 Ogg/Opus 语音笔记、MP3 音频文件输出

ElevenLabs v3

eleven_v3 模型加入捆绑 TTS 模型目录

1.2 细粒度 TTS 控制

除了新增提供商,TTS 的控制能力也大幅增强:

  • /tts latest — 支持最新语音播报,带去重抑制

  • /tts chat on|off|default — 会话级别的自动 TTS 覆盖开关

  • per-agent TTS 覆盖 — 允许 agents.list[].tts 覆盖全局 messages.tts 配置,每个 Agent 可以有独立语音

  • per-account TTS 覆盖 — Feishu、QQBot 等渠道账户可以独立配置 TTS,深度合并 channels..accounts..tts 优先级

  • TTS personas — 支持语音人格配置

1.3 Android Talk Mode

Android 端新增 Talk Mode,在 Voice Tab 中暴露,支持运行时语音捕获模式切换,以及麦克风前台服务权限升级。


二、插件注册表重构(架构级别)

2.1 冷持久化注册表

插件启动和安装路径全面迁移至冷持久化注册表(cold persisted registry),解决了之前每次启动都需要扫描大量插件清单的问题:

  • 插件索引信息现在存储在结构化的注册表文件中,而不是运行时扫描

  • 插件更新、修复、提供商发现、安装元数据都变得更加确定性

  • openclaw plugins registry 命令支持显式持久化注册表查询和 --refresh 修复,不再触发正常启动时的插件目录扫描

  • openclaw plugins list 默认读取冷持久注册表快照

2.2 向后兼容与迁移

  • 安装/更新时会自动迁移本地插件注册表

  • OPENCLAW_DISABLE_PERSISTED_PLUGIN_REGISTRY 标记为废弃(deprecated break-glass switch),引导用户使用注册表修复

  • 新增中央兼容性注册表,记录 dated owners、replacements,以及最多三个月移除目标的遗留 SDK/manifest/setup/注册表迁移/Agent 运行时表面

  • 忽略过时的持久化注册表读取(当插件策略与当前配置不再匹配时)

2.3 安装元数据整合

  • 托管插件安装元数据统一整合到 plugins/installs.json(state-managed plugin index),替换临时路径 plugins/installed-index.json

  • plugins.installs 不再作为创作配置表面


三、OpenTelemetry 全链路可观测性

3.1 覆盖范围扩展

可观测性覆盖扩展至:

  • 模型调用(Model calls)

  • Token 用量(Token usage)

  • 工具循环(Tool loops)

  • Agent 调度(Harness runs)

  • 执行进程(Exec processes)

  • 出站投递(Outbound delivery)

  • 上下文组装(Context assembly)

  • 内存压力(Memory pressure)

3.2 新增诊断指标

指标/跨度

描述

openclaw.harness.run

Agent harness 生命周期

openclaw.harness.duration_ms

Agent 执行时长

openclaw.context.assembled

上下文组装(带 prompt/history 大小,无内容)

openclaw.tool.loop

工具循环计数器/跨度

openclaw.agent 标签

聚合 Token 用量(支持 per-agent Grafana 面板)

gen_ai.client.token.usage 直方图

输入/输出 Token 用量

gen_ai.client.operation.duration 直方图

模型调用延迟(秒)

gen_ai.request.model

请求模型(带 unknown fallback)

3.3 OTEL 配置增强

  • 支持信号专属 OTLP 端点覆盖(通过配置或标准 OTEL 环境变量)

  • 支持 OTEL_SEMCONV_STABILITY_OPT_IN=gen_ai_latest_experimental 启用最新 GenAI 语义约定

  • 新增 OPENCLAW_OTEL_PRELOADED=1 支持复用已注册的 OpenTelemetry SDK

  • W3C traceparent 传播:信任模型调用 trace context 中的 tracecontext,替换调用者提供的 traceparent 值

  • 新增 bundled diagnostics-prometheus 插件,提供受保护的 gateway scrape 路由


四、浏览器自动化增强

  • Safe tab URLs — Agent 响应中的标签页 URL 更安全

  • CDP-native role snapshot fallback — 新增 iframe-aware refs,光标可点击检测,target attach 准备

  • openclaw browser doctor --deep — 深度实时快照探测

  • CDP readiness tuning — 本地托管 Chrome 启动发现和启动后 CDP 就绪超时可针对树莓派等慢速主机调高

  • openclaw browser start --headless — 一次性无头启动,不重写持久化浏览器配置


五、Control UI 与 Setup 流程改进

  • PWA 支持 — Control UI 支持安装为 PWA

  • Web Push 通知 — Gateway 聊天支持 Web Push 推送通知

  • Crestodian 首次运行修复 — 引导用户修复常见初始化问题

  • TUI setup — 全 TUI 交互式 Crestodian 安装向导

  • Context mode selector — 启动时可选择上下文模式

  • 更短的启动问候语 — 简化启动输出


六、安装/更新加固

覆盖全平台:

  • Windows — 安装路径、权限处理

  • macOS — LaunchAgent token 轮换、服务重启

  • Linux — 包管理、systemd 服务

  • Docker — 镜像构建、运行时依赖

  • Node 服务重启 — 守护进程稳定性

  • 混合版本 Gateway 验证 — 多版本共存场景

  • bundled plugin 运行时依赖 — tokenjuice runtime 升级至 0.6.3


七、其他重要更新

7.1 Google Meet

新增日历支持的考勤导出工作流、导出清单、干运行预览、会议记录工具对等。

7.2 Discord 语音

channels.discord.voice.model 可覆盖语音频道响应的 LLM,STT 和 TTS 保持现有媒体设置不变。

7.3 CLI 图像生成

  • openclaw infer image generateopenclaw infer image edit 暴露通用 --background 参数

  • --openai-background 作为 OpenAI 别名保留

  • fal 图像生成支持 --output-format png|jpeg

7.4 LiteLLM 图像生成

注册 litellm 作为图像生成提供商,image_generate model=litellm/...agents.defaults.imageGenerationModel.fallbacks 可通过 LiteLLM 代理解析。

7.5 fal 视频生成

新增 Seedance 2.0 reference-to-video 模型,支持多图像、视频、音频参考输入映射,以及模型特定的能力限制。

7.6 文档更新

全面刷新 MCP、模型 provider、doctor、故障排除、BlueBubbles、媒体生成、TTS、子 Agent、Skills、Cron/任务、exec 审批、语音通话等指南,新增结构化 Steps、Tabs、Accordion 内容。


总结

2026.4.25 是一个架构级和功能级双重进化的版本。TTS 系统的全面扩张让 OpenClaw 在语音交互上有了更多选择;插件注册表重构解决了长期困扰的启动性能问题;OpenTelemetry 全链路覆盖则让生产环境的可观测性终于落地。对于已经在使用 OpenClaw 的用户,这次更新值得尽快升级;对于考虑自建 AI Agent 网关的开发者,OpenClaw 的多渠道接入能力和这次的可观测性增强让它的成熟度又上了一个台阶。

升级方式:

npm install -g openclaw@latest

项目

内容

作者

胡小纯

发布日期

2026-04-27

联系微信

hu--xiaochun

个人主页

https://胡小纯.cn

备用主页

https://xn--yets91feqb.cn/

技术没有捷径,但有方向

评论交流

文章目录