早上6点08分,OpenClaw生态迎来两个重磅消息:Naveen团队推出的Mercury无代码编排平台正式上线,获得a16z 150万美元投资;Clawbot发布Claude Opus 4.7深度解读,详解opus别名系统与Gemini TTS语音集成的工程实践。这是Agent团队协作范式的一次重大升级。
Naveen和联合创始人本周正式发布Mercury——一个面向OpenClaw和企业Agent团队的无代码画布编排平台。该平台获得a16z 150万美元投资,并有来自OpenAI和Cognition的天使投资人参与。Mercury的核心洞察是:企业AI的真正挑战不是让单个Agent更聪明,而是防止它们重复工作、互相矛盾、并向人类发送冗余请求。
来源: Clawbot Blog
Mercury用直观的图形编辑器取代了传统的命令行配置方式。你将Agent拖拽到画布上,用连线定义它们之间的委托路径和通信流。人类也以节点形式出现在画布中,形成人机协作的完整视图。这不仅是文档工具——画布就是运行时环境。当Agent A委托任务给Agent B时,视觉连线代表真实消息通过Mercury的任务系统传递。
来源: Clawbot Blog
Mercury的创新在于将"委托"视为一等公民。当Agent A向Agent B发送任务时,这不是简单的消息传递——而是一个持久化的任务架构。创始人通过3人团队+30个Agent的内部测试发现:当Agent数量从3个增长到30个时,运营开销变得难以管理。Mercury解决了这个"协调难题"。
来源: Clawbot Blog
Claude Opus 4.7在复杂编码任务、扩展上下文处理(最高20万token)和多步骤Agent工作流的指令遵循方面都有显著提升。对于OpenClaw开发者,这意味着Agent能在更长的执行跟踪中保持连贯性,更有效地调试自己的代码,并在无需人工干预的情况下处理细微的工具选择场景。
来源: Clawbot Blog
2026.4.15版本引入了智能别名机制。你现在可以在Agent配置中直接写 model: opus,框架会自动解析到最新的稳定Opus版本(当前为4.7),同时保持对固定版本的向后兼容。别名系统通过manifest解析层工作,在API调用前检查 ~/.openclaw/models.json 的规范映射。团队管理20个Agent定义时,只需更新单个映射文件即可。
来源: Clawbot Blog
2026.4.15之前,启用视觉能力需要显式功能标志和单独API端点。现在图像理解直接捆绑在Claude Opus 4.7集成中。当Agent收到base64编码图像或MEDIA:命名空间的本地文件路径时,OpenClaw自动路由到多模态管道,无需额外manifest声明。捆绑方式还优化了token使用——多模态输入批量化为单次请求,高吞吐量场景延迟降低15-20%。
来源: Clawbot Blog
Google Gemini文本转语音直接集成到捆绑的google插件中,使Agent能够生成WAV格式的标准回复语音输出和PCM格式的电话应用音频。这是OpenClaw向多模态交互迈出的重要一步——Agent终于能"开口说话"了。
来源: Clawbot Blog
Gemini TTS集成包括:提供商注册、语音选择、WAV回复输出、PCM电话输出,以及完整的设置和文档指导。无论你是构建语音助手还是电话自动化系统,现在都有开箱即用的解决方案。
来源: Clawbot Blog
新增的 --opus-quickstart 标志完全跳过提供商选择提示,为新开发者提供即时访问高性能推理能力的快捷路径,无需 navigating 复杂的提供商配置菜单。
Mercury支持通过Composio与800+工具集成,OpenClaw和其他主流框架通过适配器连接。这意味着你可以将现有的OpenClaw Agent无缝接入Mercury的编排画布。
每周获取最新 OpenClaw 更新、玩法技巧和深度解读。订阅请访问 miaoquai.com/rss/ 或加入我们的 Discord 社区。