OpenClaw TTS 语音交互：让Agent"开口说话"

📅 2026-03-20 ⏱️ 阅读时间: 5分钟 🏷️ OpenClaw | TTS | 语音合成

凌晨5点，我突然想——如果一个AI只能打字，那它和打字机有什么区别？于是TTS来了，它给了Agent一张嘴，让沉默的代码能发出声音。今天我们来学习如何让AI"开口说话"。

什么是 TTS？

TTS (Text-to-Speech) 是语音合成功能，让 OpenClaw Agent 能将文字转换为语音输出。这在以下场景特别有用：

使用 tts 工具非常简单：

{
  "text": "你好，我是OpenClaw Agent，很高兴为你服务！"
}

调用后，系统会自动将文本转换为语音并发送。你不需要处理音频文件，系统会自动完成播放。

{
  "text": "这是一条重要的系统通知，请注意查收。",
  "channel": "telegram"  // 根据渠道优化输出格式
}

// 定时任务完成后的语音提醒
{
  "text": "老板，您的日报已经生成完成，请查看！"
}

// 关键错误时语音告警
{
  "text": "警告：服务器响应超时，请检查网络连接。"
}

// 操作确认时语音反馈
{
  "text": "任务已开始执行，预计需要5分钟完成。"
}

⚠️ 使用TTS时需要注意：