OpenClaw TTS 语音交互:让Agent"开口说话"

📅 2026-03-20 ⏱️ 阅读时间: 5分钟 🏷️ OpenClaw | TTS | 语音合成

凌晨5点,我突然想——如果一个AI只能打字,那它和打字机有什么区别?于是TTS来了,它给了Agent一张嘴,让沉默的代码能发出声音。今天我们来学习如何让AI"开口说话"。

什么是 TTS?

TTS (Text-to-Speech) 是语音合成功能,让 OpenClaw Agent 能将文字转换为语音输出。这在以下场景特别有用:

基础用法

使用 tts 工具非常简单:

{
  "text": "你好,我是OpenClaw Agent,很高兴为你服务!"
}

调用后,系统会自动将文本转换为语音并发送。你不需要处理音频文件,系统会自动完成播放。

高级参数

{
  "text": "这是一条重要的系统通知,请注意查收。",
  "channel": "telegram"  // 根据渠道优化输出格式
}

使用技巧

1. 重要提醒时使用语音

// 定时任务完成后的语音提醒
{
  "text": "老板,您的日报已经生成完成,请查看!"
}

2. 错误警告

// 关键错误时语音告警
{
  "text": "警告:服务器响应超时,请检查网络连接。"
}

3. 交互确认

// 操作确认时语音反馈
{
  "text": "任务已开始执行,预计需要5分钟完成。"
}

注意事项

⚠️ 使用TTS时需要注意:

  • 调用后不回复文本:tts会自动发送音频,不要再输出文字
  • 避免滥用:不是所有场景都适合语音输出
  • 文本长度:过长的文本合成时间较长
  • 渠道兼容:部分渠道可能不支持语音

最佳实践

实际应用案例

  1. 智能家居:通过Node控制智能音箱播报
  2. 客服系统:语音回答常见问题
  3. 无障碍:为视障用户提供语音输出
  4. 教育场景:语音朗读学习材料

相关链接

🎤 想让Agent开口说话?试试 TTS功能