← 返回玩法首页
🎙️ 语音对话

和 AI 像 Jarvis 一样对话

按住说话 → 实时语音识别 → AI 回复 → ElevenLabs 语音合成 → 播放
这一套下来,你就有自己的贾维斯了!

🧙‍♂️ 这有多酷?

想象一下:早上起床,喊一声 "Hey OpenClaw,今天天气怎么样?"
AI 立刻回答:"北京今天晴,15-28 度,适合穿轻薄外套..."

🎯 它是怎么工作的?

Talk Mode 是一个连续的语音对话循环,整个过程只需要 4 步:

🎤

1. 听

检测麦克风输入,等待你说话

🤖

2. 识别

语音转文字,发送给 AI 模型

🧠

3. 生成

AI 处理并生成回复文本

🔊

4. 播放

文字转语音,通过扬声器播放

🧑‍🏫 3 分钟教程

第一步:配置语音

~/.openclaw/openclaw.json 中添加:

{
  talk: {
    voiceId: "你的 ElevenLabs voice ID",
    modelId: "eleven_v3",
    apiKey: "你的 ElevenLabs API Key",
    silenceTimeoutMs: 1500,
    interruptOnSpeech: true
  }
}

第二步:开始对话

在 macOS 菜单栏点击 Talk 按钮,或者直接语音唤醒(配合 Voice Wake)

第三步:说话就行

按住说话,说完松开,AI 会立刻回复你!

🎮 骚操作合集

1. 随时打断 AI 说话

当 AI 正在说话时,你突然想改问题——直接开口就行!AI 会立刻停下,听你说新的内容。

2. 切换不同声音

在 AI 回复的开头加一行 JSON,可以切换声音:

{ "voice": "另一个 voice ID", "once": true }

# 上面这行会被 Strip 掉,不会读出来,但会让 AI 用这个声音说话
"once": true" 表示只换这一次的声音

3. 语速调节

{ "speed": 120 }  # 120 WPM,语速加快

4. 不同情绪/风格

{ "style": 0.8 }  # 0-1 之间,越高越有表现力

💡 真实使用场景

🚗

开车时问路

"Hey OpenClaw,最近的加油站在哪里?" 眼睛不离路,AI 给你指方向

🏃

跑步时听新闻

"帮我总结一下今天的科技新闻" AI 朗读要点,不用看手机

🧹

做饭时查菜谱

"红烧肉怎么做?" 手上有油也能问,AI 念步骤

😴

睡前设闹钟

"明早 7 点叫我起床" 不用摸手机,语音搞定

⚠️ 注意事项

🎉 接下来做什么?

组合更多技能,效果更酷!

🎙️ + 🎙️ 语音唤醒 = 完美组合 🧠 + 🌐 让 AI 帮你搜网页