深夜2点17分,我盯着Discord语音频道的波形图发呆。突然意识到——为什么我的AI助手不能像人一样「听」我们说话?
OpenClaw v2026.5.21带来了这个看似简单却改变游戏规则的功能:Discord语音跟随。它让OpenClaw能够:
就像王家卫电影里那个总是在合适时机出现的旁白,OpenClaw现在能在你说话的瞬间捕捉到关键信息。
Connect、Speak、Listen权限,并且你的OpenClaw版本必须 ≥ v2026.5.21。
@openclaw/plugin-discord-voice 插件# 检查当前版本 openclaw --version # 更新到最新版 openclaw update # 确认版本(应该显示 v2026.5.21 或更高) openclaw --version
# 安装Discord语音插件 openclaw plugin install @openclaw/plugin-discord-voice # 启用插件 openclaw plugin enable discord-voice # 查看插件状态 openclaw plugin list
前往 Discord开发者门户,为你的Bot添加以下权限:
bot - 基础Bot权限applications.commands - 斜杠命令权限Connect、Speak、Listen// ~/.openclaw/config.json
{
"plugins": {
"discord-voice": {
"enabled": true,
"voiceChannel": "general-voice", // 要监听的语音频道名称
"language": "zh-CN", // 语音识别语言
"autoTranscribe": true, // 自动转录
"responseMode": "contextual", // 响应模式:immediate/contextual/batch
"whisperModel": "medium" // Whisper模型大小:tiny/base/small/medium/large
}
}
}
# 方法1:通过命令启动 /voice-follow start # 方法2:配置文件自动启动 openclaw start --with-voice
| 命令 | 说明 | 示例 |
|---|---|---|
/voice-follow start |
开始监听当前语音频道 | /voice-follow start |
/voice-follow stop |
停止语音跟随 | /voice-follow stop |
/voice-follow status |
查看当前状态 | /voice-follow status |
/voice-follow transcript |
获取本次会话的转录文本 | /voice-follow transcript --format markdown |
medium或large模型,准确度更高noiseReduction: true// 优化配置示例
{
"discord-voice": {
"performance": {
"bufferSize": 4096, // 音频缓冲区大小
"processingInterval": 2000, // 处理间隔(毫秒)
"maxConcurrentStreams": 3 // 最大并发流
}
}
}
~/.openclaw/voice-logs/ 目录,清理敏感数据sensitivity: "mention-only"配置,只在被@提及时响应解决方案:
medium或largelanguage设置正确(中文为zh-CN)noiseReduction: true可能原因:
Connect权限# 检查Bot权限 openclaw plugin discord-voice check-permissions # 测试连接 openclaw plugin discord-voice test-connection
使用本地Whisper模型而不是云端API:
{
"discord-voice": {
"transcription": {
"provider": "local", // 使用本地模型
"model": "~/.openclaw/whisper-medium.bin"
}
}
}
{
"discord-voice": {
"language": "auto", // 自动检测语言
"fallbackLanguage": "en-US",
"supportedLanguages": ["zh-CN", "en-US", "ja-JP"]
}
}
| 模式 | 说明 | 适用场景 |
|---|---|---|
| immediate | 实时响应每句话 | 问答场景、即时交互 |
| contextual | 根据上下文智能判断 | 会议记录、日常聊天 |
| batch | 批量处理,定期总结 | 长会议、异步处理 |
你可以创建自定义Skill,让OpenClaw在检测到特定关键词时触发动作:
// skills/meeting-notes/index.js
export default {
name: "meeting-notes",
trigger: {
type: "voice-keyword",
keywords: ["总结一下", "生成纪要", "记录会议"]
},
action: async (context) => {
const transcript = context.voice.getTranscript();
const summary = await context.ai.summarize(transcript);
await context.discord.sendToChannel("#meeting-notes", summary);
}
}