TTS:让 OpenClaw 把回复说出来
TTS 是 Text to Speech,也就是文字转语音。OpenClaw 可以把 Agent 的回复变成音频,发到支持语音消息的通道里。
能用在哪些地方?
根据通道能力,TTS 可能表现为:
- Telegram 语音消息。
- WhatsApp 语音消息。
- Matrix 音频。
- 飞书音频。
- 其他通道里的音频附件。
- Talk 或电话场景里的音频流。
常见提供商
OpenClaw 支持多种语音提供商,常见有:
- OpenAI。
- ElevenLabs。
- Google。
- Microsoft。
- MiniMax。
- DeepInfra。
- xAI。
- 本地 CLI。
有些需要 API Key,有些可以本地运行。
快速配置思路
- 选一个 TTS provider。
- 配好 API Key 或本地命令。
- 给默认 persona 选一个声音。
- 在需要的通道开启语音输出。
示意:
json5
{
messages: {
tts: {
enabled: true,
provider: "openai"
}
}
}实际字段以当前版本配置为准。
什么时候不要开?
不建议在这些场景默认开启:
- 群聊里消息很多。
- 回复内容很长。
- 通道里有人不方便听音频。
- 成本敏感。
你可以只对特定通道、特定用户、特定命令开启。
