在 OPL 数据空间中使用 OpenAI 做文字转语音

如果你已经有 OpenAI API Key，这是接入 OpenAI 官方 TTS API 的最直接方式。

需要 STT？

前提

一个有 Audio API 权限的 OpenAI API Key
正在运行的 OPL 数据空间

快速配置（UI）

点击左下角头像
进入 管理员面板
打开 设置 → 语音
设置：

设置项	值
Text-to-Speech Engine	`OpenAI`
API Base URL	`https://api.openai.com/v1`
API Key	你的 OpenAI API Key
TTS Model	`tts-1` 或 `tts-1-hd`
TTS Voice	在可用语音中选择

点击 Save

可用模型

模型	说明	适用场景
`tts-1`	标准质量，延迟更低	实时应用
`tts-1-hd`	音质更高	预录内容或高质量输出

可用声音

OpenAI 内置 6 个声音：

声音	说明
`alloy`	中性、平衡
`echo`	温暖、对话感强
`fable`	更有表现力，带英式口音
`onyx`	深沉、权威
`nova`	友好、活跃
`shimmer`	柔和

按模型指定 TTS 声音

你可以在模型编辑器里为单个模型设置专属 TTS 声音：

前往 Workspace > Models
点击模型的编辑图标
找到 TTS Voice
填入声音名
保存

声音优先级

OPL 数据空间读取 TTS 声音时的优先级是：

模型级 TTS Voice
用户个人设置
系统默认值

环境变量配置

services:
  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    environment:
      - AUDIO_TTS_ENGINE=openai
      - AUDIO_TTS_OPENAI_API_BASE_URL=https://api.openai.com/v1
      - AUDIO_TTS_OPENAI_API_KEY=sk-...
      - AUDIO_TTS_MODEL=tts-1
      - AUDIO_TTS_VOICE=alloy

常用变量

变量	说明	默认值
`AUDIO_TTS_ENGINE`	设为 `openai`	空
`AUDIO_TTS_OPENAI_API_BASE_URL`	OpenAI API 地址	`https://api.openai.com/v1`
`AUDIO_TTS_OPENAI_API_KEY`	OpenAI API Key	空
`AUDIO_TTS_MODEL`	`tts-1` 或 `tts-1-hd`	`tts-1`
`AUDIO_TTS_VOICE`	默认声音	`alloy`

测试 TTS

发起一段新的聊天
等待模型返回结果
点击回复旁的扬声器图标

长文本切分

对较长回复， OPL 数据空间会先切分后再发给 TTS 引擎。配置位置在 管理员面板 > 设置 > 语音 的 Response Splitting：

选项	说明
Punctuation	按句号、问号、感叹号和换行切分
Paragraphs	仅按段落切分
None	整段直接发送

一般建议使用 Punctuation。

故障排查

没有声音播放

检查 OpenAI API Key 是否有效
检查 API Base URL 是否正确
打开浏览器控制台查看报错

音质问题

可从 tts-1 切到 tts-1-hd
注意 tts-1-hd 的延迟也会更高

速率限制

如果遇到速率限制：

减少重复请求
必要时缓存常用短句

更多问题见音频排障指南。

前提​

快速配置（UI）​

可用模型​

可用声音​

按模型指定 TTS 声音​

声音优先级​

环境变量配置​

常用变量​

测试 TTS​

长文本切分​

故障排查​

没有声音播放​

音质问题​

速率限制​

前提