跳到主要内容

在 OPL 数据空间中使用 OpenAI 做文字转语音

如果你已经有 OpenAI API Key,这是接入 OpenAI 官方 TTS API 的最直接方式。

需要 STT?

前提

  • 一个有 Audio API 权限的 OpenAI API Key
  • 正在运行的 OPL 数据空间

快速配置(UI)

  1. 点击左下角头像
  2. 进入 管理员面板
  3. 打开 设置 → 语音
  4. 设置:
设置项
Text-to-Speech EngineOpenAI
API Base URLhttps://api.openai.com/v1
API Key你的 OpenAI API Key
TTS Modeltts-1tts-1-hd
TTS Voice在可用语音中选择
  1. 点击 Save

可用模型

模型说明适用场景
tts-1标准质量,延迟更低实时应用
tts-1-hd音质更高预录内容或高质量输出

可用声音

OpenAI 内置 6 个声音:

声音说明
alloy中性、平衡
echo温暖、对话感强
fable更有表现力,带英式口音
onyx深沉、权威
nova友好、活跃
shimmer柔和

按模型指定 TTS 声音

你可以在模型编辑器里为单个模型设置专属 TTS 声音:

  1. 前往 Workspace > Models
  2. 点击模型的编辑图标
  3. 找到 TTS Voice
  4. 填入声音名
  5. 保存

声音优先级

OPL 数据空间读取 TTS 声音时的优先级是:

  1. 模型级 TTS Voice
  2. 用户个人设置
  3. 系统默认值

环境变量配置

services:
  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    environment:
      - AUDIO_TTS_ENGINE=openai
      - AUDIO_TTS_OPENAI_API_BASE_URL=https://api.openai.com/v1
      - AUDIO_TTS_OPENAI_API_KEY=sk-...
      - AUDIO_TTS_MODEL=tts-1
      - AUDIO_TTS_VOICE=alloy

常用变量

变量说明默认值
AUDIO_TTS_ENGINE设为 openai
AUDIO_TTS_OPENAI_API_BASE_URLOpenAI API 地址https://api.openai.com/v1
AUDIO_TTS_OPENAI_API_KEYOpenAI API Key
AUDIO_TTS_MODELtts-1tts-1-hdtts-1
AUDIO_TTS_VOICE默认声音alloy

测试 TTS

  1. 发起一段新的聊天
  2. 等待模型返回结果
  3. 点击回复旁的扬声器图标

长文本切分

对较长回复, OPL 数据空间会先切分后再发给 TTS 引擎。配置位置在 管理员面板 > 设置 > 语音Response Splitting

选项说明
Punctuation按句号、问号、感叹号和换行切分
Paragraphs仅按段落切分
None整段直接发送

一般建议使用 Punctuation

故障排查

没有声音播放

  1. 检查 OpenAI API Key 是否有效
  2. 检查 API Base URL 是否正确
  3. 打开浏览器控制台查看报错

音质问题

  • 可从 tts-1 切到 tts-1-hd
  • 注意 tts-1-hd 的延迟也会更高

速率限制

如果遇到速率限制:

  • 减少重复请求
  • 必要时缓存常用短句

更多问题见 音频排障指南