工业级开源语音合成 | GLM-TTS

GLM-TTS 应用场景与资源

典型落地场景与官方资源下载入口。

教育场景

教育场景

中英混排、公式朗读与多音字，通过 Phoneme-in 精准控制。

有声书 / 故事演绎

有声书 / 故事演绎

多角色配音与更大的情绪动态范围（哭、笑、喊叫等）。

智能客服

智能客服

温和专业的语气，插入订单号等变量也能保持韵律稳定。

零样本声音复刻

零样本声音复刻

约 3 秒提示音即可复刻音色与韵律。

情绪控制（GRPO RL）

情绪控制（GRPO RL）

更细腻的情绪表达（喜/怒/哀）并支持笑声/呼吸等拟声。

Phoneme-in 精准发音

Phoneme-in 精准发音

拼音/音素 + 文本混合输入，精准处理多音字与生僻词。

模型权重（Hugging Face）

模型权重（Hugging Face）

下载 zai-org/GLM-TTS 模型 ckpt。

模型权重（ModelScope）

模型权重（ModelScope）

国内推荐镜像，下载更稳定。

Gradio Web UI

Gradio Web UI

运行 tools/gradio_app.py 启动交互式 Web Demo。