GLM-TTS 应用场景与资源
典型落地场景与官方资源下载入口。

教育场景
中英混排、公式朗读与多音字,通过 Phoneme-in 精准控制。

有声书 / 故事演绎
多角色配音与更大的情绪动态范围(哭、笑、喊叫等)。

智能客服
温和专业的语气,插入订单号等变量也能保持韵律稳定。

零样本声音复刻
约 3 秒提示音即可复刻音色与韵律。

情绪控制(GRPO RL)
更细腻的情绪表达(喜/怒/哀)并支持笑声/呼吸等拟声。

Phoneme-in 精准发音
拼音/音素 + 文本混合输入,精准处理多音字与生僻词。

模型权重(Hugging Face)
下载 zai-org/GLM-TTS 模型 ckpt。

模型权重(ModelScope)
国内推荐镜像,下载更稳定。

Gradio Web UI
运行 tools/gradio_app.py 启动交互式 Web Demo。
