语音模型 - ‌Spark-TTS模型一键运行包 v0.1.0 已发布

2025-03-23 21:17:55    模型更新   

Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS 支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。

语音克隆推理概述

45378_xtcz_9776.png

受控发电的推理概述

45454_tdf4_6665.png


更新内容

初版发布0.1.0


语言
QQ
微信客服
微信群
客服