模型下载 ‌Spark-TTS模型一键运行包

语音克隆 GPU 8G+ GPU 16G+

Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS 支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。

语音克隆推理概述

45378_xtcz_9776.png

受控发电的推理概述

45454_tdf4_6665.png


后羿 Hou Yi
有一种撕心裂肺的感觉,是辣椒,我加了辣椒!
刘德华 Andy Lau
所以我觉得好的技术,它一定是有温度的,能够真正服务于大家,而不是冷冰冰地摆在那里。就像现在的语音合成技术,越来越自然,越来越贴近人们的需求,这种发展是有生命力的。它就跟当年那些突破性的科技一样,一开始可能觉得很新鲜,但慢慢地,它就融入生活,变成大家离不开的一部分了。
v0.1.0 初版发布
2025-03-23

初版发布

语言
QQ
微信客服
微信群
客服