免费
GPU 8G+
内存 16G+
语音指令
支持50显卡
语音合成
语音克隆
Win-x86
MacOS-Apple
300M语音模型,支持语音克隆、语音合成,支持指令控制
最新版本
v1.0.0
发布时间
2025-09-30 10:55:46
GPT-SoVITS 是一款开源语音转换与合成工具。它结合了 GPT 模型和 SoVITS 语音变换技术,支持零样本和少样本的即时文本到语音转换,只需 5 秒音频样本即可进行语音风格迁移。
最新版本
v1.0.0
发布时间
2025-10-10 18:40:44
VIP/SVIP
GPU 8G+
内存 16G+
支持50显卡
语音合成
语音克隆
Win-x86
MacOS-Apple
300M参数语音模型,支持语音合成、语音克隆,长文合成优化
最新版本
v1.1.0
发布时间
2025-09-25 23:05:17
VIP/SVIP
GPU 8G+
内存 16G+
语音指令
支持50显卡
0.5B参数语音模型,支持语音克隆,支持指令控制,长文本优化
最新版本
v1.1.0
发布时间
2025-10-09 08:45:28
VIP/SVIP
GPU 8G+
内存 16G+
语音指令
支持50显卡
语音合成
语音克隆
Win-x86
MacOS-Apple
300M语音模型,支持语音克隆、语音合成,支持指令控制,长文本优化
最新版本
v1.1.0
发布时间
2025-10-02 18:52:38
免费
GPU 8G+
内存 16G+
支持50显卡
IndexTTS2 是 哔哩哔哩(B站)研发的新一代文本转语音(TTS)模型,主要在情感表达、时长控制、音色与情感解耦等方面实现突破。
最新版本
v1.0.1
发布时间
2025-10-09 08:56:31
VIP
内存 16G+
GPU 16G+
支持50显卡
支持视频换口型,Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计
最新版本
v0.2.0
发布时间
2025-10-17 09:39:04