Model Download CosyVoice-300M-Instruct模型一键运行包

语音合成 语音克隆 语音指令 GPU 8G+ 内存 16G+

CosyVoice-M300-Instruct 是一个用于语音合成的模型,主要应用于语音生成和转换任务。这个模型属于 CosyVoice 语音合成系列,旨在提供高质量、自然的语音合成效果。CosyVoice-M300 特别适用于需要自定义情感、语调和发音特征的场景。

效果可以参考:https://fun-audio-llm.github.io/

v0.2.0 常规优化
2025-02-28
v0.1.0 CosyVoice-300M-Instruct
2025-02-24

支持指令如下

[breath] 插入呼吸声音

[breath] 插入呼吸声音

<strong></strong> 强调说明

<laughter></laughter> 笑着说

[noise] 表示噪音或杂音

[laughter] 插入笑声

[cough] 插入咳嗽声

[clucking] 模拟鸡叫声

[accent] 标记或模拟带有某种口音的语音

[quick_breath] 表示快速的呼吸

[hissing] 插入嘶嘶声

[sigh] 插入叹气声

[vocalized-noise] 表示口头上的杂音或模糊的语音

[lipsmack] 插入嘴唇发出的“咂嘴”声音

[mn] 插入“嗯”的声音

声音克隆

模型克隆 请使用5-10s的音频,太长的音频会导致克隆变慢。


Language
QQ
微信客服
微信群
客服