QQ扫一扫联系
CosyVoice-M300-Instruct 是一个用于语音合成的模型,主要应用于语音生成和转换任务。这个模型属于 CosyVoice 语音合成系列,旨在提供高质量、自然的语音合成效果。CosyVoice-M300 特别适用于需要自定义情感、语调和发音特征的场景。
支持指令如下
[breath] 插入呼吸声音
[breath] 插入呼吸声音
<strong></strong> 强调说明
<laughter></laughter> 笑着说
[noise] 表示噪音或杂音
[laughter] 插入笑声
[cough] 插入咳嗽声
[clucking] 模拟鸡叫声
[accent] 标记或模拟带有某种口音的语音
[quick_breath] 表示快速的呼吸
[hissing] 插入嘶嘶声
[sigh] 插入叹气声
[vocalized-noise] 表示口头上的杂音或模糊的语音
[lipsmack] 插入嘴唇发出的“咂嘴”声音
[mn] 插入“嗯”的声音
声音克隆
模型克隆 请使用5-10s的音频,太长的音频会导致克隆变慢。