讨论 Yec TA的回帖
第 1323 位会员
注册于
帖子
1
回帖
2
TA的回帖
声音跨语种克隆出现整个句子丢失
0%| | 0/1 [00:00<?, ?it/s]2025-03-14 22:22:54,308 WARNING synthesis text 我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。 too short than prompt text Hi jeff,Merry christmas,on behalf of vozo AI,we wish you a holiday season filled with joy warmth and meaningful moments.May this Christmas bring you happiness love and inspiration for the year ahead., this may lead to bad performance
175
2025-03-14 22:23:04,898 INFO synthesis text 我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。
176


原文:我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。

上面是日志输出,下面是我的原文,看起来分句没有丢失啊

声音跨语种克隆出现整个句子丢失

52902_rugw_7077.png

同一段文字,跨语种和不跨语种,合成结果都不对

146
2025-03-14 22:22:16 - 开始运行
147
2025-03-14 22:22:16 - config {'id': 'SoundClone_4', 'mode': 'local', 'modelConfig': {'type': 'soundClone', 'seed': 0, 'speed': 1, 'text': '我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。', 'promptAudio': 'C:\\Users\\YeSha\\AppData\\Roaming\\aigcpanel\\data\\soundClonePrompt\\96zCs9lXUkWTJE9o.wav', 'promptText': 'Hi jeff,Merry christmas,on behalf of vozo AI,we wish you a holiday season filled with joy warmth and meaningful moments.May this Christmas bring you happiness love and inspiration for the year ahead.', 'crossLingual': False}, 'setting': {}} ['E:\\Models\\VoiceModel\\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\\aigcpanelrun.py', 'C:\\Users\\YeSha\\AppData\\Roaming\\aigcpanel\\temp\\file_1741962136246_BhUKYXiIpphqOZEjpWnAjbAUgWJx8a7H.json']
148
2025-03-14 22:22:18 - 开始运行 {'UseCuda': True}
149
2025-03-14 22:22:18,756 - modelscope - INFO - PyTorch version 2.3.1+cu121 Found.
150
2025-03-14 22:22:18,758 - modelscope - INFO - Loading ast index from E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_cache\modelscope\ast_indexer
151
2025-03-14 22:22:18,868 - modelscope - INFO - Loading done! Current index file version is 1.15.0, with md5 07e8d434b80614c0fc9136fc191aee2a and a total number of 980 components indexed
152
failed to import ttsfrd, use WeTextProcessing instead
153
E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\diffusers\models\lora.py:393: FutureWarning: `LoRACompatibleLinear` is deprecated and will be removed in version 1.0.0. Use of `LoRACompatibleLinear` is deprecated. Please switch to PEFT backend by installing PEFT: `pip install peft`.
154
deprecate("LoRACompatibleLinear", "1.0.0", deprecation_message)
155
2025-03-14 22:22:26,672 INFO input frame rate=50
156
E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\onnxruntime\capi\onnxruntime_inference_collection.py:69: UserWarning: Specified provider 'CUDAExecutionProvider' is not in available provider names.Available providers: 'AzureExecutionProvider, CPUExecutionProvider'
157
warnings.warn(
158
2025-03-14 22:22:28,310 WETEXT INFO building fst for zh_normalizer ...
159
2025-03-14 22:22:28,310 INFO building fst for zh_normalizer ...
160
2025-03-14 22:22:50,988 WETEXT INFO done
161
2025-03-14 22:22:50,988 INFO done
162
2025-03-14 22:22:50,988 WETEXT INFO fst path: E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\zh_tn_tagger.fst
163
2025-03-14 22:22:50,988 INFO fst path: E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\zh_tn_tagger.fst
164
2025-03-14 22:22:50,989 WETEXT INFO E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\zh_tn_verbalizer.fst
165
2025-03-14 22:22:50,989 INFO E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\zh_tn_verbalizer.fst
166
2025-03-14 22:22:50,995 WETEXT INFO found existing fst: E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\en_tn_tagger.fst
167
2025-03-14 22:22:50,995 INFO found existing fst: E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\en_tn_tagger.fst
168
2025-03-14 22:22:50,995 WETEXT INFO E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\en_tn_verbalizer.fst
169
2025-03-14 22:22:50,995 INFO E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\tn\en_tn_verbalizer.fst
170
2025-03-14 22:22:50,995 WETEXT INFO skip building fst for en_normalizer ...
171
2025-03-14 22:22:50,995 INFO skip building fst for en_normalizer ...
172
2025-03-14 22:22:54 - soundClone {'type': 'soundClone', 'seed': 0, 'speed': 1, 'text': '我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。', 'promptAudio': 'C:\\Users\\YeSha\\AppData\\Roaming\\aigcpanel\\data\\soundClonePrompt\\96zCs9lXUkWTJE9o.wav', 'promptText': 'Hi jeff,Merry christmas,on behalf of vozo AI,we wish you a holiday season filled with joy warmth and meaningful moments.May this Christmas bring you happiness love and inspiration for the year ahead.', 'crossLingual': False}
173
174
0%| | 0/1 [00:00<?, ?it/s]2025-03-14 22:22:54,308 WARNING synthesis text 我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。 too short than prompt text Hi jeff,Merry christmas,on behalf of vozo AI,we wish you a holiday season filled with joy warmth and meaningful moments.May this Christmas bring you happiness love and inspiration for the year ahead., this may lead to bad performance
175
2025-03-14 22:23:04,898 INFO synthesis text 我的学习没有多好,成绩也不算顶尖。我其实很想留在学校里,可是有一道看不见的墙挡在我的眼前,把我和求学的道路隔开了。弟弟比我小九岁,他从出生起心脏就有毛病,如果不做手术甚至活不到成年。
176
E:\Models\VoiceModel\aigcpanel-server-cosyvoice2-300m-instruct-win-x86-v0.2.0\_aienv\lib\site-packages\diffusers\models\attention_processor.py:1584: UserWarning: 1Torch was not compiled with flash attention. (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\aten\src\ATen\native\transformers\cuda\sdp_utils.cpp:455.)
177
hidden_states = F.scaled_dot_product_attention(
178
2025-03-14 22:23:10,346 INFO yield speech len 4.435011337868481, rtf 1.2283834064359829


1
语言
QQ
微信客服
微信群
客服