视频模型-LatentSync模型 v0.1.0 Windows版 已发布

2025-02-26 21:17:44    模型更新   

LatentSync 模型 LatentSync 是字节跳动推出的一种基于音频条件的端到端唇同步技术,通过潜在扩散模型和时间表示对齐技术(TREPA),实现高质量、时间一致的动态视频生成,并优化了 SyncNet 的收敛问题,使唇同步的准确性达到更高水平。

模型功能

  • 视频换口型

效果参考

效果可以参考:https://github.com/bytedance/LatentSync

更新说明

视频模型-LatentSync v0.1.0 已发布,这个版本主要提升了模型运行兼容性,优化了模型运行性能。


语言
QQ
微信客服
微信群
客服