QQ扫一扫联系
LatentSync 模型 LatentSync 是字节跳动推出的一种基于音频条件的端到端唇同步技术,通过潜在扩散模型和时间表示对齐技术(TREPA),实现高质量、时间一致的动态视频生成,并优化了 SyncNet 的收敛问题,使唇同步的准确性达到更高水平。
视频换口型
效果可以参考:https://github.com/bytedance/LatentSync
视频模型-LatentSync v0.1.0 已发布,这个版本主要提升了模型运行兼容性,优化了模型运行性能。