LatentSync 模型 LatentSync 是字节跳动推出的一种基于音频条件的端到端唇同步技术,通过潜在扩散模型和时间表示对齐技术(TREPA),实现高质量、时间一致的动态视频生成,并优化了 SyncNet 的收敛问题,使唇同步的准确性达到更高水平。
效果可参考:https://github.com/bytedance/LatentSync
QQ扫一扫联系
点击联系
2726531257
微信扫一扫联系
微信扫一扫加群