近日,美团推出了音频驱动的多人对话视频生成框架 MultiTalk,并在 GitHub 上开源,首创 L-RoPE 绑定技术,通过标签旋转位置编码精准解决多音频流与人物错位难题。
评论删除后,数据将无法恢复
暂无更多评论