MultiTalk 是由 MeiGen-AI 开发的音频驱动多人对话视频生成框架。它能基于多流音频输入、参考图像和提示词,生成符合提示且唇形与音频同步的互动视频,支持单人 / 多人对话、卡通角色生成、唱歌场景等。其具备 480p/720p 分辨率灵活输出、最长 15 秒长视频生成能力,还引入 Multi-GPU 推理、TeaCache 加速等技术优化性能,可用于虚拟人对话、动画制作等场景。...详情>>
MultiTalk 是由 MeiGen-AI 开发的音频驱动多人对话视频生成框架。它能基于多流音频输入、参考
MultiTalk 是由 MeiGen-AI 开发的音频驱动多人对话视频生成框架。它能基于多流音频输入、参考图像和提示词,生成符合提示且唇形与音频同步的互动视频,支持单人 / 多人对话、卡通角色生成、