8月26日,通义万相又迎来开源。全新发布的通义万相模型家族新成员为音频驱动的视频模型Wan2.2-S2V,仅需一张图片和一段音频,该模型即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。
上证报中国证券网讯(记者 杨翔菲 温婷)8月26日,通义万相又迎来开源。全新发布的通义万相模型家族新成员为音频驱动的视频模型Wan2.2-S2V,仅需一张图片和一段音频,该模型即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。模型生成视频时长可达分钟级,可大幅提升数字人直播、影视制作、AI教育等行业的视频创作效率。目前,该模型已在通义万相官网上线。