通义实验室开源Fun-CineForge:全球首个影视级多模态配音大模型
创始人
2026-03-17 17:18:10

3月16日消息,通义实验室今日正式发布并开源Fun-CineForge,该模型为全球首个支持影视级多场景配音的多模态大模型,同时开放其配套高质量数据集构建方法 CineDub,旨在解决AI在专业影视配音中长期存在的“口型不同步、情绪不匹配、音色不一致、时间对不准”四大核心难题。

目前,模型已在 GitHub、Hugging Face、ModelScope 三平台开源,支持30秒以内视频片段推理。

相关内容

热门资讯

Cloudflare推出智能体... Cloudflare这家知名的安全和内容分发网络公司推出了一项名为"智能体专用Markdown"的新...
AI热潮推动RISC-V挑战A... RISC-V标准已经发展成熟,与经过长期验证但价格昂贵的Arm和x86处理器相比,性能差距已基本消失...
Atlassian裁员1600... Atlassian将裁减约10%的全球员工,约1600个岗位,这家协作软件制造商正将资本重新投向人工...
阿里成立ATH,以Token重... 3月16 日,阿里巴巴集团CEO吴泳铭宣布了一项组织调整:成立Alibaba Token Hub(简...
软硬一体大整合,大厂决战AI硬... 请输入图说 在AI大厂的全面博弈中,AI硬件承载“入口+数据+应用”三位一体的价值。 采写 /马十四...