蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0_学习资源

蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0

创始人

2026-02-11 12:18:39

2月11日消息，蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0，是业界首个全场景音频统一生成模型，可在同一条音轨中同时生成语音、环境音效与音乐。用户用自然语言下指令，可对音色、语速、语调、音量、情绪与方言等进行控制。模型在推理阶段实现了3.1Hz的极低推理帧率，实现了分钟级长音频的实时高保真生成。（财联社记者黄心怡）

上一篇：AI拉动，阿里云市场份额扩大至36%

下一篇：中国东方航空与阿里千问、飞猪达成AI合作

热门资讯

深耕细作·惠州行五洲·露营装备... 当露营从“诗和远方”变成周末常态，消费者的眼光也越来越“刁”。他们不再满足于“能住”，而是追求“好住...

帐篷选的好，露营受罪少，运良两... 帐篷选的好，露营受罪少，运良两款帐篷应该怎么选运良越野露营帐篷户外露营户外装备

用这个帐篷过夜露营，可得小心了... 用这个帐篷过夜露营，可得小心了帐篷露营 bivvybag

特价68丨6.07周日【三角山... 【三角山丨从化十登】千米山之恋从化第七峰三角山广州附近十座千米山峰你都去过吗？这次跟随我们的...

原创六... 一想起儿童节出游，脑子里是不是马上浮现出：景区门口望不到头的长队、餐厅里高到离谱的儿童套餐、游乐场里...

蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0

相关内容

热门资讯