钛媒体App 2月11日消息,蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。(广角观察)
上一篇:飞荣达A股股东户数增加3953户增幅8.55%,流通A股户均持股7880.97股降幅7.88%,户均持股市值27.61万元增幅2.08%
下一篇:AI需求驱动半导体行业上行,AI人工智能ETF(512930)持续获资金关注