华为昇腾多模态推理加速套件正式开源!集成四大能力
创始人
2025-12-19 10:16:44

【CNMO科技消息】12月19日,华为计算官方宣布,昇腾多模态推理加速套件——MindIE SD项目已正式开源。该项目旨在通过与开源社区协作,将昇腾在多模态推理领域积累的原子能力赋能给广大开发者,实现在昇腾硬件上高效运行各类前沿多模态模型。

华为

CNMO注意到,MindIE SD项目包含以下四大关键加速特性,旨在全方位提升多模态模型在昇腾平台上的推理效率:

1. 加速插件

提供多模态亲和加速插件能力,例如支持block-wise稀疏Attention的稀疏Attn插件,以及对RoPE(旋转位置编码)等操作进行融合的融合插件,有效减少计算与内存访问开销。

2. 以存代算

提供DiT module、DiT block、Attention等多种粒度的缓存(Cache)算法。该特性支持根据不同场景需求选择加速策略,能显著提升模型运行时性能。用户可自定义加速比,并利用工具实现缓存算法的快速寻优。

3. 多卡并行

集成了CFG(Classifier-Free Guidance)并行、USP(Ulysses并行) 等先进并行能力。这些能力已融入加速算子的API设计中,开发者仅需进行接口替换即可自动使能,从而快速适配生成类模型的通用并行算法优化框架,充分利用多卡计算资源。

4. 量化与稀疏Attention

针对昇腾硬件的数据类型和算力分布,提供亲和的量化算法,在保证模型效果的前提下提升推理效率并降低资源消耗。同时,提供亲和的稀疏Attention算子,以降低Attention计算的复杂度,并支持多模态算子的快速寻优。

目前,MindIE SD已成功实现对Stable Diffusion系列、OpenSora、混元(Hunyuan)、万视(Wan) 等多模态生成模型的快速适配与昇腾加速。相关模型已在Modelers/ModelZoo仓库中发布,并与vllm-omni等开源组件对接。未来,其加速能力将进一步扩展至多模态理解、全模态等更广泛的场景。

相关内容

热门资讯

利用AI软件编造谣言!合肥警方... 为有效净化网络环境,切实维护人民群众合法权益,合肥市公安机关网安部门依法严厉打击编造传播网络谣言违法...
AI能否成为万物云致胜“法宝”... 近日,在万物云(002602.HK)召开的2025年度业绩发布会上,万物云董事长朱保全判断,当前物业...
看好工业AI前景 西门子与中企... 中新网北京3月24日电 (陈昊星 王恩博)人工智能正迅速从数字世界走向实体经济。基于对中国工业AI前...
崇川今年开展百场AI夜校培训 本报讯 (记者 贲腾) 南通市崇川区委党校报告厅,一堂“AI实操运用及AI+办公”专题课近日开讲,区...
市民赏花爱用AI“寻根问底” “看一下,这是什么花,咋辨别?”3月23日,市民刘志梅走进双塔公园,将手机镜头对准枝头粉嫩的花朵,向...