IBM 推出 Granite 4.0 系列开源模型:混合架构设计降低内存需求
创始人
2025-10-04 17:13:23

IT之家 10 月 4 日消息,IBM 当地时间 2 日宣布推出 Granite 4.0 系列企业级 LLM 模型,新一代的模型采用 Mamba-Transformer 混合架构,可在不牺牲性能的前提下大幅降低内存需求,这降低了推理部署的成本。

Granite 4.0 系列模型的首发型号包括 Small、Tiny、Micro 规模的标准和指令变体(规格参见下方列表),未来其它参数规模版本和推理变体则将在 2025 年底推出。

    • Granite-4.0-H-Small:总参数 32B,激活 9B;
    • Granite-4.0-H-Tiny:总参数 7B,激活 1B;
    • Granite-4.0-H-Micro:总参数 3B;
    • Granite-4.0-Micro:采用传统 Transformer 架构,总参数 3B。

IBM 表示混合架构的设计能在长输入和多并发场景下减少 70% 的内存需求。性能方面,即使是最小的 Granite 4.0 模型在基准测试中也明显优于 Granite 3.3 8B,而 Granite-4.0-H-Small 则以较小参数规模取得了开源模型中一流的表现

IBM 以标准 Apache 2.0 许可开源 Granite 4.0 系列模型,这些模型得到了 ISO 42001 认证并经过加密签名。

相关内容

热门资讯

刚刚!AI,突传重磅! AI领域,传出多则大消息! 日前,有外媒报道称,贝莱德旗下GIP正在就收购Aligned数据中心进行...
三亚南山景区双节假期人气高涨,... 国庆中秋双节期间,三亚南山文化旅游区迎来客流高峰。晴好的天气下,景区内国旗迎风飘扬,处处洋溢着喜庆祥...
一句“上海不是上海人的上海”,... 原创 上海云河 我是云河 2025年10月04日 13:37 上海 “这言论口罩就出现过,抖某十几...
游客被曝在司马台长城城墙刻字,... 近日,北京密云古北水镇景区,有游客被曝在司马台长城墙上刻字,引发热议。10月4日,景区工作人员告诉南...