上证报中国证券网讯(记者 孙小程)3月4日,大模型创业公司阶跃星辰继开源Step3.5Flash模型后,又开源了该款Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。 Step3.5Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。该模型专为智能体(Agent)场景设计,擅于处理复杂推理和长链任务。 Step3.5Flash目前在Hugging Face上的下载量已超30万次,并登上Open Router Trending第一名,获得了较高的社区认可度。而在知名开源项目OpenClaw上,该模型排名已升至前二。
上证报中国证券网讯(记者 孙小程)3月4日,大模型创业公司阶跃星辰继开源Step3.5Flash模型后,又开源了该款Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。
Step3.5Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。该模型专为智能体(Agent)场景设计,擅于处理复杂推理和长链任务。