大模型竞技场LMArena日前更新的排名显示,智谱上月底发布的最新旗舰模型GLM-4.6综合排名位列第4,与阿里旗下的Qwen3-Max-Preview持平,并列国内第一,也是全球开源模型第一。
GLM-4.6发布于9月30日,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。
智谱提供的信息显示,在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
在LMArena最新排名中,GLM-4.6的创造性写作能力也成功登上了全球第一。
凭借良好的能力表现,GLM-4.6目前也在Hugging Face Trending和全球⼤模型API超市OpenRouter趋势榜双双登顶。
另外值得一提的是,阿里通义Qwen3-Max的正式版本0923,却未能在LMArena的测试中超越Preview版本,仅仅排在第9位。但其数学能力也能够排名全球第一。
9月份以来,国产大模型迎来密集更新,包括GLM-4.6、Qwen3-Max和Kimi K2等均有出色的跑分表现。