ChatGPT哭了!马斯克新AI直接封神
创始人
2025-11-18 18:16:27

近日,马斯克的xAI公司推出了最新一代大语言模型 Grok 4.1。这次更新距离今年 7 月 Grok 4 发布仅过去四个多月,却带来了用户立刻就能感知到的显著提升。马斯克本人在 X 平台上发帖表示,大家应该会明显感觉到速度和质量的双重飞跃,而实际体验也确实如此。

Grok 4.1 的最大亮点在于它对大模型顽疾的针对性优化。xAI 团队这次把后训练阶段的重心放在了减少幻觉上,通过大规模强化学习和针对信息求取类提示的专项纠偏,新模型在真实世界查询中的幻觉率从 Grok 4 的 12% 左右直接降到 4% 左右,降幅接近三倍。这意味着用户问事实性问题时,Grok 4.1 更不容易胡编乱造,而是给出可靠、可验证的答案。对于依赖 AI 进行研究、写作或决策的用户来说,这无疑是一次实质性进步。

除了更可靠,Grok 4.1 在对话体验上也完成了质的飞跃。官方描述称它在创意、情感和协作交互方面表现出色,更善于捕捉用户细微意图,回复更有共情力、个性更连贯,同时保持了前代模型那种锋利又幽默的风格。在 EQ-Bench 情感智商测试中,Grok 4.1 的得分从 Grok 4 的 1206 分暴涨到 1586 分,在创意写作和人际理解维度同样领先。这让它不再只是冷冰冰的问答机器,而是更像一个真正懂你的对话伙伴。

第三方盲测数据进一步印证了这些改进。在 LMArena 的 Text Arena 排行榜上,Grok 4.1 的思考模式以 1483 的 Elo 分数稳坐第一,甚至非推理的快速模式也拿下第二,领先所有非 xAI 模型 31 分之多。更值得一提的是,在 11 月 1 日到 14 日为期两周的静默灰度测试中,xAI 把新旧模型的回复随机混在一起让用户盲选,结果 Grok 4.1 以 64.78% 的偏好率完胜前代。这份来自真实用户的投票,比任何内部基准都更有说服力。

访问方式也保持了 xAI 一贯的亲民作风。Grok 4.1 已向所有用户免费开放,无论在 grok.com 网站、X 平台,还是 iOS 和 Android 的 Grok App 上,都可以直接使用。进入界面后,Auto 模式默认就是 Grok 4.1,如果你想手动指定,也能在模型选择器里找到它。付费的 SuperGrok 或 Premium+ 用户自然能享受更高配额,但免费版已经足够日常使用。

这次发布没有大张旗鼓的直播,也没有长篇的技术报告,xAI 只是平静地把模型推上线,任由用户自己去感受变化。这种低调反而凸显了自信:当产品真正好用时,不需要太多噱头。和其他厂商动辄几个月一次的大版本迭代相比,xAI 的节奏明显更快,从 Grok 4 到 4.1 只用了不到半年,就实现了从排行榜三十多名到全面登顶的逆袭。

当然,Grok 4.1 并非完美无缺。它依然继承了 Grok 系列一贯的直率风格,有时回答会比其他模型更不加修饰,但这也正是许多用户喜欢它的原因。在当前 AI 军备竞赛白热化的背景下,xAI 用实际表现证明,追求真理和最大化帮助用户,依然能在性能和体验上占据上风。

相关内容

热门资讯

2025最新消息“华彩棋牌开挂... 亲,华彩棋牌有的,ai轻松简单,又可以获得无穷的乐趣,华彩棋牌是你和朋友度过闲暇时光的不二选择,赶紧...
2025最新消息“中至二人开挂... 无需打开直接搜索微信:中至二人有挂吗本司针对手游进行,选择我们的四大理由:1、软件助手是一款功能更加...
2025最新消息“来来竞技开挂... 2025最新消息“来来竞技开挂辅助器工具”难怪经常输有猫腻,亲,有的,ai轻松简单,又可以获得无穷的...
2025最新消息“大同麻将开挂... 您好:大同麻将这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,...
2025最新消息“壹号娱乐开挂... 【无需打开直接搜索微信;29290261】 操作使用教程:1.亲,实际上壹号娱乐是可以开挂的,确实有...