• 1.摘要
  • 2.基本信息
  • 3.发展历程
  • 4.研发技术
  • 5.功能特点
  • 6.竞品对比
  • 7.参考资料

Grok 3

xAI公司开发的人工智能模型

Grok 3是马斯克旗下人工智能公司xAI开发的人工智能模型Grok的第三代版本1,被马斯克描述为“地球上最聪明的人工智能”2,于2025年2月18日发布3

Grok这个词源自美国科幻作家 罗伯特·海因莱因的小说 《异乡异客》(Stranger in a Strange Land)。在书中,“Grok”由一位在火星上长大的角色使用,意指对某事物全面且深刻的理解3

基本信息

  • 外文名

    Grok 3

  • 所属国家

    美国

  • 开发机构

    xAI

发展历程

2024年7月,埃隆·马斯克表示,Grok 3依托于10万块英伟达H100芯片的算力进行训练4。22日,Grok 3已经在“孟菲斯超级集群(Memphis Supercluster)”上进行训练。该集群由10万个液冷H100 GPU组成,在单个RDMA结构(即远程直接数据存储结构,可解决网络传输中服务器端数据处理的延迟)上运行,是“世界上最强大的人工智能训练集群”5

2025年1月4日,Grok 3预训练现已完成,计算量比Grok 2高10倍6

2025年1月27日,Grok 3短暂现身独立平台和X平台,开启内部测试6

2025年2月13日,Grok 3已进入开发的最后阶段7

2025年2月16日,人工智能初创公司xAI于太平洋时间2月17日晚上8点发布Grok 3聊天机器人2

2025年2月18日,Grok 3聊天机器人正式发布。Grok 3会首先面向X的Premium Plus 订阅用户开放。此外,xAI还为忠实粉丝推出了名为Super Grok的独立订阅服务,提供最先进的功能和最早的新特性访问权限3

研发技术

2025年2月18日,xAI表示,他们花了122天让首批10万颗GPU上线并运行,这是目前全球最大的全连接H100集群。随后,xAI进一步加速扩建数据中心,仅用92天便完成第二阶段建设,使计算能力再次翻倍(依此计算约有20万块GPU)3

功能特点

Grok 3的模型是在合成数据上进行训练的,能够通过反复查看数据来实现逻辑一致性,从而反思所犯的错误。最大的特点在于引入了“思维链”(Chain Of Thought)推理能力。该能力让Grok 3能够像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应能力2

Grok 3可以执行有趣的任务。例如计算从地球到火星的航天器任务。Grok 3生成了一张太空发射的动画 3D 轨迹图(即从地球到火星然后再返回地球的可行轨迹)。这涉及一些复杂的物理知识,Grok 3需要理解这些内容3

Grok 3还拥有在自动化游戏开发方面的潜力。xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏。Grok 3生成的Python脚本定义了游戏的常量、颜色、方块形状等元素,并呈现出独特玩法:当连接了至少三个相同颜色的方块时,会触发重力机制使方块消除,这种方式类似《宝石迷阵》3

Grok 3生成的游戏

此外,Grok 3包含一个名为Big Brain的功能,这是一个推理模型模式,允许在处理查询时进行更深入的思考3

竞品对比

2025年2月18日,马斯克和他的人工智能团队声称,Grok 3测试版的推理能力超过了现有的人工智能模型。在有关推理和测试时间的基准测试中,Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3 minihigh、Gemini-2 Flash Thinking更优的效果3

Grok 3同竞品在推理和测试时间的数据对比

根据xAI的比较基准显示,Grok 3在科学、编码和数学方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且,在盲测方面,xAI的Grok-3(早期版本) 在 lmArena 排行榜中以1402 分的历史最高成绩登顶,成为首个突破1400分的AI模型。这一成绩超越了Google、OpenAI、DeepSeek等业界主要竞品3