Grok 4：纯推理模型，追求复杂问题解决和真相探索

AI聊天工具 AI训练模型

马斯克旗下xAI发布的大语言模型

链接直达手机查看

20 浏览

Grok 4 是埃隆·马斯克（Elon Musk）旗下人工智能公司 xAI 于 2025年7月正式发布的最新大语言模型 。它被设计为一个纯推理模型，在多项基准测试中表现卓越，旨在处理需要深度思考的复杂任务。

下面是关于 Grok 4 的核心信息概览：

维度	详细说明
核心定位	纯推理模型，追求复杂问题解决和真相探索
发布公司	马斯克旗下的 xAI
模型版本	Grok 4 (单智能体) 和 Grok 4 Heavy (多智能体，支持4个智能体协同工作)
核心能力	复杂推理、工具调用、代码生成与调试、多语言支持
关键技术特性	- 上下文窗口：最高 256K tokens - 训练量达 Grok 2 的 100倍，推理训练算力投入为其他模型的 10倍以上 - 支持文本和图像作为输入 (输出暂仅支持文本)
访问与定价	- 免费使用：已向所有用户开放，但有使用量限制 - 付费订阅：SuperGrok Heavy 会员月费高达 300美元 - API 调用：输入每百万 tokens 3美元，输出每百万 tokens 15美元

强大的推理能力与学术表现：Grok 4 的核心优势在于其深度推理能力。在被誉为“人类最后考试”的 HLE 基准测试中，Grok 4 的准确率达到了 38.6%，而其多智能体版本 Grok 4 Heavy 更是借助智能体协作，将分数提升至 44.4%，显著超越了同期其他顶级模型。马斯克和 xAI 团队声称，Grok 4 在处理学术问题上的表现已在所有学科达到博士水平，甚至超越了大多数博士。
卓越的编程与工具使用能力：Grok 4 在代码生成和调试方面表现出色。在 SWE-Bench 基准测试中，其代码修复识别准确率据称可达 89% 。更重要的是，它具备原生工具使用能力，能够主动调用网络搜索、文献检索、代码执行等外部工具来辅助完成任务，例如编写并运行关于引力波和黑洞的模拟代码。
独特的“多智能体”协作模式：这是 Grok 4 Heavy 版本的独有特性。它支持四个智能体同时工作，就像一个专家团队，通过内部讨论、投票或分工合作来处理同一个复杂问题，以此提升推理的准确性和深度。

Grok 4 提供了多种访问方式以适应不同用户的需求：

免费体验：你可以通过访问 Grok 官方网站 (grok.com) 并注册账户来免费使用 Grok 4。免费用户通常会有使用量的限制，例如每天可进行少量查询，对于复杂查询，系统在“自动”模式下会将其路由到 Grok 4 进行处理。
付费订阅与 API：对于有高强度或商用需求的用户，xAI 提供了 SuperGrok Heavy 订阅服务，月费为 300美元，可以无限制地使用最强大的 Grok 4 Heavy 模型。开发者也可以通过 API 调用模型，价格为每百万 tokens 输入3美元，输出15美元。

尽管技术强大，Grok 4 及其背后 xAI 的发展也面临一些挑战：

高昂的成本：xAI 为训练 Grok 4 投入了巨大的算力成本，据报道每月支出高达 10亿美元，这种“烧钱换领先”的战略能否持续是个疑问。
内容审核与偏见争议：Grok 4 的前代曾因发表激进言论和反犹内容引发严重争议。此外，有用户实测发现，Grok 在回答问题时可能会优先考虑马斯克的观点，这引发了关于模型客观性的讨论。

希望以上信息能帮助你全面了解 Grok 4。如果你对其中的技术细节或具体应用场景有更深入的兴趣，我们可以继续探讨。