马斯克力赞Grok 3：地球上最聪明的人工智能实测表现如何？

股市热点 2025-02-23 21:10:03 来源：每经头条作者：网络

AI导读：

近日，xAI发布Grok 3大模型，马斯克称其为地球上最聪明的人工智能。经实测，Grok 3在数学、逻辑和编程等方面表现出色，但并未拉开与其他同等级模型的显著差距，其最大的亮点在于极快的响应速度。

近日，人工智能初创公司xAI发布了更新版Grok 3大模型，该模型被埃隆·马斯克誉为“地球上最聪明的人工智能”。这一声明迅速引起了业界的广泛关注。

北京时间2月23日，马斯克在社交平台X上宣布，Grok语音模式的早期测试版已在Grok应用程序中上线。尽管是早期版本，马斯克仍对其表现赞不绝口，并表示团队会迅速解决可能遇到的问题。

据官方公布的测试结果，Grok 3在AIME（评估模型在数学问题上的表现）和GPQA（评估模型在博士级别的物理学、生物学和化学问题上的表现）等基准测试中，远超GPT-4o、Gemini-2 Pro、Deepseek V3、Claude 3.5 Sonnet等大模型。在LMSYS测试中，Grok 3也获得了第一名，达到了140分。

基于Grok 3的卓越表现，业内对算力堆积路径的认可度再度提升。然而，也有部分用户在体验后对Grok 3的能力提出质疑，认为其并未达到马斯克所宣称的水平。OpenAI应用研究主管Boris Power更是对Grok团队在模型评估中的行为表示失望。

《每日经济新闻》记者经过实测发现，Grok 3确实展现了世界顶级模型的水平，但并未与其他模型拉开太大差距，其最大的亮点在于极快的响应速度。

Grok 3由马斯克旗下的人工智能公司xAI发布，马斯克称其为“地球上最聪明的人工智能”，并表示Grok 3的能力比前代产品高出一个数量级，具备更强的推理、计算和适应能力。在发布会上，马斯克还宣布，在发布后48小时内，xAI将免费开放Grok 3给所有用户，直至服务器负载达到极限。

记者通过一系列测试发现，Grok 3在数学、逻辑思考和编程等方面均表现出色，但并未在所有测试中独占鳌头。例如，在逻辑思考测试中，Grok 3的表现就不如DeepSeek R1。而在数学能力测试中，虽然Grok 3答对了多道难题，但并未与其他同等级模型拉开显著差距。

总的来说，Grok 3确实是世界顶尖的AI模型之一，但其实测效果并未像马斯克在发布会上展示得那么夸张。其极快的响应速度是其最大的亮点之一，但在其他方面，Grok 3仍需不断提升和完善。（文章来源：每经头条）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。