AI导读:

近日,xAI发布Grok 3大模型,马斯克称其为地球上最聪明的人工智能。经实测,Grok 3在数学、逻辑和编程等方面表现出色,但并未拉开与其他同等级模型的显著差距,其最大的亮点在于极快的响应速度。

近日,人工智能初创公司xAI发布了更新版Grok 3大模型,该模型被埃隆·马斯克誉为“地球上最聪明的人工智能”。这一声明迅速引起了业界的广泛关注。

北京时间2月23日,马斯克在社交平台X上宣布,Grok语音模式的早期测试版已在Grok应用程序中上线。尽管是早期版本,马斯克仍对其表现赞不绝口,并表示团队会迅速解决可能遇到的问题。

据官方公布的测试结果,Grok 3在AIME(评估模型在数学问题上的表现)和GPQA(评估模型在博士级别的物理学、生物学和化学问题上的表现)等基准测试中,远超GPT-4o、Gemini-2 Pro、Deepseek V3、Claude 3.5 Sonnet等大模型。在LMSYS测试中,Grok 3也获得了第一名,达到了140分。

基于Grok 3的卓越表现,业内对算力堆积路径的认可度再度提升。然而,也有部分用户在体验后对Grok 3的能力提出质疑,认为其并未达到马斯克所宣称的水平。OpenAI应用研究主管Boris Power更是对Grok团队在模型评估中的行为表示失望。

《每日经济新闻》记者经过实测发现,Grok 3确实展现了世界顶级模型的水平,但并未与其他模型拉开太大差距,其最大的亮点在于极快的响应速度。

Grok 3由马斯克旗下的人工智能公司xAI发布,马斯克称其为“地球上最聪明的人工智能”,并表示Grok 3的能力比前代产品高出一个数量级,具备更强的推理、计算和适应能力。在发布会上,马斯克还宣布,在发布后48小时内,xAI将免费开放Grok 3给所有用户,直至服务器负载达到极限。

记者通过一系列测试发现,Grok 3在数学、逻辑思考和编程等方面均表现出色,但并未在所有测试中独占鳌头。例如,在逻辑思考测试中,Grok 3的表现就不如DeepSeek R1。而在数学能力测试中,虽然Grok 3答对了多道难题,但并未与其他同等级模型拉开显著差距。

总的来说,Grok 3确实是世界顶尖的AI模型之一,但其实测效果并未像马斯克在发布会上展示得那么夸张。其极快的响应速度是其最大的亮点之一,但在其他方面,Grok 3仍需不断提升和完善。(文章来源:每经头条)