马斯克旗下xAI发布Grok 3 AI模型,引发热议
AI导读:
马斯克旗下xAI公司正式发布Grok 3 AI模型,声称在基准测试中击败所有市面上模型。然而,有用户指出其在特定问题上存在不足。OpenAI联合创始人Andrej Karpathy体验后认为Grok 3表现与ChatGPT的o1-pro相当。
一度“跳票”的AI模型Grok 3终于迎来正式发布。当地时间2月17日晚,马斯克旗下AI公司xAI发布了Grok 3及其精简版Grok 3 mini,发布会吸引超百万观众在线观看。Grok 3作为xAI对OpenAI等模型的回应,可分析图像、回答问题,并为X平台提供技术支持。马斯克称其为“地球上最聪明的人工智能”。
在发布会上,马斯克与工程师共同演示了Grok 3的多种功能,声称其在AI基准测试中击败所有市面上模型,包括AIME和GPQA等。测试数据显示,早期版本的Grok 3在Arena排行榜上拿下第一,成为首个超1400分的模型。
然而,有用户指出Grok 3在游戏《流放之路2》相关结论中错误频出,且在经典编程问题上亦存在不足。OpenAI联合创始人Andrej Karpathy体验后认为,Grok 3表现与ChatGPT的o1-pro相当,略优于Deepseek-R1和谷歌Gemini 2.0 Flash Thinking。
Grok 3的发布历经波折,马斯克曾预计于2024年底发布,但最终跳票。不过,在迪拜峰会上,马斯克宣布将于一到两周内推出,并强调其强大程度“令人害怕”。从基准测试结果看,Grok 3在数学、科学和编程领域大幅领先其他主流模型。
此外,马斯克透露,为训练Grok 3,其超级计算机集群Colossus规模已扩大至20万块GPU。演示团队还展示了Grok 3在物理学和游戏方面的能力,包括生成复杂三维动画图表和编写结合俄罗斯方块与宝石迷城的游戏代码。
除了基本模型能力,Grok 3还具备智能体功能,可全面搜索互联网并提供整合报告。尽管Grok 3在某些测试中表现卓越,但仍有用户发现其在特定问题上存在不足,需进一步评估。

图片来源:直播截图

图片来源:xAI

图片来源:xAI

图片来源:X

图片来源:X

图片来源:xAI

图片来源:xAI

图片来源:哔哩哔哩

图片来源:X
(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。