AI导读:

2月27日,银河证券发布计算机行业全球科技动态追踪,指出Claude 3.7 Sonnet作为全球首个混合推理模型,在处理复杂任务时表现出色,刷新编程任务SOTA记录,加剧了AI市场竞争,有望加速AI Agent推广。

2月27日,银河证券发布计算机行业全球科技动态追踪,聚焦Claude 3.7 Sonnet推出,预示着AI Agent推广加速。Claude 3.7 Sonnet作为全球首个混合推理模型,能在实时响应与深度推理间自由切换,处理复杂任务表现出色。在研究生级推理任务中,其准确率达78.2%,超越Deepseek R1及OpenAI最新模型。

尤为值得一提的是,Claude 3.7 Sonnet在编程任务上刷新SOTA记录,SWE-bench Verified测试通过率高达70.3%,远超OpenAI的o1、o3-mini及DeepSeek R1。银河证券指出,Claude 3.7 Sonnet的发布加剧了AI市场竞争,特别是在推理与编程领域,将促使OpenAI、DeepSeek等企业加快创新步伐。

Claude 3.7 Sonnet的混合推理模式为AI模型设计提供新思路,其在编程与推理任务中的卓越表现,重新定义了AI助手的性能标准,有望加速AI Agent的推广。

(文章来源:财中社)