AI导读:

百川智能对外开源新一代医疗大模型 M3,在全球医疗AI评测中取得优异成绩,刷新了最高分记录,并首次实现了对GPT-5.2的全面超越。M3还具备原生的“端到端”严肃问诊能力,为医生和患者提供更精准的医疗服务。

  1月13日,百川智能对外开源新一代医疗大模型 Baichuan—M3,其在全球最权威的医疗AI评测 HealthBench 中以65.1分的综合成绩位列全球第一;在专门考验复杂决策能力的 HealthBench Hard 上,也以44.4分的成绩夺冠。这一成绩,不仅刷新了 HealthBench 的最高分,更首次在医疗领域实现了对 GPT—5.2的全面超越。在OpenAI引以为傲的低幻觉领域,M3也实现了超越,幻觉率3.5全球最低。M3还首次具备了原生的“端到端”严肃问诊能力。从1月初OpenAI发布医疗产品ChatGPT Health,到今天Anthropic 推出Claude for Healthcare,AI 医疗正在全球范围内提档加速,竞争也正式进入深水区。在这场竞速中,百川持续突破低幻觉率、端到端问诊和复杂临床推理等核心能力,已从“跟随者”跃迁为行业“引领者”与新范式的“定义者”,正以硬核实力扛起中国 AI 医疗发展的旗帜。