AI导读:

美国科技巨头微软推出了一项深度研究智能体更新,允许用户同时调用OpenAI的GPT大模型和Anthropic旗下Claude大模型。该功能旨在提高研究效率和产出质量,并通过裁判模型评估两个大模型的合作效果。

财联社3月31日讯(编辑史正丞)美国科技巨头微软周一推出一项深度研究智能体更新,允许用户在同一项研究中同时调用OpenAI的GPT大模型和Anthropic旗下Claude大模型。截至发稿,微软涨近2%。不过从去年10月高点到上周五,微软股价已经累计回撤超过30%,是“七巨头”中表现最惨的一家。微软周一宣布,在365 Copilot的研究代理更新中上架名为“Critique”的新功能。在实际操作中,由OpenAI的GPT先展开研究、生成初稿,然后让Claude遵循学术研究的评审流程,对稿件准确性、完整性和引证质量进行审查,最终生成回复给用户的报告。微软表示,预计未来这项功能最终能双向运行,即由Claude先写报告,然后GPT进行审查和完善。根据业界衡量深度研究质量的DRACO基准测试显示,两个模型之间的合作的确要比“单打独斗”强出一个档次。微软也推出另一项大模型“理事会”机制:让多个模型同步展开研究,然后比较双方的产出。在演示中,微软同步使用GPT和Claude模型独立生成研究报告。关键点在于,在两份报告生成后,会有一个裁判模型对产出进行评估,并提炼出两个大模型达成一致或出现分歧的地方,并总结每个模型的独特贡献。