AI导读:

OpenAI公开o3-mini系列模型的思维链技术,但非原始版本。DeepSeek R1模型及kimi的k1.5模型已在国内市场展现动态思考推理过程。OpenAI与DeepSeek在开源策略上的不同举措引发全球关注,大模型公司面临保持竞争力的挑战。

当地时间2025年2月6日,全球领先的AI研究机构OpenAI正式揭晓了其o3-mini系列模型的思维链(CoT)技术。这一技术揭示了模型在解决问题时的中间推理步骤,类似于人类拆解问题并逐步推理的过程,为用户提供了一种直观理解机器动态思考路径的新视角。

OpenAI虽公开o3-mini思维链,但非其原始形态

思维链技术,简而言之,即为模型在解答问题过程中展现的中间逻辑链条,它模拟了人类在面对复杂问题时如何逐步拆解并推理的过程。这一技术的推出,使用户在运用大型AI模型时,能够亲眼见证机器如何动态思考并给出答案。

当前,在国内市场中,用户在使用DeepSeek深度思考R1模型及kimi的k1.5长思考模型时,已能直观观察到这些大模型的动态思考及推理流程。例如,当输入“算八字”的指令时,DeepSeek R1不仅给出了答复,还展示了其完整的思维链;同样,kimi在处理“圣杯一的含义”这一指令时,也展现了详细的推理过程。

OpenAI研究员Noam Brown在社交平台上指出,“See CoT Live”往往是大型AI模型的“顿悟时刻”。但他同时强调,尽管当前展示的思维链已非常接近原始版本,但它并非完全未经处理的原始形态。

原始思维链未公开背后的考量

面对为何不公开原始思维链的疑问,OpenAI团队解释称,他们正在努力提升原始CoT的可读性,并在必要时提供翻译,以确保忠实传达原始内容。OpenAI首席产品官Kevin Weil亦发文表示,OpenAI深知用户对此类信息的渴望,并将致力于找到一个恰当的平衡点。

随着DeepSeek在全球范围内的技术进展和开放举措备受瞩目,不少用户开始将DeepSeek R1模型与OpenAI的最新动向进行对比。有评论指出,DeepSeek CoT之所以引人入胜,部分原因在于其原始性和未经修饰的真实性。

此外,部分用户认为OpenAI此次公开思维链是对DeepSeek开源举措及市场效果的积极回应,标志着其从过去的封闭策略中有所转变。但也有用户对OpenAI迟至今日才开放这一技术表示不满,并指出DeepSeek早已免费提供了类似功能。

DeepSeek开源后基础大模型面临的新挑战

此前,OpenAI之所以未公开思维链,很大程度上出于“保密性”考虑,旨在维护自身的技术领先地位。一位开发者向蓝鲸新闻透露,思维链可能暴露模型的内部工作机制,竞争对手可借此改进自身模型。同时,思维链中还可能包含敏感数据或信息,一旦公开,可能导致数据泄露,损害公司利益。

然而,开放思维链也为用户带来了显著价值。一位海外开发者认为,DeepSeek R1最吸引人的特性之一是能够暴露模型提示词汇对CoT的影响,从而使不良响应更易于解决。推理过程的公开让开发者更容易识别错误环节,进而消除歧义,引导AI给出更准确的回答。

DeepSeek的开源策略正是其在全球范围内产生巨大影响的关键因素之一。DeepSeek创始人梁文峰此前在接受采访时曾表示,在颠覆性技术面前,闭源形成的保护壁垒是短暂的。他强调,开源和发表论文并不会失去什么,反而能激发技术人员的成就感。对技术人员而言,开源更像是一种文化行为,而非纯粹的商业行为。

Meta首席AI科学家杨立昆(Yann LeCun)也公开表示,开源模型正在超越专有模型。他赞扬DeepSeek提出了新想法,并在他人工作的基础上进行了构建。由于DeepSeek的工作是公开且开源的,因此每个人都能从中受益,这正是开放研究和开源的力量所在。

近期,OpenAI CEO Sam Altman罕见地发表检讨,承认在开源问题上他们一直站在历史的错误一边,并在内部承认保守的开源策略是一个战略失误。

面对如何把握开放尺度的关键问题,OpenAI正面临重要抉择。此次公开思维链的小动作,实际上反映了OpenAI正尝试采取更多开放性举措的趋势。

在DeepSeek开源之后,全球大模型公司都受到了重大影响。许多基础大模型公司都面临着如何保持自身竞争力的挑战,同时,更多公司的价值和估值也将因此受到考验。

(文章来源:蓝鲸财经