Deepseek发布新模型Deepseek-R1,引领AI创新浪潮
AI导读:
中国AI企业深度求索(Deepseek)发布最新开源模型Deepseek-R1,以低成本达到GPT-o1性能,破解“堆算力”路径依赖,激发AI创新浪潮,推动全球AI进步。业界高度评价,认为将降低开发门槛,提升企业盈利能力。
中国人工智能(AI)领域的佼佼者深度求索(Deepseek)公司,近期震撼发布了其最新力作——开源模型Deepseek-R1。该模型以较低的成本,成功逼近了美国开放人工智能研究中心(OpenAI)所打造的GPT-o1模型的卓越性能。这一里程碑式的突破,不仅打破了全球AI产业长期依赖“堆算力”的固有模式,更在资本市场掀起了轩然大波。业界内外普遍认为,Deepseek模型的问世,有望引领一场前所未有的创新风暴,进一步加速全球AI技术的蓬勃发展。
据深度求索公司官方网站详尽介绍,Deepseek-R1在后训练阶段大规模融入了强化学习技术,即便在标注数据稀缺的情况下,仍能显著提升模型的推理能力。在数学运算、代码编写、自然语言推理等多项任务中,其测评性能已逼近GPT-o1模型正式版的水平。
国际知名投行摩根士丹利发表观点称,“规模庞大不再等同于智慧超群”。Deepseek通过大幅提升数据质量并优化模型架构,开辟了一条迥异于过往大模型的高效训练新路径。摩根士丹利进一步指出,相较于国际上的知名大模型,Deepseek的模型在成本方面展现出了显著优势,降低了约一个数量级。
高盛集团同样对Deepseek新模型给予了高度评价,认为其成本远低于现有模型,这标志着开发利用大模型的门槛已大幅降低。在此背景下,互联网巨头或将面临来自初创企业的激烈竞争。
英国权威媒体《金融时报》发表评论文章指出,Deepseek成功挑战了AI产业的核心信念,即更强大的硬件是推动AI发展的关键。Deepseek的实践证明,前沿AI能力或许无需依赖庞大的计算资源。
摩根士丹利进一步阐述道,Deepseek的模型表明,通过精巧的工程设计和高效的训练方法,高效利用资源可能比单纯的计算能力更为重要。这一观点有望激发新一轮的创新浪潮,促使企业探索更具成本效益的AI开发和部署策略。
值得一提的是,Deepseek的模型是开源共享的。近日,全球知名开源平台抱抱脸公司等多个团队已宣布成功复现了Deepseek-R1的训练过程。美国“元”公司首席AI科学家杨立昆在社交媒体上高度评价称,Deepseek-R1的面世标志着开源模型正在逐步超越闭源模型。
英国《金融时报》的评论文章还指出,开源模型Deepseek-R1对全球用户产生了极大的吸引力,这将有力推动AI技术的开发与应用。对于大多数商业用户而言,拥有一款足够可靠且实用的模型,比追求绝对领先的模型更为关键。文章比喻道:“并非每位司机都需要法拉利,像R1这样的模型在推理能力上的进步,可能会为与客户互动或处理工作任务的‘智能体’带来革命性的变化。”若能以更低的成本获取这些模型,企业的盈利能力将得到显著提升。
瑞士瑞银集团预测,随着AI训练和推理成本的显著降低,预计将有更多终端用户利用AI技术来改善业务或开发新的应用场景。
(文章来源:经济参考报,图片及链接信息保留原样)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。