DeepSeek春节连发三款大模型,AI产业链受瞩目
AI导读:
DeepSeek在春节期间连续发布三款大模型,包括基座模型V3、推理模型R1及多模态模型Janus Pro,引发市场高度关注。景顺长城基金认为,此次发布对国内AI产业链形成确定性利好,特别是端侧、AI应用及国产GPU链将受益。
上证报中国证券网讯(记者何漪)近期,国内人工智能(AI)领域迎来重大突破,DeepSeek在2025年春节假期期间,即1月29日大年初一附近,连续推出了三款具有里程碑意义的大模型,分别是基座模型DeepSeek V3(旨在与OpenAI的GPT-4相媲美)、推理模型R1(对标OpenAI的o1模型)以及多模态模型Janus Pro(力图与OpenAI的DALL-E 3一争高下),这一系列动作迅速吸引了市场的广泛关注与热议。
景顺长城基金深入分析指出,DeepSeek V3模型的显著优势在于其低成本特性,得益于DeepSeek在算法工程上的极致优化,模型的训练及推理成本得到了有效压缩。而R1模型则是在V3模型的基础上进行了强化学习,其亮点在于卓越的性能表现,整体效果足以与OpenAI的o1正式版相抗衡。
从投资角度来看,景顺长城基金认为,DeepSeek此次发布的三大模型,无疑为国内AI产业链带来了明确的利好信号。具体而言,端侧设备制造商、AI应用开发商以及国产GPU产业链将成为主要受益者。
在应用层面,DeepSeek凭借其开源创新的理念以及低成本优势,显著降低了AI应用落地的实际门槛。同时,通过采用蒸馏技术,DeepSeek进一步提升了端侧模型的能力上限,为AI应用的广泛发展奠定了坚实基础。
在端侧及2C Agent类应用方面,R1版本的核心价值在于其能够将大模型的推理能力通过蒸馏技术有效转移到端侧模型范畴(涵盖PC端及手机端)。此外,R1版本还具备自主规划能力,这将极大地加速端侧Agent类应用的商业化落地进程。
针对AI应用方面,V3版本与R1版本从高性价比、开源特性以及用户教育三个维度入手,全面降低了应用(如类O1推理模型)落地推广的难度。高性价比意味着较低的单位推理成本;开源特性则使得V3版本与R1版本能够开放思维链过程,进而降低部署门槛和复制难度;而DeepSeek的广泛关注度则进一步增强了用户认知度,为AI应用的普及创造了有利条件。
在算力层面,DeepSeek的推出大幅提升了AI算力的推理叙事能力。同时,市场上部分兼具训练与推理逻辑的A股算力标的(如ASIC供应链相关企业)因市场误读而存在被低估的机会。
(文章来源:上海证券报·中国证券网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。