DeepSeek开启中国AI新纪元,引领端侧AI发展机遇
AI导读:
DeepSeek凭借“低成本、高性能”的技术突破,迅速吸引全球关注。其开源策略降低了AI技术门槛,推动了端侧AI的发展。DeepSeek的出现为AI产业带来了巨大机遇,同时也带来了数据和伦理的挑战。
“海谈科技”核心观点
Deepseek在底层训练模型架构优化、基于强化学习的训练策略优化等方面的技术突破显著,备受瞩目;
客户对AI算力及解决方案的需求高涨,AI在政务、教育等领域的落地进程正在加速;
数据安全至关重要,数据标注领域蕴藏着巨大的投资机遇……
近日,海富通基金与上海证券报联合举办的“海谈科技”DeepSeek专场上,复旦大学博导、上海市数据科学重点实验室主任肖仰华,达观数据首席财务官许涵卿,以及海通证券计算机行业、科技金融首席分析师杨林三位嘉宾,围绕DeepSeek技术突围的底层逻辑及AI应用落地,深入探讨了产业发展和投资之道。
开启中国AI新纪元
2025年中国农历春节期间,国产AI大模型DeepSeek凭借“低成本、高性能”的技术突破,一经推出便迅速吸引了全球AI产业界及资本市场的目光,一时间风靡全球。
DeepSeek何以风靡?其背后蕴含着怎样的底层逻辑?
肖仰华解读道,DeepSeek的突破主要体现在三个方面:一是采用混合专家(MoE)架构,并成功解决了MoE架构在训练过程中难以扩展的问题;二是在数值精度上实现优化,采用FP8训练标准,超越了美国主流的FP16标准;三是资源效率大幅提升,仅使用2048个H800GPU(相当于1000—1500个H100GPU),便实现了与GPT-4相当的AI性能。
DeepSeek的突破,让全球见证了中国AI的力量,被视为“神秘的东方力量”。杨林将其誉为“科技的国运时刻”,其成功极大地增强了中国人的科技自信。
1月27日,DeepSeek应用成功登顶苹果美国地区应用商店免费App下载排行榜,超越了ChatGPT。同日,在中国区应用商店免费榜上,DeepSeek也位居榜首。
“DeepSeek的成功,源于开源。”许涵卿表示,DeepSeek将模型权重、训练框架及数据管道全部开源,用户可自由使用、修改和商业化。这降低了AI技术的进入门槛,开发者和企业能够以较低的成本进行模型微调和应用开发。同时,DeepSeek允许下游应用者进行本地化的模型部署,消除了其对数据安全和数据隐私的担忧。
端侧AI:中国的新机遇
“作为企业,我们看到了更多的产业机会,客户咨询和采用AI大模型产品的意愿显著增强。”许涵卿表示,DeepSeek的突破对产业端产生了深远影响,端侧AI的发展已经迫在眉睫。
许涵卿介绍,早在2022年,达观数据便开始进行大模型的前沿研究。以往,客户对于上马大模型存在诸多顾虑,如GPU、大模型本身等方面的投入成本。然而,DeepSeek的“低成本、高性能、安全性”让应用端客户兴奋不已,现在政府机构、央地国企等对于尝试AI大模型的意愿大幅提升。
DeepSeek的API定价为每百万tokens10美分,相比之下,其成本仅为GPT-4的十分之一,这重新定义了AI经济模型。
DeepSeek的出现推动了AI技术的低成本化和边缘化,云端和边缘处理的混合AI模型被视为AI未来的发展方向。端侧AI芯片和端侧小模型的场景应用,恰恰是中国的优势所在,为中国AI产业的发展带来了巨大机遇。
不过,许涵卿也强调,在不同行业,端侧AI应用落地的速度有所不同。当前,在日常需要AI协助的领域,如智能助手、chat bot等应用已经有了显著提升,但在司法等相对严肃的领域以及B端客户领域,大模型的应用还需要一些时间。
“2月份我们调研了多家上市公司,都在全力帮助客户测试大模型的demo版本。”杨林表示,大家之所以高度关注DeepSeek,是因为这种技术跨越式的进步将带动整个平台的切换,带来世纪性的投资机遇,类似于互联网、移动互联网诞生时的时刻。
资本往往走在产业发展的前沿,表现更为乐观。杨林指出,从智算中心到算力芯片,从光模块到电力运维、节能散热等,围绕大模型本身及场景落地,资本市场看到了诸多投资机遇。DeepSeek发布后,开启了端侧AI领域的投资机遇,值得长期关注。
数据和伦理:关键变量
“虽然DeepSeek的技术报告并未披露太多细节,但我们可以感受到其‘思维’质量极高,这说明其可能在数据上进行了大量精准标注和筛选。”肖仰华认为,精细的数据处理是DeepSeek成功的重要因素之一。
在专家学者看来,国产大模型的发展应遵循成本可控、安全可信的技术路线,DeepSeek为这条路线提供了更多可行性。
肖仰华表示,以往大模型性能的提升依赖于算力堆积,而DeepSeek为大模型指出了低成本训练的方向,这将影响整个大模型的发展方向。业界可以以更低的成本提升大模型的安全可靠性。
“数据壁垒高筑、数据汇聚困难,导致大模型无法在垂直领域进行有效训练,也无法在专业场景发挥作用。”肖仰华指出,当前提升大模型的成熟度面临两大瓶颈问题:一是数据孤岛现象普遍,二是数据精细化标注有待加强。
AI技术快速发展,AI大模型在多个场景迅速落地,正在重塑人的概念和内涵,进而给社会关系带来一系列挑战。
“以人为本,从这个角度出发,我们应提前建立AI应用准则。”肖仰华强调,生成式人工智能技术的发展日新月异。然而,人类的情感、价值、伦理观念调整却相对缓慢。如何调和这一矛盾,是我们需要直面的挑战之一。科技普惠,人工智能的发展应始终坚持“服务于人”的本质。
(文章来源:上海证券报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。