DeepSeek爆火引全球关注,中国AI创新力量再获肯定
AI导读:
DeepSeek以不到OpenAIGPT-4十分之一的训练成本,达到接近性能并实现开源,引发全球关注。其成功不仅提高了中国科技知名度,也让市场开始重新定义创新,对中国创新的体制机制等是一次触动。
“深度求索(DeepSeek)将来怎么样不得而知,但它的横空出世至少告诉世界,中国很多‘小角落’能够爆发出大能量。”
在近日由盘古智库举办的研讨会上,谈及正以破圈之势引起全球巨震的国产AI大模型DeepSeek时,国盛证券首席经济学家熊园表示,如果从宏大叙事的角度来说,它提高了中国的科技知名度,也让国际资本重拾拥抱中国资产的信心。一位外国基金经理透露,他们内部从未撰写过超过40页的中国报告,但因DeepSeek,他们刚完成了60页的报告。
春节前夕,中国AI初创公司DeepSeek发布的开源模型DeepSeek-R1,以不到OpenAIGPT-4模型十分之一的训练成本,达到接近的性能,并实现开源,颠覆了AI行业认知。这家成立仅一年多的初创公司,脱胎于一家以量化交易为主的对冲基金,公司85后创始人梁文锋成长于“广东一个五线城市”,拥有浙大硕士学历,其团队成员均为本土研究人员。
这一典型的中国版“大卫战胜歌利亚”的故事,引发国内外资本市场、学界和产业界的广泛讨论。国际市场重新审视中国企业创新实力的同时,国内市场也开始思考金融资本在支持科技创新中的角色,探索DeepSeek的成功能否被复制。
“DeepSeek现象既是偶然,也是必然。我国去年的研发投入比2014年多了2万多亿元,这一规模可能在全球前所未有。与此同时,企业的主体地位也在逐渐形成,但赋能企业还缺少一些机制。目前研发投入靠前的企业以国企为主导,地方还需营造更好的创新创业环境。”九三学社中央副秘书长、科技专委会主任张旭说。
创新及创新人才的再定义
近期,吸引全球视线的中国市场主角有二:一是超越ChatGPT成为全球增速最快的AI应用DeepSeek,它以算法集成创新突破算力限制,以开源模式引发“科技平权”讨论;另一个是中国影史首部票房破百亿元、进入全球票房榜前11名的电影《哪吒之魔童闹海》。
优实资本董事长邢杰表示,DeepSeek掌舵人梁文锋与魔童哪吒有相似之处,梁文锋就像活着的哪吒,虽非“名门正派”,但也“杀出了一条血路”。
邢杰解释说,将DeepSeek-R1的推出置于AI产业发展时间轴上,其影响力可能有限,但DeepSeek的R1恰好在从预训练向推理转向的大模型第二阶段,在国内算力资源受限的情况下,达到与全球顶级大模型OpenAI GPT-4比肩的性能,打破了此前业界圭臬——大模型训练的效率或创新的速度根本上取决于算力大小。
“有时候匮乏反而是财富,算力匮乏倒逼DeepSeek进行汇编语言编程,就像以色列资源极度匮乏,但极度创新。这是值得国内处于弱势地位的行业和机构思考的。”邢杰说。
邢杰认为,Open AI的论文指出过程性激励非常重要,其也沿着这个思路获得成功,但闭源之下,业界只能根据其提供的思路前行;而DeepSeek发现改过程激励为结果激励,通过推理模式的形成能以高性价比达成类似性能。
硅谷知名风险投资人马克·安德森(Marc Andreessen)近期在接受采访时也提出,这家中国公司想出了如何使用更便宜的芯片获得高性能,将使用变得更加高效。同时,他们以开源形式将经验提供给全世界,为任何想要进行类似工作的人提供了路线图。
“六个月前,这些还非常深奥、昂贵且专有。如今,它对每个人来说都是免费且永远可用的。”马克·安德森说,在美国,很多大型科技公司、互联网公司和初创公司,要么基于DeepSeek进行重建,要么将其整合到产品中,要么研究其使用的技术,并用它来改进现有的AI系统。
多名国内业界人士认为,DeepSeek的横空出世,让市场开始重新定义创新。
DCCI未来智库与FutureLabs未来实验室首席专家胡延平认为,DeepSeek的亮点依次为强化学习、混合专家模型MoE、知识与模型蒸馏等,尽管没有一项是DeepSeek完全原创,但DeepSeek进行了非常系统的再创新,使模型在推理能力方面大大提升,实现了降本增效。
图灵新智算创始人暨董事长刘淼持相近态度,认为在目前AI领域几乎很难有从0到1的原创。OpenAI第一个利用算力、数据、算法作出智能涌现。DeepSeek则是把每一个环节做到极致,达到高质量、低成本的效果。其成功证明,以工程学的路径达到整个系统优化是完全可行的。
在邢杰看来,DeepSeek的成功也提示中国社会,需要看到一类“非共识、非主流、非中庸”的创新人才。越前沿的东西可能越是非共识的,这需要从机制上保证,从资源上支持,从文化上给予土壤。
一名业内人士对第一财经表示,即便实施开源,国内AI企业短期内也很难成为第二个DeepSeek,原因在于很难有企业拥有足够的自有资金、能力和恒心,专注于纯技术。
另一方面,DeepSeek的“免费”和“高性价比”不免令人想起电商界的拼多多。不过,目前DeepSeek-V3 API服务的优惠价格体验期已结束,从2月9日开始已调整新的付费价格。
“一个很有意思的现象是,在DeepSeek的API涨价200%-500%时,阿里云等实施大幅度降价。这种‘你涨价我降价’的现象,我称之为AI大模型的内卷以及反内卷。AI大模型领域比其他领域都更需要反内卷,如果大家都没有钱挣,就变成了少数人的游戏,这会极大妨碍整个创新的进程。”胡延平说。
如何影响中国创新路径?
“DeepSeek以及《哪吒2》的破圈,对中国创新的体制机制等都是一次触动。我们必须重新审视市场的力量、基金的力量、场景的力量,以及年轻人的力量和宽松环境的力量。总之,DeepSeek的爆火不仅是一次技术突破,更是对创新思维的肯定。”盘古智库理事长易鹏说。
梁文锋曾成立量化基金幻方量化,是熊园的客户之一。后来,梁文锋在接受采访时提出,幻方量化在一定程度上增强了该团队对技术驱动创新的信心,这促使其后来成立了纯技术公司DeepSeek。
Aletheia Capital中国策略分析师陈昌华近日撰文提出,这次突破来自一家以量化交易为主的对冲基金,或许会让人理解金融和其他服务业对经济和科技进步的贡献。一个现代经济体要健康发展,需要多个产业协同进步。
也有业界观点认为,DeepSeek让人们思考,中国在什么地方、以什么体系可以培植出如DeepSeek一般的现象级创新。
作为中国第一批互联网连续创业者中的一员,英诺创新空间创始合伙人邓永强经常面对三个问题:梁文锋为何来自浙大而非清华?这家年轻的大模型公司为何在杭州而非其他城市?站在投资人的角度,如何看待VC们集体错过DeepSeek的现象?
另一个值得关注的问题是:这种创新为何没有出现在科研院所、互联网大厂或科技巨头公司?
“国家战略引领下的一些大院、大所以及相当多由地方政府合资成立的新型研发机构,过去在基础研究上,包括在解决一些卡脖子问题上,形成了一种比较主流的技术创新体系。但以DeepSeek为代表的创新,是非常市场化的,是在一个市场空白点上实现的重大突破。”人文财经观察家秦朔说。
张旭认为,对于未来的科技体制改革框架,应有两个转变:一是从“跟随”到“原创”的转变,原创不见得是基础研究;二是尽管目前企业的创新主体地位越来越明显,但政策还不够配套,科研经费需要进一步向企业主体转移。
从城市维度来看,盘古智库学术委员会副主任委员梁春晓表示,杭州与成都两座城市亲近小微、柔性治理,聚集了很多小微企业,能够产生震惊中国和世界的成绩并非偶然。
以电子信息产业密集的深圳为例,一名接近当地政府的人士提出反思:第一,杭州的创新以软件和阿里生态为核心,而深圳尽管十几年前开始注重原创和教育基础设施培养,但远水解不了近渴;第二,近五到十年里,深圳过于注重引进大企业,但部分大厂的创新成果不尽如人意;第三,深圳的成本不断推高,使得不少中小企业离开深圳去往长三角。
“目前,当地政府已经注意到了这些创新问题,预计近月内会有政策出台。”前述人士说。
(文章来源:第一财经)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。