AI导读:

2025全球开发者先锋大会(GDC2025)将于21日在上海开幕,DeepSeek引领的人工智能大模型技术热潮备受瞩目。大会前夕,多家AI企业展示了大模型的创新应用,聚焦场景落地,上海不断加强大模型“基建”基础。

新华财经上海2月20日电(记者杜康)以“模塑全球无限可能”为主题的2025全球开发者先锋大会(GDC2025)将于21日在上海拉开帷幕。今年春节前夕,Deepseek火遍全球,人工智能大模型的技术热潮持续高涨,让GDC2025备受瞩目。

大会开幕前夕,记者走访了上海多家领先的AI企业和平台,包括备受瞩目的大模型“六小虎”企业,以及专注于算力、语料等AI关键要素供给的上下游企业。大模型的功能边界不断拓展,“会聊天”已成为基础功能;“开源”的Deepseek引领行业潮流,激发下游应用创造力。上海正不断加强大模型的“基建”基础,从算力和语料入手,为大模型在多场景的应用落地做好准备。

大模型功能远超“聊天”范畴

“DeepSeek的火爆是一次全民科普,今年春节,我终于不用再向家人解释我的工作内容了。”阶跃星辰副总裁刘璟笑道。这家成立于2023年的企业被誉为多模态“卷王”,在短短10个月内推出11款自研基座大模型,成为“六小虎”之一。

DeepSeek爆火后,人们乐此不疲地向大模型提出各种有趣的问题,如“如果你成为人类,你最想做什么”,甚至开始尝试“AI算卦”。在这个过程中,许多人初次体验了大模型,现在大模型给出的答案不仅条理清晰,而且富有文采和创意,能够进行多轮对话。然而,大模型的能力远不止于此。商汤科技展示了其大模型产品“小浣熊”在智慧办公和辅助编程等领域的应用。

以辅助编程为例,商汤科技产品总监贾安亚介绍,辅助编程是大模型最早落地的场景之一,它能帮助解决枯燥重复的工作,提升开发者效率。其“编程助手”已从简单的代码补全和问答交互升级为面向企业的完整研发解决方案,涵盖需求分析、测试环节等多个方面。

同样作为“六小虎”之一的MiniMax展示了其图生视频、文生音频的“多模态”能力。用户仅需输入文字即可生成自然流畅的超拟人人声,最长可输入10000个字符,并能自由配置声音的情绪、语速、音高和音色。其最新视频模型仅凭一张图片即可生成电影质感的视频。

令人欣喜的是,大模型能力的提升正激发越来越多的下游应用创造力,降低开发门槛。凭借创意,独立开发者也能大展身手。阶跃星辰的网红AI应用“胃之书”、服务于女性的“AI智能收藏夹”以及“陌生人闹钟”等产品,从构思到落地用时不到半年,背后仅有一人一台电脑。

“DeepSeek”引领开源成为行业关键词

在DeepSeek的冲击下,国内大模型企业展现出更开放的姿态,希望加快建立开发者生态和应用生态。DeepSeek开源R1模型后,英伟达AI科学家吉姆·范评价道:“一家非美国公司正在延续OpenAI的初心,真正开放前沿的研究,赋能所有人。”Meta首席科学家杨立昆也表示,DeepSeek更重要的价值在于“开源对闭源的胜利”。

GDC2025开幕前夕,阶跃星辰开源了两款Step系列多模态大模型,MiniMax也发布并开源了新一代01系列模型。百度文心一言宣布将于4月1日起全面免费。

DeepSeek的火爆还引发了一项商业奇观,其竞争对手纷纷接入DeepSeek的大模型,包括商汤、MiniMax、阶跃星辰等AI创业公司,以及百度、阿里、腾讯等大公司。

商汤科技宣布在万象平台上架DeepSeek系列模型,并提供3个月内1000万tokens的免费使用权益。MiniMax副总裁刘华对DeepSeek表示赞赏,认为其强化了学习和算力调配能力,在图片、音视频等多模态领域,国内厂商各有千秋。

值得一提的是,DeepSeek刷新了海外对中国大模型的认知,有助于国内厂商在海外拓展业务。MiniMax已成功出海,其视频大模型产品Hailuo AI用户遍布200多个国家和地区,月访问量突破2700万。

聚焦场景落地,上海加强大模型“基建”基础

今年的GDC2025将聚焦场景,展示大模型在金融、教育、医疗、文旅、制造、城市治理等重点行业的产业化解决方案。阶跃星辰将展示大模型在智能终端、金融财经、内容创作方面的创新实践;MiniMax将携“硬件联盟”参展,其开放平台已打通多个行业场景。

此外,大会还将展示上海如何加强大模型产业的“基建”基础。算力是人工智能应用的动力引擎,上海智能算力公共服务平台已投产多个领先的智算集群,为大模型企业提供低成本算力服务。语料是人工智能的另一大要素,库帕思已链接超过50家语料生态合作伙伴,打造“五位一体”的工具链平台,提高语料加工效率。

(文章来源:新华财经)