AI导读:

2025全球开发者先锋大会在上海举行,聚焦技术为创新基石、应用为落地关键、发展需可持续性思维。会上,AI产业链语料企业库帕思CEO黄海清表示,随着DeepSeek的崛起,基础大模型公司将重新洗牌。同时,上海本地头部大模型公司阶跃星辰开源了两款多模态大模型,引领AI发展。

  开年之际,上海迎来科技盛事——“2025 全球开发者先锋大会(GDC)”,会上碰撞出技术为创新基石、应用为落地关键、发展需可持续性思维的火花。

  会上,AI产业链语料企业库帕思CEO黄海清在接受《科创板日报》记者采访时表示,随着Deepseek的崛起,基础大模型公司将重新洗牌,语料行业亦需紧跟变革,降低成本。

  库帕思作为人工智能语料数据服务的佼佼者,已向阶跃星辰、商汤、MiniMax及上海人工智能实验室等提供了高质量的语料数据。

  黄海清认为,当前为Data for AI的时代,但未来将是AI for Data。AI产业链中,算力、算法、算料三要素至关重要。算力需向10万卡集群规模演进;算法方面,DeepSeek已弯道超车,未来能否被再次超越,值得期待;算料方面,国内丰富的人工智能应用场景将推动高质量算料的发展。

  针对语料产业发展趋势,黄海清指出,未来行业语料标注和清洗将引入AI技术,实现自动化与知识化,减轻数据获取成本。

  高质量的语料数据应具备鲜活度、真实性、大样本、完整性、多样性、高知识密度等特点。目前,大模型在情绪理解和知识深度上的语料能力仍有待提升,需通过高质量语料和算法优化加以改进。

  在此背景下,《科创板日报》记者注意到,上海本地头部大模型公司阶跃星辰开源了两款多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。

  阶跃星辰副总裁李璟表示,多模态一直是阶跃星辰的标签,开源旨在吸引更多智慧,优化改进大模型,构建强大生态。

  评测结果显示,阶跃Step-Video-T2V在参数量和模型性能上均处于全球开源视频生成领域领先水平。而Step-Audio作为业内首款产品级开源语音交互模型,已在跃问App内开放用户体验。

  李璟介绍,Step-Audio能根据不同场景需求生成情绪、方言、语种等个性化表达,与用户进行高质量对话。

  黄海清也认为,语料数据的情绪化是大模型发展的重要一步,有“情绪”的大模型能让AI更具人情味,成为人类更好的伙伴。

(文章来源:科创板日报)