念空科技联合上海交大向NIPS投递大模型研究论文,量化行业展现底层创新能力
AI导读:
念空科技联合上海交通大学计算机学院向NIPS投递大模型研究论文,显示中国金融科技底层创新能力。论文聚焦实证研究更高效的大模型训练方式,提出自适应切换SFT与RL的训练框架,有望推动量化行业技术创新。
5月15日,国内知名百亿级量化私募念空科技与国际顶级学术会议NIPS(Neural Information Processing Systems)合作,投递了与上海交通大学计算机学院联合研究的大模型论文。5月20日,该论文网址链接正式公布:https://arxiv.org/abs/2505.13026。
业内人士指出,念空科技此举不仅展示了中国金融科技在应用层面的实力,更彰显了其底层创新能力。论文聚焦于实证研究“更高效的大模型训练方式”。

念空科技向NIPS投递的论文来源:网站截图
念空科技自2015年成立以来,一直走在将AI应用于金融领域的前沿。公司机器学习技术已覆盖期货、股票等多个金融领域,自2019年起全面转向神经网络算法,并于2020年成功搭建全流程投研平台。2021年,公司管理规模突破百亿元大关。
近年来,ChatGPT的出现为量化行业带来了新的算法工具。然而,念空科技创始人王啸发现,ChatGPT的使用成本高、权限受限,难以满足AI大模型的大规模训练需求。为此,念空科技提出了一种自适应切换SFT与RL的训练框架,通过与上海交通大学计算机学院的深度合作,验证了该框架在提升模型训练效率方面的显著优势。

念空大模型论文中的研究图片来源:念空科技
业内人士分析认为,这一研究成果不仅展示了念空科技在AI算法方面的深厚功底,更体现了中国头部量化机构在AI底层技术研究上的巨大潜力。
为深入探索大模型技术边界,王啸于2025年成立全资子公司AllMind,专注于通用大语言模型的底层算法与工程技术研究,旨在推动AI技术在更多领域的应用。
量化行业作为AI技术的重要应用者和“大模型孵化器”,此次念空科技向NIPS投递论文,标志着量化行业正从“工具使用者”向“创新贡献者”转变。这一转变具有深远意义,不仅有助于深化技术理解、推动垂直领域应用,还能突破行业定位、赋能AI大模型生态。
量化行业人士表示,量化行业的高门槛和严谨的投研体系为其技术研发和创新提供了坚实基础。更多量化团队加入AI领域的基础研究,将为中国AI技术的发展注入新的活力。
(文章来源:中国证券报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。