对话式AI爆发：关键技术与应用场景展望

股市热点 2025-03-08 21:22:25 来源：科创板日报作者：网络

AI导读：

随着对话式AI技术日益成熟，其应用场景爆炸式增长。多位专家在声网对话式AI引擎发布会上认为，对话式AI可能率先在桌面助手、手机助手等场景爆发。声网发布全球首个对话式AI引擎，支持文本大模型升级为对话式多模态大模型。DeepSeek爆火吸引更多人关注AI，推动技术发展与创新。

在生成式AI的浪潮下，行业普遍认为多模态大模型是实现AGI的必经之路。知名投资机构a16z最新Voice AI报告指出，随着大模型的不断进步，语音将成为对话式AI的关键切入点。

对话式AI技术日益成熟，其应用场景爆炸式增长。聊天机器人作为对话式AI的重要应用，广泛应用于客户服务、教育、医疗、娱乐等领域。那么，对话式AI的爆发将率先在哪个领域和场景出现？

近日，声网对话式AI引擎发布会上，阿里云智能集团、腾讯云AI等多位专家参与了讨论。他们认为，对话式AI可能率先在桌面助手、手机助手、智能硬件、陪伴机器人等场景爆发。

腾讯云AI产品架构师总监曹超表示，对话式AI能传递情感和交互方式，随着模型升级，情感传递更多。应用场景来看，对话式AI更多适用于语音和听觉交互，为视力不便者等人群提供新的沟通工具。目前，对话式AI的硬件视角也主要基于手机。

阿里云智能集团通义千问高级产品架构师辛晓剑补充，教育领域的学习机也是对话式AI的好场景。大模型加持下，学习机客单价显著提升，达到八千以上。

市场上已有亚马逊Alexa+、汤姆猫AI情感陪伴机器人、苹果Siri等对话式AI产品。近日，声网发布全球首个对话式AI引擎，凭借超低延时响应、优雅打断等能力，支持文本大模型升级为对话式多模态大模型。

声网AI RTE负责人姚光华表示，用户与AI每产生1次对话，平均有3轮问答，对话时长约21.1s，单次成本仅需3分钱。开发者可通过声网对话式AI引擎，快速部署智能助手、虚拟陪伴等场景。

谈及大模型从文本走向多模态交互的关键，嘉宾们认为，多模态模型架构和训练范式变化不大，提升主要依赖数据质量和数量。实现多模态交互的关键在于将不同模态信息转化到同一语境，ASR技术的发展有助于此。但还需提升模型推理速度，解决工程化问题，应对复杂情况。

嘉宾们普遍认为，Deepseek爆火吸引更多人关注AI，开源对技术发展意义重大，推动技术交流与创新。DeepSeek在模型训练上减少对数据依赖，通过强化学习实现迭代，降低算力需求，使AI普惠更具可能。Minimax解决方案高级总监冯雯表示，DeepSeek开源助力技术出圈，AI已进入更大用户群体。

（文章来源：科创板日报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。