对话式AI爆发:关键技术与应用场景展望
AI导读:
随着对话式AI技术日益成熟,其应用场景爆炸式增长。多位专家在声网对话式AI引擎发布会上认为,对话式AI可能率先在桌面助手、手机助手等场景爆发。声网发布全球首个对话式AI引擎,支持文本大模型升级为对话式多模态大模型。DeepSeek爆火吸引更多人关注AI,推动技术发展与创新。
在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的必经之路。知名投资机构a16z最新Voice AI报告指出,随着大模型的不断进步,语音将成为对话式AI的关键切入点。
对话式AI技术日益成熟,其应用场景爆炸式增长。聊天机器人作为对话式AI的重要应用,广泛应用于客户服务、教育、医疗、娱乐等领域。那么,对话式AI的爆发将率先在哪个领域和场景出现?
近日,声网对话式AI引擎发布会上,阿里云智能集团、腾讯云AI等多位专家参与了讨论。他们认为,对话式AI可能率先在桌面助手、手机助手、智能硬件、陪伴机器人等场景爆发。
腾讯云AI产品架构师总监曹超表示,对话式AI能传递情感和交互方式,随着模型升级,情感传递更多。应用场景来看,对话式AI更多适用于语音和听觉交互,为视力不便者等人群提供新的沟通工具。目前,对话式AI的硬件视角也主要基于手机。
阿里云智能集团通义千问高级产品架构师辛晓剑补充,教育领域的学习机也是对话式AI的好场景。大模型加持下,学习机客单价显著提升,达到八千以上。
市场上已有亚马逊Alexa+、汤姆猫AI情感陪伴机器人、苹果Siri等对话式AI产品。近日,声网发布全球首个对话式AI引擎,凭借超低延时响应、优雅打断等能力,支持文本大模型升级为对话式多模态大模型。
声网AI RTE负责人姚光华表示,用户与AI每产生1次对话,平均有3轮问答,对话时长约21.1s,单次成本仅需3分钱。开发者可通过声网对话式AI引擎,快速部署智能助手、虚拟陪伴等场景。
谈及大模型从文本走向多模态交互的关键,嘉宾们认为,多模态模型架构和训练范式变化不大,提升主要依赖数据质量和数量。实现多模态交互的关键在于将不同模态信息转化到同一语境,ASR技术的发展有助于此。但还需提升模型推理速度,解决工程化问题,应对复杂情况。
嘉宾们普遍认为,Deepseek爆火吸引更多人关注AI,开源对技术发展意义重大,推动技术交流与创新。DeepSeek在模型训练上减少对数据依赖,通过强化学习实现迭代,降低算力需求,使AI普惠更具可能。Minimax解决方案高级总监冯雯表示,DeepSeek开源助力技术出圈,AI已进入更大用户群体。
(文章来源:科创板日报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。