超快响应 长城Coffee OS 2语音能力升级

[本站 资讯]  在智能化、数字化、信息化技术蓬勃发展以及终端市场消费需求升级的双重驱动下,汽车不断被重新定义,已经不仅仅是传统意义上的出行工具,而是向智能的第三生活空间快速进化。面向用户对智能座舱人机交互能力、响应速度、场景体验等方面的更高诉求,长城汽车打造了新一代智能座舱系统Coffee OS 2。并在4月12日的Coffee OS 2智能语音公开课上邀请业内专家一起展望了未来智能座舱的发展方向。

本站

在设计之初,长城的Coffee OS 2就考虑到了很多当下智能座舱产品的痛点,比如兼容性。据工程师介绍,他们把一套自研的框架作为桥梁,向上衔接表层应用和服务服务生态,向下匹配各种不同的硬件配置,以此来达到硬件和软件的“解耦”。简单来说,就是长城把APP和生态的接口固定下来给到合作伙伴,让他们按照这套标准去移植或是开发应用程序。同时设计一套能适应旗下多种不同硬件配置的操作系统,让车机也像Windows电脑一样,即使使用不同硬件,也能带来相同体验。

本站

当然,一套座舱系统是否足够智能,其中很重要的一环就是语音交互。此次的长城Coffee OS 2.0公开课上,长城也找来了一位竞争对手同场较量,它就是以语音交互能力见长的小鹏Xmart OS。在直播的对比环节,主持人使用了一句话下达十个指令的方式考验两台车的语音交互能力。Coffee OS 2在面对这种复杂的跨域指令时表现出了相当不错的反应速度和执行力。

从用户指令最后一个字音开始,到车机系统反馈第一个字音结束,这中间的时间差被行业内成为响应速度。行业内第一梯队的产品大多也需要300ms-350ms才能响应用户的指令。据官方透露,Coffee OS 2的语音产品设计之初就规划了海量的对话场景功能。包含车辆控制、系统设定、地图导航、影音娱乐等各个模块共计940多个不同场景。同时也针对语音交互的响应速度进行了提升,达到了250ms。

本站

为了提升响应速度,长城的研发团队采用了低帧低延时神经网络唤醒模型,同时基于流式语义解析模型,实现了快速响应的同时让指令“边说边执行”。不仅响应速度得到提升,指令实际执行效率也得到了提高。

大规模预训练的语言模型可以让并行的多任务指令得以实现。在实际测试中,面对开窗、切换驾驶模式、打开蓝牙、播放音乐、设置导航等连续复合型指令,Coffee OS 2也确实能够一个不漏的处理好。当然了,光有长板还不够,智能座舱能力的综合提升才能让用户在实际使用中持续获得良好的体验。像座舱域常用功能的免唤醒、可见即可说、全双工多轮对话、上下文理解、模糊指代、后排干扰抑制等功能,Coffee OS 2也同样在直播中做了演示,都达到了相当不错的水平。(图/文 本站 杨鹏)

原创文章,作者:车主头条,如若转载,请注明出处:http://www.chezutt.com/hangye/114043.html