抗干扰/多指令/250ms唤醒 长城汽车Coffee OS 2智能语音解读

技术 发布于:2023-04-12 15:34:07

4月12日,长城汽车举办了一场别开生面的「Coffee OS 2智能语音」公开课,对咖啡智能座舱系统Coffee OS 2的语音交互进行了深度解读。

面对智能化、数字化、信息化的技术大趋势,长城汽车为其Coffee OS 2智能座舱系统构建了【1+2=N】新模式,即自研架构作为Coffee OS 2的1个自研中间件,通过APP和HAL 2个自研统一接口,可实现N种硬件配置+应用服务生态,并可向下兼容多种高算力平台,向上可适配长城汽车旗下各大品牌车型。

借助1+2=N架构及软硬件支持, Coffee OS 2能够实现快速迭代,以适应市场变化。其中Coffee OS 2的语音交互功能是其最大亮点之一,其语音覆盖全车功能领域控制与对话场景功能高达940个,包括四大功能:

(1)瞬间响应:唤醒速度仅需250毫秒,超过行业第一梯队300~350毫秒的平均速度;

(2)多领域多意图指令精准识别执行:Coffee OS 2可支持一句话包含多领域十意图复杂口令;

(3)后排抑制:Coffee OS 2通过多音区声源定位,后排闲聊不影响前排语音交互,大大降低语音控制误报、漏报率;

(4)语音车控:Coffee OS 2具备超强的上下文理解和泛化理解能力,极限逼近真实口语习惯;

此外,Coffee OS 2还拥有可见即可说、免唤醒、全双工多轮对话、车机闲聊、跨域知识上下文等多项行业领先的语音交互能力,并支持触控交互、手势交互、头姿交互等各种自然交互模式。

Coffee OS 2重点解决了语音交互中后排闲聊干扰驾驶员交互、多指令执行反应慢乃至遗漏、下达指令要先唤醒等诸多难点。不仅拥有超高唤醒率、超高识别率、迅速响应的扎实语音交互基础实力,还在多指令执行、多音区识别、后排抗干扰、免唤醒、模糊指代语义理解等更高阶语音交互能力上实现了突破。

同时,Coffee OS 2还配备了满足不同用户视听需求的显示屏、高可靠性的AI算力、运行流畅的16G内存、实现高速读写速度的UFS 2.1储存协议、可集成适配不同AI算法的千兆级以太网接口等高性能硬件,以及座舱OS、自研语音、自研地图/导航、自研视觉算法等全链路、全方位自研软件。

相信通过技术积淀、算力提升、数据积累,长城汽车将不断探索智能座舱更多可能,在车机性能、智能交互方式等多方面提供更丰富、更人性化的体验。

+1
评论 收藏