奔驰如何跃升智驾第一梯队?端到端+无图实现“有路就能开”
技术 发布于:2024-11-19 09:55:14
不需要激光雷达,不依赖高精地图,为中国驾驶开发,有导航就可以开。
11月14日,梅赛德斯-奔驰2024科技创新日活动,奔驰展示了全新一代智能域控制架构、纯电越野以及安全科技等最新技术矩阵,其中最令人感兴趣的自然是奔驰全新“纯视觉方案无图L2++全场景高阶智驾功能”。
作为豪华品牌推出的首个无图全场景高阶智能驾驶方案,它基于奔驰全新自研的MB.OS智能域控制架构打造,不需要激光雷达,不依赖高精地图,专为中国驾驶开发,有导航就可以开。
奔驰这套智驾方案是什么水平?还有哪些细节值得深究?借着皆电总经理龚梦采访梅赛德斯-奔驰(中国)投资有限公司执行副总裁、梅赛德斯-奔驰中国研发自动驾驶及车联网负责人王忻的契机,让我们一点一点来解析。
据奔驰介绍,这套高阶智能驾驶系统采用纯视觉方案,搭载NVIDIA DRIVE Orin芯片,不依赖高精地图,应用端到端大模型、数据驱动地标检测,可实现感知决策一体化,专为中国打造,终极形态具备从出发车位泊出到目的地车位泊入、点到点的全场景智驾能力。
这里面就有三大关键词,一个是端到端架构、一个是不依赖高精地图、一个是针对中国路况的本土化适配。
随着近年智能驾驶的快速发展,新技术不断涌现,从MCNN到RNN、从GAN再到Transformer大模型,去年行业主流方案还是轻高精地图的城区智驾,但到今年,但凡提到智能驾驶就离不开“端到端”。
它究竟是什么呢?
端到端(End-to-End)原本是深度学习中的一个概念,指的是一个AI模型,只要输入原始数据就可以输出最终结果。而端到端智能驾驶,指的就是感知、决策到控制都由一个完整的智能模型直接融合处理。
与之相对的,传统智能驾驶的逻辑是将各个环节拆分成一个个典型任务,譬如感知模型先处理道路信息,然后汇总交给规划模型,规划模型再根据信息规划出行驶路线,最后再交给控制模块控制车辆的行进。
将两者放在一起,就能看出“端到端”架构的优势了。
传统模块化架构,可以视作一项流水线作业,后级模型的输入来自前级模型的输出,如果前级模型输出的结果有误差,就会影响下一级模型的输出,进而导致级联误差的出现,最终影响整套系统的性能。
而端到端架构,就是通过单个模型实现所有功能,研发人员只需要对一个模型进行整体训练、调整优化,没有中间环节的误差,当它具备一定基本常识(数据)后,就能通过不断训练、学习,自我进化,大大提升了系统性能的上限。
从研发成本角度来看,一个模块化智能驾驶系统里,可能包含了很多很多个模型,不仅每个模型都要专门进行训练、优化、迭代,模型与模型之间的协作也要充分考虑,随着模型不断进化、参数量提高,需要的研发人员、研发投入都水涨船高。据马斯克透露,通过使用端到端自动驾驶算法,特斯拉只用2000行代码就代替了原本的30万行代码,可以说是量级程度的进步。
就目前来看,未来想要普及真正意义上的高阶自动驾驶,甚至是无人驾驶,一定要依靠端到端架构,所以现在整个汽车行业都在从模块化架构向端到端架构过渡。
而奔驰,就是率先迈出这一步的传统豪华品牌。
在接受采访时,王忻表示:「奔驰是全球首个获得L3级有条件自动驾驶国际认证并在欧美量产的车企,去年年底,我们也成为首批在北京获批开展L3级有条件自动驾驶系统测试的车企之一。这些都帮助我们积累了宝贵的经验,也都对我们迭代我们这套全新的L2++全场景高阶智驾有很多帮助。因此,我们在智能驾驶领域进入的快速发展期,并非一蹴而就,而是多年经验积累的过程。我们不追求最激进的方案,而是要找到更合适的路线,并以更安全的方法上线。」
第二个是不依赖高精地图。早几年,高精地图还被视作是智能驾驶必要的基础条件与安全冗余方案,但当大家意识到高精地图高昂的更新成本以及缓慢的更新速度,这一路线逐渐被舍弃。
至于为什么不用激光雷达?王忻表示“理论上,并不是传感器越多越好,它们在不同的条件下有着各自不同的优势。在开发这套L2++系统时候,奔驰做了大量的前期测试,特别是针对极端场景。目前奔驰正在进行L2++系统实地道路测试,并发现纯视觉的方案的效果非常好。”
但是想要“舍弃”并不容易,这对智能驾驶的视觉方案提出极高的需求。奔驰通过英伟达 Orin 芯片(单颗芯片算力可达 254TOPS)、高像素摄像头和毫米波雷达的传感器组合等行业顶配硬件方案,以及核心的端到端大模型,支撑起了这套纯视觉智驾的软硬件底层。
即便没有高精地图、没有激光雷达,奔驰这套系统依然能对交通参与者、道路环境,以及斑马线、红绿灯、车道线等交通信息进行精准的识别和判定,甚至不再依赖车道线的支持,静止亦可启用,这意味着能够支持“停车位到停车位”的智能驾驶。此前,我们皆电也受邀提前体验了这套方案的上路表现,并给出了相当高的评价。
而这还不是这套智驾方案的全部,官方表示,这套系统同样可以准确识别包括潮汐车道、通行禁行标识等高难度标志,后续研发甚至会解决坑洼路面等特殊的驾驶场景,这在以往技术方案中是无法识别、解决的问题。
奔驰的工程师表示,这套系统可以实现100%的全场景的端到端智驾能力:它可以在没有高清地图的依赖下实现从出发车位泊出、途经城区/高速/城区、到目的地车位泊入,点到点的智驾能力。当然,奔驰会对各个城市进行充分的测试,才会开放给客户使用。
此前,王忻已经与德国梅赛德斯-奔驰集团股份公司董事会主席、首席执行官Ola Källenius一同对这套L2++全场景高阶智驾的beta版本进行了试驾,大约一小时的使用过程,实现零次接管。
“非常喜欢这套L2++系统的驾驶风格”,Ola Källenius体验后说到,“中国研发团队能在这么短的时间内将这套系统做出来,非常惊喜,希望这一系统能尽快落地。”
一项技术在试验场的表现良好,并不意味着用户买到手之后还能有同样的优秀表现。中国道路环境的复杂性,相信大家也有目共睹,奔驰显然意识到了这一点。
奔驰这套全新的智能驾驶方案,合作方正是来自中国的Momenta。这家2016年成立的中国自动驾驶公司,核心技术包括基于深度学习的环境感知、高精度地图和驾驶决策方案,主打“数据驱动的算法”理念,深耕智能驾驶多年,已获得上汽集团、通用汽车、梅赛德斯-奔驰、丰田和博世的战略投资。
与奔驰合作的这套全新的智能驾驶方案,便是基于AI大模型驱动,通过GPU万卡集群的超强云端算力,带来了更聪明的机器学习能力,目前已学习了超百PB级训练数据,其中包括大量中国司机素材,更擅长中国式驾驶博弈。
就拿自动泊车这一点来说,自动泊车系统由中国团队本土团队牵头开发,基于端到等系统架构以及大模型技术,训练上,采用中国泊车训练素材,已进行了超过100 万次泊车训练,具备了低速倒车碰撞预防碰撞支持动态调整、图像质量检测机制、具备行人检测三大能力。
进而,这套系统可以从容地应对中国复杂泊车场景(断头路、三面靠墙等)、小尺寸车位,可实现压线停车,能识别异形障碍物如地锁、A字牌等。一些极端的车位,比如极限死角垂直车位泊出,面临车道5米,而车长5.32m的情况,也能应对自如。奔驰自动泊车工程师表示,这一代产品的车位识别成功率、泊车成功率达到98%,跟上一代相比至少提升了3%以上。
此外,在记忆泊车上,这套系统可以通过一次学习完成最长三公里的记忆泊车。最大记忆距离100米,支持全自动循迹倒车。基于Momenta由数据驱动的端到端模型,后续随着训练次数叠加,整个系统的能力还会出现更大的提升。
中国已然是全球最大的新能源市场,智能驾驶领域发展得要比其他市场更为广泛,多年来更是积累下了丰富的经验,奔驰此次与Momenta的合作,也是奔驰首次采用国内智驾供应商的解决方案。一方面展现出中国产供应商的实力,另一方面也透露出奔驰深耕中国市场的野心。
2025年发布的全新奔驰纯电CLA,将是首款搭载这套高阶智驾方案的奔驰车型。
“安全第一、奔驰标准、中国速度”,王忻接受采访时,这样总结奔驰智能驾驶研发的三条逻辑线,同时表示“智驾在奔驰的整个战略中具有非常高的优先级”。
从2013年率先推出L2级智能驾驶辅助系统,至今10余年间,奔驰L2级智驾系统的行驶总里程已超过300亿公里,2023年,奔驰仅用12个月就完成研发L2+导航辅助驾驶功能,2024年9月又交付了为中国停车位专属定制了的全新自动泊车功能,如今无图L2++全场景高阶智能驾驶系统已上路测试。这背后是奔驰过去5年在华投入105亿元的加码、超过2000人的研发团队的打磨结果。
大家都说,新能源时代,智能就是新的豪华,但如果一个本身就豪华属性拉满的品牌,同时还有同级第一梯队的智能表现呢?