网络百科 心情随笔 智能驾驶“血拼”端到端,元戎启行准备好了吗?

智能驾驶“血拼”端到端,元戎启行准备好了吗?

智能驾驶从规则驱动转向数据驱动,正在引导行业进入新的竞争区间。

在之前的中国电动汽车百人会论坛(2024) 上,比亚迪董事长兼总裁王传福认为,新能源汽车渗透率在未来3个月将超过50%。自动驾驶公司元戎启行CEO周光指出,在上半场的电动化之后,汽车行业的竞争已经进入智能化下半场。高阶智驾作为智能化核心议题,其发展拐点正在加速接近。

淘汰赛之后,转折点出现。在行业之前的发展阶段里,智驾重视高精地图,也依赖预设的规则。但当数据积累达到一定边界,智驾系统将有能力从获得的驾驶情况感知中,快速制定合理的策略,从而像人类一样思考和决策。

这推动了智驾转向成本更低、智能度和集成度更高的方案。现在,在上车需求的推动下,自动驾驶正在一边完成降本目标,一边推进系统向前发展。

万美元、万元、千元,智驾“下神坛”

2023年6月16日,元戎启行CEO周光在粤港澳大湾区车展上,给出了智驾在一两年内像ChatGPT一样大爆发的充分条件:智能驾驶方案不能有行驶范围限制,且成本要足够低。

这其实涉及智驾系统去高精地图化和多元降本两个方面,但降本是基础。一方面,高精地图方案的缺陷之一就包括成本;另一方面,在汽车产业链上,成本控制向来都是一种核心竞争力。对车企来说,智能化的诉求实际上只有三个关键点:价格低、功能好、上车快。没有高性价比上车能力的智驾方案,对主机厂和想成为新一代Tier 1的智驾企业来说,都是缺乏价值的。

而在3月17日的电动汽车百人会论坛上,关于智驾低价“平权”的言论也层出不穷,比如“城市 NOA 其实只用 7000 元,而且油车同样可以使用”,以及“行业第一批 AI+双目方案,4000 元就能实现领航辅助功能”。这种比拼,实际上就是对智驾加速实现规模化的追求。

对元戎启行来说,由于它的目标是“打造人人都消费得起的智能驾驶技术”,所以强调和着重凸显量产智驾产品的性价比,是一件顺其自然的事。关键在于兑现这个目标的路径——怎么真正把成本降下来?

行业的综合成本线是在持续降低的,这有产业链的功劳。在自动驾驶行业早期创业时代,一套完整的自动驾驶解决方案,硬件加上软件足够做到数万美元的高价,比一辆车还贵。而随着激光雷达之类的组件走向成熟化,行业综合成本下降,元戎启行能够把原先数万美元级别的方案成本下降到2000美元级别,硬件成本甚至低至人民币7000元。

这主要源于产品组合上的巧思。硬件方面,元戎启行将机械式激光雷达换成了半固态激光雷达,同时采用车规级芯片,在软件上利用算法能力的提升,充分发挥硬件的能力,以及提高与现实世界交互的效率,实现综合降本。

在去年接受第一财经专访时,周光表示:“比如说我这个算法只需要7个摄像头就能达到别人家8个摄像头的功能,那我的成本肯定更低,在卖给车企的时候也会有价格优势。”

这个降本思想看似朴素,实际却体现了对智驾大爆发条件的考虑——有智驾产品的能力足够强这个基点,去高精地图化和降本将实现统一。化二为一,更是系统价值的升华。

这其实是一个蕴含哲理的发展现象:高阶智驾加速走入现实场景,能力在提升,与人类的交互要简化,原本极其复杂的系统也要越来越精简高效,最终实现在尽可能“小”的系统中,做尽可能大的事。

端到端驱动智驾:在高度精简趋势中实现极致高效

最开始的智驾需要很多外置设备,而后随着技术发展,它们一步步撤去或隐形——去繁就简是智驾发展的一条基础原则,它的奇妙之处在于,智驾系统看似越成长越“简单”,实则能力在不断进化。

比如,NVIDIA全球副总裁兼中国区汽车事业部总经理刘通曾经对行业降本的一则方法进行介绍:“未来的芯片是融合的芯片,把智驾芯片和座舱芯片的能力放在一个芯片里面去做,以降低成本”。

比如,去高精地图的同时,智驾出现了端到端模型派,以端到端模型为基础,让汽车在接收信息的同时像人一样思考,再输出决策。这个过程中,汽车将会把周遭环境和其他客体,包括汽车、行人等,都纳入自己的“思考”——这已经进入了主动智能的范畴,一个整体的智能系统替代了高精地图这样的“身外之物”。

元戎启行也是坚定的“无图派”,同时也是端到端模型上车的领军者。2023年,元戎启行正式推出国内首个不依赖高精度地图的高阶智驾方案DeepRoute-Driver3.0。同年8月,元戎启行运用端到端模型完成了道路测试,成为国内第一家能够将端到端模型成功上车的人工智能企业。而凭借这方面的能力,《晚点 Auto》报道称,长城汽车引入元戎启行作为第二家智能驾驶供应商,今年计划落地三款车。

所以,元戎启行在端到端模型上车方面是最积极甚至激进的,落地应用上也注定是领先的。

从实际效果看,端到端模型让车辆能够思考,会主动判断前车行驶意图、考虑后车需求,也能自动识别和完善完整的行车场景。而亮点在于,这不是靠传统智驾的模块化模型再增加其他模块实现的——传统智驾系统需要感知、预测、规划三个独立模型支撑,越复杂的场景,模型负担越大,传递给规则编写者就会变成过度劳动,即不断生产代码和规则去适应环境的变化。

但是,在元戎启行的实践中,端到端模型将三个模型融为一体,用数据训练系统,实现自主学习,实现对实时采集的数据做出直接反应,减少了系统的耦合难度,并提高了效率。最终,这会帮助智驾成本进一步降低。元戎启行CEO周光表示,有端到端模型的量产车,将在今年投入消费者市场。元戎启行还与英伟达合作,将于2025年使用英伟达的DRIVE Thor芯片适配端到端智能驾驶模型。

这背后隐藏着对信息学“三论”的思考——系统论,信息论,控制论。

智驾是一个整体系统,端到端模型通过优化中间环节,给智驾系统提质增效铺平了道路。

随着智驾发展,数据积累越来越多,行业可以利用端到端模型及巨大的参数量,实现对现实的高度拟合,再基于硬件、模型和算法,提高信息获取和处理效率,实现智驾升级。

最后是控制角度,机器控制由中枢决策、感觉、效应三大“器官”组成,智驾系统的运作与控制机制也类似。利用信息在这个系统中的传递和反馈,智驾系统可以不断修正对现实场景和消费者需求的认知与理解,不再是依托信息猜测场景、分配给子模块,并做出下一步动作的模式,而是对信息进行直接理解和反应,提供更好的“AI司机”表现。

用算法+硬件诠释复杂思维,实现了一个智能“大脑”灵活处理多任务。在端到端模型的指引下,元戎启行让整车智驾的功能向核心集中,真正提升了智能化能力,也逐渐颠覆着汽车的工具属性。

最终,汽车也许会在这个趋势下进入主动智能时代,为车主的终极驾驶体验提供支持。这一天还很远,但一点一滴的提升,正在日复一日地发生。