科技巨头“秀肌肉”:AI大模型上车,数据驱动智能驾驶突围

2023-04-22 03:29:33 来源:21世纪经济报道

4月19日,小米手机发布会的次日,雷军现身2023上海车展,并出现在小鹏、蔚来、极氪、高合甚至大众、奥迪等展台。

对此,有知情人士表示,雷军此行目的是要学习上海车展并为小米汽车明年的车展做准备。而不久前雷军曾公开透露,小米造车进展超预期,最近已经顺利完成了冬季测试,预计将会在2024年上半年实现量产。

事实上,自2021年高调宣布跨界造车以来,小米汽车甚至雷军的一举一动就广受关注。


【资料图】

而在小米跨界造车的背后,是在汽车智能化浪潮之下,科技巨头在人工智能、数据算法的多年布局成果向汽车行业的不断渗透。

在本届车展期间,除了占据绝对C位的新能源汽车外,包括百度、华为、阿里巴巴、腾讯、滴滴在内的科技巨头以及地平线、黑芝麻(000716)、四维图新(002405)、亿咖通科技、地平线、星纪魅族等多家芯片、自动驾驶解决方案、高精地图等行业的头部企业纷纷参展,并带来自动驾驶、AI大模型等最新的技术应用,试图打破上下游各个环节的协作障碍和信息壁垒,参与到汽车技术与产业变革之中。

其中,百度Apollo首次以独立展商的身份参加本届上海车展,其展台展出了基于L4级自动驾驶技术打造的Apollo智驾系统;而另一家专注于提供智能汽车解决方案的企业华为,不仅展出了其合作车型,更展出高阶智驾系统ADS 2.0等产品。

而在4月13日发布过L4级Robotaxi最新进展的滴滴,其自动驾驶货运KargoBot也在本届上海车展首次亮相。此外,滴滴自动驾驶首款未来服务概念车DiDi Neuron、滴滴自动驾驶网约车主力运营车型XC90以及滴滴自动驾驶和北醒公司联合研发的激光雷达“北曜Beta”以及滴滴自动驾驶自研的三域融合计算平台“Orca虎鲸”等也在车展同步展出。

而腾讯和阿里巴巴虽未直接参展,但在车展期间,腾讯全面展示了“车云一体”领域的技术和产品体系,并发布HD Air轻量级高精数据产品;阿里巴巴则在车展首日上宣布AliOS智能汽车操作系统已接入通义千问大模型进行测试。

“大模型开启AI时代,会重塑千行百业,而新汽车是大模型最大的交互应用场景,智能汽车操作系统也会被重塑。”4月18日,阿里集团副总裁、斑马智行CEO张春晖在阿里巴巴新能源汽车发布会上表示,“大模型会带来巨大转折点,不光是人工智能领域,对汽车产业也是。”

在张春晖看来,新汽车具有交互主体多、交互方式多、交互粘性强、计算零件多、数据规模大、空间属性和社会属性等等特征,决定了新汽车一定是大模型最大的交互应用场景。

而大模型的上车应用,也将为汽车行业带来交互智能与服务智能的深刻变革,带来包括与情感化的数字人交互、开放而丰富的服务生态、智能生成内容与表现形式等在内的全新体验。

AI大模型重塑智能汽车

近几个月来,ChatGPT在全行业掀起了一场变革。尤其是在作为下一代智能终端的智能汽车上,随着智能驾驶、智能座舱的快速普及和功能的不断提升,行业也在加速推进AI大模型的上车应用。

从功能上来看,目前AI大模型在汽车上主要有两种落地形式,一是用于人工智能交流对话领域,多数应用在智能座舱,这一类以文心一言为代表,也是主流应用形式;另一类如毫末,利用GPT背后的生成式技术,帮助解决认知决策问题,最终实现端到端的自动驾驶。

“斑马智行跟达摩院在两年前就开始讨论大模型和数字人的事情,ChatGPT产生了深远的影响。今年将是人工智能的一个转折点,大模型将开启AI的新时代,重塑千行百业。阿里集团CEO张勇也提到,阿里巴巴所有产品,未来将接入‘通义千问’。”张春晖表示,“中国(新能源汽车)已经引领全球,在汽车智能化的关键节点,大模型出现了,给了行业一个巨大的推动力。”

据 IHS Markit 数据统计,目前中国市场座舱智能配置水平的新车渗透率约为 48.8%,到 2025年预计可以超过 75%。

而在智能驾驶领域,高工智能汽车研究院数据显示,2022年度中国市场(不含进出口)乘用车前装标配搭载辅助驾驶(L0-L2)交付1001.22万辆,首次突破千万辆规模。其中,L2级辅助驾驶(含L2+)前装标配交付585.99万辆,同比增长61.66%,前装搭载率升至29.4%。

有行业人士预判,2023年智驾产品进入全线爆发期,大模型将开启在车端的落地应用。毫末智行预估,到2025年高级别辅助驾驶搭载率将超过70%。

“自动驾驶技术发展到现在,硬件性能早已不是天花板,关键是自动驾驶感知决策能力以及数据样本的量级。ChatGPT的成功表明,大模型可能才是行业最终的解决方案。”4月11日,自动驾驶生成式大模型DriveGPT发布现场,毫末智行COO侯军在接受记者采访时表示。

据介绍,毫末DriveGPT通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。现阶段主要用于解决自动驾驶的认知决策问题,后续持续会将毫末多个大模型的能力整合到DriveGPT。

毫末智行董事长张凯预测,智驾产品正在进入快速增长的全线爆发期,2023年是非常关键的一年。而首个搭载DriveGPT的车型——新摩卡DHT-PHEV也即将量产上市,未来DriveGPT可以逐步应用到城市NOH、捷径推荐、智能陪练以及脱困场景中。

不过,不同于聚焦智能驾驶数据训练的毫末DriveGPT,阿里巴巴则聚焦智能座舱,AliOS智能汽车操作系统已接入通义千问大模型进行测试。

同时,基于通义千问大模型、面向汽车场景打造的第三代汽车AI能力体系Banma Co-Pilot首次亮相。

“一辆汽车应该具备什么样的体验功能,用户负责提要求,大模型负责来制作生成”。张春晖表示,“汽车作为消费互联网和产业互联网交汇点的产品,能给大模型找到很好的应用场景,也可能是最大的(应用场景)。”

无独有偶,借助在AI技术领域的布局,腾讯也在车展前夕发布全新升级的腾讯云智能车载语音助手。据介绍,腾讯通过打通训练平台和云端能力,语音交互功能更新周期将缩短至小时级;3D数字人与语音助手联合,多方言、多语种识别等功能,也将助力车企打造更有温度、有效率、有感情的人车交互体验。

值得注意的是,在通义千问之前,文心一言已经抢先上车,吉利、岚图、红旗、长城等多家车企都确认接入文心一言。

数据驱动大模型上车

“有人说大模型是贵族俱乐部的游戏,这句话也对,确实还是要花点儿算力。”张春晖表示。

的确,AI大模型上车,离不开算法、算力和数据的驱动。而包括腾讯、阿里巴巴、毫末智行、地平线在内的企业也围绕AI大模型所需要的数据驱动和数据训练进行布局。

“智能汽车的传感器足够多,传感数据也多,有了大模型能力,可以将数字世界和模拟世界进行无边界融合。大模型一定会带来这样的深刻变革,而新汽车绝对是最好的应用场景。”张春晖指出,但要做大模型,最后还是回到数据上,数据规模是一方面,数据质量是另一方面。

同样,在张凯看来,不管是L4的公司还是渐进式路线的公司,数据驱动是一定要坚持的方向。

从毫末DriveGPT实现过程来看,在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。

此外,毫末打造的中国首个自动驾驶数据智能体系MANA也将针对大模型训练,在参数规模、稳定性和效率方面进行优化,并将MANA感知和认知相关大模型能力统一整合到DriveGPT中。

不过,海量数据(603138)与巨量模型需要更高效的基础设施。国内智能驾驶计算方案提供商地平线则在本届上海车展上发布新一代BPU 智能计算架构,为智能汽车数据计算提供解决方案。

地平线在今年提出了基于BEV+Transformer的端到端的算法框架,并已经将这套架构的部分模块应用于征程5芯片,包括纯视觉BEV动静态环境感知,基于Transformer的道路关联关系识别,以及所有道路参与者的轨迹预测。

但这样的技术和模型,需要更大规模的神经网络参数来支撑,预计未来参数规模将达到百万亿级别。目前,地平线已经上线了接近20亿亿次每秒的算力,开发了具有90%以上自动化率的4D标注系统,可以实现每周5万+clips的标注能力,仿真系统可以支持每天百万公里的数据仿真能力并持续提升。

而腾讯同样定位数据训练“基础设施”的建设者。通过云原生的“车云一体”应用框架,腾讯将通过三个核心能力来实现“车云一体”的数据驱动。

“从技术发展趋势上来看,现在做自动驾驶绕不开AI了。数据驱动是一定要坚持的,在硬件上,一定会给数据驱动留下相应的算力、空间,这样才能推动自动驾驶能力的可生长状态,逐步从L2做到更高级别的无人驾驶,这是一条必经的路线。”张凯对记者表示。

标签:

推荐阅读>