他们用ChatGPT方式搞自动驾驶，能告诉你“我在干嘛”_钢企网

还在玩ChatGPT？已经有自动驾驶算法能告诉你“我在干嘛”。

基于视觉和神经网络的自动驾驶算法，虽然能通过传感器数据，以及学习人类的驾驶行为，自主决策并控制车辆。

但是，算法基于什么做出的决策？特别是出现故障，也就是决策错误的时候，算法是怎么想的？这些一直被称为自动驾驶算法里的“黑匣子”，让算法缺乏透明度和可解释性。

(资料图片仅供参考)

不过，现在有这么一个模型，既能预测车辆控制行为，还能自己解释“我停车是因为红灯亮了，并且有行人在过马路”。

模型论文入选ICRA 2023，相关模型已开源。

那么，是一个什么样的算法？

ADAPT：驾驶行为感知说明大模型

这是一种叫ADAPT（Action-aware Driving Caption Transformer）的端到端算法，也是目前第一个基于Transformer的驾驶行为描述框架，可以感知和预测驾驶行为，并且输出自然语言叙述和推理。

直白一点说，输入车辆视频后，这个算法可以判断车辆行为并告诉你：车在做什么，为什么要这么做。

在论文作者提供的测试视频里，这个算法最终上车的效果是这样的。（红色字是车辆行为，蓝色字是解释）

“车在向前开。因为路上没有车。”

驾驶行为变化后，算法也能及时感知：

“车靠左边停下了。因为要停车。”

“车开始移动并且靠右行驶。因为路左边停着车。”

算法不仅能识别路口，也能识别骑着车的人。

“车在十字路口停下了。因为要避开街上骑着自行车的人，”

这是怎么实现的？

多任务框架下的联合训练

ADAPT框架可以分为两个部分：车辆行为描述（DCG，Driving Caption Generation）和车辆控制信号预测（CSP，Control Signal Prediction）。

首先，传感器端输入视频，Video Swin Transformer对车辆视频进行编码，得到的视频特征会输入进各任务模块里。

在DCG模块，算法利用Vision-Language Transformer生成两个自然语句，也就是上文中提到的车辆行为描述和原因解释。

相同的视频特征也会输入进CSP模块（类似一般基于视觉的自动驾驶系统），输出车辆实际的控制信号序列，并利用Motion Transformer输出模型预测的控制信号，比如速度、方向和加速度。

在单个网络中，作者利用车辆实际的控制信号序列和模型预测的控制信号序列，两者的均方误差作为CSP模块的损失函数。

而在多任务框架下，通过联合训练DCG和CSP，可以减少车辆决策和文本描述之间的差异，提高控制信号预测的准确率。

论文里，作者们在包含控制信号和车辆视频的大规模数据集BDD-X上，利用机器评测和人工评测验证了ADAPT的有效性。

机器评测方面，使用的是BLEU4、METEOR、ROUGE-L和CIDEr（对应缩写分别为B4、M、R、C）等多种语言任务常用的指标。

最终显示ADAPT达到了当前最优（State-of-the-Art）的结果，ADAPT在动作描述方面比原有先进方法CIDEr高出31.7，在原因解释方面高33.1。

人工评测分为动作描述、原因解释和全句三个部分。通过人工判断，ADAPT在这三部分的准确性分别达到了90%，90.3%和82.7%，证明了ADAPT的有效性。

在可视化结果里，也能看出ADAPT可以准确识别车辆行为以及决策原因。并且在黑夜、阴雨天等场景下，ADAPT也能保证准确度；即使有雨刷器干扰，ADAPT也可以识别道路上的停止标识。

为什么需要ADAPT？

自动驾驶行为的可解释性

在基于视觉的自动驾驶算法里，比较常见的解释图有视觉注意图（Attention Map），或者成本量图（Cost Volume），但不熟悉自动驾驶算法的人容易对这些图造成误解。

上：视觉注意图；下：成本量图

因此，ADAPT这种能够生成自然语言、“说人话”的算法，能够帮助用户更好地理解自动驾驶算法在做什么、为什么要这么做，同时还能让用户更信任自动驾驶技术。

而对于算法工程师和研究人员来说，当发生极端情况时、或者发生故障（比如判断错误）时，ADAPT可以帮助他们获得更多信息，进而改进算法。

作者们将进一步研究如何在模拟器和实际车辆上如何部署ADAPT，以及如何利用文本转语音技术，让生成的句子转化为语音，帮助普通乘客，特别是视力障碍乘客使用。

本文来源：量子位，原文标题：《他们用ChatGPT方式搞自动驾驶，论文入选了ICRA 2023》

风险提示及免责条款市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

推荐内容

【全球独家】SVB破产背后：高管为了高薪而追逐高风险

2023-03-24
今日热议：小米电话会：去库存措施有效 AI大模型方面有积累 | 财报见闻

2023-03-24
他们用ChatGPT方式搞自动驾驶，能告诉你“我在干嘛”

2023-03-24
美国2月耐用品订单环比初值-1%，创2年来最大降幅

2023-03-24
头条焦点：戴康：港股牛市处于第二阶段，上行动力大于A股，逢低配置港股“三支箭”

2023-03-24
热讯：小米Q4营收660.5亿元好于预期净利润同比下滑67% | 财报见闻

2023-03-24
“ChatGPT之父”推虹膜扫描计划验证身份，未来可区分人与AI

2023-03-24
商业活动复苏强劲！欧元区3月服务业PMI创10个月来新高，而制造业增长乏力

2023-03-24
天风孔蓉：人工智能已进入从1到N的落地期丨见智研究

2023-03-24
全球快资讯丨又一个独角兽要赴美IPO

2023-03-24
【播资讯】欧美银行股重启跌势！德银欧股重挫10% 欧洲银行股指数跌2.5% 原油跌超3%

2023-03-24
每日关注!微信向客户提供投资建议？这个期货公司和员工一起被罚了

2023-03-24
美团Q4营收601亿元超预期，净亏损降80% | 财报见闻

2023-03-24
央行本周公开市场回笼资金逾千亿，下周3500亿逆回购到期

2023-03-24
天天信息:耶伦打脸！为什么监管者没有预判本次银行危机？

2023-03-24
市场监管总局发布四部反垄断法配套规章

2023-03-24
热议：日本2月核心CPI一年多来首次放缓，但另一关键通胀指标创41年新高

2023-03-24
世界观察：“恐惧情绪利好黄金”！高盛大幅上调目标价至2050美元/盎司

2023-03-24
环球看点！AI 建筑也要来了，对行业影响有多大？

2023-03-24
每日热议!和新加坡“争夺”富豪！香港家族办公室新政出炉涉及利得税豁免

2023-03-24
欧美银行业都炸了，为何满手美债的日本银行却安然无恙？

2023-03-24
环球观天下！浑水创始人：应该让硅谷银行的储户承受损失

2023-03-24
世界快看点丨从“29—33大萧条”到硅谷银行：银行挤兑到债务危机的传导路径

2023-03-24
世界快资讯：朱啸虎：ChatGPT太强大，对创业公司很不友好

2023-03-24
港股低开高走，恒生科技指数涨超1.78%，百度涨超4%

2023-03-24
【独家焦点】银行有多缺钱？美联储一周共贷出1639亿美元！

2023-03-24
“币圈逃犯”韩国人Do Kwon在黑山被捕纽约检方指控其欺诈

2023-03-24
里程碑式更新：ChatGPT的“应用商店”来了！

2023-03-24
多城住宅成交量上升，年后房地产市场暖风能够吹多久？

2023-03-24
最新快讯!科创板IPO丨理想、小鹏供应商威迈斯三度上会寄售模式合理性再迎考

2023-03-24
每日短讯：A股“闭眼打新”时代结束了！

2023-03-24
环球新资讯：下一个“核弹”商业地产债大考在即：今年4000亿到期，未来五年2.5万亿

2023-03-24
A股主板注册制两IPO定价超募近6亿 23倍市盈率天花板终成历史

2023-03-24
每日播报!下注债权人能赢强制清零官司！对冲基金在抢购瑞信AT1债

2023-03-24
引发市场巨震后，耶伦修改证词关键部分，称准备必要时采取额外的存款行动

2023-03-24
【报资讯】大公司减员行动继续！埃森哲将暴力裁员1.9万人

2023-03-24
天天短讯！蔡经理重回巅峰，但这批基金经理好像更“猛”

2023-03-23
进军电影院！苹果拟每年投入10亿美元制作将在影院上映的电影

2023-03-23
当前头条：面临不同程度风险该如何应对？券商今年压力测试工作正式展开

2023-03-23
每日热议!新猎物登场！做空印度首富后，兴登堡研究将矛头对准支付服务提供商Block

2023-03-23
环球观焦点：银行危机暴击! 大批宏观对冲基金遭重创最大跌幅达32%

2023-03-23
环球微速讯：瑞信A1债“清零”激怒投资者，瑞士监管辩解：该决定在法律上是无懈可击的

2023-03-23
许家印迎来一线生机

2023-03-23
百图生科AIGP平台发布：提供多种蛋白质生成能力，加速前沿生命科学研究

2023-03-23
天天资讯：这家央企地产商想冲刺前五

2023-03-23
环球速读：退休两年半！股份制银行“元老”王桂芝接受审查调查

2023-03-23
英国央行加息25基点，符合预期

2023-03-23
世界实时：银行业动荡之际，瑞士央行坚持加息50个基点！

2023-03-23
环球播报:初代时尚“女魔头”全部谢幕

2023-03-23
世界快看点丨雅居乐“真还传”的代价

2023-03-23