滚动：全球最佳！提出感知决策一体化端到端自动驾驶大模型上海科研团队闪耀AI顶会

新民晚报| 2023-06-22 05:49:23

温哥华当地时间6月21日，全球人工智能和计算机视觉领域顶级国际会议CVPR 2023正式公布奖项。上海人工智能实验室、武汉大学及商汤科技联合研究成果《以路径规划为导向的自动驾驶》从9155篇投稿论文中脱颖而出，获得本届CVPR最佳论文奖。该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD，开创了以全局任务为目标的自动驾驶大模型架构先河, 为自动驾驶技术与产业的发展提出了新的方向。

这是近十年中国学术机构作为第一单位首次获CVPR最佳论文奖，也是近十年计算机视觉三大顶级会议（CVPR、ICCV、ECCV）的最佳论文奖首次颁给第一单位为中国的学术机构。

CVPR是计算机视觉和人工智能领域公认的顶级会议。CVPR最佳论文是计算机视觉领域学术研究的顶级荣誉，对技术和行业发展将产生重要影响。根据谷歌学术统计，CVPR在所有学术期刊和会议中位列《自然》（Nature）、《新英格兰医学杂志》（The New England Journal of Medicine）和《科学》（Science）之后排名第四。

(资料图)

2023年CVPR会议在加拿大温哥华举行，今年CVPR会议共计9155篇投稿，2359篇论文被接收（接收率25.78%）。在本届CVPR上，上海人工智能实验室和商汤科技以一篇最佳论文、一篇最佳论文候选、54篇论文被接收的优异成绩单，在国际学术舞台上展现了中国AI实力。

自动驾驶是一个高度复杂的技术体系，不仅需要多个学科领域的知识和技能，包括传感器硬件、机器学习、多模态融合等内容，还需要适应不同国家与地区的道路规则和交通文化，与车辆及行人进行良好的交互，以实现高度的可靠性和安全性。自动驾驶系统包含三大主任务：感知、预测和规划。当前，业界主流的方案架构分别采用不同的模块来处理这些具体任务，但由于各模块并非以驾驶为最终目标进行优化，因而自动驾驶系统的整体性能提升受到了很大限制。

在UniAD中，研究人员首次将感知、预测和规划等三大类主任务、六小类子任务（目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划）整合到统一的基于Transformer的端到端网络框架下，实现了全栈关键任务驾驶通用模型。在nuScenes真实场景数据集下，UniAD的所有任务均达到“领域最佳性能”，尤其是预测和规划效果远超之前的最佳方案。其中，多目标跟踪准确率超越“领域最佳性能”20%，车道线预测准确率提升30%，预测运动位移和规划的误差则分别降低了38%和28%。

上海人工智能实验室青年科学家李弘扬介绍，凭借其充分的可解释性、安全性、与多模块的可持续迭代性，UniAD是目前为止最具希望实际部署的端到端模型。基于UniAD的纯视觉自动驾驶方案可为产业界提供全新的研发思路，在节省大量硬件成本的同时，有助于提高出行的安全性与舒适性。该科研成果在产业界的落地应用，将有力地推动自动驾驶技术与产品的规模化发展。

自动驾驶是通用智能大模型“书生”重要的落地应用领域之一，近年来，上海AI实验室自动驾驶团队不断突破创新，挑战各项自动驾驶研究任务，在多模态、时空融合、端到端、多任务等方面提出了新思路、新模式。“以原始创新引领技术突破，上海AI实验室作为人工智能领域的新型科研机构，致力于通过开展战略性、原创性、前瞻性的科学研究与技术攻关，目标成为享誉全球的人工智能原创理论和技术的策源地。”上海人工智能实验室主任助理乔宇表示。

新民晚报记者郜阳