当智能网联汽车开始驶入城市的“毛细血管”,“驾驶权”交接的问题正摆在人类面前。我们该如何理解自动驾驶的底层逻辑?AI究竟是辅助驾驶员的工具,还是未来的驾驶主体?面对“黑箱”决策带来的信任危机,又该如何破局?
没有AI,就没有自动驾驶
“可以说,没有AI,就没有自动驾驶。”清华大学计算机科学与技术系教授邓志东说。在他看来,自动驾驶汽车并非简单的交通工具升级,而是一个具备感知、决策与执行闭环能力的“类脑智能体”。
以前方车辆出现事故这一场景为例,自动驾驶的“感知-决策-执行”闭环如何完成?
“一切始于感知。”邓志东表示,车辆周身遍布的激光雷达、高清摄像头和毫米波雷达,构成了“复眼”,但硬件只是基础,真正的挑战在于如何处理海量的环境数据。
在事故发生的瞬间,传感器必须在毫秒级时间内捕捉到异常。但这仅仅是物理层面的“看见”,AI的核心作用在于“看懂”,即对场景与障碍物进行语义理解。
当感知系统确认前方无法通行后,系统大脑开始飞速运转,进入复杂的博弈阶段。此时AI需要瞬间预测出左侧车道后方来车的行驶意图,例如降速或匀速行驶,还是在加速,左前方是否有足够的安全间隙切入,等等。
“这是一个极其复杂的路径规划过程。”邓志东介绍,与人类驾驶员依靠直觉相似,AI模型会根据预设的“激进变道”与“保守等待”等行驶风格,进行具体的决策与规划。这一过程模拟了人类大脑处理不完整信息时的机制——在信息瞬息万变的变道过程中,不仅要看路,还要“懂”车,甚至要“揣摩”其他驾驶员的心理。
决策与规划一旦下达,就进入了执行与闭环环节。指令被瞬间转化为对底盘的电信号。油门输出多少扭矩,方向盘转动多少角度,刹车施加多少压力,都需要在毫秒间精准执行。
这一连串动作的流畅度与稳定性,正是衡量自动驾驶AI水平高低的试金石。它不再是死板的程序执行,而是模拟人类“老司机”的驾驶直觉,力求在安全、效率与舒适之间达到完美的平衡。
面对复杂路况如何举一反三?
在自动驾驶发展的上半场,行业主要依赖“规则驱动”的技术路线。工程师试图把所有的交通规则和驾驶经验写成代码。然而,现实世界的路况是极其复杂且充满不确定性的。比如突如其来的暴雨、没有信号灯的乡间路口,甚至是在路边散步的牛羊……这些被称为“边缘事件”的难题,长期制约着自动驾驶的安全上限。
邓志东指出,AI技术,特别是大模型的引入,正在从根本上解决这一痛点。他特别提到了一个关键优势——“多场景适配”。“比如智能辅助驾驶对高速公路、城区道路的适配。”邓志东说。
相比于传统算法,大模型的最大优势在于强大的“泛化能力”。通过海量驾驶视频和动作数据的预训练,大模型学习到的不再是死板的规则,而是通用的驾驶逻辑和物理常识。邓志东表示,这种泛化能力让汽车在面对未见过的路况时,不再束手无策,而是能像人类一样“举一反三”。
黑箱带来的安全隐患如何破局?
随着新能源汽车的普及,越来越多用户开始尝试使用领航辅助驾驶功能。邓志东坦言,这背后既有技术成熟的因素,也离不开“车企科技感宣传”和“实际通勤便利性”带来的用户习惯改变。但由此带来的安全隐患,只有直面并予以解决,才能让自动驾驶真正走进千家万户。
“事实上,明确决策逻辑这样的事故溯源很难实现,因为基于大模型的方法可能是黑箱式的。”邓志东指出了当前技术的局限性。
深度神经网络的决策分布在数以千亿计的神经元参数路径中,而非可读的代码逻辑。当车辆在紧急情况下做出一个刹车或避让动作时,我们很难像检查传统代码一样,精准定位是哪一行逻辑起了作用。这种“不可解释性”,给事故定责、保险理赔以及用户的心理安全感构建带来了巨大挑战。
邓志东认为,这是未来AI研究的前沿方向之一,即可解释AI的发展,或者是建立一套系统的多重闭环的安全评估标准。
展望未来5到10年,邓志东对行业前景充满信心。他认为,随着AI算力的突飞猛进、法律法规的不断完善,加之基础设施的智慧升级,我们将迎来“更自主的出行与服务能力”。届时,汽车将不再仅仅是从A点到B点的交通工具,而是懂你、护你、解放你、服务于你的智能移动空间。它能理解你的意图,预判潜在的安全风险,真正在复杂的城市环境中实现“科技护航”。
采访专家:邓志东 清华大学计算机科学与技术系教授、人工智能研究院视觉智能研究中心主任
制作:北京市科协融媒体中心