4月10日,小马智行正式发布其在物理AI领域的最新技术成果——PonyWorld世界模型2.0。这是自动驾驶核心训练体系的一次重大升级。
据介绍,与1.0相比,2.0最本质的变化在于世界模型具备了自我诊断与定向进化的能力:AI不再依赖工程师花大量精力判断模型哪里有问题、需要采集什么样的数据来迭代,而是能够自主诊断自身短板,自我定向进化,并主动“指导”人类团队的研发和数据采集工作。这一变化标志着小马智行的自动驾驶技术进入全新的研发训练范式。

目前,世界模型2.0已经应用在小马智行L4级无人驾驶车队和研发体系中,来确保车辆不断提升安全性、舒适性和通行效率,从而带动更快的扩张速度和商业变现能力。当无人驾驶车队规模从百辆跃升至千辆乃至万辆,要确保安全性等各项指标整体上稳步提升,自动驾驶技术亦需要不断迭代进化,世界模型2.0是目前技术的最优解。PonyWorld不局限于优化自动驾驶场景,也具有探索其他物理AI场景和应用的可能。
作为物理AI的第一个成熟商业化落地的应用,L4级自动驾驶和Robotaxi对安全性的要求极高,只有远超人类的安全性,才能大规模上路运营并被公众接受。正因如此,小马智行认为自动驾驶模型的训练目标不应是“像人开得一样”,而是“比人开得好”,这意味着一种范式的变化——从模仿学习到强化学习。小马智行从2020年起,通过数年时间逐步打造并完善了一套贯穿云端与车端的完整体系,让AI通过强化学习增强模型开车能力,使AI可以在“虚拟驾校”中反复开车、训练车端模型的驾驶能力,这也就是“世界模型”。世界模型不是简单生成虚拟数据的仿真环境,而是一套完整的强化学习训练系统以及开发范式,帮助AI提升驾驶中最重要的博弈交互能力。
通过世界模型,小马智行提升自动驾驶能力的过程,本质上也是提升世界模型精度的过程。
而随着AI司机的能力尤其是安全性已经远超人类,小马智行世界模型的精度也达到了很高的高度,如何进一步高效率提升世界模型精度的迭代效率便成为核心目标。小马智行为此打造了一套更进化的世界模型系统——由AI驱动,可以主动找到自己精度不足的场景,主动寻求人类帮助去提升——也就是PonyWolrd世界模型2.0。
京公网安备 11010202009201号] [京ICP备2021034286号-7] [互联网宗教信息服务许可证:京(2022)0000118;京(2022)0000119]