当各界正探讨应采取开源或闭源AI模型技术来作为工作基础,NVIDIA也持续扩展其开放式AI模型、资料集和工具库组合,可应用於几近所有研究领域。且为了让研究社群具备最新的数位和物理AI能力,已在今年NeurIPS大会上发表其开放式物理AI模型和工具,来支援相关研究,分享涵盖AI推理、医学研究、自驾车(AV)开发等领域的创新专案。
 |
| NVIDIA全球首款,专为自动驾驶设计的产业级开放式推理视觉语言动作(VLA)模型,提升自驾车在复杂道路场景中的安全性。 |
其中包含全球首款,专为自动驾驶设计的产业级开放式推理视觉语言动作(VLA)模型NVIDIA DRIVE Alpamayo-R1(AR1),将思维链(chain-of-thought)AI推理,与可实现Level 4自动驾驶关键要素的路径规划相结合,提升自驾车在复杂道路场景中的安全性。
有别於以往的自动驾驶模型,在处理行人密集的十字路囗、即将出现的封闭车道或自行车道上的并排停车等复杂场景时,经常面临困境。AR1 则透过分解及评估所有场景发展可能,再运用情境资料选择最隹路线,并逐步推理来赋予自驾车类似於人类驾驶的常识判断能力。
当自驾车行经行人密集区且邻近自行车道时,车辆得以即时整合路径资料、纳入推理轨迹作为采取特定行动的决策依据。进而规划後续路径,例如远离自行车道或为可能违规穿越马路的行人预作停车准备。
此外,基於NVIDIA Cosmos Reason的AR1开放型基础,还让研究人员能根据自身的非商业用途客制化模型,无论是用於基准测试,或是建立实验性的自动驾驶应用。对於後训练的AR1,强化学习已被证明特别有效,与预训练模型相比,AR1的推理能力显着提升。