當各界正探討應採取開源或閉源AI模型技術來作為工作基礎,NVIDIA也持續擴展其開放式AI模型、資料集和工具庫組合,可應用於幾近所有研究領域。且為了讓研究社群具備最新的數位和物理AI能力,已在今年NeurIPS大會上發表其開放式物理AI模型和工具,來支援相關研究,分享涵蓋AI推理、醫學研究、自駕車(AV)開發等領域的創新專案。
 |
| NVIDIA全球首款,專為自動駕駛設計的產業級開放式推理視覺語言動作(VLA)模型,提升自駕車在複雜道路場景中的安全性。 |
其中包含全球首款,專為自動駕駛設計的產業級開放式推理視覺語言動作(VLA)模型NVIDIA DRIVE Alpamayo-R1(AR1),將思維鏈(chain-of-thought)AI推理,與可實現Level 4自動駕駛關鍵要素的路徑規劃相結合,提升自駕車在複雜道路場景中的安全性。
有別於以往的自動駕駛模型,在處理行人密集的十字路口、即將出現的封閉車道或自行車道上的併排停車等複雜場景時,經常面臨困境。AR1 則透過分解及評估所有場景發展可能,再運用情境資料選擇最佳路線,並逐步推理來賦予自駕車類似於人類駕駛的常識判斷能力。
當自駕車行經行人密集區且鄰近自行車道時,車輛得以即時整合路徑資料、納入推理軌跡作為採取特定行動的決策依據。進而規劃後續路徑,例如遠離自行車道或為可能違規穿越馬路的行人預作停車準備。
此外,基於NVIDIA Cosmos Reason的AR1開放型基礎,還讓研究人員能根據自身的非商業用途客製化模型,無論是用於基準測試,或是建立實驗性的自動駕駛應用。對於後訓練的AR1,強化學習已被證明特別有效,與預訓練模型相比,AR1的推理能力顯著提升。