AI晶片巨頭Nvidia計畫於本月稍晚舉行的GTC 2026大會上,正式發表一款專為推論優化的全新晶片,回應市場對低功耗、高效率解決方案的迫切需求。
這款次世代推論處理器據悉將整合由AI初創公司Groq開發的新型技術,專門針對大規模語言模型(LLM)的即時回應進行優化。與傳統GPU相比,推論專用晶片能更有效地處理已訓練完成的模型,並顯著降低數據中心的營運成本。
Nvidia此次轉型反映了產業趨勢的結構性改變。根據Deloitte最新報告,2026年全球半導體營收將有近一半來自數據中心AI晶片,而推論需求正成為市場增長的主引擎。
業界分析指出,Nvidia此舉不僅是為了維持技術領先,更是為了擴大在自動駕駛與邊緣運算領域的滲透率。隨著全球開發者愈發關注人工智慧的「成本效益比」與「投資報酬率(ROI)」,這款推論晶片的成功與否,將直接影響Nvidia能否在多模態AI與自主系統(如機器人)硬體生態系中續領風騷。