全球高速連接晶片領頭羊Astera Labs今日在COMPUTEX展會中舉行記者會。計算連接事業群資深副總裁兼總經理Thad Omura在會中表示,針對AI基礎設施的全新「Scorpio Smart Fabric Switch」已正式向雲端業者出貨。同時,為因應全球AI機櫃級基礎設施向台灣集中的趨勢,Astera Labs也宣布與台灣5大ODM深化合作,並將在台建立「雲端級互連實驗室」,全面擴大在台的半導體工程與軟體研發投資。
|
Thad Omura指出,當前AI工作負載已從傳統的訓練與推理,演進至代理型AI。在超大規模資料中心追求投資報酬率極大化的前提下,每瓦代幣產出(Tokens per Watt)成為最關鍵的指標。Astera Labs本次推出的Scorpio系列包含主打擴充網格(Scale-up Fabrics)的X系列,以及具備高彈性伺服器架構的P 系列,在AI運算機櫃中扮演核心支柱。
透過單一大型交換晶片取代過往多顆小晶片串聯的繁複配置,能為系統提升2倍頻寬、減少2至3倍的交換機跳數(Hops),並大減4至6倍的交換機數量,實質解決多晶片組裝產生的網路壅塞問題。
Scorpio P系列跨足PCIe 6 擴展主機架構與KV快取彈性
在本次發布的產品陣容中,Scorpio P系列提供市場上最全面的PCIe 6交換晶片家族,提供從32通道(Lanes)、160通道到最高320通道的豐富變體選擇。該系列晶片具備極高的架構適應性,打破過往主機CPU僅能連接4個或8個GPU的限制,新型伺服器架構透過Scorpio P系列可輕鬆將連接規模擴展至16個以上的GPU。
此外,晶片也為資料中心必備的儲存設備、向外擴充(Scale-out)網路卡(NIC)以及前端網路保留了充裕的連接埠。
針對大語言模型運算中日益關鍵的KV快取(KV Cache)需求,Scorpio P系列亦提供了量身打造的解決方案。由於GPU內建的HBM記憶體容量有限,系統設計能透過佈署Scorpio大型交換晶片,將大量的NVMe SSD接入網路,作為高速 KV快取,藉此大幅擴展整個集群的記憶體容量並加速推理工作負載。
更重要的是,Scorpio P系列的所有變體晶片皆具備良好的軟體相容性,全面納入Cosmos基礎設施管理套件之下,讓AI實驗室能根據不同的應用場景進行客製化與「規模最佳化」,例如在需要前端網路裝置多樣性的架構中,彈性導入32或64通道的機型,大幅縮短產品研發並推向市場的時間。
導入Hypercast與網格內運算
除了Scorpio P系列在PCIe 6拓撲結構上的彈性,Scorpio X系列則整合了大量的智慧化功能。Thad Omura強調,為了加速當前主流的混合專家(Mixture of Experts, MoE)工作負載,晶片導入了「Hypercast」技術,能將封包一次性多播(Multicast)給動態配置的GPU群組,省去逐一發送的時間。
此外,「網格內運算(In-Network Compute)」功能則讓GPU在進行集體通訊操作相互比較資料時,可直接交由交換機處理,大幅減少網路流量,使通訊效率提升高達2倍,並將GPU利用率極大化。
在系統營運韌性(Resilience)方面,由於大規模資料中心面臨數百萬條鏈路維護的挑戰,Scorpio交換晶片架構採雙平面設計,將負責資料傳輸的硬體平面與韌體平面完全獨立。
當系統處於高載運作時,維運人員可直接進行即時韌體更新或變更配置,完全無需停機。搭配專屬的Cosmos軟體基礎設施管理套件,甚至能深入物理層監測損壞電容或補捉錯誤封包,確保點對點傳輸的萬無一失。
台灣成為全球AI樞紐 策略中心就地並肩作戰
|
針對亞太區的佈局,Astera Labs亞太區業務副總裁暨台灣總經理Campbell Kan表示,台灣已成全球AI基礎設施的黃金礦脈與核心樞紐。隨著GPU生命週期縮短至約12個月,從新產品導入到大規模量產的驗證流程幾乎皆在台灣進行。為了縮短與客戶的溝通時差,Astera Labs也與技嘉、英業達、鴻海、廣達以及緯創等5大台灣ODM廠緊密結盟。
Campbell透露,Astera Labs將在台灣打造「雲端級互連實驗室」,不僅就地取材、與ODM廠並肩研發以即時解決技術瓶頸,更計畫將晶圓代工、封裝測試等半導體工程資源持續擴大。未來,甚至連核心的管理軟體開發與測試驗證都將落戶台灣,實現「在地協同開發、在地解決問題、直接整機出貨」的高效生態鏈,力求以最快速度將最新的 AI 機櫃平台推向全球市場。
|

