帳號:
密碼:
最新動態
產業快訊
CTIMES / 文章 /
偏執又偏鋒 資訊用GPU持續激進
GPU技術發展洞悉

【作者: 陳隱志】   2006年11月01日 星期三

瀏覽人次:【5515】

雖然GPU(Graphics Processing Unit)一詞是在1999年8月,Nvidia在發表GeForce 256顯示晶片時所一同提出,此詞創的用意是期望眾人能將顯示晶片與Intel力倡的CPU(Central Processing Unit)等量齊觀,而別再是PC系統內獨尊CPU,不過到了今日GPU一詞已成為普遍通行的稱法,甚至已比過去的「顯示晶片」、「繪圖晶片」等更常稱用。


此外,今日GPU的運用領域可說是愈來愈廣,除了資訊領域的個人電腦(包括主流桌上型電腦、低價電腦、筆記型電腦)、專業繪圖工作站、伺服器之外,在消費性電子的領域也頗多斬獲,例如STB視訊機頂盒、HDTV高清晰數位電視、Media Center媒體中心、Game Console電視遊樂器等也都需要GPU,此外熱門的手持裝置也一樣愈來愈倚重GPU,包括智慧型手機、PDA、GPS電子地圖與導航、PMP可攜式媒體播放器、掌上型電玩等,甚至股票機、電子字典等,這些也都需要GPU來強化繪圖效果。


由此可知,GPU的應用層面已愈來愈大,且規格與技術仍持續在強勁變革中,本文以下將針對最早發端的資訊領域,來瞭解近年來GPU的技術發展與演進。


《圖一 Nvidia的GeForce3 Ti200的繪圖處理器。》
《圖一 Nvidia的GeForce3 Ti200的繪圖處理器。》

主流桌上型電腦

近年來主流桌上型電腦所用的GPU有幾項新發展趨勢:


  • (1)2002年開始,PCI Express取代自1996年以來的AGP,原因在於AGP的技術作法已難再提升傳輸效能,如此一路走來為AGP 1X、2X、4X、8X、PCIe 16X;


  • (2)隨著PCI Express的普及,過去(1998年)僅適合在PCI、不適合於AGP的SLI組態技術於2004年開始再度被起用;


  • (3)由於GPU的平行浮點運算效能已達高度充沛,自2005年ATI提出GPGPU(Genera Purpose GPU;一般性用途的GPU)的概念,期望GPU的浮點運算也能用於娛樂3D繪圖之外的應用,特別是科學、工程方面的應用,如核磁共振、流體模擬。此外Nvidia也提出「物理SLI」,以及AGEIA提出PhysX,使物理引擎與繪圖引擎更互近與交跨發展。


  • SLI(Scan-Line Interleave)技術是於1998年時,由3dfx所提出,2000年Nvidia併購3dfx,2004年NVIDIA再次提出過往的SLI技術,但全寫含意已有所變,改成:Scalable Link Interface,然技術本質不變,此外ATI於2005年提出的CrossFire技術也屬相同性質。


  • 除此之外,其他相關的技術還有DirectX函式庫、視訊記憶體、平面顯示與串流媒體。在娛樂3D函式庫(Library;或稱「API」應用程式介面)上,自1995年以來年年大改版本數字的DirectX,在近4年都僅有小幅更動,即持續停留在DirectX 9.0的層次,預計Windows Vista問世後,附帶的DirectX 10才可能帶來更大的變革。



《圖二 繪圖卡上的運算系統》
《圖二 繪圖卡上的運算系統》

其次是視訊記憶體(Frame Buffer),主流桌上系統一向採行獨立、特用的視訊記憶體,從最早的VRAM,到之後的SGRAM,以及更後續的GDDR2,及今日的GDDR3,其他短暫特用的也包括WRAM(Matrox的Millenium IS-STORM R2)、MDRAM(Tseng Labs的ET6000/ET6100)及RDRAM(Cirrus Logic的GD546x)等。


同時,視訊記憶體的容量、傳輸寬度、時脈等都在提升,容量從最初的2、4MB水準,一路倍增至今日256MB,寬度也從32bit、64bit、128bit,到今日的256bit。另一方面時脈也持續飆升,無論GPU處理核心、視訊記憶體匯流排、RAMDAC等皆是,核心已至430MHz、470MHz之高,視訊記憶體介面方面更是達525MHz、600MHz。


再者,自1999、2000年起,電腦監視(顯示)器逐漸從CRT轉換成LCD,如此在顯示驅動上也必須因應改變,例如Nvidia的Pure Video技術、ATI的AVIVO技術,皆是為此而設,此外也針對近年來開始盛行的串流媒體格式:MPEG-4、H.264等進行硬體式的最佳化清晰播放。


至於從1997年由Microsoft發起的TV Output功效,多年來並沒獲得太大迴響,且多半以獨立封裝晶片(或模組子卡)型態來提供,而非內建整合到GPU中,到了2003年Microsoft另行推展Media Center理念,將主流桌上PC再行包裝,具備TV Tuner、TV Output功效的GPU/顯示卡則轉往此領域發展,如此已屬CE消費性電子領域,在本次文章中暫且略提。


《圖三 3D繪圖卡設計》
《圖三 3D繪圖卡設計》

低價桌上型電腦

低價桌上型電腦(Low Cost PC)是自1997年2月開始,Intel起初不以為意,但經過一年觀察後才正式承認低價市場的存在,並在1998年4月推出針對此領域的處理器:Celeron,不過1996~1998正是3D顯示卡起飛的數年,當時除積極提升3D效能外,尚無人顧及低價需求,一直到1999年由各晶片組業者提出整合型晶片組(Integrated Graphics Processor;IGP),才算正式對這塊市場有所回應。


IGP作法是將GPU與晶片組(主要是北橋晶片)進行整合,較高階的IGP仍具有自屬獨立的視訊記憶體,如Intel推行的動態視訊記憶體技術(Dynamic Video Memory Technology;DVMT),不過也有採行與系統主記憶體合一的更經濟作法,此種作法一般稱為一體性記憶體架構(Unified Memory Architecture;UMA),UMA最早是來自於工作站,為了讓工作站單價更低而提出的架構性精省構想。如Nvidia的TurboCache技術,以及ATI的HyperMemory技術,此種技術今日也經常用在訴求平價的筆記型電腦中。


IGP發展的初期,必須在製造階段就決定是否要設置獨立配置的視訊記憶體,出廠之後就無從再變更,此外用戶也只能使用IGP內建的GPU,無法再行擴充選擇,或只能選擇傳輸頻寬更有限的PCI,不過近年來這些限制都逐漸去除,不僅可以關閉內建的GPU功效而選擇外接方式的升級擴充,甚至也支援SLI、CrossFire等並列加速的組態,如此使得低價用GPU的規格及功效愈來愈與主流水準拉近。


《圖四 GPU散熱設計》
《圖四 GPU散熱設計》

專業繪圖工作站

專業繪圖工作站對GPU的需求比PC更早,不過在1996年Windows工作站出現後,與原有市場中的UNIX工作站進行了數年的價格戰,直到1999年工作站市場萎縮,價格戰的結果迫使過去特有介面紛紛走入歷史,例如Apple從NuBus改用PCI/AGP,Sun也從UPA改用PCI/AGP,甚至是用64bit PCI與PCI-X。Sun方面仍有部分在使用舊的UPA介面,此外也有新的接替介面:Fireplane,以及更後續的J-Bus。


同樣也因為PC陣營的強勢成長,過去僅經營工作站市場的GPU業者也逐漸退縮,包括SGI將繪圖部門賣給Nvidia,Creative Labs買下3DLabs等。雖然如此,但工作站依然是眾領域中對視訊規格要求最高的,以頂級的專業繪圖卡而言,最高已可配屬達1GB的容量,由此可看出專業繪圖對資源的苛求性。


工作站用的GPU不僅各項表現都要達最高標,在功效設計上也有幾項與主流桌上PC不同,一是針對專業3D繪圖所需的API:OpenGL進行更佳的支援,雖然主流PC用的GPU也支援OpenGL,但支援性仍會低於娛樂3D繪圖所用的DirectX,主流PC用的GPU之所以會支援OpenGL,主要也在於部分3D遊戲有支援OpenGL,然遊戲軟體與遊戲GPU絕非對此專精訴求。


另一是多視訊輸出,許多專業工作者早已採行多螢幕的工作環境,如此可提升專業工作的效率,所以工作站的GPU通常還要搭配特屬的設計,使其能夠同時執行及處理多個畫面的輸出。


《圖五 比Intel Centrino更早實現CPU、GPU、North Bridge三種晶片整合成一體的,是Cyrix的MediaGX處理器,今日筆記型電腦用的GPU愈來愈講究整合精縮與省電性。》
《圖五 比Intel Centrino更早實現CPU、GPU、North Bridge三種晶片整合成一體的,是Cyrix的MediaGX處理器,今日筆記型電腦用的GPU愈來愈講究整合精縮與省電性。》

筆記型電腦

筆記型電腦用的GPU首重省電性、次講究體積精縮性、再次才會考慮效能、價格等因素。為了省電,除了在半導體製程上提升外,GPU業者也額外設計了多種省電機制,例如ATI的Powerplay技術,能偵測筆記型電腦在進行簡報性的雙畫面同步輸出時,會主動將近端自有的顯示部分減少用電,因為簡報講者多以大投影畫面為主盯,僅會有幾次回神到自有的筆記型畫面中。


又如在一般操作或DVD-Video播放時,GPU也會自動將3D方面的功效電路加以關閉,以精省用電。類似的也有Nvidia的PowerMizer技術,這些都屬於動態因應、調適性的省電技術。


值得注意的是,由於筆記型電腦愈來愈普及,甚至有凌駕桌上型之勢,過往筆記型電腦用的GPU有了更多的發展路線,除了高價位採獨立GPU、獨立視訊記憶體外,平價的筆記型電腦則採行整合性的IGP,並盡可能精省記憶體而使用共享式的UMA,但除這兩者如今又有兩種,一種是講究更精縮與省電的Intel Centrino(迅馳),將CPU、GPU、Chipset(北橋)三合一設計,以求更整合的體積與更統合的電源管控。另一則是更強效的偏執發展,將過往僅在桌上才具備的強悍效能也轉移到筆記型,因此也開拓出「行動用工作站」的新頂級路線。



《圖六 蘋果電腦(Apple Computer)於2003年以後推出的Xserve伺服器,連GPU晶片都加以精省,足見伺服器、伺服應用機(也包含家用閘道器Home Gateay、常駐閘道器Residential Gateway)的領域相當不重視GPU。》
《圖六 蘋果電腦(Apple Computer)於2003年以後推出的Xserve伺服器,連GPU晶片都加以精省,足見伺服器、伺服應用機(也包含家用閘道器Home Gateay、常駐閘道器Residential Gateway)的領域相當不重視GPU。》

伺服器

最後是伺服器(也包含伺服應用機;Server Appliance),老實說這是最不需要GPU的一塊,過去許多伺服器皆直接配屬一張出貨前市場上最低階的顯示卡,如此即可交差,後來IGP興起後也多半直接使用內建的視訊功效。


更有甚者如Apple,Apple在2003年推出的第二代Xserve伺服器中直接棄捨GPU,任何近端的本機操作都是透過連線,直接讀取機內記憶體中的視訊內容,以此解決。此外許多Server Appliance也都採行類似方式,或提供Web介面以供簡易設定。


當然,也有業者試圖以更大的規模用量來爭取伺服器/伺服應用機的GPU市場,由於不重視繪圖效能與3D效果的嵌入式應用也相當多,包括POS(收銀機)、ATM(提款機、自動櫃員機)、KIOSK(服務亭/資訊亭)、Thin Client(精簡型電腦/瘦身型用戶端)等,GPU業者可用單一種GPU,並透過大量量產的單價均攤效益,讓上述各種嵌入應用獲得更低廉、合用的視訊功效功能,這也是另一種可行的出路。


相關文章
未來無所不在的AI架構導向邊緣和雲端 逐步走向統一與可擴展
促成次世代的自主系統
需求逐步到位 邊緣運算重要性與日俱增
神經處理/運算為邊緣帶來實時決策
自行調適運算平台帶來高效能AI加速
comments powered by Disqus
相關討論
  相關新聞
» TI創新車用解決方案 加速實現智慧行車的安全未來
» AMD擴展商用AI PC產品陣容 為專業行動與桌上型系統挹注效能
» 豪威汽車影像感測器高通數位底盤 可用於次代ADAS系統
» 意法半導體擴大3D深度感測布局 打造新一代時間飛行感測器
» AMD第2代Versal系列擴展自調適SoC組合 為AI驅動型系統提供端對端加速


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.3.149.214.32
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw