帳號:
密碼:
CTIMES / 文章 /   
高效能運算當道 低功耗設計為虎添翼
低功耗已是必要

【作者: 王岫晨】   2020年08月31日 星期一

瀏覽人次:【1191】
  

無論行動裝置或者工業生產設備,一致的發展趨勢都是高效能運算。


但高效能運算能否再往更高的目標發展,取決於能否有效降低功耗。


功耗增加會影響散熱成本與電池續航力,嚴重更將影響使用者經驗。



從隨身行動裝置到工業生產設備,高效能的運算技術已經普遍應用於生活中的各個層面。而在追求高效能運算的背後,低功耗設計往往卻是能否降低發熱量的重要關鍵。目前無論是隨身行動裝置、工業生產設備,或者任何介於兩者之間的裝置,其一致的發展趨勢都是『高效能運算』,亦即數據吞吐量更大、運算更快、判斷越來越正確、反應更即時等。但同時,高效能運算也代表更高的功耗。因此高效能運算能否再往更高的目標發展,在5G時代實現AI Everywhere的願景,取決於能否有效而顯著的降低功耗。



圖一 : 低功耗設計往往都是能否降低發熱量的重要關鍵。
圖一 : 低功耗設計往往都是能否降低發熱量的重要關鍵。

事實上,高效能運算的應用在不同裝置與應用場景上,不外乎以電池供應電源或者接市電,因此對功耗增加的忍受度不同。功耗增加對工業應用帶來的是電費及散熱成本增加,對行動裝置來說其衝擊則表現在電池使用的時限上,電池續航力不足,將影響使用者經驗,例如智慧手機就是一個最好的例子。


低功耗設計的重要性

由於人工智慧物聯網等高效能運算技術,得益於神經網路技術的進步,機器學習不再侷限於超級電腦的世界了。如今智慧型手機應用處理器可以執行AI推論,用於實現影像處理和其他複雜的功能。這些邊緣運算裝置有許多是採用電池供電,因此對於系統的功耗有很高的要求,用來延長系統的工作時間。


對現今許多設計而言,功耗是選擇元件最重要的標準,因為可攜式產品的電池壽命越長,對消費者越有吸引力。在基礎設備應用中,低功耗也是一項重要規格,因為較低功耗代表晶片將產生較少熱量,過高的熱量可能會限制系統產品的通道密度,或使得設計團隊無法增加新的功能。此外,有些較著重電源成本的設計,例如以通用序列匯流排(USB)供電的產品,或由汽車電瓶供電的汽車修配零件產品等,其電力預算亦相對有限。


以恩智浦半導體(NXP)為例,其在打造更低功耗的運算解決方案時,除了在晶片設計上有許多創新,電源管理軟體的精密度亦大幅提升外,晶片製程方面也採用更先進製程生產。目標是讓系統設計人員不用於設計系統時為任一項功能遷就妥協。然而,沒有裝置十全十美,設計人員必須仔細考量系統需求,檢視目前不斷推出的低功耗處理器,以了解哪一項產品最符合應用需求。


低功耗運算關鍵需求

Arm主任應用工程師張維良指出,降低功耗的方式除了透過半導體製程之外,也可以透過IP本身設計達到降低平均功耗的效果。若以Arm的Cortex-M系列處理器為例,原本就針對嵌入式系統設計一系列低功耗運算技術,包括Multiple Power Domain支援架構級的Sleep Mode、Wake-up中斷控制器、架構級Power Gating技術。此外Cortex-M0+額外優化減少了程序存取,來保持系統層級的低功耗。


除了過往Cortex-M處理器針對低功耗技術來設計,Arm在新款的Cortex-M55處理器上,也針對高效能低功耗運算打造了一個ML引擎,這個名為Helium的向量運算引擎(MVE)可以有效率的降低運算與功耗比,意即Helium能在單位時間內處理約15倍以往Cortex-M系列的ML運算能力,但是功耗方面只略微增加幾成。透過Cortex-M55搭配Helium技術能更符合IoT裝置搭載AI運算的需求。


運算效能與低功耗的平衡點

對現今許多設計而言,功耗是選擇元件最重要的標準,因為可攜式產品的電池壽命越長,對消費者越有吸引力。

在半導體業界中,經常會提到PPA(power、performance、area),三者互為影響。高運算效能(Performance)通常代表需要的面積(Area)要增加,面積增加相較之下其功耗(Power)也會增加,通常面積與功耗都會以正比的比例來增加或減少,這三個元素很難面面俱到。因此需要透過架構設計來解決這些挑戰,如此就可以不必在追求高效能的同時,還必須對於面積與功耗方面妥協。在實際的設計上,可以參考下列的一些案例。


優化每單位面積的效能:


在面積高度受限的前提下,就該思考如何增加每單位面積的效能密度。例如在M55上引進的Helium向量處理器即是透過架構上的改變,用增加不到一單位功耗的單位,來換取十多倍的效能提升。


搭配NPU大幅提升運算效能:


以ML在IoT的運算方面,Arm研發了另一個利器,即用來搭配Cortex-M的類神經網路處理器(NPU)Ethos-U55。類神經網路處理器是一款專用於ML運算的加速器,Ehtos-U55的面積與Cortex-M55相近,但是提供的是相較於Cortex-M55有32倍ML效能上的提升,透過這類架構上的變革帶給AIoT應用更多的可能性。


電源控制設計:


以多重電壓域設計(Multiple Power Domain),設定不同指令啟動不同的功能框(Functional Block),例如P-Channel控制Core的電源,以Q-Channel 控制Cluster的電源,或者以非同步設計與FMA,調配頂層與核心的用電,以節省電力的消耗。



圖二 : 要降低整體發熱,異質運算多核心處理器以及記憶體等的配置也至關重要。
圖二 : 要降低整體發熱,異質運算多核心處理器以及記憶體等的配置也至關重要。

至於恩智浦,很早就預見到運用最新應用處理器架構和設計理念來製造高效能跨界處理器需求。2017年推出i.MX RT系列跨界處理器,兼顧功耗與性能。如今,不只推出i.MX RT1170突破GHz主頻限制,為更多應用開啟邊緣運算的大門。


恩智浦在近期也發表eIQ機器學習(ML)軟體對Glow神經網路(Neural Network;NN)編譯器的支援功能,針對恩智浦的i.MX RT跨界處理器,實現佔用較低記憶體並更高效能的神經網路編譯器應用。Glow編譯器由Facebook開發,能整合特定目標的最佳化,恩智浦利用這種能力,使用適用於Arm Cortex-M核心和Cadence Tensilica HiFi 4 DSP的神經網路運算元庫(NN operator libraries),最大化提升處理器的推論效能。


低功耗設計考量

以Cortex-M55為例,Arm的架構設計還考量了以下幾個因素:


‧ Designed for efficient compute:以最優功耗效率為設計前提;


‧ Increased DSP/ML performance:提升數位訊號處理器(DSP)及機器學習的表現;


‧ Incremental scalar performance:增進純量效能;


‧ Advanced power management:更先進的電源管理方式;


‧ Robust security with TrustZone:以TrustZone架構的安全防護;


‧ Additional features for advanced debug: 更先進的偵錯工具。


要降低整體晶片發熱,除了晶片的低功耗設計之外,異質運算多核心處理器以及記憶體等的配置至關重要。


以跨界處理器i.MX RT1170為例,它的特色包含雙核心架構,其中Arm Cortex-M7核心運行頻率高達1GHz,Cortex-M4核心運行頻率高達400MHz。雙核心系統將高性能內核與獨立的工作電源區域結合在一起,使開發人員可以同時運行應用程式,或者依據應用需求關閉核心以降低功耗。例如,高效能的Cortex-M4核心可專門針對時間要求嚴格的應用,像是電機控制;而Cortex-M7核心可進行更複雜的運用。至於雙核心可並行運作邊緣運算相關應用程式,像是機器學習、語音處理、人臉辨識等。


同時,針對邊緣運算應用,工作頻率高達GHz的Cortex-M7核心也顯著強化了ML的性能、語音/視覺/手勢識別的邊緣推論,還有自然語言理解、數據分析和數位訊號處理(DSP)等功能。


結語

晶片的低功耗已經不再只是一種需要,而是成為了一種必要。先不談延長滿街跑的行動裝置電池續航力,低功耗對於近年來強調環保節能的產品設計理念,也十分能符合時代的需求。隨著電路技術與半導體製程的精進,未來更高效能且更低功耗的各種晶片,將會更進一步結合在你我的生活當中。


**刊頭圖(source:pxhere.com)


相關文章
優勢科技,優質生活:科技如何提供更美好的「新常態」
智慧製造的「四大要件」
掃除導熱陰霾 拉近IC與AI的距離
AIoT引爆數據潮 MCU與MPU需求逐年升高
促進工作負載整合成效
comments powered by Disqus
相關討論
  相關新品
NXP-LPC4088FET208
原廠/品牌:NXP
供應商:NXP
產品類別:MCU
NXP-LPC812M101FD20
原廠/品牌:NXP
供應商:NXP
產品類別:MCU
NXP-SSL21084AT
原廠/品牌:NXP
供應商:NXP
產品類別:LED
  相關新聞
» 迎接嵌入式運算巨變 Arm攜手微軟推動邊緣裝置AI開發工具
» Volkswagen MEB平台採用NXP電池管理方案 增加續航里程
» 因應百萬兆級運算挑戰 愛德萬新系統支援數位IC測試
» 意法半導體收購功率放大器和射頻前段模組企業SOMOS半導體
» 2020 IEEE亞洲固態電路研討會 台灣區獲選論文搶先發表
  相關產品
» 恩智浦全新感測解決方案 擴展安全超寬頻產品組合
» ST多彈性可配置雙通道I/O-Link和SIO雙模收發器簡化感測器連線
» Arm全新運算方案確保安全優先功能 鎖定自主系統設計市場
» Arm推出Arm Neoverse運算平台 加速雲端到終端的基礎設施
» NXP推出基於MCU的Glow神經網路編譯器 實現邊緣機器學習
  相關資源
» Power Management Solutions for Altera FPGAs

AD


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 遠播資訊股份有限公司版權所有 Powered by O3
地址:台北市中山北路三段29號11樓 / 電話 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw