账号:
密码:
CTIMES / 文章 /   
高效能运算当道 低功耗设计为虎添翼
低功耗已是必要

【作者: 王岫晨】2020年08月31日 星期一

浏览人次:【1193】
  

无论行动装置或者工业生产设备,一致的发展趋势都是高效能运算。


但高效能运算能否再往更高的目标发展,取决於能否有效降低功耗。


功耗增加会影响散热成本与电池续航力,严重更将影响使用者经验。



从随身行动装置到工业生产设备,高效能的运算技术已经普遍应用於生活中的各个层面。而在追求高效能运算的背後,低功耗设计往往却是能否降低发热量的重要关键。目前无论是随身行动装置、工业生产设备,或者任何介於两者之间的装置,其一致的发展趋势都是『高效能运算』,亦即数据吞吐量更大、运算更快、判断越来越正确、反应更即时等。但同时,高效能运算也代表更高的功耗。因此高效能运算能否再往更高的目标发展,在5G时代实现AI Everywhere的愿景,取决於能否有效而显着的降低功耗。



图一 : 低功耗设计往往都是能否降低发热量的重要关键。
图一 : 低功耗设计往往都是能否降低发热量的重要关键。

事实上,高效能运算的应用在不同装置与应用场景上,不外??以电池供应电源或者接市电,因此对功耗增加的忍受度不同。功耗增加对工业应用带来的是电费及散热成本增加,对行动装置来说其冲击则表现在电池使用的时限上,电池续航力不足,将影响使用者经验,例如智慧手机就是一个最好的例子。


低功耗设计的重要性

由於人工智慧物联网等高效能运算技术,得益於神经网路技术的进步,机器学习不再局限於超级电脑的世界了。如今智慧型手机应用处理器可以执行AI推论,用於实现影像处理和其他复杂的功能。这些边缘运算装置有许多是采用电池供电,因此对於系统的功耗有很高的要求,用来延长系统的工作时间。


对现今许多设计而言,功耗是选择元件最重要的标准,因为可携式产品的电池寿命越长,对消费者越有吸引力。在基础设备应用中,低功耗也是一项重要规格,因为较低功耗代表晶片将产生较少热量,过高的热量可能会限制系统产品的通道密度,或使得设计团队无法增加新的功能。此外,有些较着重电源成本的设计,例如以通用序列汇流排(USB)供电的产品,或由汽车电瓶供电的汽车修配零件产品等,其电力预算亦相对有限。


以恩智浦半导体(NXP)为例,其在打造更低功耗的运算解决方案时,除了在晶片设计上有许多创新,电源管理软体的精密度亦大幅提升外,晶片制程方面也采用更先进制程生产。目标是让系统设计人员不用於设计系统时为任一项功能迁就妥协。然而,没有装置十全十美,设计人员必须仔细考量系统需求,检视目前不断推出的低功耗处理器,以了解哪一项产品最符合应用需求。


低功耗运算关键需求

Arm主任应用工程师张维良指出,降低功耗的方式除了透过半导体制程之外,也可以透过IP本身设计达到降低平均功耗的效果。若以Arm的Cortex-M系列处理器为例,原本就针对嵌入式系统设计一系列低功耗运算技术,包括Multiple Power Domain支援架构级的Sleep Mode、Wake-up中断控制器、架构级Power Gating技术。此外Cortex-M0+额外优化减少了程序存取,来保持系统层级的低功耗。


除了过往Cortex-M处理器针对低功耗技术来设计,Arm在新款的Cortex-M55处理器上,也针对高效能低功耗运算打造了一个ML引擎,这个名为Helium的向量运算引擎(MVE)可以有效率的降低运算与功耗比,意即Helium能在单位时间内处理约15倍以往Cortex-M系列的ML运算能力,但是功耗方面只略微增加几成。透过Cortex-M55搭配Helium技术能更符合IoT装置搭载AI运算的需求。


运算效能与低功耗的平衡点

对现今许多设计而言,功耗是选择元件最重要的标准,因为可携式产品的电池寿命越长,对消费者越有吸引力。

在半导体业界中,经常会提到PPA(power、performance、area),三者互为影响。高运算效能(Performance)通常代表需要的面积(Area)要增加,面积增加相较之下其功耗(Power)也会增加,通常面积与功耗都会以正比的比例来增加或减少,这三个元素很难面面俱到。因此需要透过架构设计来解决这些挑战,如此就可以不必在追求高效能的同时,还必须对於面积与功耗方面妥协。在实际的设计上,可以叁考下列的一些案例。


优化每单位面积的效能:


在面积高度受限的前提下,就该思考如何增加每单位面积的效能密度。例如在M55上引进的Helium向量处理器即是透过架构上的改变,用增加不到一单位功耗的单位,来换取十多倍的效能提升。


搭配NPU大幅提升运算效能:


以ML在IoT的运算方面,Arm研发了另一个利器,即用来搭配Cortex-M的类神经网路处理器(NPU)Ethos-U55。类神经网路处理器是一款专用於ML运算的加速器,Ehtos-U55的面积与Cortex-M55相近,但是提供的是相较於Cortex-M55有32倍ML效能上的提升,透过这类架构上的变革带给AIoT应用更多的可能性。


电源控制设计:


以多重电压域设计(Multiple Power Domain),设定不同指令启动不同的功能框(Functional Block),例如P-Channel控制Core的电源,以Q-Channel 控制Cluster的电源,或者以非同步设计与FMA,调配顶层与核心的用电,以节省电力的消耗。



图二 : 要降低整体发热,异质运算多核心处理器以及记忆体等的配置也至关重要。
图二 : 要降低整体发热,异质运算多核心处理器以及记忆体等的配置也至关重要。

至於恩智浦,很早就预见到运用最新应用处理器架构和设计理念来制造高效能跨界处理器需求。2017年推出i.MX RT系列跨界处理器,兼顾功耗与性能。如今,不只推出i.MX RT1170突破GHz主频限制,为更多应用开启边缘运算的大门。


恩智浦在近期也发表eIQ机器学习(ML)软体对Glow神经网路(Neural Network;NN)编译器的支援功能,针对恩智浦的i.MX RT跨界处理器,实现占用较低记忆体并更高效能的神经网路编译器应用。Glow编译器由Facebook开发,能整合特定目标的最隹化,恩智浦利用这种能力,使用适用於Arm Cortex-M核心和Cadence Tensilica HiFi 4 DSP的神经网路运算元库(NN operator libraries),最大化提升处理器的推论效能。


低功耗设计考量

以Cortex-M55为例,Arm的架构设计还考量了以下几个因素:


· Designed for efficient compute:以最优功耗效率为设计前提;


· Increased DSP/ML performance:提升数位讯号处理器(DSP)及机器学习的表现;


· Incremental scalar performance:增进纯量效能;


· Advanced power management:更先进的电源管理方式;


· Robust security with TrustZone:以TrustZone架构的安全防护;


· Additional features for advanced debug: 更先进的侦错工具。


要降低整体晶片发热,除了晶片的低功耗设计之外,异质运算多核心处理器以及记忆体等的配置至关重要。


以跨界处理器i.MX RT1170为例,它的特色包含双核心架构,其中Arm Cortex-M7核心运行频率高达1GHz,Cortex-M4核心运行频率高达400MHz。双核心系统将高性能内核与独立的工作电源区域结合在一起,使开发人员可以同时运行应用程式,或者依据应用需求关闭核心以降低功耗。例如,高效能的Cortex-M4核心可专门针对时间要求严格的应用,像是电机控制;而Cortex-M7核心可进行更复杂的运用。至於双核心可并行运作边缘运算相关应用程式,像是机器学习、语音处理、人脸辨识等。


同时,针对边缘运算应用,工作频率高达GHz的Cortex-M7核心也显着强化了ML的性能、语音/视觉/手势识别的边缘推论,还有自然语言理解、数据分析和数位讯号处理(DSP)等功能。


结语

晶片的低功耗已经不再只是一种需要,而是成为了一种必要。先不谈延长满街跑的行动装置电池续航力,低功耗对於近年来强调环保节能的产品设计理念,也十分能符合时代的需求。随着电路技术与半导体制程的精进,未来更高效能且更低功耗的各种晶片,将会更进一步结合在你我的生活当中。


**刊头图(source:pxhere.com)


相关文章
优势科技,优质生活:科技如何提供更美好的「新常态」
智慧制造的「四大要件」
扫除导热阴霾 拉近IC与AI的距离
AIoT引爆数据潮 MCU与MPU需求逐年升高
促进工作负载整合
comments powered by Disqus
相关讨论
  相关新品
NXP-LPC4088FET208
原厂/品牌:NXP
供应商:NXP
產品類別:MCU
NXP-LPC812M101FD20
原厂/品牌:NXP
供应商:NXP
產品類別:MCU
NXP-SSL21084AT
原厂/品牌:NXP
供应商:NXP
產品類別:LED
  相关新闻
» 迎接嵌入式运算巨变 Arm携手微软推动边缘装置AI开发工具
» Volkswagen携手恩智浦 MEB电动汽车平台采用NXP电池管理方案
» 因应百万兆级运算测试新挑战 爱德万推出次世代V93000测试机
» 意法半导体收购功率放大器和射频前段模组企业SOMOS半导体
» 2020 IEEE亚洲固态电路研讨会台湾区获选论文抢先发表
  相关产品
» 恩智浦全新感测解决方案 扩展安全超宽频产品组合
» ST灵活可配置双通道I/O-Link和SIO双模收发器简化感测器连线
» Arm全新运算解决方案确保安全优先功能 锁定自主系统设计市场
» Arm推出Arm Neoverse运算平台 加速云端到终端的基础设施
» NXP推出基於MCU的Glow神经网路编译器 实现边缘机器学习
  相关资源
» Power Management Solutions for Altera FPGAs

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw