账号:
密码:
CTIMES / 文章 /   
扫除导热阴霾 拉近IC与AI的距离
AI处理器与终端晶片的设计趋势

【作者: 吳雅婷】2020年09月03日 星期四

浏览人次:【3031】
  

随着晶片设计越来越复杂,以及人工智慧应用对运算与储存的要求变得更加严苛,不论是处理器或终端应用晶片,都面临散热的严峻挑战,未来晶片设计也显现高度整合与智慧化的发展趋势。


提到晶片设计,往往会出现一个冲突的景象,那就是设计人员必须面临很多艰难的抉择,且最终常常只能妥协(tradeoff)。尤其在人工智慧(AI)技术即将大放异彩的开发时代,做出「高效能或低功耗」、「小尺寸或多功能」这类选择的次数只会越来越频繁。


而在设计AI晶片的巨量题库中,导热无疑是道必考题。在设计考量的天平上,走向多功能、高效能的一端,可能就必须牺牲节能或小巧的特点,且要面对晶片散热问题可能会降低运作效能与产品寿命的威胁。


观察目前半导体制程的进展,尽管摩尔定律的有效性仍是未知数,但以最新的5nm或7nm技术节点来说,每平方毫米多达数十亿个的电晶体密度,就已经让晶片的散热设计名??其实地成了「炙手可热」的话题。


再加上,晶片的AI应用势必使得新世代晶片历经大量或高速的运算工作,无疑是火上加油。这些AI晶片的开发选择多元,根据市调机构Grand View Research针对AI小晶片(chiplet)市场进行调查的报告结果,估计到2025年,ASIC晶片将在亚太区的开发市场中具备最高的经济价值,其次是GPU和CPU晶片。



图一 : 市调机构Grand View Research预估到2025年亚太区的AI小晶片开发市场中,能够加速推广AI在不同领域应用的ASIC晶片最具经济价值,其次是GPU和CPU晶片。(source:grandviewresearch.com;制图:CTIMES 2020)
图一 : 市调机构Grand View Research预估到2025年亚太区的AI小晶片开发市场中,能够加速推广AI在不同领域应用的ASIC晶片最具经济价值,其次是GPU和CPU晶片。(source:grandviewresearch.com;制图:CTIMES 2020)

整体而言,不论是设计大型资料中心、云端运算平台等应用的高效能运算(HPC)等级处理器,或是分散在网路边缘的智慧终端处理晶片,降低运算功耗来排除导热阴霾,将是实现新世代硬体智慧化的关键技术。


HPC系统级降温方案 导入AI优化成效

大型资料中心、超级电脑、云端运算平台等HPC应用场域,往往是最新处理器技术的首要验证场域。作为巨量资料的总仓与中控室,这些场域的硬体系统呈现高度复杂性,除了多半采用多核架构之外,在进行AI工作时,整体系统运作的处理核心数量更动辄上看几十万颗,功耗庞大,且对运算的需求呈现高动态性,峰值需求的功耗可能高达200W以上。


此外,由於这些应用中的处理器设计为大规模的多核架构,所以晶片的热生成模式也呈现了异质的特性(heterogeneity),运作中与闲置的核心之间温差可达20℃~30℃,不仅散热与监测设计更复杂,验证程序也更费时。要在工作负载呈现如此高度动态且24/7运转的严峻环境下维持高效稳定的运算工作,无疑带给硬体设计人员严峻挑战,相应的热管理解决方案因而涉及晶片至系统级的多层面向。


从晶片角度来说,尽管伺服处理器朝向7nm甚至更低的技术节点迈进,并选用极紫外光(EUV)技术制造,理论上电路的传输距离缩短,动态能耗就会降低,但也因为电晶体持续微缩,静态漏电流变大,因此,摩尔定律虽让晶片尺寸更为小巧,但功耗却并没有等比例降低。事实上,以系统的角度来看,大量电晶体累积的总体功耗呈现上升趋势。


各家科技大厂分别选用不同类型的处理器来实现云端运算、边缘运算、AI模型训练(training)或推论(inferencing)等不同HPC应用,例如像是传统用来处理复杂运算的CPU、具备平行运算能力的GPU,到采用FPGA等具备弹性设计优势的AI加速器类型。可以发现,AI应用的整体运算工作量庞大,因此专用硬体的分工细琐,目标皆是在消耗可能最低或系统可负担的功耗使用情况下完成不同AI运算,架构开发以提高能耗使用效率为导向。


目前,在深度学习(deep learning)推论与机器学习(machine learning)模型训练的应用中,GPU因为能在较短时间内完成大量运算而备受瞩目,而GPU大厂Nvidia更着力开发一系列全新架构,从Pascal、Maxwell、Volta到最新的Ampere架构,每一代采用了更进阶的半导体制程与多核GPU互连技术NVLink,以缩短资料传输距离,提升频宽与降低延迟,但在低功耗设计上却着墨较少。


而以CPU为主的伺服器系统运行已久,像是科技大厂英特尔(Intel)推出的水冷或气冷式CPU散热解决方案因而相对完善。由此可见,HPC应用的处理器涉及的性能与功耗表现皆为系统级,效果较为显着的导热方案多半是在伺服器系统加装专用的降温系统。



图二 : 随着资料中心运算需求增长,机房的能源使用效率(PUE)成为关键指标,而面对降温系统日渐加重的工作负载,Google导入AI演算法进行更高效且低成本的监控。(source:google.com)
图二 : 随着资料中心运算需求增长,机房的能源使用效率(PUE)成为关键指标,而面对降温系统日渐加重的工作负载,Google导入AI演算法进行更高效且低成本的监控。(source:google.com)

也因为系统级的降温系统成本高,Google、华为等科技大厂也纷纷导入AI演算法以监控并调配能源使用效率,维持HPC效能之外,更努力达到企业的节能减碳目标。


Edge AI晶片应用广泛 专用IP兴起

相较於大规模的AI伺服系统,边缘运算晶片通常是嵌入式的小型晶片,设计复杂度相对较低,但也因为这些晶片具备可携或行动式的特点,这也代表着运算、储存与资料传输工作都必须仰赖电池供电,功耗要求甚至低至1W以下。


从电路设计的角度来看,功能性越趋复杂的晶片就必须处理多闸极电压(multi-gate voltage)的设计问题,晶片系统充斥着不同的用电需求,使得供电电容的可靠性验证变得复杂。


因此,在晶片设计时,设计者除了可以善用逐渐导入智慧功能的设计模拟工具,进行更快速且完整的效能分析与验证之外,还能进行更精准的热点(hotspot)分析,运用电源闸控(power gating)或动态电压与频率调整(dynamic voltage and frequency scaling;DVFS)等技术,依据处理器或控制晶片当前所需完成之运算工作,进一步调节晶片的运算资源分配,例如控管睡眠电晶体的尺寸与唤醒排程,将晶片上闲置区块的电路关闭,以降低漏电流与功耗。


此外,提前在规划设计流程时,采用丛集(cluster)的架构进行晶片的分区管理,以简化散热管理的复杂度,也是有助於优化晶片降温效果的做法。


另一方面,透过缩短记忆与运算单元之间的电路复杂度与传输距离,进而实现低功耗传输的记忆体内运算(CIM)、3D记忆体等高度整合技术,也是设计AI晶片的未来趋势。



图三 : 爱美科携手格罗方德,研发记忆体内运算的高效能低功耗AI推论终端晶片,图为封装在PCB板上的测试晶片。(source:imec-int.com)
图三 : 爱美科携手格罗方德,研发记忆体内运算的高效能低功耗AI推论终端晶片,图为封装在PCB板上的测试晶片。(source:imec-int.com)

日前爱美科(imec)与格罗方德(GLOBALFOUNDRIES)才宣布共同研发出高效节能的AI推论终端晶片,采用imec的类比记忆体内运算架构(Analog in Memory Computing;AiMC)架构,以及格罗方德的22nm FD-SOI制程,实现在SRAM内进行类比运算,运算性能高达2,900TOPS/W,提供推进物联网终端装置智慧化的发展动能。


针对智慧终端晶片的各类应用,新思科技(Synopsys)、益华电脑(Cadence)、明导国际(Mentor Graphics)等EDA大厂也积极开发特定AI应用领域的IP方案,其中最受欢迎的无非是车用电子。


Synopsys日前宣布推出整合电动车(EV)软硬体开发的完整虚拟原型(virtual prototyping)解决方案,进一步优化电池管理、功能安全(functional safety)以及多层验证的流程与整合资源;而Cadence提供了开发ADAS系统单晶片所需的混合讯号、可靠性与进阶制程方面的设计支援,整合车用所需的光达、雷达与影像感测器的类比、电热学分析与验证;Mentor Graphics则开发一系列系统架构设计、车联网软体开发、感测融合与降温系统的热学模拟等解决方案。


结语

智慧化,是未来晶片与处理器的指标性趋势,因此,国际科技大厂与晶片开发商除了积极扩充AI硬体的功能性与效能之外,优化系统的能源效率与达成可能的最低功耗也会是开发计画不可忽视的一大重点。利用AI演算法、EDA验证与模拟工具,以及运算与储存单元的硬体设计优化,晶片导热产生的设计阴霾也能渐渐散去,迎向AI时代的明媚风光。


**刊头图(source:itp.net)


相关文章
藉由惯性感测器和机器学习评估老年人跌倒风险
高效能运算当道 低功耗设计为虎添翼
先进制程推升算力需求 云端EDA带来灵活性与弹性
ATMOS Wave Flow管线泄漏即时检测系统
利用Simulink进行无线收发器之设计与网路建模
comments powered by Disqus
相关讨论
  相关新品
CWFA205: WiFi+BT
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
GPS SiP Module
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
CGPA10x: GPS SiP
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
  相关新闻
» 因应百万兆级运算测试新挑战 爱德万推出次世代V93000测试机
» 慧荣科技:PCIe Gen4将SSD效能推升到全新层次
» 意法半导体收购功率放大器和射频前段模组企业SOMOS半导体
» 盛群针对智慧生活与居家安全防护 推出新款MCU产品
» 台达一站式储能技术 协助台湾迈向绿能
  相关产品
» ST灵活可配置双通道I/O-Link和SIO双模收发器简化感测器连线
» 瑞萨新款光隔离型三角积分调变器适用於工业自动化应用
» DELO 推出新款旒合剂适用於功率半导体元件
» 英特尔将神经形态研究系统扩展至1亿个神经元
» ST独占飞时测距感测器领域??头
  相关资源
» Power Management Solutions for Altera FPGAs

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw