账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
为快速增长的网路终端AI应用提供更高性能的解决方案
 

【作者: 萊迪思半導體】2019年11月12日 星期二

浏览人次:【5346】

人员侦测和物件计算等网路终端人工智慧(AI)应用正日益普及,但设计人员越来越迫切地要求在不影响性能的情况下实现低功耗和小尺寸的网路终端人工智慧解决方案。莱迪思的sensAI技术集合的最新版本,加上ECP5和iCE40 UltraPlus FPGA,为设计人员提供了在网路终端实现低功耗、高性能AI所需的硬体平台、IP、软体工具、参考设计和设计服务。


低成本、高性能的网路终端解决方案的市场竞争日益激烈。各市场研究公司预测,在未来六年内,网路终端解决方案市场将迎来大爆发。 IHS预计到2025年,将有超过400亿台设备在网路终端运行,而市场情报机构Tractica预测,届时每年将出货超过25亿台网路终端设备。


随着新一代网路终端应用的出现,设计人员越来越倾向于开发结合低功耗和小尺寸而不降低性能的解决方案。推动这些全新AI解决方案需求的是网路终端应用的增长,例如用于智慧门铃和监视器等家庭控制应用的存在侦测,零售应用中用于库存的物件计算,以及工业应用中的物件和存在侦测。一方面,市场要求设计人员开发出性能比以往更高的解决方案。另一方面,延迟、频宽、隐私、功耗和成本问题限制了他们依赖云端运算资源来执行分析。


同时,性能、功耗和成本限制因应用而异。随着即时线上网路终端应用的资料需求不断推动对基于云端服务的需求,设计人员必须解决传统的功耗、电路板面积和成本问题。开发人员如何解决系统对于日益严格的功耗(毫瓦级)和小尺寸(5 mm2到100 mm2)要求。单论各种性能要求就已经很难满足。


利用FPGA的优势

莱迪思的FPGA具有独特的优势,可以满足网路终端设备快速变化的市场需求。设计人员可以在不依赖云端的情况下,快速为网路终端设备提供更多运算资源的其中一个方法,为使用FPGA中本身的并行处理能力来加速神经网路性能。


此外,通过使用针对低功耗运行而优化的低密度、小尺寸封装FPGA,设计人员可以满足新的消费和工业应用对功耗和尺寸的严格限制。例如,莱迪思的iCE40 UltraPlus?和ECP5?产品系列支援网路终端解决方案的开发,功耗低至1 mW到1 W,硬体平台尺寸小至5.5 mm2到100 mm2。通过将超低功耗、高性能和高精度与全面的传统介面支援相结合,这些FPGA为网路终端设备开发人员提供了满足不断变化的设计要求所需的灵活性。



图一 : 莱迪思半导体的低功耗、小尺寸FPGA提供适当的性能和功能组合,支援网路终端人工智慧应用。
图一 : 莱迪思半导体的低功耗、小尺寸FPGA提供适当的性能和功能组合,支援网路终端人工智慧应用。

为了满足这一需求并加速开发,莱迪思sensAI为设计人员提供了开发智慧家居、智慧工厂、智慧城市和智慧汽车中低功耗、高性能网路终端设备所需的所有工具。 sensAI旨在满足支援AI的网路终端设备不断增长的需求,提供全面的硬体和软体解决方案,用于在网路终端运行的智慧设备中实现低功耗、即时线上的AI功能。 sensAI旨在无缝创造新设计或更新现有设计,其低功耗AI推理针对这些新应用要求进行了优化。


这个全面的设计生态系统中有什么?首先,莱迪思的模组化硬体平台,如带有HM01B0 Shield开发板的iCE40 UPduino 2.0和基于ECP5的嵌入式视觉开发套件(EVDK),为应用开发提供了稳固的基础。 UPduino可用于仅需几毫瓦的AI设计,而EVDK支援需要更高功耗但通常工作在1W以下的应用。


Soft IP可以轻易地具现化到FPGA中,以加速神经网路的开发。因此,sensAI开发包包括CNN加速器IP,能让设计人员在iCE40 UltraPlus FPGA中实现深度学习应用。 sensAI还提供完整的CNN可设置参数的加速器IP核心,可以在莱迪思的ECP5 FPGA中实现。这些IP支援可变数化。这反过来又使设计人员能够在资料准确性和功耗之间进行权衡。


莱迪思的sensAI技术集合允许设计人员通过便于使用的工具流程探索设计选项和权衡。设计人员可以使用Caffe、TensorFlow和Keras等行业标准框架进行网路训练。开发环境还提供神经网路编译器,将训练的网路模型映射为固定点表示,支援权重和启动的可变数化。设计人员可以使用编译器来?明分析、模拟和编译不同类型的网路,以便在没有RTL经验的情况下在莱迪思的加速器IP核上实现。然后,设计人员可以使用传统的FPGA设计工具,如Lattice Radiant和Diamond来实现整个FPGA设计。


为加快设计实现,sensAI提供了越来越多的参考设计和演示。包括脸部辨识、手势侦测、关键字检测、人员侦测、脸部跟踪、物件计算和速度标志检测。最后,设计团队通常需要一定的专业知识才能完成设计。



图二 : sensAI是一整套硬体和软体解决方案,适用于网路终端人工智慧应用的开发
图二 : sensAI是一整套硬体和软体解决方案,适用于网路终端人工智慧应用的开发

大标:主要更新


为了满足网路终端AI快速增长的性能要求,莱迪思在2019年发布sensAI更新,增强了其性能并优化了设计流程。更新后的sensAI比上一版本的性能提升了10倍,这是由多个优化促成的,包括通过更新CNN IP和神经网路编译器,新增8位元启动量化、智慧层合并以及双DSP引擎等特性,优化了记忆体的存取。


在最新版本中,由于更新了神经网路编译器,支援8位元输入资料,记忆体访问序列得到大幅优化。因此不仅外部记忆体的存取减少了一半,还支援使用更高解析度的图像作为资料输入。使用更高解析度的图像,解决方案自然更为精确。


为进一步加速性能,莱迪思优化了sensAI神经网路中的卷积层,减少了卷积计算耗费的时间。莱迪思将设备中的卷积引擎数量翻倍,减少了约50%的卷积时间。


莱迪思在不增加功耗的情况下提升了sensAI的性能,设计人员因此可以选择ECP5 FPGA产品系列中闸数较少的装置。经优化的演示范例可以?明实现性能提升。例如,针对低功耗运行进行优化、采用CMOS图像感测器的人员侦测演示,通过VGG8网路提供64 x 64 x 3的解析度。


该系统以每秒5帧的速率运行,使用iCE40 UltraPlus FPGA功耗仅为7 mW。第二个性能经优化的演示,针对人员计算应用,同样也使用CMOS图像感应器,通过VGG8网路提供128 x 128 x 3的解析度。该演示以每秒30帧的速率运行,使用 ECP5-85K FPGA功耗为850 mW。



图三 : 这些参考设计展示了sensAI提供的功耗与性能可选方案
图三 : 这些参考设计展示了sensAI提供的功耗与性能可选方案

与此同时,sensAI给使用者带来无缝的设计体验,它支援更多神经网路模型和机器学习框架,从而缩短设计周期。全新可定制化的参考设计可简化物件计算和存在侦测等常见的网路终端解决方案的开发,同时设计合作伙伴生态也在不断拓展,为使用者提供重要的设计服务。有了这些,莱迪思能为开发人员提供他们复制或调整其设计所需的全部关键工具。例如,图四展示了莱迪思提供的一系列全面的元件,包括训练模型、训练资料集、训练脚本、经过更新的神经网路IP和神经网路编译器。



图四 : sensAI的设计流程包括了业界领先的机器学习框架、训练资料和脚本、神经网路IP等设计和训练网路终端AI设备必需的资源
图四 : sensAI的设计流程包括了业界领先的机器学习框架、训练资料和脚本、神经网路IP等设计和训练网路终端AI设备必需的资源

莱迪思还拓展了对机器学习框架的支援,致力于提供无缝的使用者体验。最初版本的sensAI支援Caffe和TensorFlow,最新版本新增支援Keras,这是用Python编写的开源神经网路,可在TensorFlow、Microsoft Cognition Toolkit或Theano上运行。 Keras旨在协助工程师快速实现深度神经网路,它可以提供高度方便使用性、模组化和可拓展的环境,加速原型设计。 Keras最初被当做一种介面而非独立的机器学习框架,它的高度抽象性能让开发人员加速开发深度学习模型。


为进一步简化使用,莱迪思更新了sensAI神经网路编译器工具,它可以在机器学习模型转换为固件档时自动选择最精确的分数位数。 sensAI更新还新增了一个硬体除错工具,让使用者可以在神经网路每个层级进行读取和写入。进行软体模拟之后,工程师也需要知道他们的网路在实际硬体上的表现。使用此工具,工程师可以在短短几分钟内看到硬体运行的结果。


此外,最新版本的sensAI得到了越来越多公司采用,提供专为低功耗、即时线上的网路终端设备而优化的设计服务和产品开发技能。这些公司通过无缝更新现有设计或针对特定应用开发完整的解决方案来协助客户构建网路终端AI设备。


sensAI设计案例

莱迪思这一更高性能的全新解决方案可用于下列四种不同的加速器设计案例。在第一个设计案例中(图五),设计工程师使用sensAI来构建独立运行模式的解决方案。这种系统架构能让设计工程师在莱迪思iCE40 UltraPlus或ECP5 FPGA上开发出即时线上的整合解决方案,具有低延迟、高安全性的特点,其中FPGA资源可用于系统控制。典型的一种应用就是使用独立运行的感应器实现人员侦测和计算。



图五 : 将sensAI作为独立运行的网路终端AI处理解决方案
图五 : 将sensAI作为独立运行的网路终端AI处理解决方案

设计人员还使用sensAI开发两种不同类型的预处理解决方案。第一种情况下(图六),设计人员采用了莱迪思sensAI以及一片低功耗的iCE40 UltraPlus FPGA对感测器资料进行预处理,从而最大程度地降低了向SoC或云端传输资料进行分析的成本。例如,如果是用在智慧门铃上,sensAI会初步读取来自影像感测器的资料。如果判断为不是人,比如说是一只猫,那么系统就不会唤醒SoC或连接到云端作进一步处理。


因此,这种方法可以最大程度降低资料传输成本和功耗。如果预处理系统判断门口的物件是人,则唤醒SoC作进一步处理。这能极大减少系统需要处理的资料量,同时降低功耗要求,这对于即时线上的网路终端应用来说至关重要。



图六 : 在此案例中,sensAI会预处理感测器资料来判断该资料是否需要发送到SoC作进一步处理。
图六 : 在此案例中,sensAI会预处理感测器资料来判断该资料是否需要发送到SoC作进一步处理。

在第二个预处理应用中,设计人员可以使用ECP5 FPGA实现神经网路加速(图七)。在此案例中,设计人员利用ECP5 IO的灵活性将各类现有的板载器件(如感测器)连接到低端MCU,实现高度灵活的系统制。



图七 : 第二个系统架构也采用了预处理,设计人员可以使用ECP5和sensAI预处理感测器资料,加强神经网络的综合性能
图七 : 第二个系统架构也采用了预处理,设计人员可以使用ECP5和sensAI预处理感测器资料,加强神经网络的综合性能

设计人员还可以在后处理系统中使用sensAI加速器(图八)。越来越多的设计案例表明,很多公司虽然已经开发出经过验证、基于MCU的解决方案,但是他们希望在不更换元件或重新设计的情况下新增某种AI功能。但是在某些情况下,他们的MCU性能相对不足。


典型的例子就是智慧工业或智慧家庭应用,在进行分析之前需要图像滤波。设计人员可以在这里添加另一个MCU,然后经历耗时的设计验证过程,或者也可以在MCU和资料中心之间添加加速器进行后处理,最大限度地减少发送到云端的资料量。这种方法对想要添加AI功能的物联网设备开发人员尤其有吸引力。



图八 : 通过sensAI增强该基于MCU的设计,让现有的设计支援网路终端AI功能
图八 : 通过sensAI增强该基于MCU的设计,让现有的设计支援网路终端AI功能

结论

显然,未来几年将是即时线上的网路终端智慧设备市场发展的关键时期。由于应用变得越来越复杂,设计人员将急需能够以低功耗支援更高性能的工具。莱迪思最新版本的sensAI技术配合ECP5和iCE40 UltraPlus FPGA,将为设计人员提供硬体平台、IP、软体工具、参考设计和设计服务,协助他们战胜竞争对手,快速开发出成功的解决方案。


相关文章
利用云端运算提升Moldex3D成效
用AI解决智慧医疗痛点 从那e间诊所谈起
专攻低功耗工业4.0应用 可程式化安全功能添防御
NanoEdge AI实际范例:风扇堵塞侦测
以设计师为中心的除错解决方案可缩短验证时间
comments powered by Disqus
相关讨论
  相关新闻
» 互盛以IoT智能环保可视化服务 协助顾客加速双轨转型
» 鼎新电脑携手和泰丰田解缺工 以数位劳动力开启储运新时代
» Fortinet SASE台湾网路连接点今年落成 全台巡??落实云地零信任资安
» GTC 2024:益登展示跨域人工智慧解决方案
» Ansys模拟分析解决方案 获现代汽车认证为首选供应商


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK83SBFPU9ASTACUKR
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw