账号:
密码:
CTIMES/SmartAuto / 產品 /   
NXP推出基於MCU的Glow神经网路编译器 实现边缘机器学习
 

【CTIMES/SmartAuto 报导】   2020年08月06日 星期四

浏览人次:【1063】
  

恩智浦半导体(NXP Semiconductors N.V.)发表eIQ机器学习(ML)软体对Glow神经网路(Neural Network;NN)编译器的支援功能,针对恩智浦的i.MX RT跨界微控制器,实现占用较低记忆体并更高效能的神经网路编译器应用。

Glow编译器由Facebook开发,能整合特定目标的最隹化,恩智浦利用这种能力,使用适用於Arm Cortex-M核心和Cadence Tensilica HiFi 4 DSP的神经网路运算元库(NN operator libraries),最大化提升i.MX RT685以及i.MX RT1050和RT1060的推论效能。此外,此功能已整合至恩智浦的eIQ机器学习软体开发环境中,於恩智浦的MCUXpresso软体开发套件(Software Development Kit;SDK)中免费提供。

2018年5月,率先开发PyTorch的Facebook导入Glow(Graph Lowering神经网路编译器),作为开源社区(open source community)专案,其目的是藉由最隹化提高一系列硬体平台上的神经网路效能。

作为神经网路编译器,Glow能在尚未最隹化的神经网路的基础上,生成高度最隹化的代码。这就有别於典型的神经网路模型处理(neural network model processing),後者采用即时编译,因此需要更高的效能,并增加记忆体消耗。然而,像Glow这样直接运作最隹化的代码可显着降低处理与记忆体要求。此外,恩智浦也在Glow开源社区中扮演着积极角色,帮助推广和普及Glow的新功能。

Facebook软体工程经理Dwarak Rajagopal表示:「GitHub中提供的标准版Glow可直接在任何装置上运行,让使用者能够灵活地针对Arm Cortex-A和Cortex-M核心以及RISC-V架构等其感兴趣的基础架构编译神经网路模型核心。恩智浦藉由充分运用微控制器运算元件的专用软体库,并将效能提升2至3倍,展示了从以云端为基础的高阶机器到低成本的嵌入式平台的广泛范围内,将Glow神经网路编译器用於机器学习应用的诸多优势。」

未来几年内,机器学习应用的需求预期将大幅增加。据TIRIAS Research预测,2025年,98%的边缘装置将使用某种形式的机器学习/人工智慧。而市场预测,届时即使没有专用的机器学习加速器(machine learning accelerator),也将有180亿至250亿部装置具有机器学习功能。消费型装置制造商和嵌入式物联网开发人员将需要将机器学习框架最隹化,进而实现使用微控制器的低功耗边缘嵌入式应用。

恩智浦半导体资深??总裁暨边缘处理业务总经理Ron Martino表示:「藉由eIQ机器学习软体框架,运用高度整合的i.MX应用处理器和高效能i.MX RT跨界微控制器的强大功能,恩智浦正在推动机器学习功能在边缘装置上的实现。随着i.MX RT系列跨界微控制器增加对Glow的支援,我们的客户能够编译深度神经网路模型,为他们的应用带来竞争优势。」

恩智浦针对机器学习的边缘智慧环境解决方案是一个全面的工具包(toolkit),提供开发人员需要的建构模组,帮助他们高效地在边缘装置中实现机器学习。Glow整合到eIQ软体後,机器学习开发人员将拥有全面的高效能框架,可在包含i.MX RT跨界微控制器和i.MX 8应用处理器在内的恩智浦边缘处理解决方案上进行扩展。客户拥有更强大的工具,能够在i.MX RT微控制器和i.MX应用处理器上开发机器学习语音应用、物体辨识、脸部辨识等应用。

eIQ现在具有针对Glow和TensorFlow Lite的推论支援,对此,恩智浦会定期执行基准测试以衡量其效能。微控制器基准测试包含标准神经网路模型,例如CIFAR-10。以CIFAR-10模型为例,恩智浦采集的基准测试资料展现了如何运用i.MX RT1060装置(采用600MHz Arm Cortex-M7)、i.MX RT1170装置(采用1GHz Arm Cortex-M7)和i.MX RT685装置(采用600 MHz Cadence Tensilica HiFi 4 DSP)的效能优势。

恩智浦对Glow的支援与Cadence为Tensilica HiFi 4 DSP提供的神经网路库(Neural Network Library;NNLib)紧密相结合,该DSP提供4.8GMAC效能。同样以CIFAR-10为例,恩智浦的Glow藉由使用此DSP来加快神经网路运算,实现25倍的效能提升。

Cadence Tensilica IP企业??总裁Sanjive Agarwala表示:「Tensilica HiFi 4 DSP最初整合在i.MX RT600跨界微控制器中,目的是提高各种不同的音讯和语音处理应用的速度。然而,当越来越多机器学习推理应用瞄准低成本、低功耗的微控制器级应用时,HiFi 4 DSP凭藉固有的DSP运算效能,成为加快这些神经网路模型的理想选择。随着恩智浦在eIQ机器学习软体中采用Glow,i.MX RT600微控制器的客户能够利用该DSP来满足多种机器学习应用的需求,包含关键字检索(keyword spotting;KWS)、语音辨识、降噪和异常检测。」

Arm公司机器学习行销??总裁Dennis Laudick表示:「恩智浦将Arm CMSIS-NN软体库涵盖在elQ中,目的是尽可能地提升效能,减少Arm Cortex-M核心上的神经网路记忆体占用。以CIFAR-10神经网路模型为例,恩智浦能够利用CMSIS-NN实现1.8倍的效能提升。其他神经网路模型应该亦能够产生相似的结果,这清楚地展示了此款高阶编译器与我们的最隹化神经网路运算元库(NN operator library)的优势。」

恩智浦的整合Glow神经网路编译器的eIQ软体现已上市,并透过i.MX RT600跨界微控制器、i.MX RT1050和i.MX RT1060跨界微控制器的MCUXpresso 软体开发套件提供。未来将会推出适用於恩智浦其他微控制器的整合Glow神经网路编译器的eIQ软体。

關鍵字: 神经网路  编译程序  边缘运算  NXP 
相关产品
施耐德推出Galaxy VS系列三相UPS 用於关键基础设施及边缘运算应用
宸曜强固型GPU运算平台通过NVIDIA Tesla伺服器认证
恩智浦整合i.MX RT跨界MCU、Wi-Fi和蓝牙方案 扩展安全的边缘平台
边缘应用环境严苛 Moxa推出强固型边缘电脑保障关键AI运算
莱迪思最新超低功耗FPGA Certus-NX 实现智慧边缘处理效能
相关讨论
  相关新品
Arduino Motor Shield
原厂/品牌:RS
供应商:RS
產品類別:
mbed
原厂/品牌:RS
供应商:RS
產品類別:
Arduino
原厂/品牌:RS
供应商:RS
產品類別:
  相关新闻
» 贺利氏推出全球首创可替代金线AgCoat Prime镀金银线
» ADI携手Microsoft 共同推出3D ToF产品及解决方案
» 台达携手远传叁展SEMICON 一览高效节能5G设备解决方案
» 高通推出Snapdragon 7系列5G行动平台 现已用於140款5G设计
» K&S:享受智能型生活 就从先进封装开始
  相关文章
» 车用雷达IC设计之环境??圈验证
» 藉由惯性感测器和机器学习评估老年人跌倒风险
» 新款零交叉侦测 IC可大幅降低生活家电待机功耗
» BCM将高压电池转化至SELV系统
» 具智慧监控之伞架装置
  相关资源
» Power Management Solutions for Altera FPGAs

AD

刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw