账号:
密码:
CTIMES / 文章 /   
移动演算法 而非巨量资料
 

【作者: Simon Holt】2022年06月26日 星期日

浏览人次:【661】
  

机器学习神经网路进步使我们能够处理越来越大量储存资料。传统方法是将资料传输到演算法设备,但是这种移动巨量资料(高达 1 PB)以供可能只有几十百万位元元演算法来进行处理真的有意义吗?因此,在靠近资料储存位置处理资料的想法引起了很多关注。本文研究了计算储存理论和实践,以及如何使用计算储存处理器 (CSP) 为许多计算密集型任务提供硬体加速和更高性能,而不会给主机处理器带来大量负担。


资料集崛起

近年来,神经网路演算法在汽车、工业、安全和消费等应用中使用显着增加。基於边缘物联网感测器通常只处理少量资料,因此所使用演算法占用很少代码空间。然而,伴随微控制器处理能力提高和功耗降低,机器学习演算法在边缘应用中使用开始呈指数级增长。卷积神经网路用於视觉处理以及工业和汽车应用中物件检测。例如,视觉处理系统可用於检测标签是否正确贴在高速工业生产线的瓶子上。


视觉系统还适用於更复杂任务,例如根据物件类型、条件和大小对物体进行分类。在汽车应用中,使用即时视觉系统进行多物体分类和识别能够更充分利用神经网路。除了具体市场应用外,神经网路也可用於科学研究。例如,它可广泛用於处理由分布在全球各地遥感卫星和地震监测感测器收集的大量资料。


在大多数应用中,机器学习用於增加正确观察和分类物件概率。然而,为此目的的训练演算法需要大型资料集(高达 PB),这些资料集移动、处理和储存都具有非常大挑战性。


计算储存

近年来,基於NAND快闪记忆体普及程度快速增长,这种技术不再局限于高端储存,还可用於一般商品固态储存,一个典型用例是正在取代笔记型电脑和桌上型电脑中的磁碟机。固态储存普及,加上NVMe协定兴起(支援更高频宽、更低延迟和更高储存密度)以及 PCIe 连接带来的更高资料速率,为我们提供了重新思考如何使用储存和计算资源方法的机会。



图一 : 具有计算和储存平面的传统计算架构。(source:BittWare)
图一 : 具有计算和储存平面的传统计算架构。(source:BittWare)

图一所示传统方法可在计算平面和储存平面之间移动资料。计算资源用於资料传输、处理、压缩和解压缩以及许多其他系统相关任务。所有这些任务的组合对可用资源造成沉重负担。



图二 : 计算储存架构。(source:BittWare)
图二 : 计算储存架构。(source:BittWare)

图二所示计算储存架构是一种更有效方法。它透过使用硬体加速器(通常在FPGA 上)来执行计算密集型任务。将 NVMe 快闪记忆体靠近并连接到硬体加速器,CPU 不再需要将资料从其储存位置移动到处理位置附近,从而显着降低运行负担。如图三所示,FPGA在其中扮演计算储存处理器角色,从而能够减轻 CPU 处理压缩、加密或神经网路推理等计算密集型任务负担。



图三 : 计算储存处理器 (CSP)。(source:BittWare)
图三 : 计算储存处理器 (CSP)。(source:BittWare)

基於 FPGA 的计算储存处理器

计算储存处理器的一个例子是 BittWare IA-220-U2,它采用 Intel Agilex FPGA(具有多达 140 万个逻辑元件、多达 16GB DDR4 记忆体和四个 PCIe Gen4 介面)。 DDR4 SDRAM 能够以高达 2,400 MT/s 速率传输资料,它使用符合 SFF-8639 标准的 2.5 英寸 U.2 封装和对流冷却散热器,能够整合到 U.2 NVMe 储存阵列,如图 4 所示。



图四 : BittWare IA220-U2。(source: BittWare)
图四 : BittWare IA220-U2。(source: BittWare)

BittWare IA-220-U2通常消耗 20W功率,并支援热??拔,它具有板载 NVMe-MI且相容 SMBus 控制器、SMBus FPGA 快闪记忆体控制功能以及 SMBus 访问板载电压和温度监测感测器,可理想适用於企业 IT 和资料中心等应用。BittWare IA-220-U2 功能方块图和主要特性如图 5 所示。



图五 : BittWare IA-220-U2 功能方块图和特性。(source:BittWare)
图五 : BittWare IA-220-U2 功能方块图和特性。(source:BittWare)

IA-220-U2 设计用於在大容量应用中执行各种加速任务,包括演算法推理、压缩、加密和散列(hashing)、影像搜索和资料库分类以及重复资料删除等。


使用 BittWare IA-220-U2 实现 CSP

BittWare IA -220-U2 可以使用 Eideticom 的 NoLoad IP 作为预配置解决方案提供。或者,它可以为客制化应用进行使用者程式设计。


透过提供包含 PCIe 驱动器、电路板监控设备以及电路板库的 SDK,BittWare可用来支援客制开发。可以使用Intel Quartus Prime Pro 和高级综合工具链以及设计流程来执行 FPGA 应用开发。



图六 : Eideticom NoLoad IP 硬体特性。(来源:BittWare)
图六 : Eideticom NoLoad IP 硬体特性。(来源:BittWare)

Eideticom 的 NoLoad IP 包括一个预配置随??即用解决方案,该解决方案采用基於 BittWare U.2 模组的整合软体堆叠,还提供一组硬体加速计算储存服务 (CSS),在图 6 中以橙色突出显示。



图七 : Eideticom 的 NoLoad IP 软体堆叠。(source:BittWare)
图七 : Eideticom 的 NoLoad IP 软体堆叠。(source:BittWare)

图七 展示了 NoLoad IP 软体元件,其中包括内核空间堆叠档案系统和使用 NoLoad CSS 的 NVMe 驱动器,以及面向具体应用的使用者空间 Libnoload。


Eideticom NoLoad CPU 不可知解决方案卸载功能将服务品质 (QoS) 提高了 40 倍,并还有较低拥有成本和更低功耗优势。


卸载计算密集型任务可提高通量

使用基於 NVMe 计算储存架构可在大型资料处理应用中提供更高性能并使用更少功率。这种架构透过使用基於 FPGA 的计算储存处理器来执行计算密集型任务,降低了将资料从储存点传输到处理器(并返回)的要求。在 NVMe NAND 快闪记忆体阵列上处理点附近储存资料可以节省能源,同时还可以减少延迟和所需频宽。


相关文章
摩尔定律碰壁 成本为选择先进封装制程的关键考量
以设计师为中心的除错解决方案可缩短验证时间
NanoEdge AI 解决方案协助嵌入式开发应用
用於工业应用中环境监测的感测器
物联网技术促进节能减排
comments powered by Disqus
相关讨论
  相关新品
Pad(MID) SiP Turnkey Solution
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
  相关新闻
» 贸泽供应超过41,000款Littelfuse零件 巩固最隹代理商地位
» 贸泽扩大感测器解决方案产品组合 满足各种应用需求
» 贸泽抢先导入新品 2022年第二季新增超过20,000项元件
» Netcetera将3DS服务迁移至云端运算平台
» 翱腾ORION企业协作服务平台获金漾奖
  相关产品
» 衡崴科技正式代理TeamT5 助企业资安对抗勒索加密攻击
» RTS安全管理程序设计提供混合关键应用
» 贸泽即日起供应Analog Devices ADIN2111乙太网路交换器
» IAR Systems发表最新版完整开发工具链加速创新
» 贸泽和ROHM合作发表最新电子书 探讨IIoT高效解决方案


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2022 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw