账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
移动演算法 而非巨量资料
 

【作者: Simon Holt】2022年06月26日 星期日

浏览人次:【2182】

机器学习神经网路进步使我们能够处理越来越大量储存资料。传统方法是将资料传输到演算法设备,但是这种移动巨量资料(高达 1 PB)以供可能只有几十百万位元元演算法来进行处理真的有意义吗?因此,在靠近资料储存位置处理资料的想法引起了很多关注。本文研究了计算储存理论和实践,以及如何使用计算储存处理器 (CSP) 为许多计算密集型任务提供硬体加速和更高性能,而不会给主机处理器带来大量负担。


资料集崛起

近年来,神经网路演算法在汽车、工业、安全和消费等应用中使用显着增加。基於边缘物联网感测器通常只处理少量资料,因此所使用演算法占用很少代码空间。然而,伴随微控制器处理能力提高和功耗降低,机器学习演算法在边缘应用中使用开始呈指数级增长。卷积神经网路用於视觉处理以及工业和汽车应用中物件检测。例如,视觉处理系统可用於检测标签是否正确贴在高速工业生产线的瓶子上。


视觉系统还适用於更复杂任务,例如根据物件类型、条件和大小对物体进行分类。在汽车应用中,使用即时视觉系统进行多物体分类和识别能够更充分利用神经网路。除了具体市场应用外,神经网路也可用於科学研究。例如,它可广泛用於处理由分布在全球各地遥感卫星和地震监测感测器收集的大量资料。


在大多数应用中,机器学习用於增加正确观察和分类物件概率。然而,为此目的的训练演算法需要大型资料集(高达 PB),这些资料集移动、处理和储存都具有非常大挑战性。


计算储存

近年来,基於NAND快闪记忆体普及程度快速增长,这种技术不再局限于高端储存,还可用於一般商品固态储存,一个典型用例是正在取代笔记型电脑和桌上型电脑中的磁碟机。固态储存普及,加上NVMe协定兴起(支援更高频宽、更低延迟和更高储存密度)以及 PCIe 连接带来的更高资料速率,为我们提供了重新思考如何使用储存和计算资源方法的机会。



图一 : 具有计算和储存平面的传统计算架构。(source:BittWare)
图一 : 具有计算和储存平面的传统计算架构。(source:BittWare)

图一所示传统方法可在计算平面和储存平面之间移动资料。计算资源用於资料传输、处理、压缩和解压缩以及许多其他系统相关任务。所有这些任务的组合对可用资源造成沉重负担。



图二 : 计算储存架构。(source:BittWare)
图二 : 计算储存架构。(source:BittWare)

图二所示计算储存架构是一种更有效方法。它透过使用硬体加速器(通常在FPGA 上)来执行计算密集型任务。将 NVMe 快闪记忆体靠近并连接到硬体加速器,CPU 不再需要将资料从其储存位置移动到处理位置附近,从而显着降低运行负担。如图三所示,FPGA在其中扮演计算储存处理器角色,从而能够减轻 CPU 处理压缩、加密或神经网路推理等计算密集型任务负担。



图三 : 计算储存处理器 (CSP)。(source:BittWare)
图三 : 计算储存处理器 (CSP)。(source:BittWare)

基於 FPGA 的计算储存处理器

计算储存处理器的一个例子是 BittWare IA-220-U2,它采用 Intel Agilex FPGA(具有多达 140 万个逻辑元件、多达 16GB DDR4 记忆体和四个 PCIe Gen4 介面)。 DDR4 SDRAM 能够以高达 2,400 MT/s 速率传输资料,它使用符合 SFF-8639 标准的 2.5 英寸 U.2 封装和对流冷却散热器,能够整合到 U.2 NVMe 储存阵列,如图 4 所示。



图四 : BittWare IA220-U2。(source: BittWare)
图四 : BittWare IA220-U2。(source: BittWare)

BittWare IA-220-U2通常消耗 20W功率,并支援热??拔,它具有板载 NVMe-MI且相容 SMBus 控制器、SMBus FPGA 快闪记忆体控制功能以及 SMBus 访问板载电压和温度监测感测器,可理想适用於企业 IT 和资料中心等应用。BittWare IA-220-U2 功能方块图和主要特性如图 5 所示。



图五 : BittWare IA-220-U2 功能方块图和特性。(source:BittWare)
图五 : BittWare IA-220-U2 功能方块图和特性。(source:BittWare)

IA-220-U2 设计用於在大容量应用中执行各种加速任务,包括演算法推理、压缩、加密和散列(hashing)、影像搜索和资料库分类以及重复资料删除等。


使用 BittWare IA-220-U2 实现 CSP

BittWare IA -220-U2 可以使用 Eideticom 的 NoLoad IP 作为预配置解决方案提供。或者,它可以为客制化应用进行使用者程式设计。


透过提供包含 PCIe 驱动器、电路板监控设备以及电路板库的 SDK,BittWare可用来支援客制开发。可以使用Intel Quartus Prime Pro 和高级综合工具链以及设计流程来执行 FPGA 应用开发。



图六 : Eideticom NoLoad IP 硬体特性。(来源:BittWare)
图六 : Eideticom NoLoad IP 硬体特性。(来源:BittWare)

Eideticom 的 NoLoad IP 包括一个预配置随??即用解决方案,该解决方案采用基於 BittWare U.2 模组的整合软体堆叠,还提供一组硬体加速计算储存服务 (CSS),在图 6 中以橙色突出显示。



图七 : Eideticom 的 NoLoad IP 软体堆叠。(source:BittWare)
图七 : Eideticom 的 NoLoad IP 软体堆叠。(source:BittWare)

图七 展示了 NoLoad IP 软体元件,其中包括内核空间堆叠档案系统和使用 NoLoad CSS 的 NVMe 驱动器,以及面向具体应用的使用者空间 Libnoload。


Eideticom NoLoad CPU 不可知解决方案卸载功能将服务品质 (QoS) 提高了 40 倍,并还有较低拥有成本和更低功耗优势。


卸载计算密集型任务可提高通量

使用基於 NVMe 计算储存架构可在大型资料处理应用中提供更高性能并使用更少功率。这种架构透过使用基於 FPGA 的计算储存处理器来执行计算密集型任务,降低了将资料从储存点传输到处理器(并返回)的要求。在 NVMe NAND 快闪记忆体阵列上处理点附近储存资料可以节省能源,同时还可以减少延迟和所需频宽。


相关文章
在量子电脑中使用超导电路
生成式AI与PC革新
机器学习可以帮助未来的癌症诊断
资料科学与机器学习协助改善颈部损伤评估
新一代汽车架构设计:挑战还是机遇?
comments powered by Disqus
相关讨论
  相关新闻
» 联发科与大联大品隹集团於Embedded World 2024展出嵌入式智慧物联网合作成果
» 远东医电与台北荣总签订MOU 旅游E指服务接通
» 资策会携手日本5GMF推动5G发展趋势及创新应用
» Satellite 2024:仁宝携手耀登与富宇翔展示全新卫星通信解决方案
» 圆展与新光保全合作打造远距照护服务


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84A8KAFFCSTACUK7
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw