账号:
密码:
CTIMES / 文章 /   
运用FPGA加速运算 将大数据挑战转化为机遇
 

【作者: Daniel Eaton】2018年12月27日 星期四

浏览人次:【3132】
  

新宇宙的诞生

大量的电子元件和连接至互联网的「事物(thing)」创造了数位宇宙,其包含任何事情和所有在工厂、在整个连锁餐厅、横跨整个智慧城市,或在某些研究专案中正在发生之事物的资料。从资料中获取价值就有机会提升业务绩效、加速医疗进步、加强安全和执法,并改善全球数百万数位消费者的日常生活,及提高社交媒体体验等,就不再此一一列举。


传统的资料库和查询工具无法处理庞大的资料量、各种不同的资料类型,以及为获得所需洞察力而用来组合和运算资料的复杂方式。因此,新型资料来源(如Hadoop)、日志工具(如Splunk)和视觉化工具(如Tableau)正在兴起,它们更适合用於分析作业负载。


适用於资料分析作业负载

大数据分析工具在存取和使用资料的方式,与历史应用查询资料库事务的过程不同。事务应用以顺序索引的方式处理少量资料,而SAP预测分析这类的应用则可以批量检索资料,并能够应用各种分析技术。此外,使用者手中的设备数量迅速增加,且与物联网相连的设备也正在以指数级速度大量的产生资料。



图1 :  资料中心
图1 : 资料中心

综合起来,资料的爆炸性增长和作业负载的复杂性,已逐渐超过现有资料中心运算平台的效能。然而客户现在为达业务或财务目的,都要求分析应用能够快速(有时甚至是即时)地产出深刻的洞察,这使得传统架构无法跟上脚步。随着与摩尔定律相关的CPU进程,及工作频率的增长(Dennard 缩放)在过去五年内的双双放缓,提升效能的传统方法也开始慢慢失效。另一方面,从成本、空间和功耗的角度来看,简单地添加额外的刀锋(blade)或机柜来提升效能,也变得越来越困难。


专家之见

高效能运算领域的专家正在推动新平台的开发,此平台将会运用整合了传统CPU、绘图处理器(GPU)和现场可编程闸阵列(FPGA)的灵活异质架构内的硬体来加速。新一代运算加速器正在兴起,它利用每种处理器的独特优势,让效能、功耗和空间效率方面均有显着的提升。


赛灵思联盟计划(Xilinx Alliance Program)成员InAccel的执行长Chris Kachris认为,采用FPGA等硬体加速器的异质运算,正变成高效执行资料分析的主要平台。他表示:「典型的处理器无法承受分析应用增加的运算复杂性,而FPGA可以透过即用型模组和专用晶片的效能,来发挥处理器的灵活性。」


InAccel创建高效能加速器,并应用於机器学习、财务或其他应用中的IP,包含采用Apache Spark 应用的加速器,且这些加速器可部署到FPGA IaaS,如亚马逊 AWS EC2 F1执行个体、 华为FPGA加速云伺服器 (FACS)、阿里巴巴弹性运算服务F2执行个体,或就地部署(on-premise)到赛灵思、研华科技(Advantech)、Bittware和其他公司的PCIE FPGA板。加速器可提高关键任务应用的效能,并显着降低客户的拥有成本。


Kachris补充表示:「FPGA能提供比其他平台更高的效能,并且拥有足够的灵活性,来满足未来需求及演算法。我们可以在采用函式库的方案中部署FPGA,且无需更改原始应用。」


异质运算平台

Bigstream的Brad Kashani提供更多关於适合GPU与FPGA作业负载类型的细节。他表示:「像密集矩阵乘法或记忆体需求非常高的运算,可能适用於GPU。而FPGA则能够更有力地支援Sparse矩阵运算、SQL运算(如过滤、连接或分类)或涉及运算资料格式的应用,且FPGA 提供了有效撷取大量资料分析运算所需的灵活性。」


「此外,通过在内联(inline)模式使用FPGA,能够在无需CPU干预的情况下,直接从网路介面卡(NIC)处理资料,进而成功加速。这种模式提供了我们目前所见过的最高效能,同时减少了整个系统的延迟变化。」


其中,为因应巨量资料的需求,需要一款能在机器集群上运行的解决方案,而异质架构则可透过支援运算密集型任务和重复任务,从主CPU上卸载来满足需求,而可配置的加速器(如 FPGA)可因而获得最隹化。Vitesse Data执行长暨共同创办人CK Tan解释他们公司如何将这种方法付诸行动,来进一步加速该司Deepgreen DB 的效能,其为Greenplum 的一种变体,运行速度比开源方案快数倍。



图2 : 大数据分析与云端资料
图2 : 大数据分析与云端资料

「许多分析应用均需要在MPP资料库上运行SQL,且客户希??获得最快的处理效能。然而,集群(cluster)中的CPU存在密度限制,很明显地CPU本身无法满足更快速聚合业务情报和临时OLAP查询的需求。」若使用FPGA作为加速器,就可释放CPU用於处理其他合并查询,进而提高系统的整体回应能力。「这使我们能够在不扩大占用面积的情况下,将集群上可用的运算资源增加四倍,而这与从企业资料中获取更多情报和深刻洞察的需求十分吻合。」


他进一步阐述了如何让终端使用者有效地看见加速力。「透过简单倒换资料库软体,Greenplum客户就可以切换至Deepgreen,且会立即看到其应用在同一硬体上运行得更快。此外,客户还可以通过在机器中添加 FPGA 卡,使系统运行速度更快;Deepgreen DB为使用额外的资源将效能指标进一步向上推动。」


预测和学习

随着大数据分析不断地发展,许多公司都希??在预测分析领域获得巨大的额外价值,以帮助预测从机器维护到金融服务等各个领域的趋势和事件。Xelera执行长Felix Winterstein表示:「像建构手头资料的预测模型等这类的大规模分析,流程设定通常在夜间运行。但我们发现越来越多的客户不是想要更精确的模型,就是希??将周转时间缩短到几小时,甚至是几分钟,以便更快的获得资料模型。」


为了满足这些需求,Xelera已透过使用 FPGA,在目标应用中比多核CPU 提供高达两个数量级的加速。Winterstein表示:「在一些本质上非常适合GPU 架构的应用中,GPU是一个强而有力的加速工具选项。然而,FPGA则属於极其通用的加速器,可以加速更广泛的应用。」


藉由硬体加速不仅能达到更短的分析作业负载执行时间,还可以进一步节省功耗。Ryft透过将FPGA用於模糊文本搜索、讯号处理和机器学习影像或视讯分析等作业负载,达到10到100之间的加速因子,同时,功耗也降低许多。工程设计??总裁Pat McGarry表示:「在许多现实场景中,我们已成功降低高达十倍以上的功耗。对边缘分析感兴趣的客户而言,通过较小的功耗需求获得巨大的效能提升才能真正振奋他们,因为在这些领域里,功耗通常非常高,而设备的相交堆叠的机架根本不用考虑。」


McGarry进一步探讨了硬体加速在本地(on-premise)和混合边缘/云端部署模型中的作用。「虽然我们大多数的客户在本地运行时,都是运用本地FPGA加速资源,来通过PCIe连接至标准的机架式x86伺服器,但我们还是提供了在 AWS FPGA 加速的 EC2 F1 执行个体上运行 FPGA 的能力,这能加速采用云端的作业负载,甚至落实结合本地和云端运算的混合部署模型。」


McGarry预计随着时间的推移,混合部署将变得越来越重要。「很明显地,我们无法即时将『所有』的边缘资料传送至云端,且也不符合成本效益。因此,我们将看到具有前瞻性的分析平台在边缘,利用一些有意义的资料分析进行资料处理,这将减少传送到云端的资料,以进行更广泛的处理。」McGarry同意FPGA在混合方程式的两端皆占有一席之地,并补充表示:「FPGA 在各种机器学习用途中所能提供的边缘运算加速能力,将由今天的小众应用,扩展为广受资料分析领域关注的方法。」


展??未来,随着资料产生速度不断的提高,即时演算法能力、储存、网路频宽、运算效能和人类分析能力都很难同时并进,因此,机器学习对於未来的有效资料分析而言,将变得前所未有的重要。


结论

企业和科学使用者越来越意识到,从物理和虚拟世界中收集到的大量资料所拥有的价值。对资料分析的需求通常与正在产生的资料量成正比,因此,随着资料量持续呈指数增长,对资料分析的需求将以类似的速率增加。


当代的硬体和软体架构无法以低成本的方式来满足资料产生、储存和分析的需求,因此,迫切需要采用适当地耦合CPU和FPGA资源之异质运算平台的新颖方法。FPGA具有可配置性、灵活性、并行性和功率效率,可确保有效且高效地对资料处理作业负载进行加速。


(本文作者Daniel Eaton为赛灵思策略市场开发资深经理)


相关文章
再见摩尔定律?
延伸工业感测器价值链 须藉系统整合深入应用
仿真和原型难度遽增 Xilinx催生世界最大FPGA
使机器学习推论满足实际效能需求
为NVMe-over-Fabrics确定最隹选项
comments powered by Disqus
相关讨论
  相关新品
Platform Manager Devices
原厂/品牌:Lattice
供应商:Lattice
產品類別:Power
Power Manager II Hercules Development Kit
原厂/品牌:Lattice
供应商:Lattice
產品類別:Power
Processor PM Development Kit
原厂/品牌:Lattice
供应商:Lattice
產品類別:Power
  相关新闻
» 看好5G、AI领域新应用 软硬体大厂整合数位双生核心
» Xilinx:後摩尔时代催生半导体产业新架构问世
» 虚引世界迎向永续工业复兴 达梭系统「体验时代的制造业」大会落实战略
» Xilinx三大战术加速工业与医疗物联网产业发展
» 仿真和原型难度遽增 催生Xilinx全球最大FPGA问世
  相关产品
» 全球最大 Xilinx推出拥有900万个系统逻辑单元的FPGA
» Xilinx拓展Alveo产品系列 推出自行调适运算、网路与储存加速器卡
» 笙泉科技推出新一代MG82F6D17 MCU
» 意法半导体生态系统扩充功能支援微控制器以USB-C作为标准介面
» 安森美半导体与NVIDIA合作开展基於云端的自动驾驶汽车仿真
  相关资源
» Power Management Solutions for Altera FPGAs

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2019 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw