账号:
密码:
CTIMES / 文章 /   
具备深度学习能力的装置将无所不在
NVIDIA大展AI生态系统

【作者: 林彥伶】2018年05月02日 星期三

浏览人次:【3585】
  


NVIDIA从传统图形处理器(GPU)设计起家,近年来将触角广泛深入至深度学习、人工智慧、ADAS等领域,NIVIDIA日前在矽谷举办GPU技术大会(GTC 2018),为人工智慧和深度学习的盛会,会中发表了许多和深度学习相关的进程,包括深度学习运算平台效能升级、将深度学习加速器(NVDLA) IP整合到Arm Project Trillium平台、与技术夥伴合作一起扩充深度学习推论功能。


NVIDIA创办人兼执行长黄仁勋在GTC 2018期间指出:「深度学习非凡的进展揭露更多未来值得期待的部分,这些精进很多是建立在NVIDIA的深度学习平台上,我们正以远远超越摩尔定律的速度提升效能,并达成各种突破性的进展,可以为医疗照护、交通运输、科学探索与其他无数领域带来革命性的发展。」


深度学习运算平台效能升级

Tesla V100 GPU记忆体倍增


图1 :  NVIDIA创办人暨执行长黄仁勋宣布推出Quadro GV100 GPU。(Source: NVIDIA)
图1 : NVIDIA创办人暨执行长黄仁勋宣布推出Quadro GV100 GPU。(Source: NVIDIA)


Tesla V100为针对资料中心所推出的GPU,这次NVIDIA透过提升其记忆体至32GB,以应对深度学习与高效运算作业负载对记忆体的需求,让更大、更深的深度学习模型进行更高准度的训练。


目前已有电脑制造商如Cray、Hewlett Packard Enterprise、IBM、Lenovo、Supermicro与Tyan,已宣布将在第二季开始推出全新的Tesla V100 32GB系统,而Oracle云端设备服务也宣布计划於今年下半年透过云端系统提供 Tesla V100 32GB。


高运算效能伺服器NVIDIA DGX-2


图2 :  NVIDIA DGX-2 (Source: NVIDIA)
图2 : NVIDIA DGX-2 (Source: NVIDIA)


DGX-2为一运算效能可达2 petaflop的单一伺服器,搭载具32GB记忆体Tesla V100 GPU,采纳NVSwitch革命性光纤互连技术的系统,可让系统中16个GPU共享相同的记忆空间,而NVSwitch比PCIe交换系统的频宽高出5倍,让开发者可以连接更多高速GPU来打造系统。


此外,DGX-2整合完整优化的更新版NVIDIA深度学习软体,可在两天内针对最顶尖的神经机器翻译模型FAIRSeq进行训练,而效能比2017年发表的Volta DGX-1提升了十倍。


深度学习推论功能扩充

TensorRT 4与TensorFlow的整合


图3 : 整合常用的开法语言和框架。(Source: NVIDIA)
图3 : 整合常用的开法语言和框架。(Source: NVIDIA)


NVIDIA将新版TensorRT整合至Google TensorFlow 1.7,让用户更容易在GPU上运行各种深度学习推论应用,TensorRT能提供INT8与FP16精准的推论内容,让资料中心成本最高可减少70%,


而TensorRT 4为新版TensorRT,其软体能为多种应用程式进行深度学习推论加速,能用来快速进行最隹化、验证以及将训练完成的类神经网路部署到超大规模资料中心、嵌入式装置和车用GPU平台。


在处理包括电脑视觉、神经机器翻译、自动语音辨识、语音合成与推荐系统等常见应用时,新版软体在执行深度学习推论的速度是CPU的190倍。


ONNX扩充支援


ONNX是由脸书和微软发起的开放神经网路交换格式,使不同深度学习模型地框架可以互通,目前Intel、高通、IBM、华为、AMD、Arm、NVIDIA等厂商都已加入。


NVIDIA与Amazon、Facebook以及Microsoft等公司密切合作,使NVIDIA的深度学习平台可扩充支援ONNX框架开发,包括Caffe 2、Chainer、CNTK、MXNet和Pytorch的用户,进一步统合了深度学习模型的框架。


NVDLA整合至Arm Project Trillium平台


2018年初Arm推出的Arm Project Trillium机器学习平台,包含机器学习处理器(Arm ML Processor)、物件辨识处理器(Arm OD Processor)以及神经网路软体(open-source Arm NN software)。



透过开源的NVIDIA深度学习加速器(NVDLA)架构整合至Arm Project Trillium机器学习平台,让物联网晶片制造商能轻易将AI整合至设计中,进而让平价的智慧产品普及到全球数十亿消费者手中。



NVDLA的基础建构为强大的自主机器系统单晶片NVIDIA Xavier,为免费的开放架构,协助推广深度学习推论加速器的设计标准化。此外,NVDLA的模组化架构具备可扩充与高度可配置等特性,且为简化整合与移转作业而设计。NVDLA带来了许多优势,并加速深度学习推论技术的采用,其背後还NVIDIA 一系列开发者工具全力支援,包括新版TensorRT可编程深度学习加速器。


Moor Insights & Strategy深度学习首席分析师Karl Freund表示:「对於计画开发AI加速推论解决方案的物联网、行动与嵌入式晶片厂商而言,这项合作对大家都是双赢局面。NVIDIA与Arm分别为机器学习训练与物联网端点的领导者,两家巨擘在IP上进行结盟对业界的影响甚远。」


NVIDIA深度学习应用

更新医疗影像仪器:超级电脑Project Clara


全球共有近300万台的医疗影像仪器,医生也依赖这些仪器所呈现出的结果,了解病人的状态并有效治疗,而这些仪器的汰换周期大多都在10年以上,NVIDIA的Project Clara是一款医学影像超级电脑,可以实地更新影像仪器的功能。


现在人们能够利用深度学习和人工智慧来分析这些影像,最近有一种称为V-Net的演算法,使用了3D体积分割技术,可自动测量通流经心脏的血流量。这种演算法在15年前必须使用一台千万美元的电脑,且电脑的耗电须500??,才能进行V-Net运算,现在只需要几颗Tesla V100 GPU,便可完成此运算。


Clara可以同时运行多项运算工具;还能在远端利用NVIDIA vGPU 来支援多人使用;Clara具通用性,可以为任何仪器执行运算作业,如CT、MR、超音波、X光,乳房X光摄影;Clara还具备扩展性,在GPU上使用Kubernetes,有效率地依需求调节运算规模。


NVIDIA已与许多医疗机构、公司及新创展开合作,其AI应用如AutoMap和V-Net为放射学领域带来了无形的价值。


自驾车: DRIVE Constellation模拟系统


图4 :  NVIDIA DRIVE Constellation运算平台。(Source: NVIDIA)
图4 : NVIDIA DRIVE Constellation运算平台。(Source: NVIDIA)


NVIDIA发表了一套云端模拟系统DRIVE Constellation,利用拟真技术来进行自驾车测试,DRIVE Constellation包含两个伺服器,第一个伺服器用於执行NVIDIA DRIVE Sim软体,可模拟自驾车感测器,如摄影机、光达与雷达等;第二个伺服器内含NVIDIA DRIVE Pegasus人工智慧车用电脑,用以执行完整的自驾车软体堆叠,并将模拟资料当作真实资料进行处理。


DRIVE Constellation由多个NVIDIA GPU驱动,每个GPU皆可产出一系列模拟感测资料,在将其?入DRIVE Pegasus进行处理。来自DRIVE Pegasus的驾驶指令会在回??至模拟器,以完成数据资料??路,此「??路硬体(hardware-in-the-loop)」每秒执行30次,用来验证DRIVE Pegasus上运行的演算法和软体,是否正确的进行车辆的模拟。



图5 :  DRIVE Sim可产出一系列拟真的资料,以创造极大范围的各种测试环境。(Source: NVIDIA)
图5 : DRIVE Sim可产出一系列拟真的资料,以创造极大范围的各种测试环境。(Source: NVIDIA)


DRIVE Sim可产出一系列拟真的资料,以创造极大范围的各种测试环境,可模拟不同的天气,如暴风雨与暴风雪、每天不同时间点令人感觉刺眼的光线或夜间视力受限的情境,以及各种不同的道路铺面与地型,各种危险情境也能以不伤害任何人的风险下,被写入模拟系统中来测试自驾车的反应能力。


IHS Markit研究与分析总监Luca De Ambroggi表示:「自驾车的开发需要一套可以涵盖从训练、测试到上路驾驶的系统。NVIDIA端对端的平台是正确的方式,而用来进行虚拟测试与验证的DRIVE Constellation系统,可以让我们更进一步迈向自驾车的量产。」


实现人工智慧的晶片有很多种,包含CPU、GPU、FPGA、ASIC等,Google、Apple也在加紧研发自己的AI晶片,大陆华为也於近日推出搭在AI晶片麒麟970的手机,NVIDIA作为专精於GPU的厂商,在各个应用领域积极布局,期待未来透过AI实现更多我们还未曾想过的创新。


相关文章
服务型机器人成长快速 掌握关键技术方能站稳市场
使机器学习推论满足实际效能需求
透过一致生产测试确保汽车雷达性能
内建自我诊断功能之电源监控 IC
家庭小帮手:新创公司的机器人可以收拾凌乱的房子
comments powered by Disqus
相关讨论
  相关新品
CWFD301&CWFD401: WiDi
原厂/品牌:鉅景
供应商:鉅景
產品類別:RF
2DoF IMU EV_Board
原厂/品牌:SD
供应商:敦吉科技
產品類別:Sensor
Blackfin Development Tools Bundle
原厂/品牌:ADI
供应商:安馳科技
產品類別:DSP
  相关新闻
» NVIDIA即时对话式AI突破语言理解的AI训练、推论效能
» 智慧显示展8月登场 跨界整合抢攻未来商机
» 工研院生医成果助攻精准医疗与居家医疗落地化
» 台湾生医晶片产业链强强联手 打造卵巢癌检测新利器
» 台湾计算云TWCC联手NVIDIA 助科学家驾驭GPU加速科学应用
  相关产品
» 英飞凌CoolSiC 肖特基二极体 1200 V G5 系列增添新封装
» Silicon Line在Computex 2019上展示用於HDMI 2.1、DisplayPort、USB和虚拟实境的最新光连结科技
» Diodes新款双LDO具备高PSRR及低静态电流
» Digi-Key推出采用BQR可靠度数位解决方案的BOM MTBF预测服务
» 博世推出针对可穿戴设备获得优化的BMI270型智能超低功耗IMU

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2019 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw