账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 新闻 /
NVIDIA在Interspeech大会分享表达性语言合成研究成果
 

【CTIMES / SMARTAUTO ABC_1 报导】    2021年09月06日 星期一

浏览人次:【2283】

原本的自动电话语音和已经发展数十年的 GPS 导航系统都只能发出生硬的机器合成声音,而人工智慧 (AI) 却让智慧型手机和智慧音箱中的虚拟助理呈现逼真的语调。不过,AI 合成的声音和我们在日常对话及媒体中听到的真实人声之间,还是差了那么一点,原因在于人们说话时带有复杂的节奏、音调和音色,这是很难以 AI 仿真出来的。

开发人员与创作者可运用最先进的表达性语言合成对话式人工智慧模型
开发人员与创作者可运用最先进的表达性语言合成对话式人工智慧模型

然而这个差距正在迅速缩小。 NVIDIA 的研究人员正在打造高品质、可控制的语音合成模型与工具,它们能捕捉人类口说声音中的丰富细节,又不会听起来人工感很重。研究人员也于 INTERSPEECH 2021 大会展示这项最新的研究成果。

这些模型有助银行和零售商的自动语音客服,也能让电玩游戏或书籍中的人物更为生动,并即时为数位分身加上合成语音。 NVIDIA 内部的创意团队甚至运用这项技术,为一支介绍 AI 的系列影片制作出富有表现力的旁白内容。

表达性语言合成只是 NVIDIA Research 团队在对话式 AI 的其中一项研究,这个领域还包括自然语言处理、自动语音辨识、关键字侦测、音讯增强等。这项先进研究成果的部分内容已透过 NVIDIA NeMo 工具套件成为开放原始码,可以在 NGC 容器及其它软体中心取得,并经最佳化调整,能在 NVIDIA GPU 上高效执行。

關鍵字: GPU  边缘运算  NVIDIA 
相关新闻
研华与群联打造「平民化」GenAI方案 落实边缘运算与工控应用
AMD扩展商用AI PC产品阵容 为专业行动与桌上型系统??注效能
MSI於2024 NAB Show展示媒体及娱乐产业适用的GPU伺服器
AMD第2代Versal系列扩展自调适SoC组合 为AI驱动型系统提供端对端加速
Arm打造全新物联网叁考设计平台 加速推进边缘AI发展进程
comments powered by Disqus
相关讨论
  相关文章
» 开启边缘智能新时代 ST引领AI开发潮流
» ST以MCU创新应用技术潮流 打造多元解决方案
» ST开启再生能源革命 携手自然迎接能源挑战
» ST引领智慧出行革命 技术创新开启汽车新纪元
» ST:精准度只是标配 感测器需执行简单运算的智慧功能


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84J6XDLJISTACUK5
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw