账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 新闻 /
微软与光禾感知合作打造AI新闻主播
 

【CTIMES / SMARTAUTO ABC_1 报导】    2023年10月16日 星期一

浏览人次:【1279】

生成式 AI 技术颠覆以往使用 AI 的方式,并深入各领域发展出多样化的创新应用,而媒体产业在此波浪潮下也没有缺席。相信大家对於在民视主播台上播报国际气象的「敏熙」主播并不陌生,专攻影像技术的光禾感知以 AIGC(AI Generated Content,人工智慧生成内容)技术,结合微软 Azure AI 语音服务,为民视新闻打造台湾首位 AI 生成的虚拟电视新闻主播。

微软与光禾感知合作打造AI新闻主播
微软与光禾感知合作打造AI新闻主播

光禾感知整合微软技术 打造拟真AI主播「敏熙」

本次合作集结影像、声音与新闻制播等三方专业技术,由光禾感知生成 AI 虚拟主播影像後,搭配微软 Azure AI 的语音合成技术产出发音自然、流畅的播报人声,再借助民视新闻多年新闻制播经验,以及丰富的新闻播报、访谈节目等高画质新闻影像资料库进行形象优化,量身打造专属於的 AI 主播模型。

光禾感知科技执行长王友光指出:「光禾感知 2022 年底开始投入 AI 主播制作,透过大量搜集照片作为训练原料,以扩散模型(Diffusion model)为技术基底,训练出能够生成动态图像的模型,完成主播脸孔塑造。很高兴此次与台湾微软携手促成民视『敏熙』主播的诞生,展现生成式 AI 於影像生成领域无限的技术发展潜力。」

除了外貌,声音在新闻播报中亦扮演重要角色,微软 Azure AI 语音服务的 TTS(文字转语音)及 Viseme 技术即为实现敏熙主播自然且顺畅人声关键。不同於传统如机械音般的文字转语音服务,Azure AI 语音服务拥有丰富模型,提供 140 种语系以上、超过 400 个近似真人发音的预建神经语音模型供选择。除了预建模型,Azure AI 语音服务还支援自订模型,可根据您的需求调整语音的风格、速度、音调等叁数,进而生成贴近真人主播具备情绪及抑扬顿挫的语音,展现出结合 AI 与美感的传播科技成果。

此外,透过 Viseme 技术还能提升虚拟主播嘴型与播报文字精准度。Viseme 技术能够在说话过程定义脸部及嘴唇、下颚及舌头等位置,使虚拟主播脸部嘴型与语音的结合呈现更为自然。两者技术相辅相成不仅能生成嘴型与声音吻合的 AI 脸部影像,也能进一步实现多国语系主播的可能,敏熙现在已可以进行综合中文及英文的播报内容。

關鍵字: 生成式AI  人工智能  Microsoft  光禾感知 
相关新闻
联发科发表3奈米天玑汽车座舱平台 推动汽车产业迈入AI时代
Arm:因应AI永无止尽的能源需求 推动AI资料中心工作负载
英业达以AI科技实践永续 携手台大保护云雾林生物多样性
研华与群联打造「平民化」GenAI方案 落实边缘运算与工控应用
MIC:智慧城市整合AI技术 带动软硬体与设备新商机
comments powered by Disqus
相关讨论
  相关文章
» 高频宽电源模组消除高压线路纹波抑制干扰
» 电动压缩机设计ASPM模组
» PCIe桥接AI PC时代
» 用科技灭火:前线急救人员的生命徵象与环境监测
» 打造沉浸式体验 XR装置开启空间运算大门


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84T4EG614STACUKZ
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw