账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 新闻 /
联发科、中研院、国教院 打造全球首款千亿叁数级繁中AI语言模型
 

【CTIMES / SMARTAUTO ABC_1 报导】    2023年02月23日 星期四

浏览人次:【2584】

由联发科集团辖下的前瞻技术研究单位联发创新基地、中央研究院词库小组和国家教育研究院三方所组成的研究团队,今日开放全球第一款繁体中文语言模型到开源网站提供测试。本次公开释出以开源语言模型BLOOM开发的繁体中文大型语言模型(large language model),比目前开源可用的最大繁体中文模型大1,000倍,所使用的训练资料也多1,000倍。该模型已公开让外界下载,可应用於问答系统、文字编修、广告文案生成、华语教学、客服系统等。

联发创新基地负责人许大山博士表示: 「大型语言模型是近年来人工智慧技术进步的亮点,更是未来进步不可或缺的基石。联发科技向来重视创新及科技发展,此次结合中研院及国教院,成为台湾极少数能训练大型语言模型的团队,以透明、开放和包容的方式,善用技术、人才及资源,既发展自主训练大型人工智慧模型的能力,也让繁体中文的大型语言模型研究及应用更为普及。」

开放原始码释出的大型语言模型,目前多数仍以英文为主要优化的对象,繁体中文的语言模型相对不足。为此中央研究院词库小组在2019年开发并公开BERT和GPT-2的繁体中文优化版本,但是因为资料量的差距,这些模型与主流的大型语言模型差距越来越大。有监於开放原始码繁体中文大型语言模型的重要性与迫切性,在2022年5月,联发创新基地、中央研究院和国家教育研究院展开合作计画,使用大型语言模型BLOOM的繁体中文模型再训练与优化。目前开放系列中第一个有量级跳跃意义的繁体中文语言模型,联发创新基地也暂备一个手机网页的介面,供语言模型研究者试用。此模型系列的评量指标,以及叁数量更大(176B)的模型,将会陆续开放下载。

为了建立该项语言模型,国家教育研究院提供了大量高品质的繁体中文语料,作为主要的训练材料。联发创新基地则建置了训练的硬体环境,制订各种符合国际标准的繁体中文评量指标,收集更近期的语料,并对模型进行能更有效读懂使用者的指示(prompt)的特别训练。中央研究院词库小组则针对模型生成的文字是否具有偏见或敌意等不合适的内容,进行自动侦测与改正的研究与评估。评估结果表明,这套由三方提供的一系列繁体中文语言模型,均达到开源模型前所未有的效果,较能避免具有偏见或敌意的内容。

大型语言模型近来的蓬勃发展,源自於2019年Google推出的BERT语言模型,以及同年OpenAI开始推出的一系列GPT语言模型。这些大型语言模型已经被证实具备相当的知识与能力,即使在少量训练资料,甚至无训练资料之下也依然能够对新任务产生正确结果,已成为人工智慧往前进化不可或缺的基础。

關鍵字: 联发科 
相关新闻
联发科与大联大品隹集团於Embedded World 2024展出嵌入式智慧物联网合作成果
联发科蔡力行:持续追求技术领先 强化AI与车用平台
为10月上市暖身 达发首次展示网通与高阶AI物联全系列方案
爱立信携手联发科 完成5G独立组网RedCap互通性测试
联发科第六届智在家乡21强出炉 净零与能源议题受关注
comments powered by Disqus
相关讨论
  相关文章
» 高频宽电源模组消除高压线路纹波抑制干扰
» 电动压缩机设计ASPM模组
» PCIe桥接AI PC时代
» 用科技灭火:前线急救人员的生命徵象与环境监测
» 打造沉浸式体验 XR装置开启空间运算大门


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84R8PIGTYSTACUKQ
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw