账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
理解人工智慧:训练
 

【作者: Mark Patrick】2020年07月15日 星期三

浏览人次:【4793】

人工智慧(AI)和机器学习是非正式使用术语,表示机器模仿人类进行知觉(perceiving)、推理(reasoning)和解决问题(problem-solving)等认知方面能力。籍由与人类似的「思考」能力,人工智慧在许多不同领域承担着多种任务。它的影像识别功能可?明进行医疗诊断和安全监视活动,语音辨识、翻译、新药出现和开发以及财务欺诈检测等也都属于AI范畴,而且这些仅是不断扩大应用领域中的一小部分。随着物联网(IoT)呈现指数级增长,人工智慧将在包括自动驾驶汽车、外科手术机器人和军用无人机等在内的IoT设备运作中起关键作用。


受到人脑启发,深度学习是一种机器学习,它将影像、语音或文本转换为数目,然后透过多层面数学操作来分析这些数目(因此称为「深度」)。在此过程中,分析层形成了概念层次结构或「思维」系统,可以分解输入,并识别潜在趋势或模式。深度学习在许多方面也与大脑背道而驰。例如大脑具有不同类型神经元和功能区,而机器学习目前只专注于以最高精确度对讯息进行归类。


学习过程

像人类一样,人工智慧在完成一项任务之前首先需要学习。人脑从外部线索中学习,以建立适用于解决之前尚未遇到过问题之思维系统。在机器学习方面,它是一种演算法,是一个解决问题过程,或是一组规则,从资料中学习然后生成模型(或一组参数,如权重和偏差),这样可使将来问题的解决既高效又尽可能准确。本文将讨论如何训练机器进行「自学」。


许多类型机器学习可归为六大类:


▓ 监督式学习


▓ 迁移式学习(transfer)


▓ 无监督式学习


▓ 半监督式学习


▓ 整体式学习(ensemble)


▓ 强化学习(reinforcement)


监督式学习

如果学生在监督下学习,则老师需要确保学生学习正确且推理合理。类似,在监督式学习中,一种演算法学习一整套带有标记答案的资料,同时接收有关其解决方案准确性的连续回馈。监督式学习对于归类或估计变数之间关系(回归,regression)的任务非常有用。其应用包括识别金融系统中可疑活动,以及面部、物体、语音、手势或笔迹识别等方面。


神经网路:每个神经网路包括一个输入层,一个或几个中间(或「隐藏」)层和一个输出层组成。神经网路是监督式学习的一个示例。影像、声音或文本等信号在输入层被转换为数目,然后在中间层和输出层进行处理。


卷积(convolutional)和复现(recurrent)是最常见的神经网路。卷积神经网路(CNN)从输入信号(影像或语音档)中提取特征,同时保留这些特征之间的空间关系以供进一步分析。 CNN在电脑视觉工作(例如面部和语音辨识)中特别有效,非常适合于操作自动驾驶汽车。 CNN影像识别能力在此对于识别附近其他车辆、行人或道路障碍物,以及提醒自动驾驶车辆前方任何潜在危险至关重要。


在复现神经网路(RNN)中,处理层的输出将回馈到其所在的同一层,但这一次是作为校正输入。如果预测错误,则系统会在下次自我学习并改进预测。这种类型神经网路对于文本到语音转换非常有效。 RNN主要用于长时间,内容丰富的输入,例如包含具有双重含义单词的句子(「crane」可能表示鸟类或建筑设备,具体取决于上下文),或者包含不同单词但却发音相同的音讯档(如「their」和「there」)。


最后,大规模和复杂任务可能需要模组化神经网路(MNN),它由以独立方式执行子任务的不同网路组成。透过独立运作,这些网路不会互相妨碍,从而提高了整体运算速度。


迁移式学习

监督式学习需要完全标记的大型资料集。但是,为每个特定应用组合大型完整资料集是一项挑战,而且通常不切实际。为应对完整资料集短缺问题,迁移式学习透过重用已经透过资料集训练模型(预训练模型)输入层和中间层来达到该目的,因此它只需要为新任务重新训练最后一层。预训练模型参数将在开始时使用,然后在训练过程中进行调整以实现最高准确性。此外,透过避免从头开始训练所有层,迁移学习将显著缩短每种特定应用的总体训练时间。


有很多种预训练模型,其中最流行的包括用于物件实例分割的Mask R-CNN资料集,用于物件检测的YOLOv2,用于面部识别的VGG-Face模型,用于透过番茄成熟度而进行分类的Keras VGG-16模型,以及用于汽车分类的Stanford Car资料集等。虽然转移式学习解决了缺乏完整而独特资料集的问题,但它也具有某些缺点。这种学习必须缓慢进行,以避免失真,并且受预先训练资料集中预先存在参数限制。


无监督式学习

在无监督式学习中,演算法尝试从一组未标记的资料中提取特征,这些资料可以是具有各种属性的示例或信号,目的是在没有任何明确指令状况下找到基础模式。因此,无监督式学习在透过分组(聚类)确定要素或属性之间关联的任务中非常有用。例如了解关联可以?明根据客户以前购买习惯来预测客户可能还会喜欢什么产品。无监督式学习可以根据一个人提出的问题以不同方式组织资料。因此,在无监督式学习中,提出正确问题,或以正确方式提出问题,这些都比在其他类型学习更为重要。


半监督式学习

在半监督式学习中,演算法使用部分标记的资料集进行训练。在此以CT扫描或MRI影像中肿瘤识别应用为例,由训练有素的放射科医师标记一小部分肿瘤,将大大提高演算法在无人监督下的准确性,从而改善诊断指标。


整体式学习

与透过单独使用任何一种演算法可实现的预测相比,整体式学习演算法结合了多种演算法以实现更准确预测。这种方法的一个著名应用发生在2006年Netflix大奖上,当时向竞争团队提供了一半用户对大量电影进行评级讯息的相关资料,目标是要弄清楚另一半用户如何评价同样的电影。获胜团队使用整体式学习方法击败了Netflix内部演算法。


强化学习

强化学习不断分析其环境中线索,以运算如何达到最佳下一步。强化学习主要应用大多是控制问题或游戏,如国际象棋或围棋。例如,在1990年代后期,IBM Deep Blue利用强化学习技术与世界象棋冠军加里·卡斯帕罗夫(Garry Kasparov)一决高下。然后在2018年,AlphaGo使用相同的方法击败了该游戏的顶级玩家之一Lee Sedol。


云端与边缘机器学习

传统上,用于工业应用的机器学习总是在物理资料中心或虚拟云端进行,并需要足够高处理能力和电力支援。但是,伴随物联网出现,这种模式正面临挑战。远离中央云端(因此位于「边缘」)的物联网设备不断收集大量资料。并将资料传输到中央云端以进行学习,然后重新部署到边缘。这不仅昂贵,而且非常耗时。相关时滞将使要求即时决策(或推断)的操作(例如自动驾驶汽车或军用无人机)无法进行。同样,资料传输可能会威胁到资料安全性和完整性。


解决此问题的一种方法是让机器学习运作在边缘。但是,该模型也有缺点。例如,物联网设备通常由小电池供电,并安装在难以补给(有时甚至不可能)的位置,因此能源供应是一个问题。另外,物联网设备提供的处理能力可能不足以进行机器学习。因此,如果要真正在边缘进行机器学习,就需要对硬体进行改进。本系列的第2部分将讨论工业以及IoT边缘机器学习的硬体要求。


(本文作者Mark Patrick任职于贸泽电子)


相关文章
开启边缘智能新时代 ST引领AI开发潮流
NVIDIA人工智慧专家看2024年
你的下一个运动教练可能是人工智慧
生成式AI与PC革新
显微镜解决方案助力台湾半导体技术提升研发效能
comments powered by Disqus
相关讨论
  相关新闻
» 互盛以IoT智能环保可视化服务 协助顾客加速双轨转型
» 鼎新电脑携手和泰丰田解缺工 以数位劳动力开启储运新时代
» Fortinet SASE台湾网路连接点今年落成 全台巡??落实云地零信任资安
» GTC 2024:益登展示跨域人工智慧解决方案
» Ansys模拟分析解决方案 获现代汽车认证为首选供应商


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK83T434HZMSTACUKA
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw