账号:
密码:
CTIMES / 文章 /   
人工神经网路打开AI应用新局
成就以任务为导向的人工智慧

【作者: 王岫晨】2019年02月26日 星期二

浏览人次:【1765】
  


说起人工智慧(AI),就不能不提起人工神经网络(ANN)这件事。AI与ANN是电脑运算发展史上,最能激动人心且又彼此相依的两大领域。而这两者之间的差异,十分值得人们去深入探讨。而其最关键的区别,就在於神经网络是实现人工智慧的垫脚石。


人工智慧是一个非常宽广的领域,最主要的目标就只有一个:创造智能化机器,事实上,这样的目标已经多次实现在我们的生活中,当然这将取决於一般人如何去定义机器智能。尽管在过去的历史上,我们的超级电脑已经可以赢得益智节目《Jeopardy》(超级电脑华生),并可击败国际西洋棋冠军(超级电脑深蓝),但人工智慧的真正目标,通常应该是被视为是对一般广泛智能的追求,或者可以应用於各种不同情境问题的智能。


到目前为止所建立的许多人工智慧,其实都是为了某一种目的而建构的。比如用人工智慧来打乒乓球,或者是面对某种危机来给予智能化主导判断的机器人。这些都是电脑工程师与科学家针对某项特定任务所创造专属电脑的必然结果,他们最终目的是完成这些特定任务,例如赢得棋局,而不是其他任务。


解决以任务为导向的AI问题

而现在,人工智慧当道,只不过如果人工智慧都只是用来下棋或打乒乓球的话,未免也太浪费运算资源了。因此科学家也开始思考,为了解决以任务为导向的AI问题,电脑科学家就必须要开始使用人工神经网络。


一般来说,人们大脑的智能是由生物神经网络所组成,这些网络根据人们的感知和外部刺激来建立关连。举一个非常简单的例子,例如烧伤所带来的痛苦。当烧伤的情况第一次发生的时候,在大脑中就会建立起一个连接,这样的识别会被标示为火焰(并衍生包括火焰、烟雾、热量等)的感觉讯息,并将其与疼痛的感觉关连起来。



图一 : 神经网络背後的基本意义,就是模拟电脑中的大脑互连单元,以便它可以从环境中学习、识别不同的情境,并且做出类似於人类的决策。
图一 : 神经网络背後的基本意义,就是模拟电脑中的大脑互连单元,以便它可以从环境中学习、识别不同的情境,并且做出类似於人类的决策。

这样的关连,可以让一个人从很小的时候,就学会如何避免被烧伤的方法。透过这种相同的神经网络脉络,我们就可以做出很多的一般性学习,例如:冰淇淋冰冰甜甜的味道很好。甚至还可以做出演绎性的跳跃思考,例如看到乌云来了,就知道可能快下雨了,或者股票市场在12月总是会出现反弹力道。尽管这些跳跃思考并不总是正确的,例如也有不好吃的冰淇淋(麻油鸡囗味??),12月也有下跌的股票等。然而透过经验的累积与修正,就可以允许自适应的学习方式。


将电脑打造成为通才

人工神经网络试图透过一个简单框架程序的建构,来响应问题的本质,并接收有关它如何处理的反??,然後进一步在电脑上重建这个学习系统。电脑可以透过数千次执行相同的问题来优化其响应,并根据其收到的反??来调整其响应。在这之後,再给予电脑一个不同的问题,它便可以采用与前一个电脑相同的方式来进行处理。透过这种改变电脑已经学习的响应问题与解决方法的数量,电脑科学家就可以将这样的电脑改造成为一个通才。


走到这一步,就开始令人联想到电脑正在一步步接管世界并管理人类,在很多电影中都已可见到类似的场景。尽管如此,但神经网络的发展还有很长的一段路要走。在神经网络上所测试的问题,都是透过数学的方式来表达。换句话说,人们不能把花拿到电脑前,并让它透过气味来猜测可能的颜色,因为气味必须以数字来表示,然後计算机再将这些数字记录在记忆中,以及哪一种花的图像可以散发出这种气味,这一切都必须要全部进行关连。


从这样看来,人工神经网路透过不断的资讯输入(好比??觉),并且再从这些输入资讯中去进行学习的能力,将可以获得更多,最终并将可能产生出人们囗中所称的真正人工智能。


神经网路基本结构


图二 : 卷积神经网络已经存在多年,并受到生物行为模式的启发,特别是大脑如何理解从眼睛接收到的信号。
图二 : 卷积神经网络已经存在多年,并受到生物行为模式的启发,特别是大脑如何理解从眼睛接收到的信号。

神经网络背後的基本意义,就是模拟电脑中的大脑互连单元,以便它可以从环境中学习、识别不同的情境,并且做出类似於人类的决策。基本的神经网络包含大约数百万个人工神经元。这些单元分层排列,每层连接到另一侧。其结构大约分成以下几个部分:


●输入单元:可从外部环境接收讯息。


●隐藏单元:最终输入到输出单位。每个隐藏单元都是其输入的压缩线性函数。


●输出单元:这些资讯表示网络应如何反应最近所获取的讯息。


大多数神经网络都是完全连接。这意味着每个隐藏单元和每个输出单元都连接到每层另一侧的每个单元。每个单元之间的连接称为「重量」(weight)。这里所称的重量可以是正的也可以是负的,正或负取决於它对另一个单元的影响程度。通常来说,较高的权重对互连单元具有较高的权限。


当神经网络被训练,或者在训练开始之後,将使用不同的输入单元将不同的讯号模式??送到网络中。这些讯号将触发隐藏单元,之後并将达到输出单元。通常这称之为前??网络,是一种神经网路经常会有的设计。


当使用不同的学习范例对神经网络进行充分训练之後,它就会到达一个新的阶段,并呈现一组全新的输入,这些输入通常可以预测出令人满意的输出。神经网路对於深度学习有着相当重要的影响,以下是现今神经网络和深度学习的一些重要趋势。


卷积神经网络

卷积神经网络(Convolutional Neural Networks;CNN)已经存在多年,并受到生物行为模式的启发,特别是大脑如何理解从眼睛接收到的信号。以目前来说,现有的视觉识别系统便是采用CNN演算法来执行影像分类、定位与对象检测等工作。


近年来,科学界对於卷积神经网络的兴趣不断提高,因为它正被大量运用於智能监控、社交网络照片标记和影像分类、机器人、无人机和自动驾驶汽车等用途上。包括Google、Amazon、Facebook等数据工程师则使用它来进行各种图像过滤和分类。


一个密切相关的重要领域,则是机器视觉的深度学习,这是条码扫描器能够看到并理解条码中条纹的能力。同样的,这也是Apple的Face ID在看到人脸时的识别方式。为了开始深入学习机器视觉,目前市面上有许多的平台,包括Google的Vision API、Allegro.ai,以及Missinglink.ai等。


胶囊网络

胶囊网络(Capsule Networks;CapsNets)是深度神经网络的一种新兴模式。他们以类似於人类大脑的方式来处理讯息。它实质意涵在於,胶囊网络可以维持着层次关系。胶囊网络与卷积神经网络形成了一个对比。



图三 : 胶囊网络(CapsNets)是深度神经网络的一种新兴模式。他们以类似於人类大脑的方式来处理讯息。
图三 : 胶囊网络(CapsNets)是深度神经网络的一种新兴模式。他们以类似於人类大脑的方式来处理讯息。

尽管卷积神经网络是至今使用最为广泛的神经网络之一,但它们未能考虑到简单和复杂对象之间所存在的关键空间层次结构,这将会造成错误分类,并导致更高的错误率。当进行简单的识别任务时,胶囊网络能提供更高的准确度,同时减少错误数量。他们也不需要大量的培训模型数据。


深度强化学习

深度强化学习(Deep Reinforcement Learning;DRL)是神经网络的一种形式,通过观察、行动来与环境进行交流学习。DRL已经成功应用於游戏策略上,例如着名的AlphaGo计划已经成功击败人类的棋艺冠军,在几个着名的人与机器竞赛上,深度强化学习都为机器取得了竞争中的优势。DRL是应用於开发业务应用程序的通用学习技术之一,而其另一个优点,是可以透过模拟来训练加以。


结语

人工智慧为新时代奠定了基础,许多科技上的突破都奠基於此。近年来,深度学习和神经网络已经成为发展人工智慧不得不注意的重要趋势。例如自动驾驶汽车可结合使用多种模型,如深度加强学习和卷积神经网络,用来进行自驾时的视觉识别。


就本质上来说,人工神经网络是一种人类神经网络的模型,目的在帮助电脑学习。如果将人工智慧比喻为是考古界的圣杯的话,那麽神经网路就是用来发掘出这个圣杯的最隹捷径。


[[超级电脑「华生」]]

华生(Watson)是IBM继深蓝(Deep Blue)後由华生研究中心费鲁奇博士 (Dr. David Ferrucci)最新研发出超强人工智慧电脑,运用IBM开发出问答系统(DeepQA)为运算结构,而问答系统在电脑科学与人工智慧应用上是一大挑战, 因为要回答不同的问题程式系统需要迅速整合资讯检索、自然语言处理、知识表徵及推理能力,并同时应对人机介面的互动。因此将华生的设计概念规划在可以挑战即时问答模式的益智节目《Jeopardy》并与人类叁赛者一较高下。



图四 :  IBM所研发的超强人工智慧电脑华生(Watson)
图四 : IBM所研发的超强人工智慧电脑华生(Watson)

在硬体部分,华生是结合强大的平行运算处理器、90台高速运算伺服器及2,880个处理器核心组成,能即时运算15TB的数据,且运算速度每秒可执行80兆个指令。而华生的记忆体被灌输了100万本书,相当於2亿页的资料内容,内容包罗万象,举凡天文地理、医学,甚至是百科全书跟地图图监等全是华生的智慧来源。


在软体部分,华生是由C++及JAVA语言共同撰写并结合Apache Hadoop架构来进行分散式运算,利用100多种不同的方法来分析自然语言、定义来源、产生假设并透过攫取正确讯息来确认假设,进而合并排序答案,推定可能答案范围。


为了要挑战即时问答的益智节目,华生必须要具备庞大的资料库且快速的搜寻能力,因此华生在此种硬体设备的支援下,当华生要回答问题时,会先运用600万条逻辑规则来了解人类语言的意义脉络,立即从资料库中搜索、浏览,同时比照两亿页的文字,交叉分析文章段落、确认语意,在没有连网的情况下,三秒内回答问题。


相关文章
跨出产业小框框 抓住Big Data和AI大趋势
医疗保健业:资料准备程度指数 3级
2025年产业环境应用下 高容量硬碟储存技术现况
AI补上最後一块拼图 边缘运算效能浮现
应用逐步落地 云端平台成AIoT效能关键
comments powered by Disqus
相关讨论
  相关新闻
» 趋势科技率先利用 AWS Transit Gateway 提供高效能在线式网路资安防护
» Autodesk 2020新品发表暨新知论坛 共享各领域知识及资讯
» 最新ANSYS版本加速跨产业数位转型 强化设计、工程和制造间的数位设计流程
» IBM:实现认知制造 以AI全面再造企业
» 串列设备、Modbus设备也能轻松上云 - Moxa推出
  相关产品
» JIUN推出新款云端医学影像管理系统
» 优必达借力Azure服务为全球市场提供混合式云游戏与人工智慧服务的解决方案
» IBM 与 NVIDIA 携手为资料科学家拓展开源机器学习工具
» Hortonworks、IBM与红帽协力推动工作负载容器化
» IBM与红帽携手合作加速混合云采用

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2019 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw