账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
图像巨量资料时代来临
探析电脑视觉技术与应用发展

【作者: 韓揚銘】2017年02月06日 星期一

浏览人次:【16078】


在人类的世界中,我们利用视觉来获取、处理、分析和理解大量的资讯。一般情况下,视觉就占据大脑的80%的感官认知影响力。然而,随着资讯、影像处理元件及技术的进步,我们已经在医学、工厂、军​​事、汽车、相机、航太等领域利用电脑视觉来进行代替人眼的工作。近年更因为结合了巨量资料、云端运算、以及人工智慧等技术,让电脑视觉技术更为跃进。


电脑视觉技术架构

随着资讯科技的进展,利用不同的影像成像设备,如:数位相机、监视器、红外线感测器等,将所见之影像转为数位化后(将三维实境转为二维图像),电脑视觉(Computer Vision) 再利用不同的光学、数学、物理学等影像处理(Image Processing) 技术,将二维图像的部分资讯推演出三维整体讯息的过程。


电脑视觉最早可于1960年的美国麻省理工学院 (MIT) 的教授Larry Roberts和David Marr教授开始谈起,Roberts教授率先开创如何解析三维图像的研究。 1977年后,Marr教授则更进一步谈论到电脑视觉的理论框架,从此便开展了电脑视觉的新方法、概念及理论的研究热潮。


电脑视觉理论框架

随着Marr提出电脑视觉的理论框架(如图一)后,许多相关研究也逐渐提出来精进其理论框架。然而,根据过去对电脑视觉的架构描述,电脑视觉理论框架可分为四大阶层。分别为:低层次视觉 (Low-Level Vision)、中层次视觉 (Mid-Level Vision)、高层次视觉 (High-Level Vision),及抽象层视觉 (Abstract Level Vision)。



图一 : 电脑视觉理论框架(资料来源:资策会MIC)
图一 : 电脑视觉理论框架(资料来源:资策会MIC)

低层次视觉

主要针对原始图像的处理,在此大量运用物理及数学进行基本特征辨识,包含明亮度(Luminance)、颜色识别(Color)、空间频率(Spatial Frequency)、时间频率(Temporal Frequency)、区域活动侦测(Local Motion)…等等许多技术,借以找出场景、色彩、边缘、角度和纹理或基本运动侦测等。


中层次视觉

中层次视觉要求可以恢复2D场景中的深度、物体轮廓的信息,将原本2D场景恢复至2.5D场景的情况,经常使用的技术有纹理(Texture)及表面(Surfaces)辨识、光源(Lighting)、深浅(Depth)、和全区运动侦测(Global Motion)(全区运动指整个画面一起动作,如开车忽然向右转)。


高层次视觉

高层次视觉主要将物件复原成3D图的概况,借此可对3D图中的人事物进行描述、识别。经常要做的任务就是对物件(Object)、特征(Characters)以及动作(Actions)的辨别。


抽象层之视觉

开始进行高层次及抽象主题的识别,例如:开始辨识建筑物的风格、或是了解人类的不同动作和行为模式,经常以系统结构 (System Architecture)和模式辨识(Pattern Recognition) 进行讨论。


电脑视觉流程周期及知识架构


图二 : 根据电脑视觉在处理的过程中,其实需要不同的流程才得以成为电脑视觉的产品。 (Source:CEVA's Experts blog)
图二 : 根据电脑视觉在处理的过程中,其实需要不同的流程才得以成为电脑视觉的产品。 (Source:CEVA's Experts blog)

根据电脑视觉在处理的过程中,其实需要不同的流程才得以成为电脑视觉的产品。其中本文在电脑视觉流程中,将电脑视觉的流程周期简介为四大流程,分别为:影像资讯输入(Image Input);影像前处理(Image Preprocessing);影像理解(Image Understanding);电脑视觉产品( Results)。以下说明每项流程周期之工作任务、技术以及相关知识领域。


影像资讯输入

在影像资讯输入中,最为普遍的就是数位相机以及摄影机,此外,各应用领域也有专业的取像设备,例如光源感测器、红外线感测器、深度摄影机(Depth Camera)、3D扫描器、核磁共振摄影印(MRI)等。甚至,我们利用滑鼠、绘图板所绘制的图像或是扫描器,这些其实都是影像资讯输入的装置。因此,在影像输入阶段中,技术重点仍着重在影像相关的光学及成像技术。


影像前处理

影像前处理(Image Preprocessing),又称影像还原(Image Restoration),主要目的就是利用不同的影像处理技术进行影像失真的还原、杂讯的处理。并且,也同时针对影像进行讯号的前处理,借此来了解影像的光源、角度、边缘…等。因此,在影像前处理阶段中,相对较类似电脑视觉理论框架的低层次及中层次架构,以及部分的高层次视觉处理技术。


然而,在此项流程周期中,许多技术根本是基于数学几何学、物理学、讯号处理学等。由于上述基础科技来发展图像特征侦测、光源、边缘、点线面辨别的判断,借此来达到影像前处理之目的。


影像理解

影像理解(Image Understanding),其顾名思义,就是要让系统了解影像。技术方面来说,主要着重系统结构(System Architecture)和模式辨识(Pattern Recognition)。在此流程中,为了要能够辨识及理解不同图像资料上的内容,则必须要有许多领域知识来进行判断,其中包含了行为心理学、认知科学、或者是特定领域的学科知识(例如:为了辨识巴洛克风格的建筑,必须要有其建筑知识的背景)。


除此之外,由于近年运算速度及记忆体的提升,庞大的图片及影像资料得以有效率地进行分析。因此,在近年的电脑视觉则开始有效的导入认知科学、神经生物学等来协助进行系统结构和模式辨识,以更具备自主性及智慧化。比方来说:利用类神经网路的技术,来辨识道路上的车流情况,藉由收集到的影像资料,以进行路况分析。


电脑视觉应用领域


图三 : 经过影像处理之后,电脑视觉开始能够做到事件侦测、环境∕物件建模或是定位导航等功能,利用这些影像处理的成果来推出电脑视觉相关的产品。 (Source:autor)
图三 : 经过影像处理之后,电脑视觉开始能够做到事件侦测、环境∕物件建模或是定位导航等功能,利用这些影像处理的成果来推出电脑视觉相关的产品。 (Source:autor)

在经过影像资讯输入、影像前处理、影像理解之后,电脑视觉开始能够做到事件侦测、环境∕物件建模、或是定位导航等功能,利用这些影像处理的成果来推出电脑视觉相关的产品。在过去几年当中,我们已有相当多电脑视觉的产品推出,而在近年因为大数据及物联网的发展,电脑视觉的产品更具有许多功能整合性、缩小性、和突破性的方向进行成长。以下我们列举数项产品进行说明:


功能整合性应用案例--智慧零售、安全监控

在过去,可看到部分公共场合或卖场中的摄录影机只提供事件分段记录的功能。而研华电脑于2014年以自家的WebAccess系统为核心,结合影像分析软体以及自家的影像撷取卡、处理平台等,提出「WebAccess+IVS」作为影像处理的解决方案。


研华电脑提供了如物件统计(Object Counting)、人流统计(People Counting)、摄影机干扰侦测(Camera Tamper)、光学自我诊断(Optical Self Diagnostic)、移动侦测(Motion Detection)、禁区管理(Forbidden Zone )、人口统计变数(Demographic)(如:判别男女、年龄)等影像分析功能。


缩小性应用案例之一--创新手势控制

日本新创公司Logbar所提出的「Ring」-手势控制(Gesture Control)戒指,于2014年4月在美国群众募资平台Kickstarter募资成功。该产品利用戒指中的运动感测器,来了解手指所画出的图示,借此了解不同象征性的图示后,再去执行所相对应的命令。


缩小性应用案例之二--行车防碰撞预警

另外,日前在行车安全中颇具盛名的以色列「Mobileye」公司所提出的主动式「行车防碰撞预警系统」,就以在车子高速及慢速行进间提供对行人/自行车防撞预警、车道偏离、前车防撞预警、交通标志辨识、以及智慧型远近光灯切换的功能。这些都依赖着预警系统可以即时处理影像资讯,找出特征资料并再做出合适的判断,才得以完成此预警系统。


突破性应用案例之一--主动认知

Google曾经有一项专案名为Google Brain,该专案利用自身开发的深度学习网路来复制人类大脑思考方式,并在利用电脑视觉技术「观看」了千万个Youtube影片后,学习到如何分辨「猫」这种动物。这种图像模式辨识的方式打破了过往所认知的预计规则逻辑,改以让电脑自行认知去学习何为「猫」的概念。上述的成果,不仅大大突破了原有电脑视觉的框架,也成为人工智慧的一项重要里程牌。


@中標:缩小性应用案例之二--自主游戏智慧


另外,2014年六月底时,Google花费高达6亿美元来并购了一家人工智慧公司「Deepmind」,藉由这次的并购让全世界观注到Deepmind这家公司的与众不同。 Deepmind利用所研发的人工智慧来达到「看懂」过去的电脑游戏来怎么玩才可以得到高分。并且惊人的是,Deepmind并不需要为每一款游戏去设定判断规则或是游戏怎么玩,在只需设定目标后,命令Deepmind自行学习来获得高分。


电脑视觉成为主要公司角力之地

电脑视觉是资讯产品,从被动判断拓展到主动识别过程中的重要技术,过去,一般认为的电脑视觉大多用于专属特定领域,如人脸辨识、交通号志判断等。不过,由于电脑视觉可开始整合认知科学、类神经网路、深度学习等多元人工智慧相关技术的成熟,开始逐渐走向可以广泛的对不同人事物或更甚至是行为模式的情况进行判定,使得未来不论在生活各层面、商业分析、监控管理皆有剧烈的影响。


2014年国际大厂积极收购具图形处理、电脑视觉技术能力的公司,帮助其在电子商务、资料搜寻、社群经营等应用的技术累积。在巨量资料技术对非结构性资料的处理能力不断进步,未来电脑视觉的处理效率,将成为主要公司的重要竞争要素。


(本文作者为资策会MIC产业分析师)


**刊头图片来源(Source:startyourspark)


相关文章
十大云端应用开发趋势与预测
挥别传统检测 AI电脑视觉为工业产线加值
影像感测无所不在 全域快门赋能电脑视觉应用
STM32 影像处理函式库介绍
灯塔工厂的关键技术与布局
comments powered by Disqus
相关讨论
  相关新闻
» 鼎新电脑携手和泰丰田解缺工 以数位劳动力开启储运新时代
» Fortinet SASE台湾网路连接点今年落成 全台巡??落实云地零信任资安
» Ansys模拟分析解决方案 获现代汽车认证为首选供应商
» SOLIDWORKS公开演示未来AI 率先导入工业设计软体应用
» BMW与达梭系统合作 打造3DEXPERIENCE未来工程平台


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK83T0X7JWYSTACUK9
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw