腾讯优图联手Science发布主题报告：计算机视觉的研发和应用

来源::网络整理 | 作者:管理员 | 本文已影响人

近日，腾讯优图与《科学》（Science）杂志共同发布《Seeing is believing: R&D applications of computer vision》（眼见为实：计算机视觉的研发和应用）主题报告，通过全球计算机视觉领域的专家访谈，为大众带来当下计算机视觉技术发展的全面解读，也为即将到来的计算机视觉峰会拉开序幕。

人工智能 (AI) 曾经只是一种存在于科幻领域的科技，而现在，研究实验室已经不断研发出了各种应用 AI 的日常产品。AI 技术的进步很大程度上得益于计算机视觉的发展。计算机视觉技术关注的是构建能够收集和处理视觉信息的软件。应用计算机视觉可以识别照片中的人物、读取 X 光片、进行工厂机器人系统的智能升级，但它的影响范围远不止于此。

大多数人都对自己的视觉习以为常，殊不知要拿起叉子或接住球，我们的大脑要进行大量的运算。计算机变得足够快速、强大和小巧来实现计算机视觉的实际应用，不过是这几年的事情。最先进的计算机视觉技术要运用到深度学习，而深度学习是 AI 的一大领域，灵感来自于人脑。深度学习算法使用的人工神经网络（ANN），是指能够分析并相互传递信息的互相连接的节点层，与神经元的通信机制类似。

如果我们向神经网络展示一张自拍照，一层神经元将会识别类似于面部轮廓的粗线条；另一层神经元会关注五官之间的区域，例如眼睛到嘴巴的距离；还有其他神经元会负责观察耳朵的形状。藉此，该算法可判断出这是不是一张人物照片，甚至看出这人是谁。

「在大多数计算机视觉任务当中，神经网络都能轻而易举地生成最佳算法，」腾讯优图实验室杰出科学家贾佳亚说道。腾讯总部位于中国深圳，是互联网服务和产品、娱乐及人工智能的全球领导者。

腾讯优图联手Science发布主题报告：计算机视觉的研发和应用

像人工神经网络一样，计算机视觉技术工程师也在试图模仿人类视觉系统的运作机制。但是机器比人更有优势的一处是，它不需要像人类那样依赖可见光，还能使用传感器更清楚地看到世界。

「在人脸识别、图像分类等众多任务中，计算机视觉能比人类视觉完成的更优秀。但在其他需要推理的任务，计算机视觉还有很长的路要走。」贾佳亚表示，「人类能轻易明白物体彼此之间的关联，我们看到一张图就能编出一个故事。但计算机还远不能达到这种程度的理解能力和想象力。」

随着计算机视觉技术的不断发展，它将会带来更多新的发现。计算机视觉和 AI 都处于各自发展的初始阶段，还有很多东西值得探索。计算机视觉技术的进步可能会推动 AI 的迅猛发展，把科幻小说的情节全部变成现实——比如无人车、机器人管家，甚至远距离太空旅行。

在实践中学习：AI 的工作原理

跟大多数 AI 系统类似，计算机视觉需要学习浩如烟海的数据。研究人员查阅数据并根据其特征仔细为数据添加标签，这些特征就是他们希望 AI 去理解的东西。就计算机视觉的任务而言，研究人员会收集成百上千的照片用于分析。加标签的数据会成为范例，据此训练 AI 进行分类或寻找规律。为了测试 AI 的学习效果，研究人员会展示新的、未加标签的图像，测试其是否能够正确分类。

除了要在收集、标注和筹备庞大资料的工作中投入人力外，另一个重要障碍就是运行训练算法需要的大量计算能力。费用低廉的在线服务，让研究人员可以在云端训练算法，而无需为强大的计算机投入数千美元，不过，要得出训练结果仍需数小时甚至数日。

对着镜头微笑：图像和视频识别

人工神经网络领域最重要的进展之一出自 ImageNet。ImageNet 收集了 1400 万标签图像并于 2009 年发布。ImageNet 挑战赛要求参赛者设计一个能够跟人类一样对照片进行分类的算法，但一直没有出现获胜者。直到 2012 年，一个使用深度学习算法的参赛队伍取得了显著优于以往尝试的结果。

今天，人们与计算机视觉产生交互的最常见的几种方式包括图像自动标记和拍照面部识别等，都是基于 ImageNet 获胜的技术。这些应用有助进行网上购物可视化搜索、自动标注社交媒体照片等特定任务。

除了图像识别外，这项新科技也推动了照片编辑技术的发展。图像分割算法是计算机视觉的组成部分，可以帮助机器将一张图片分成不同的部分，例如识别背景和前景中的人物。用户可迅速编辑照片，达到专业修图的效果。

视觉识别能力目前也应用于视频。计算机视觉算法可以查看摄像机的视频流，并且标记重要部分，这样人们就无需反复回看长达数小时的视频。了解视频中人物的情绪是一项研究人员正在开展的工作，不过有些机构已经率先采用了这类技术。例如坐落在中国东部浙江省的杭州第十一中学，正在尝试用摄像头追踪学生的课堂行为，这些摄像头被称为「慧眼」。

腾讯优图联手Science发布主题报告：计算机视觉的研发和应用

让机器人拥有正常视力

将 2D 图像转化成 3D 数据，带来了一系列不同的挑战以及众多的新机遇。给机器人赋予计算机视觉就是一个正在展现出前景的领域。

机器人在 20 世纪 60 年代开始投入制造业使用，这些装置可以提升重物，执行重复性任务，并且可以一次进行数小时的精确测量，从而轻松地胜过人类。

斯德哥尔摩 KTH 皇家理工学院的机器人学教授 Danica Kragic 说：「这一领域始终关注的是建造出那些可以完成人类无法完成任务的机器人。」

Kragic 表示，因为人类有 40% 的大脑致力于处理视觉信息，如果要创造能够模仿并参与我们世界的机器，了解它们在多大程度上需要视觉信息是非常重要的。「我们人类在做任何事情时都会自然而然地使用视觉反馈，」Kragic 说。

能够处理视觉信息的机器可以在工厂中完成更复杂的工作，甚至进入了我们的家庭。某些技能（例如，拾取会因压力而改变形状的柔软物品）对机器人来说仍然是遥不可及的。这是因为人类在观察时，获得的不仅仅是视觉信息；我们还会获得有关物体物理属性的线索，以及与之交互所需要的物理知识。机器需要能够收集这类信息，才能像人类一样毫不费力地穿行在物理世界中。

「在五官感觉当中，视觉是最重要的，因为它赋予了人类理解这个复杂世界的能力。」贾佳亚说，「同样地，计算机视觉就是为了让计算机能够像人类一样观察环境并能跟环境互动。」

赋予机器人能够更好地了解世界的传感器是该技术的下一个迭代，它可能让机器人完成在今天尚无法实现的任务。

即将上路：自动驾驶汽车

本文标题：腾讯优图联手Science发布主题报告：计算机视觉的研发和应用

分享到：更多

上一篇：PISA测评青少年创造性应用计算机解决问题能力
下一篇：科技生活精彩每一天

随机阅读

栏目导航

更多>>

毕业论文

考试

作文

范文

英语学习

成功

演讲与口才

文章阅读

工作职场

创业

生活课堂

经典语录

记忆力

励志

电脑教程

脑力倍增

学习方法

学习资料下载

学习资讯

热榜阅读

本周TOP10

四川托普学子在第五届全国高校计	超级计算机：从零起步赢得速度、
中国电信携手华为打造智能仓储物	计算机视觉初学者快看！这本书教
“中国超算”的创新之路	项目】河南科技职业大学计算机应

自我介绍范文网

脑力

记忆

速读

智商

方法

考试

英语

电脑

励志

口才

职场

创业

生活

礼仪

阅读

简历

范文

论文

作文

名言

语录

下载

脑力

记忆

速读

智商

方法

考试

英语

电脑

励志

口才

职场

创业

生活

礼仪

阅读

简历

范文

论文

作文

名言

语录

下载