华为机器视觉研究计划与进展丨CCF-GAIR 2020（一）--中国仿真学会

当前位置：首页 >> 业界动态 >> 业界动态

华为机器视觉研究计划与进展丨CCF-GAIR 2020（一）

2020/10/21 12:42:25 新闻来源：中国仿真学会生命系统建模仿真专业委员会

华为云人工智能领域首席科学家、IEEE Fellow 田奇

2020 年 8 月 7 日，第五届全球人工智能与机器人峰会（CCF-GAIR 2020）在深圳正式开幕。

CCF-GAIR 2020 峰会由中国计算机学会（CCF）主办，雷锋网、香港中文大学（深圳）联合承办，鹏城实验室、深圳市人工智能与机器人研究院协办。

作为中国最具影响力和前瞻性的前沿科技活动之一，CCF-GAIR 大会已经度过了四次精彩而又辉煌的历程。在大会第二天的「视觉智能?城市物联」专场上，华为云人工智能领域首席科学家、IEEE Fellow田奇博士登台发表精彩演讲，分享了华为在人工智能领域的理解与实践。

田奇介绍了华为在人工智能领域的十大愿景，华为为了实现这个战略目标，从中梳理出深耕基础研究、打造全栈方案、投资开放生态和人才培养、解决方案增强、内部效率提升五大方向，以此打造无所不及的AI，构建万物互联的智能世界。

华为计算机视觉基础研究以数据高效和能耗高效为核心，覆盖从2D视觉到3D视觉的技术和应用，主要包含底层视觉、语义理解、三维视觉、数据生成、视觉计算、视觉多模态等方面。在此方向上，华为将基础研究进一步聚焦到数据、模型和知识三大挑战：

1、数据上，如何从海量的数据中挖掘有用的信息。田奇以生成数据训练和不同模态数据对齐这两个应用场景为例，介绍了华为如何使用知识蒸馏与自动数据扩增结合的方法让AI模型高效地挖掘数据中的有用信息。

2、模型上，怎样设计高效的视觉模型。田奇认为在深度学习年代，视觉模型主要包含神经网络模型设计和神经网络模型加速两个场景。具体地，田奇介绍了华为如何通过局部连接思路解决网络冗余问题、如何加入边正则化思想来解决局部连接带来的不稳定性等等。

3、知识上，如何定义视觉预训练模型、如何通过虚拟环境学习知识、如何表达并存储知识。为了实现华为打造通用视觉模型的目标，田奇认为推理预测是从视觉感知到认知的关键步骤。虽然预训练方法目前在视觉领域的应用还不成熟，但是近期自监督学习的成果为视觉通用模型的发展注入了新活力，这也将成为常识学习的必经之路。

基于三大挑战，田奇提出华为视觉六大研究计划：数据冰山计划、数据魔方计划、模型摸高计划、模型瘦身计划、万物预视计划、虚实合一计划，来帮助每一位AI开发者。

以下是田奇博士的大会演讲全文，雷锋网作了不改变原意的整理与编辑：

尊敬的各位嘉宾、各位老师、各位朋友，大家下午好！我是田奇，现任华为云人工智能领域首席科学家。非常感谢大会的邀请，很荣幸能在这里为大家介绍华为计算机视觉计划。

首先，我会简单介绍一下华为人工智能的研究背景和在计算机视觉领域的基础研究。然后，我会从模型、数据和知识三个核心点出发，来重点介绍华为视觉六大研究计划。最后，我会介绍一下华为云人工智能在人才培养方面的理念。

近年来，AI的发展如火如荼，正在改变各行各业。华为预计：到2025年左右，97%的大企业都会上云，其中77%的企业云服务都会涉及到AI。

因此，在云上，AI是一个关键的竞争点。如果把大企业的智能化升级比作一个赛道，那么AI、IoT、5G就是提高发展速度和商业高度的重要引擎。

以前我们的董事长徐直军阐述过华为在人工智能领域的十大愿景，这里我简单介绍几点。

过去，长达数年的分析时间，未来会是分钟级的训练耗时；

过去，需要天量的资源消耗，未来将是高性能的计算；

过去，计算主要集中在云端，未来主要是云端+终端；

过去，是大量的人工标注，未来将是自动标注、半自动标注的舞台；

过去，专业人员才能用AI，未来是面向普通人的一站式开发平台。

基于这样的愿景，华为的AI发展战略就是打造无所不及的AI，构建万物互联的智能世界。

华为将从以下五个方向进行研究或者投资。

第一：深耕基础研究，在计算机视觉、自然语言处理、决策推理等领域，构筑数据高效、能耗高效、安全可信、自动自治的机器学习的基础能力。

第二：打造全栈方案，面向云、边、端等全场景，全栈的解决方案，提供充裕的、经济的算力资源。

第三：投资开放生态和人才培养，将面向全球，持续与学术界、产业界和行业伙伴进行广泛的合作。

第四：把AI的思维和技术引入现有的产品和服务，实现更大的价值、更强的竞争力。

第五：提升内部的运营效率。

华为云Cloud&AI的定位就是围绕鲲鹏、昇腾和华为云构建生态，打造黑土地，成为数字世界的底座。为了实现这个目标，华为云提出了一云两翼双引擎+开放的生态目标。

就像这架飞机一样，双引擎是基于鲲鹏和昇腾构建的基础芯片架构；两翼是计算以及数据存储和机器视觉；一云是华为云，提供安全可靠的混合云，成为生态伙伴的黑土地，为世界提供普惠的算力。开放的生态是指硬件开放、软件开源，使能我们的合作伙伴。

华为云主要面向八大行业使能AI技术。到2019年底，我们已经提供了60种服务、170多种功能，所涉及的行业包括：城市、互联网、家庭、车联网、物流、金融、园区、制造等等。

以上是对华为AI的简单介绍，下面将介绍我们在计算机视觉领域的一些基础研究。

众所周知，人类对外部世界的感知80%以上来自于视觉信号。近年来，随着视觉终端设备的不断普及，如何让机器像人类一样拥有感知视觉信号的能力是计算机视觉的终极目标。

计算机视觉已在智能汽车、智能手机、无人机、智能眼镜等诸多行业得到了广泛应用。

业界动态

业界动态

图片中心

更多>>

点击排行

首页

关于CSF

业界动态

学会工作

团体标准

分支机构

人才举荐

国际合作

CSF奖励

会员专区

联系我们