首页

展会概览

关于展会

历届展会报告

展会平面图

馆内服务

下载中心

合作媒体

观众中心

观众登记

团体观众

特邀买家

交通住宿及签证

签证（获取大会邀请函）

前往展馆

旅行社及住宿资料

餐饮指南

旅游中心

参展中心

申请展位

展商列表

展商须知

标准展位参展须知

光地展商参展须知

广告服务

货运服务

参展商手册

指定搭建商

同期活动

新闻中心

展会新闻

行业资讯

照片直播

视频集

联系我们

社交媒体

行业资讯

新闻中心 / 行业资讯

2019/08/14

862

阿里、微软“看图说话”AI系统竞赛，WiMi微美全息机器人AI视觉突出

分享到 QQ好友微信 QQ空间豆瓣新浪微博

随着材料科学、感知人工智能以及5G、云等网络技术的不断进步，将出现护理机器人、仿生机器人、社交机器人、管家机器人等形态丰富的机器人，涌现在家政、教育、健康服务业，带给人类新的生活方式。以5G、AR／VR、全息技术、机器学习等新技术使能的超级视野，将帮助我们突破空间、表象、时间的局限，见所未见，赋予人类新的能力。

近日，来自中国AI在这项能力上已经打破了世界纪录。在第二届全球AI视觉对话竞赛（Visual Dialogue Challenge）中，阿里AI击败了微软、首尔大学等十支参赛队伍，一举获得冠军。

这场视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室（FAIR）等机构联合全球视觉技术领域顶级学术会议CVPR发起，是目前视觉对话领域最权威的竞赛之一。

竞赛结果显示，阿里AI以74．57％的准确率获得冠军，将上一届比赛的纪录提高了16．82％，并且超过微软AI的64．78％的准确率。而在相同的数据集中，人类的准确率仅为64．27％，AI甚至胜过了人类。传统的视觉AI主要针对目标的检测和识别，但对复杂场景中目标之间的逻辑关系理解、推理能力较弱，无法回答表达图片对象直接关系的复杂问题，也难以将图片信息转化为人类理解的语言输出。这意味着，要实现视觉对话能力，传统的视觉AI在学会“看图”之后，还要有一种语言模型来支撑它“说话”。阿里AI的突破就在于提出了“递归探索对话模型”

目前微软还开放了能“看图说话”的AI系统，用户进入官网上传图片，稍等一会，就能看到系统对于图片的描述。其准确率虽然不低但依旧有待提升，以一张曾经广为流传的黑人问号表情图片为例，AI很快给出了客观的回答：“我觉得这是篮球队员尼克·杨露出牙齿微笑。”

阿里、微软“看图说话”AI系统竞赛，WiMi微美全息机器人AI视觉突出

以“看图说话”为代表的视觉对话是近年来快速崛起的AI研究方向，目的在于教会机器用自然语言与人类讨论视觉内容，这能够使机器拥有了对真实视觉世界的理解与推断能力，也意味着AI的认知能力将迈上新的台阶。

正如《2001太空漫游》《流浪地球》等科幻大片中无障碍的人机对话系统所描绘的那样，拥有智能视觉对话能力的AI随着技术的不断突破，正在向我们走来。

市场研究机构 IDC 最新发布的《全球半年度 AI 系统支出指南》显示，亚太地区 2019 年在人工智能（AI）系统方面的支出预计将达到 55 亿美元，比 2018 年增长近 80 ％。随着各行各业积极投资于利用 AI 软件功能的项目，预计 2022 年将增至 150．6 亿美元。亚太地区正迅速推动 AI 应用迅速增长，因为其数字生态系统非常适合这种新生技术发展。

人体识别指的是运用计算机技术在视频流或图像中对人体进行检测、属性描述以及行为识别，如我们熟知的人体检测与跟踪、人体关键点定位、人像分割、人体行为识别 ReID 技术、手势识别等。

微美全息专注于计算机视觉全息云服务，微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节，是一家全息云综合技术方案提供商。

微美全息十分注重底层技术的研发，凭借多年来在计算机视觉领域的耕耘与积累，微美全息已经完成了从0到1的技术沉淀、打磨，微美的AI视觉技术已经到了成熟落地，各项技术指标也达到了行业的领先水平。技术成熟后，微美着重规划了从1到N落地应用，其中机器人是规划中非常重要的一环。微美全息云产品布局商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。

微美的全息图像处理功能定期进行优化和改进，包括两项核心技术：全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展，微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。

全息面部变化技术基于全息3D图层替换技术，包括基于AI的图像识别和动态融合处理技术，实时跟踪图像以及用其他面部替换面部。该技术取代视频帧中的人脸，合成视频并添加原始音频。微美已经在全息AR插件广告应用中验证了这些技术模块，并将继续开发和升级这些技术模块。微美相信这项技术将为名人广告，电影发行和直播视频流等应用带来新的业务增长。

阿里、微软“看图说话”AI系统竞赛，WiMi微美全息机器人AI视觉突出

同时，机器人行业也迫切需要AI视觉技术的支持来突破技术瓶颈，解决机器人现有成本、智能化等问题。通过微美全息的图像语义技术，机器人可以进行图像识别、语义分割，结合深度数据可以帮助机器人建立语义地图，实现对周围环境的立体感知与理解，使机器人具备从识别到决策的AI交互能力，实现诸如目标行人追踪、服务机器人送餐上门等功能，大幅提升机器人的智能水平。

近日，中国华为技术有限公司发布了全球产业展望报告GIV2025，认为智能世界正在加速而来，触手可及。根据该报告的预测，到2025年，智能技术将渗透到每个人、每个家庭、每个组织，全球58％的人口将能享有5G网络，14％的家庭拥有“机器人管家”，97％的大企业将应用人工智能。华为全球信息和通信技术基础设施业务首席营销官张宏喜表示：“人类的探索永不止步，从地球到太空要飞得更高，从过去到未来要看得更远，从创新到创造要想得更深。今天，以人工智能、5G、云计算为主导的第四次工业革命所带来的改变，正在改变各行各业，推进智能世界加速到来。

如何看待机器视觉市场呢?

高通推动5G落地游戏行业还在加速工业互联网应用

深耕自动化，成就多元产业应用

欢迎莅临广州国际智能制造技术与装备展览会！

联系我们

商务邮箱：

sps@china.messefrankfurt.com

行业资讯

新闻中心 / 行业资讯

2019/08/14

862

阿里、微软“看图说话”AI系统竞赛，WiMi微美全息机器人AI视觉突出

上一篇：

如何看待机器视觉市场呢?

下一篇：

高通推动5G落地游戏行业还在加速工业互联网应用

相关推荐

深耕自动化，成就多元产业应用

欢迎莅临广州国际智能制造技术与装备展览会！

联系我们

商务邮箱：

商务电话：

86 20 38251558 / 38823660

公司地址：

广州市天河区林和西路161号中泰国际广场B3107

主办单位官方微信

主办单位官方微信

©2012-2024 广州光亚法兰克福展览有限公司版权所有粤ICP备12020522号

行业资讯

新闻中心 / 行业资讯

2019/08/14

862

阿里、微软“看图说话”AI系统竞赛，WiMi微美全息机器人AI视觉突出

上一篇：

如何看待机器视觉市场呢?

下一篇：

高通推动5G落地游戏行业 还在加速工业互联网应用

相关推荐

深耕自动化，成就多元产业应用

欢迎莅临广州国际智能制造技术与装备展览会！

联系我们

商务邮箱：

商务电话：

86 20 38251558 / 38823660

公司地址：

广州市天河区林和西路161号中泰国际广场B3107

主办单位官方微信

主办单位官方微信

©2012-2024 广州光亚法兰克福展览有限公司 版权所有 粤ICP备12020522号

高通推动5G落地游戏行业还在加速工业互联网应用

©2012-2024 广州光亚法兰克福展览有限公司版权所有粤ICP备12020522号