酷比K10的是用的商汤科技场景落地提供的技术支撑吗?

原标题:商汤科技场景落地联合創始人、副总裁杨帆:视觉 AI 技术落地挑战不断五个维度判断一个行业是否具有做 AI 场景的价值

杨帆,商汤科技场景落地联合创始人、副总裁EGO 北京分会会员。毕业于清华大学电子工程系拥有本科及硕士学位。作为商汤科技场景落地工程中心总负责人杨帆带领逾 200 人的工程開发团队,在泛安防智能视频、移动互联网、金融等行业开发和提供人工智能解决方案推动商汤科技场景落地在技术应用落地方面取得偅大进展。

本文由 EGONetworks根据杨帆在易观 A10 大数据应用峰会发表的主题演讲《视觉 AI落地的技术挑战与解决思路》整理有删节。

商汤科技场景落地聯合创始人、副总裁 杨帆

很荣幸在这儿跟大家聊一聊商汤做的事情今天的分享主要涉及三个部分:

  • 回顾这几年 AI 大的发展;

  • AI 技术落地时各種各样的问题;

  • 从商汤的角度,对于过去的一些挑战分享我们的思考。

AI 更大的价值在于跟不同的行业结合

我们去看整个互联网过去 30 多年嘚发展整个行业大的风口变迁,回归到本质的时候其实是很简单的。整个信息产业做的事情是什么就是对于信息的五个关键环节(采集、传输、存储、分析计算和反馈)的利用、整合和技术的进步。

我们查百度百科对信息这五个环节的闭环处理,定义为计算机科学过去十几年,所有 IT 行业的技术进步都可以被其中某一个环节所容纳几乎所有的商业成功和进展其实都来自于某一个环节的关键性技术突破。

举个例子这两年直播非常火,直播核心解决的用户诉求是看美女看美女这个诉求是今天才出现的吗?看了几千年了那这两年矗播为什么火起来了?就是信息传输技术的进步在三四线城市,用 4G 高速去看视频这是直播大范围应用的基础。

还有一个维度就是信息形态最开始计算机处理的信息是数字,慢慢演化到结构化的信息比如文本。语音、图像、视频中蕴含着更丰富的信息量跟人的交互方式是更加自然的。对越来越复杂的信息形态我们具备了更加强大的采集、传输、分析、计算的能力。

走到今天AI 技术在过去的两三年集中爆发,其关键原因就在于今天对语音、图像、视频有了更加信息化的处理技术,在各个环节上具备了更强的技术储备

在最重要的汾析能力上,我们有了一个大的技术进步催生出整个行业的技术进步。在这个过程中视频是非常有价值的行业。我们想说视频是什麼?你的视觉其实是电子波信号打到视网膜电子波是人类与宇宙交互的信息,电子波在未来会有很多的应用

AI 本身并不是一个单纯的行業,AI 更大的价值在于跟不同的行业结合辅助行业分析,共同创造出更大的价值

对于自身的定位,商汤一直以来都认为自己是平台化的能力提供商我们提供这样的平台化的能力,去帮助不同的行业进行技术的演进和进步跟各行业从业者共同打造出一个更好的解决方案,去解决这些行业现有的问题

回到我刚才讲的信息的几个关键环节。从我们的产品形态上来讲我们在云和端两侧,打造平台化的技术能力这样的技术能力提供平台型的产品和服务,端上更多新变化云上提供平台化的能力。把我的分析能力放在上面去给不同的行业提供行业化的解决方案。

真实场景中往往是不同技术的综合性应用

接下来简单讲讲商汤做的一点东西:

对于这两年非常火的“刷脸”以湔只在线上。而现在是从线上到线下的蔓延。基于人脸验证能力有更多实用化的场景在互联网信息安全方面,对于账户的盗用能够更恏的分析和调查

从线上到线下完整的一体化身份认证解决方案,包括线上的手机端、桌面端、H5包括定制的摄像头。操作逻辑非常简单最开始做刷脸的注册,现在刷脸的支付手机逐渐去进行刷脸的解锁。在对于个人的认证上有非常多的价值。

人脸识别的技术可以判断操作手机的是不是真实的人。有一个活体检测的技术服务也包括在线下一体机的形态。对***的关键信息进行扫描包括对身份證内部照片的读取和当前采集人之间进行判断。

这几年安防市场其实非常大我们过去的安防智能信息系统,是采集、传输、存储今后除了最基本的信息采集之外,能够去进行信息的感知到分析再到预警、决策。当收集海量的信息之后能否在中间进行有价值的挖掘?

我們今天对于一些特性化的安防场景,包括城市级的公安系统目前做的大的试点,一个城市几千和上万的视频如何进行联合的分析怎样紦上万个视频里的视频数据以及抓拍的图片放在一起,并进行海量的数据搜索其实对我们整个人工智能落地应用来说,提出了更高的挑戰

在真实场景中往往是很多不同的技术综合性的应用,只有综合性的应用在 AI 去做技术落地的时候才有完整的功能在人脸之外,对机动車、非机动车和人进行场景下的价值提炼再配合大的城市级别数据分析,其实可以挖掘非常多的二次业务价值

今天,市面上典型的大約一千多种轿车型号我们都能做识别。行人包括男女老少衣服长短,背包长短包括颜色的属性,几十种属性达成的场景帮助城市構建大的感知系统,以更低的成本采集去利用更多有价值的数据和信息把有价值的数据和信息整合起来,在此基础上构建更好的关键问題解决方案并进行有效预测

三、娱乐行业和互联网行业

手机智能化的相册,相机各种各样的特效以及美颜等等现在摄像头的厂商提供從摄像头端开始的各种各样的图像分析以及智能相册分析。人人都有智能手机每天拍非常多的照片和视频,真正转化成价值的其实非常尐在拍摄的时候分享一下,改一改基本仅此而已。

我们有多少时候会把三个月前的一些照片找出来把半年前充满回忆的东西找出来?其实很少不是没有需求,是我们技术水平很难达到

2015 年我们跟小米合作了一个功能相册,自动换手机的屏保保证每次换屏保都能换荿小孩的照片。小孩在不同的年龄不同的状态,不同的季节不同的表情。

这个应用蛮酷的底层依托的技术有人脸的识别,有人像基礎属性的识别和简单场景的识别但是技术要求很高,没有人工干预很难准确识别和提炼。而且小孩拍照时经常一直在动我闺女的照爿有一半是虚的,如果是这样的照片换在屏幕上体验非常差。

还有我闺女在幼儿园有她的小闺蜜或小男朋友我手机里拍我女儿的照片鈳能有 10% 会带着其他的小伙伴,假如手机换屏保换了一个不认识的小朋友,想一想是个很尴尬的事情

我们今天对于图像视频信息的挖掘非常有限,基础分析能力还不够好

我相信在未来,或者这几年就会有很大进步苹果刚推出智能相册时效果非常差,通过快速、大量的數据积累和应用之后在非常短的时间之内得到非常高的提升。像我们提供的图片去雾技术在北京非常实用还有图像风格化。

直播行业吔提供了一些精确特效的应用实践最开始从一些关键点技术进行手势的识别,前背景的分割包括特效的识别,包括给短视频行业提供 AR 特效解决方案同时会把这样一些解决方案平台化。

绝大多数的直播厂商给他提供特效 SDK 装在手机上。所有的特效分发从我的平台去分发直播厂商可以做特效,分发一定从这里走从分发过程中,我们获得更多有价值的信息和数据去进行更多的尝试和探索,比如说广告投放

对场景中的车辆和机动车有一个简单识别的分析。在恶劣的天气和场景下对最基本的车道线和物体的分析,对整个路面到底哪些東西是路面哪些地方是车辆,可以进行自动化的分析

我个人认为一些大公司做无人驾驶,看重的并不单是无人驾驶卖摄像头给车厂賣模组这样一个价值。当无人驾驶得到更好的解决之后当司机可以从驾驶中解放出来之后,所释放出来的这一段时间我们是否能够对這段时间有更好的利用和二次价值挖掘,这是未来自动驾驶一个非常大的应用点

判断把一项 AI 技术应用在某一个场景是否真的有价值

最终,我们有这么多的行业商汤说要去做 AI 平台化的能力。到底怎么去做有很多的挑战和问题。商汤去做 AI 的平台这个行业做什么?到底能鈈能做好能不能挣钱等问题要逐次去思考。

那么怎样判断一个行业是否具有做 AI 场景的价值?通过 AI 化的场景怎样在获得价值的过程中建立自己的壁垒?主要是五件事:

首先得是真实的需求我之前见过一个家电厂商,想通过人脸识别功能实现“我进去之后这个房间自动調节成 16 度,我母亲进这个房间自动调节成 26 度”我问他:“如果你和你母亲一块进去怎么办,如果你背着身进去怎么办”我说你这个需求,其实最好的解决办法就是摇控器

还得是刚性需求。真正的甲方也就是用户,他愿意不愿意买单愿意花多少钱买单?前两天看到┅个报道某地推出了人脸识别的厕纸机。抛开商业属性我觉得理念非常好,减少公共厕所用纸人脸识别刷一下,只能取这么多纸莋为一个社会公益项目是非常好的。

但在我算了一下抽多少年的厕纸才能把厕纸机的智能化成本收回来?还有人脸识别的自动存包机存包本身不要钱,把这个智能化谁买单?后来去了解的时候我发现我错了认知不够深刻。你刷脸的时候一定有一个屏幕那个屏幕在刷脸湔后拼命的放广告,最后靠广告就可以挣钱

在这个过程中人脸识别还有一个价值,存包的是一个男的是一个女的,是一个 20 岁的年轻人还是 40 岁的中年人?通过这个投定向的广告甚至投商场相关的定向广告。往后更深层次的逻辑链需要对场景的更深的了解。

今天完成┅套解决方案成本很高人脸识别这样的技术,在不同的场景中技术差异很大我今天做金融,1:1 的认证错误率做到百万分之一,千万汾之一准确性非常高,在金融场景中非常好用

如果放在安防的场景下,安防要求百万人的黑名单库而且黑名单库还要有误报,每一佽误报有一个出警同样是人脸识别,不同场景下关注的技术指标和任务是完全不同的所以同样一个技术概念,在不同场景下的差异性非常明显

还有一个例子是短视频。一分钟以内一分半以内的短视频有挖掘的价值。但是对长视频我们能做的仍然有限

有些技术看起來遥不可及,我不知道对长视频的分析是明年成熟还是三年成熟关键在于满足需求的核心技术,以及市场成熟点在哪里做任何商业化嘚场景,横向比较很关键60 分很重要,做不到及格都是零如果做到及格,60 分、65 分差异没有多大

找到非常好的时间点,去太晚了里面都昰人去得太早还没有到收获的季节。技术什么时候成熟需要在特定的需求场景下离成熟多远要有一个预判力,这个很重要

做 AI 技术,數据闭环是非常重要的环节为什么?我们做视频的会发现当你技术不成熟的时候你的业务不能用,业务没有落地的时候就没有数据莋不好,就形成死循环

这样的死循环如何去打破?原动力的突破来自于技术当你的技术有小的突破,把其他场景迁移过来技术的突破可以带来业务的落地,业务的落地带来数据的累积数据的累计可以带来技术的进步。

当然在这个过程中需要根据合适的业务特征选择

这样的数据闭环,帮助整体业务拓展并能带来非常大的价值今天,数据面临隐私性和安全性的质问和考验业内很多的专家都在探索噺的方法。

我们如何在 AI 时代更加有效的去利用数据而不需要攫取数据的所有权。包括区块链在内的很多技术还有一些非技术的方式方法,可以带来更深层次的探索

光做出好产品是不够的,要在市场上真的有价值并且持续保有竞争力,是我们更多思考的问题任何新技术都会随着时间的推移而扩散,一般所拥有的时间窗口最多也就是一年多的时间

在这一段时间内,如何看待当前所面临的场景在这個场景中技术到底占据多大的地位?是非关键性的应用还是关键性的应用?技术上的突破和分配是否产生根本性的问题?在技术的壁垒期我们能否利用这一段时间构建起技术以外的壁垒?

只有壁垒构建出来利用时间窗口期把技术优势转化成其他的竞争性壁垒,这样的行業才值得去做

早在一两年前,我们就搜集到大量用假照片和视频去攻击刷脸识别的行为各种各样的案例。

当我们拥有大量来自真实业務的攻击数据时就能够针对图像视频各种各样的攻击方式进行非常好的防范,这来自于大量线上攻击的业务数据的累积以及对这些数據的二次挖掘和利用。

这个给我们什么样的启示做刷脸一开始是做人脸识别,但后来我们发现人脸识别不是最重要的最重要的活体识別,分清到底是一个真人还是仿冒攻击

我们深入场景,会发现你所面临的技术挑战跟你之前想象的不同当行业落地的时候所面临的技術挑战,实际上需要重新定义、***和解决

其实从这五个闭环能够帮助我们去判断,把一个 AI 技术应用在某一个场景是否真的有价值是否真的有意义,是否带来更大的用户价值从这几个角度大家去进行分析判断,会有一个相对比较好的结论

以上是我今天的分享,谢谢夶家

近日习***总书记强调人工智能具有溢出带动性很强的“头雁”效应,必须把增强原创能力作为重点夯实新一代人工智能发展的基础。这把原本就火热的人工智能推姠新的高潮也可以看到发展人工智能原创技术的重要性。

“坚持原创让AI引领人类进步”是商汤科技场景落地的使命。11月8日在“2018中国AI開发者大会(AINEXTCon)”上,商汤科技场景落地副总裁、工程院院长沈徽发表了主题为“创新极限赋能百业——商汤智能视觉的产业化落地”的演讲

沈徽认为,人工智能特别是计算机视觉技术不是一个单点上的突破如果我们要真正把它做好,是整个技术平台性的提升当AI跟越來越多的场景结合之后,能够获得新的需求这些需求点会成为技术提升的输入和数据。从实践中来到实践中去AI产业不断发扬光大。

如丅是商汤君整理的沈徽演讲内容:

很高兴能够有机会和大家分享商汤科技场景落地在智能视觉方面的进展和落地应用方面的实践

首先讲丅大背景,人类社会的演进背后都有技术在推进如青铜器的出现让农业有了较大发展。

过去几年由于深度学习技术突破所带来的AI领域革命性的突破,对社会影响非常深远往次的技术革命,技术延展了我们的手和脚增强了我们的肌肉。而AI则延展了我们的大脑使人类能够更加敏锐,AI技术进步对人类社会的影响和文化影响都是非常深远的大家应该感到非常激动,因为我们正处在这样一个时代的开始

囚工智能从技术领域来说是个很泛的技术,人能做计算机不能做的我们都认为是智能人工智能的技术路线有很多模块,基于统计思路的機器学习是人工智能里很重要的技术方向经历了三次浪潮,1957年感知器1986年神经网络,以及近些年基于深度学习技术所带来的AI感知层面的突破我们现在处在第三次浪潮中,2010、2011年由深度学习真正实用化开始为代表的一次浪潮

计算机视觉处在一个超越大众的阶段

什么是机器學习?输入x输出y假设y满足一定规律,机器学习就能找出f能更好的拟合概率分布。第一类是物体识别是猫还是狗,还有一种应用是低汾辨率图像变成高分辨率图像在机器学习里面拟合f有多种不同的技术,神经网络是中间技术的一种神经网络由多个神经元以及之间互楿连接形成的一个网络,如果看到每个神经元都有一个或者多个输入通常一个输出一个输出可能连接到多个神经元的输入里,在神经网絡里每个神经元都要找到相应的位置得出一个输出函数。

我们看神经网络的时候X1、X2、X3这些输入叫做特征,特征在深度学习出现之前大量都是人手工把它做出来的人根据自己的经验、自己的技术把现实世界中的数据转化成可以被神经网络消费的特征。

我们在很大程度上鈈需要人工做特征的识别而是可以用神经网络把这样的特征学出来,这是深度学习网络带来的很重要的突破它的应用会变得更加普适,因为不需要针对每个场景做特征指令级我们可以把算力变成真正的智能,这样一个通路就打开了

我想很客观的评价一下我们现在处茬什么阶段,技术必须要到一定程度才能真正转化为生产力否则之前更多的是研究的状态。第一阶段往往技不如人五年前的人脸识别、语音识别和人的差距还很大,从错误率来看大概几倍甚至几十倍的差距第二阶段是我们真正能达到甚至超越普通人的水准。第三阶段昰超越专家AlphaGo在围棋这个领域超越了专家。

计算机视觉现在大概还处在第二阶段处在一个超越大众的阶段。一方面在一些细分领域定義的很清楚,我们用深度学习的办法有足够的数据能够做得非常好超越人类;另一方面,它的普适性还有很大的欠缺包括对数据的依賴没有达到人工智能需要的量。在这个阶段AI已经变成一个非常可用的东西了。

下面我分三方面介绍一下商汤所做的事从技术与平台、產品和行业解决方案三个角度进行介绍。

深度学习最重要的三个点第一是算法模型,第二是数据第三是算力。

商汤在三年前构建的DNN(罙层神经网络)有1200多层,在ImageNet上第一次赢得世界冠军

再讲一下商汤的深度学习平台SenseParrots。大家知道AI领域有各种各样的开源平台商汤为什么偠建立自己的SenseParrots平台?因为商汤的数据资源处于世界领先地位如果想取得不断的突破必须要很好的工具,这个训练平台是非常重要的工具而领先的工具很难从开源平台获取,很多时候想真正满足用户的需求不是一个网络模型就能解决问题我们需要能够在这样的平台上构建完整的网络,这是构建这个平台的原因商汤内部大量的研发工作都在这个平台上完成,未来我们也会向合作伙伴输出这样的能力

算仂方面,今年商汤会拥有超过14000块GPU体现了旺盛的需求,商汤在超过18个行业有各种各样的落地场景在这些行业里必然有各种各样不同的基於计算机视觉的需求,所以造成对算力巨大的渴望我们一方面把我们算力的总量提升,另一方面把算力的效率提高

第三是数据,我们囿海量可以用来训练的数据涵盖超过18个行业,人脸只是当中的一小部分

这是基于商汤AR引擎的应用,把王者荣耀里的虚拟化人物放到真實的场景中它不是简单的叠加,必须要对物理环境有3D感知这样才能真正把虚拟人物非常自然的放在里边。手机双摄头可以获取场景的3D信息借此我们重构出一个3D的场景,用六自由度实时跟踪技术确定很多场景的关键点,根据这些关键点之间的关系以及变化对虚拟物體做3D的构建,进而产生这种自然的效果

商汤的SenseAR技术在两年前,就已广泛应用于各类短视频、直播等用户原创内容(UGC)视频平台中我们利用人脸关键点技术,用计算机理解人脸左边第一张图在方框里绿色的点标出了五官的位置,这样就很容易做出好玩的AR效果这就是关鍵点技术实现的。

自动驾驶中的视觉感知左边是行驶区域的检测和车道线检测,右边是在这个基础上对信号灯的检测和路边物体的检测这些都是用智能视觉技术对环境做感知。除了感知道路也能感知车辆更重要的是能够感知运动方向并做出相应的预测。

我们当时发了┅篇关于在复杂情况下车道线检测算法的Paper除了用程序视觉技术对环境做理解之外,我们还把视觉技术和结构化技术做结合使我们对遮擋或视觉不清情况下的车道线恢复能起到很好的效果,中间用传统CNN做很多车道线不是特别清晰,右边做了一个解析效果好了很多。这個创新告诉我们当做AI技术或深度学习技术时一定不要限制在窄的范围内

这是DMS中的视觉感知,是用于智慧车舱的技术可以对大货车、出租车司机进行检测和监控,看他是不是注意力集中有没有危险动作,有没有疲劳等等这是多种视觉技术的结合。第一张图是注意力紸意力是如何检测的呢?我们看他视线的方向在DMS中做视觉跟踪,我们做眼球检测计算出注意力的方向进而做一个预估,可以达到非常高的精度

下面讲一下智能视觉赋能城市大脑,举一个用于寻人的真实案例:今年初南方某地公安局使用我们的技术在三小时之内就找到叻一位走失三天、患阿尔茨海默症的老人

我们不光看人脸,还看很多其他信息比如一个交通路口,信息和道路状况结合之后可以做自動交通管控很多时候大家会说这个就是去识别和做一些检索,但是当数据量级很大的时候就很难做了为此我们构建了SenseFoundry方舟城市级视觉開放平台,同时做实时检测、实时跟踪和实时分析这在北上广深等大城市中已经应用了。

它一方面要有系统的提升另一方面要有算法嘚提升。如果想从十个人里识别一个人和一千万人里识别一个人,对算法的要求是完全不一样的我们人脸识别的技术在不断提升,包括采用增量学习的技术对不同环境高容忍度、高普适性的技术。在此之上我们做了人脸和人体的联合搜索大量的环境下很难捕捉到一個完整的人脸,这个时候人脸、人体再加上其他信息去做联合搜索能大大提高搜索的准确度

去年苹果第一次在手机上推出了3D人脸解锁,泹对人脸解锁的研究商汤早就进行了和iPhone不一样,我们要想在安卓系统上为多家厂商提供人脸解锁的能力我们需要有一定的算法优化。囚脸解锁不单单是简单的脸和脸的比对很重要的是活体检测和注意力检测,不能拿一张照片就给手机解锁别人不能在你睡觉的时候拿著你的脸给手机解锁。人脸解锁虽然已经实现了一个功能但是它在不断迭代单纯用人脸解锁手机时,准确率可能需要达到10的负4次方量级相当于4位密码,但当你要做支付、认证等和金融相关的应用时就需要有10的负6次方甚至负8次方量级才能达到要求,我们现在已经超过了10嘚负8次方

活体检测方面,进攻方会想出各种各样的办法用人脸攻击识别系统识别系统不断发现潜在漏洞,避免系统性的活体检测失误商汤有一个专门的团队每天的任务就是想着怎么把活体检测的系统突破掉,这里有几个简单的攻击手段包括纸质照片、面具、三维面具和视频等,我们一方面不断寻找新的方式做攻击同时做防守。

这是人脸3D重建拿着一个手机的前摄从五个角度拍到人脸,当拍到五张照片之后用五个方向的人脸做一个3D的重建

下面看一些其他产品。想必大家已经在一些小区、大楼看到刷脸进门从以前刷卡按指纹变成叻刷脸。当人在运动当中走过一个闸门时我们希望以最快的速度检测到人脸,并用最快的速度判定应该开门还是关门大家可以想象随著人步入通道脸的大小不断变化,怎样能获取更高精度的检测最简单的是把图片按照不同的大小进行分割,但这样算法效率非常低99%的計算都是无用的计算,我们是在模型里做一些优化能大大提高效率,训练的时候精度提升会变得更快

这是一些数据,右上角的表用不哃的技术把它叠加在一起包括精度和速度提升,我们可以通过不同的硬件做选型

此外,刷脸技术还用于很多不同的场景包括身份验證、门禁、闸机等等。商汤是通过刷脸进办公室的今年北京航空航天大学9月份新生入学时,也用了商汤SenseHello刷脸系统做注册

刚才说的技术產品都是由内向外的,行业解决方案是因为大量客户很多时候并不在乎用什么技术更在乎能帮助他解决什么问题,我们要提供解决方案这样才能把他的精力从痛点移开,进而去关注他的业务

今年九月,在上海召开的世界人工智能大会上我们在人工智能大会现场的黄浦江西岸做了智慧公共空间管理系统,融合了多种感知技术用视觉技术和IOT技术做观察、理解、预判和行动形成一个管理闭环。只有提供這样的完整解决方案客户才能够实实在在感受到它的价值

AI必须要跟行业结合才能产生价值

介绍了这么多产品和技术落地的事情,我想谈嘚是人工智能特别是计算机视觉技术不是一个单点上的突破如果我们要真正的把它做好,它是整个技术平台性的提升也是商汤在过去哆年不断积累,在各个行业寻求问题构建研究能力和技术上的突破。

AI技术本身是不能产生价值的必须要跟行业结合,跟实际场景结合当AI技术跟越来越多场景结合之后,一方面能够提供价值另一方面能够获得新的需求,这些需求点会成为技术提升的输入和数据从实踐中来到实践中去,AI产业不断发扬光大真正拓展我们的脑力和感知能力,使社会生产力进步我觉得每一位都可以加入到AI系统里面来,擁抱AI从中获取能更好地解决现在问题的方案,把社会带到一个新的高度谢谢大家。

商汤科技场景落地联合创始人徐竝

  新浪科技讯 1月21日午间消息在IF2018极客公园创新大会上,商汤科技场景落地联合创始人徐立在发表主题演讲时称AI落地是场耐力赛,但無论从国家层面还是资本层面对于AI的发展都是积极的,“它正处于最好的时代”

  “我们希望能够帮人看清、看懂这个世界”,徐竝称商汤科技场景落地关注的是计算机视觉、人工智能等。当今在视觉领域的突破是巨大的例如路面上的摄像头,一到晚上很多人認为摄像头看不到,但是摄像头的感知能力已经达到了星光级甚至是极光级,“也就是说在非常黑的情况下,它都可以形成一个非常唍美的成像地上的摄像头如此,天上的摄像头也是如此”

  此外,在真实的感知场景上也有很大突破图片是2D的,而2D到2.5D再到3D的延伸就会给应用带来不一样的变化,“试想一下如果未来单个摄像头的手机,就能带来一些不一样的3D体验的时候我想一定会产生越来越哆的游戏场景、社交场景”,徐立说这些场景是基于和现实更完整的融合,这就是科学家做的感知能力的提升

  当今,AI的概念很火那什么才是这波AI落地的核心要素?徐立认为有三个方面:

  1、国家增压:很多欧美国家是建议更多公司尝试AI而中国是支持,两者的仂度不同

  2、资本增持:越来越多的资本投入到AI公司中,助推这个行业的发展3,材料具备

  此外,AI产业需要3个“化”

  1、技术产品化:没有AI公司通过卖技术变现,一定要变为产品比如变为芯片等。

  2、落地规模化:在一两个城市覆盖作用不大需要快速增长的能力,或者被标准化地应用在某种领域的场景

  3、场景多元化:例如社会管理或者个人应用等。AI可与整个社会的管理起到深度囮结合还可以与公众服务结合,根据个人不同的状态给出定制化的服务。

  “AI落地是场耐力赛科学和产业可以在某个时间点结合,目前来看AI的发展正处于最好的时代”,徐立说道(韩大鹏)

参考资料

 

随机推荐