NVIDIA金洋:NVIDIA GPU enable autonomous driving

金洋:大家好,我是英伟达公司的金洋。刚才听到了绿盟李总给大家介绍了汽车安全,我今天站在这里从人工智能角度给大家介绍一下如何去实现更安全的驾驶。

想问一下大家,对于一台汽车来说,最不安全的部件是什么?或者最不可靠的部分是什么?如果大家做一些研究和搜索可以发现,交通安全中,94%都是由于驾驶者出现了疏忽、出现了判断错误、出现了一些不该有的问题导致的交通事故。如何让汽车更加安全,有一种方式比人更加聪明、比人更加智能,人工智能的出现使得汽车的无人驾驶有了新的方向。

从人工智能发展角度和人类文明的结合来看,人工智能扮演什么样的角色?

首先有计算、PC的出现,随着互联网的出现,有了移动计算,包括高性能计算中心,同时有一些云计算,包括人工智能的出现。人类社会的发展从开始的工业革命、蒸汽革命到电力革命,一直是在解放人的物理能力,也就是说提高人的生产力水平,提高人的物理界限,使得人可以获得很大的力气,可以获得很大动能的释放。在智力方面,在智能方面,人类社会的发展一直没有达到或者超越人类本身的智能。

今日谈人工智能时,主要想我们是否有一种新的方式可以创造一个机器,可以创造一台电脑,它的智力、人工智能比人还要聪明。

之前很多科学家为了实现这个远景,想了很多办法,比如基于边缘检测、基于特征识别的图象识别方式、实现人工智能的其他方式,其实都没有达到好的效果。今天我们看一下AI人工智能到底迎来了一个什么样的关键性阶段,使得人工智能发展到一个新的高度。

NVIDIA是一家成立20多年的公司,最早大家对于NVIDIA的了解,是NVIDIA的显卡非常不错,买回家玩游戏。这二十年当中,NVIDIA发生很多变化,已经从一家专注于显卡的公司演变成了一家专注于人工智能计算的公司。

如图,基于面向人工智能推出的服务器,DGX1,有很多家公司已经买了,比如大家耳熟能详的微软、谷歌、Facebook,国内的百度、阿里、腾讯,都在买NVIDIA服务器产品进行人工智能的计算。

中间还有游戏照片,游戏是NVIDIA的主要业务。机器人,是人工智能的雏形。这两年人工智能非常火热,大家非常熟悉的一个名字叫做Alpha Go,由谷歌研究出来跟人进行对弈的机器人,Alpha Go背后也是用NVIDIA的GPU。

人工智能发展了很多很多年,但为什么在今年出现了Alpha Go,为什么今年出现了基于人工智能的无人驾驶,今年出现了基于人工智能的很多机器人,发生了什么样的变化,使它第一次达到了人的智力。

深度学习是一个理论,深度学习是科学家一直觉得非常有前途去实现人工智能的一种方法。深度学习有很多实现的途径。如图,这是一个比赛的结果,这个比赛叫ImageNet,这个比赛是用来识别图象的,74%、96%是识别图象的准确率。人对于图象识别率基本是93%到94%的准确率。

如何算出来的?一个人去看几千张、几百万张图片,进行图象识别,人是会犯错的,93%、94%是人的识别率。2010、2011、2012年,用人传统编写程序的方法编出的程序进行图象识别,准确率是74%。也就是说基于人去编写程序的结果,对于图象识别最高的准确率就是74%。但是通过深度学习去实现图象识别的准确率从74%到了90%多,到现在达到了96%。也就是说电脑第一次在图象识别领域超过了人,比人看得还准。

这是怎么实现的?深度学习有两个关键因素:第一,大数据;第二,非常高效的定型计算的能力。举例,让电脑去识别马。传统编程人员会给电脑编写程序,条件1,四条腿的是马;条件2,脸长的是马,电脑进行识别时就会比照十个条件,如果满足这个条件就认定是马,这是传统的方式。传统的方式识别率最高达到74%,为什么?

因为真正在大自然当中,马的照片也好、图画也好是非常复杂的,比如给电脑看一张水墨画的马,一张卡通的马,或者在喝水的马,或者万马奔腾的马,这些照片,电脑都会识别错误。

深度学习怎么做?深度学习会拿出一张马的照片,告诉电脑这个是马。拿出第二张照片,告诉电脑这还是马。深度学习会将几千张、几万张,甚至几百万张马的照片给电脑去看,让电脑记住这都是马,但不会告诉电脑说为什么它是马。

电脑自己通过大量数据的训练总结出马是长什么样子。这样一个方式,如果拥有足够多高质量的数据,比如几千张、几万张、几亿张、几十亿张这样的数据库去训练这个电脑,最后得出的结果会非常准确。这时候再拿出一张马的照片让电脑识别,会准确说出是马还不是马。

这个理论一九五几年就有了,但是因为这种训练的过程时间太长了,如果一台基于CPU的服务器,基于CPU的高性能计算中心进行几百万张照片的训练,可能要十年或几年才能训练完成。现在基于GPU,基于显卡,基于一个具有3072核心的图形处理器进行训练,同样100万张照片,2个小时可以做完。

现在不仅在图象识别方面,在语音识别方面,比如科大讯飞进行语音翻译,也是用NVIDIA的GPU,电脑对于语音的识别率也超过了人,对于图象的识别率也超过了人,对于视频的识别率也超过了人。基于GPU、基于深度学习,人工智能第一次达到了一个我们预期的效果,比人还要聪明。

2012年,多伦多大学基于4片NVIDIA的GPU做的一个模型,现在有专门深度学习作出的GPU。基于现在BAT、百度、微软、谷歌,所有国际、国内大公司,只要做深度学习,都在用NVIDIA的GPU做这方面的计算。

NVIDIA的GPU和汽车有不解之缘,一开始NVIDIA的GPU就做一些仿真模拟、一些测试,使汽车厂商更方便设计他们的汽车,以及进行汽车工业设计,使汽车非常漂亮。这两年我们将人工智能带到了汽车。基于人工智能的运输业产值非常大。

无人驾驶特别难。如图,世界非常复杂,世界是无法预测的,同时这个世界也有由雾霾、下雨等组成的,同时有太多太多的事情要去学习,不仅对于人工智能汽车来说,对于人也是一样的。如图,一个林间小道没有任何标识,如果这台汽车是基于摄象头标识检测方式,需要找标线,没有标线,怎么在林间小道走?比如中间骑自行车的同学忽然窜出来。

同样都是汽车,优先级不一样,校车、救护车、警车,这些车可能不遵守交通规则,这些车有自己的规范,作为无人驾驶的汽车无法识别这些车,更不可能预测到这些车下一步动作是什么。比如标线已经被雪掩埋住了。

如何在复杂的世界当中去实现基于深度学习、基于人工智能的无人驾驶?将无人驾驶分成四个部分:首先要有一个非常非常高精度的地图(Map);需要把自己定位在这个地图里面(Localize);(Perception)这台汽车要认识周围了一切,知道这是云、这是鸟、这是车、这是广告牌,而不仅仅是将所有的一切进行图片库的比对。

比如前一段时间有一个知名品牌出了一个交通事故,前面出来一台车,这台车的特征并不符合任何一个已知图片库的一台汽车,所以无法将那台汽车看成汽车,而发生了交通事故。仅仅简单进行比对是无法认识这个复杂世界的。最后是Drive。我们最关键的是第三个环节。

我们将深度学习算法放在一台汽车里,让这台汽车看周围世界时不仅仅是象素,并不仅仅是红绿蓝,可以将这些物体识别出来。将大量汽车数据库进行训练,使得这台车训练之后具有人工智能的脑子,可以识别出车、人。

如图,在雨雪天,在最远端黄色一闪一闪的是在行驶过程中的车,如果是人的话,可能因为看错或看不清就忽略掉了,而出现交通事故。基于人工智能的无人驾驶汽车可以发现很复杂天气环境背后隐藏的一些危险,包括一些自由空间的检测、汽车3D的检测,都是非常关键的事情。

如视频,NVIDIA做的基于深度学习的无人驾驶汽车,第一天上路,第一天学开车时的样子,很快进行了学习,很快又知道如何去开车,即使这条道上没有任何标志,也可以像人一样去开车。在一个建筑工地,可以自如的知道如何开出来。

在加利福尼亚进行学习的这台车,我们第一次把它放到新泽西,它第一次来到新泽西,就已经会在新泽西这边开车了。

这一台车从第一天上路,各种撞、各种发生交通事故开始,经过了一个月,经过了3000公里的训练,可以非常自如应对各种复杂的状况。在这一个月当中,编程人员什么都没干。

我们并不是像传统无人驾驶厂商一样,每天要加更多代码,将更多图片放在里面,每天要修正它的错误,都不需要,因为这提车本身是深度学习,有12个摄象头,每天有大量的视频信号进来,每天可以学习其他车怎么去开,可以学习驾驶员怎么去开,每天不断地学习,经过一个月3000公里的训练,可以像人一样从不会到会。如果再经过两个月时间,这台无人驾驶的车会在大街上继续开,每天进行大量的训练,还是不需要对它进行编程,会自我学习。

基于深度学习的无人驾驶最大的优点是可以每天都会比前天变得更好。就像Alpha Go跟人下围棋一样,即使它今天输了,没有问题,作为谷歌,再拿出10万个棋谱训练,让它学习,再拿出100万个棋谱视频,Alpha Go会更加聪明,迟早会打败人类,人别不会打败它,为什么?基于大数据训练的模型、深度学习的方式非常适合现在计算行业,因为现在计算行业有两个东西是最富余的:1、大数据。

基本任何一加大公司都有大量的数据;2、计算能力。很多国家超计算中心,很多公司服务器都是闲置的。深度学习的出现,使得大数据迸发出人工智能。

NVIDIA为代表基于GUP的深度学习的方式目前在引领整个汽车行业无人驾驶的方向。NVIDIA汽车方面做得怎么样?我们做得非常出色,首先目前在全球有超过1200万辆汽车搭载了NVIDIA公司的处理器。

大家耳熟能详的有宝马、奥迪、特斯拉,包括大众高尔夫、帕萨特、迈腾,里面的显示器、中控都是NVIDIA的,但是这件事情只是做显示输出,只是让仪表盘、中控更加漂亮,对于NVIDIA来说并不是什么难事,真正厉害的在于无人驾驶。

NVIDIA在无人驾驶方面做得怎么样?目前无人驾驶做得比较出色的公司有奥迪,奥迪测试的A7、A8都做得非常不错,奥迪全线无人驾驶都是NVIDIA提供;沃尔沃,Drive me是著名的无人驾驶计划,明年有100辆无人驾驶车进行测试,全都是NVIDIA无人驾驶的产品;特斯拉,从上上周开始,已经宣布每一台无人驾驶特斯拉都会搭载NVIDIA的芯片、GPU。

NVIDIA公司现在在传统的汽车多媒体仪表盘方向的地位毋庸置疑,同时我们还和所有Top无人驾驶汽车的厂商进行合作,沃尔沃、奥迪、特斯拉,推出基于深度学习的无人驾驶解决方案。

谈了很多深度学习、谈了很多无人驾驶,为什么深度学习适合在GPU上?因为GPU核心数量比较多,GPU有几千个核心。现在不管是高性能计算、无人驾驶,还是深度学习,还是VR、图形,所有这些复杂的计算背后的处理器都早已经不是CPU了,都是GPU。

NVIDIA传统的产品已经演变成了很多领域中的中流砥柱,比如无人驾驶的车,无人机,包括一些智能设备,有针对特斯拉推出的一些并行计算产品。整个这样的布局基于GPU人工智能的并行计算时代已经到来。
谢谢大家!

上一篇:绿盟李东宏:隐秘的黑手——车联网安全隐患分析

下一篇:红石韩黎光:智能汽车标配的FOTA升级如何提升车联网安全的体验