注册

余凯:人工智能让未来出行更加美好


来源:财经网

12月1日,2017英特尔中国行业峰会在苏州金鸡湖国际会议中心举行。此次峰会汇集900余名来自政府、金融、互联网、教育、电信等行业的精英代表,更有国内外顶尖的产经知名专家和英特尔高管带来的真知灼见,他

12月1日,2017英特尔中国行业峰会在苏州金鸡湖国际会议中心举行。此次峰会汇集900余名来自政府、金融、互联网、教育、电信等行业的精英代表,更有国内外顶尖的产经知名专家和英特尔高管带来的真知灼见,他们以全球化的视角来剖析我们所面对的未来世界。此次峰会上,地平线机器人技术公司创始人兼首席执行官余凯博士认为在中国做自动驾驶关乎到我们每一个人,也关乎一个国家的核心竞争力的未来,利用人工智能让整个交通出行未来变得更加美好。

微信图片_20171204140735

地平线机器人技术公司创始人兼首席执行官余凯博士

中国的汽车产业拥有巨大的市场,它还在不断地去增长,但是这个带来的也有很多挑战, 比如堵车塞车,交通事故。地平线机器人技术公司希望可以用人工智能,可以用高性能的计算,可以用非常高效的边缘计算,使得我们的交通出行更安全。通过利用人工智能让整个交通出行未来变得更加美好。

地平线希望能够去做这方面的一些工作,使得我们充分地去面对在中国的交通出行的路况下面所面对的挑战,同时也充分地去扮演一个技术供应商这样一个角色,为我们出行运营的服务商,以及政府相应的法律法规决策提供支撑,为行业复制赋能。

以下是余凯博士的演讲实录

地平线机器人技术公司创始人首席执行官余凯博士:各位朋友,大家下午好!

今天在这里作为一名来自创业公司的创业者,尤其特别的是作为英特尔的被投企业的家庭的一员,非常高兴在这边跟大家汇报分享地平线在打造自动驾驶的大脑方面,我们的一些思考, 我们的进展,以及我们怎么去思考未来。

地平线是一个成立两年四个月的创业公司,我们总部在北京,但是我们在南京、上海都有相应的研发的机构。整个公司现在有超过300多名非常年轻的员工。其中绝大部分都是工程师,包括软件,算法,包括硬件,而且有意思的一点是说,我们的这个工程师博士比例比较高,因为我们是一个非常注重核心的初创型企业。

地平线所思考的为自动驾驶打造大脑的方案,包括软件,包括硬件的系统。同时,光在车方面去部署这样的一个大脑是不够的,因为它必须有地图,必须有大数据。自动驾驶未来一定是边缘计算的最大场景。同时我也告诉大家,未来自动驾驶也是云计算的最大场景。我们在中国做自动驾驶因为它关乎到我们每一个人,也是关乎一个国家的核心竞争力的未来。中国的汽车产业拥有巨大的市场,它还在不断地去增长,但是这个带来的也有很多挑战, 比如堵车塞车,交通事故。我们希望可以用人工智能,可以用高性能的计算,可以用非常高效的边缘计算,使得我们的交通出行更安全。通过利用人工智能让整个交通出行未来变得更加美好。

谈到人工智能,我们每一个人其实都会谈深度学习,我自己是在业界最早从事深度学习这个领域技术的研发和创新,我们看到深度学习实际上是人工智能在过去的60年的时间里面,它的发展到今天是最激动人心的方向。 在过去的60年, 前30年是基于逻辑规则的理想化的系统,80年代末到现在是一个大数据驱动的人工智能的系统。为什么叫大数据驱动?其实简而言之,这里面一个关键的词就叫学习。学习就是从经验中不断提升自我。那么数据就是经验,经验就是数据。这是我们为什么讲今天的人工智能越来越多的是说基于大数据的这种人工智能,是因为我们希望人工智能系统能够像人类一样不断地从经验,从教训中不断学习,不断提升自我。

那一谈到大数据,我们肯定谈到计算,一谈到计算,我们就会想到英特尔,我们就会想到摩尔定律,在过去半个多世纪,不断推动信息产业往前发展。人工智能的模型,从浅层次的模型,到现在的深度学习,到增强学习,我们对于大脑的理解,对于深对神经网络的理解,其实也在不断加深。我们传统的机器学习的系统,是一系列的步骤,从数据的采集端,大数据的变换,到特征的抽取,到最后的预测和判断。过去的话,其实大部分的研究工作都是在最后这一步,前面的所有的这些步骤,看似非常的枯燥,非常的繁琐,但是他们非常重要,有很多的原因。什么是深度学习?深度学习就是说很多的这些人工步骤,这些中间的数据抽取和变换的步骤,能用更简洁的方式来做,把中间所有的人工步骤都替代为从数据中学习的步骤,从完全的从一开始到最后都是基于数据的学习,就是我们讲的是端到端的学习, 这也是我们今天深度学习的面貌。端到端的学习方式,除了直观的好处以外,比如说简化中间的这些步骤,减少人工干预,它在计算意义方面也是非常有好处,它真正是拥抱大数据, 随着数据规模的增大,深度学习的效果在不断变好。我们看到在过去的5年时间里面,深度学习突然一下使得我们在很多领域,图象识别、语音识别,甚至我们下围棋取得突飞猛进的令你想象不到的进展。我们思考未来的话,实际上深度学习所带来的重大的变革实际上是基于一个大数据的一个训练。

但是,实际上我们也必须去思考,基于这种大数据的训练,实际上它跟人的这个智能其实还有那么一点点的差距,这个差距是什么呢?因为比如说一个小朋友,他看过一张米老鼠的照片,所有的米老鼠的图,各种的形象,他都是可以立刻就认出来,他不需要那么多的大数据。 怎么样去突破人工智能对大数据的这种赤裸裸的依赖,实际上是现在的人工智能所面对的问题,尤其是对自动驾驶。因为衡量一个自动驾驶,它的系统的可靠性,安全性,稳健性实际上是什么?是在交通意外发生的时候,它究竟表现怎么样。这种意外情况本身的特征就是你在过去的时候,你不容易碰到的。这种不容易碰到的,就是说明你过去的大数据可能是失效的,因为你在这个意外情况永远面对的是小数据,怎样面对小数据的问题,这是人工智能、自动驾驶所面临的一个根本问题。关于这个问题的话,我给大家去回顾一下过去人工智能取得的两个了不起的成就,来找到一些启发。 其中的一个成就,是我过去所亲自做的一项工作,就是用深度学习提升整个搜索的相关性。实际上我们是用一个人工智能的系统来训练搜索的相关性。 比如说用户输入一个数据,会出现一些链接,他点击这个链接,另外一个链接没有点击,他认为这个更相关,这样的信息被我们捕捉到,我们形成这样一个所谓的叫三元组的训练样本,用户每天都在产生这样的数据,我们很容易产生无数的没有限制的数据,所以我们最后用一千亿的例子去训练这样一个大的神经网络,所以这里面实际上意思就是说用自然界自然产生的数据去训练模型。在自动驾驶里面,比如说司机每天都在做判断,他每天都在避障,每天都在开车的路上面让自己更加的安全,这个里面司机其实产生大量的训练数据,我们可以利用的。

第二个启发是大家都知道的ALPHAGO,今年第三代ALPHAGO叫ALPHAGO ZERO,是通过左右互搏产生的虚拟数据去训练它,提升它,它完全没有用任何人类历史上的棋手所产生的数据,这个也给我们启发。这个启发就是我有可能在仿真的平台上面产生虚拟的数据,而不是虚拟产生真实的数据驱做。这两个思想实际上都启发我们去做自动驾驶,这样的一个系统,我们希望它能够从用户大量的每天实际的行为里面去学习,我们希望它能够从很多虚拟的仿真的平台上产生的虚拟数据中去学习,这样的一个系统,它是一个学习的系统而不是一个用人工标注数据训练的系统,这个非常重要。

打造高性能的自动驾驶的大脑需要全栈式的软件硬件结合,从本地端到云端的配合, 也就是一个全栈式的技术解决方案。 在软件算法的设计上,自动驾驶来软件框架它必须有这种透明可追溯性。什么叫透明可追溯性,就是说如果一辆自动驾驶汽车在路上面出现某一个不完美的行为,或者某一个奇怪的决策跟判断,那我们需要知道,是什么原因。如果我们不能知道它是什么原因,而是一个黑箱系统,我们就找不到提升这个系统的办法。第二点就是端到端的学习,第三点是软硬件的结合,因为这是在路上跑的硬件,怎样使软件和硬件更高效的配合,达到最佳的效率,最低的功耗,最好的实时非常重要。

我们先讲第一个点,神经网络正在逐步的受到重视,其中核心的原因是因为它把一个人工智能的系统分解成一个白箱系统,这样的白箱系统使我们可以利用和构造一个软件系统,它既有深度神经网络所有的优点,同时使这个网络整个来讲的话,对我们来讲他是一个透明的可理解的,我们可以控制的,可以不断提升的,具体的技术细节。

未来自动驾驶的硬件平台需要在软件任务上面能够达到充分的优化,很难有一个固定的硬件架构能够适应软件的不断发展,是FPGA的可重塑性使得它能灵活满足。我们可以根据不同的驾驶场景从辅助驾驶到半自动驾驶等不断地演进它的硬件架构。我们和英特尔从去年的11月份开始合作,到现在发展也非常的快,在英特尔的FPGA上实现非常复杂的计算, 在ASIC上开发软件和硬件系统。基于英特尔的FPGA所实现的深度神经网络的计算不光是实时更流畅,像素的计算跟处理更精确,更强大,同时, 它提取信息的纬度更加丰富。充分通过软件和硬件的充分的协调和优化,我们未来能够不断地去迎接自动驾驶的挑战。

另一个例子是在城市道路工况上面,我们不仅仅是要知道这个行人在哪个位置,我们需要知道这个行人在未来5秒他可能往哪个方向走,这个关乎我们路径规划的决策,比如说这个视频里面,实际上我们检测每一个人脸的朝向,大家可以看到,因为脸的朝向关乎他未来行走的方式,人大概率不会往脑袋后面走,整个的身体的姿态的动作,它都会帮助我们去预测下5秒钟行人往哪个地方走。地平线基于这样的一个平台推出了国内第一款所谓的叫自主代客泊车,它会试运营两年,然后我们把它大规模的产品化。对共享出行而言,自动驾驶的第一场景是你把这个车开到一个商场,你要和朋友吃饭,那把这个车停在这个地方,这个车是会自动找无线的充电桩,会自动找这个停车场。

刚才讲了车载端的软件和硬件的配合,软件的透明和可追溯的设计,使我们在车载上面达到这样一个性能。但是同时我们还需要云端的大规模的计算。因为我们的数据是在不断增长的,未来传感器增长的数目是高于我们人口增长的速度。每一辆汽车如果它用2小时,一天产生4个TB的数据,但是如果是对共享出行,一天会使用大概6到7个小时,这样的话,它会面对10个TB的数据,一千辆这样的汽车,实际上每天所产生的数据数目规模就会大于整个百度的图像搜索引擎的规模。可以说未来的自动驾驶实际上是跑在四个轮子上面的超级计算机,是跑在四个轮子上面的数据中心。我们需要去构建一个这样的云端的大脑,使得很多的本地的这些驾驶的遇到的这些CASE可以传大云端,能够会聚,能够整体更新模型,更新到每一个车上面,尽管这样不是实时,但是他的运算,他的软件,对这个框架的要求都是非常高的。

同时还有一点很重要的是说,在云端的学习不仅仅局限于物理世界, 它同时一定包括在仿真平台,仿真平台的的数据量是物理平台的1千多倍, 更重要的是说,他不仅是数据量的差别,更重要的是你在虚拟的世界里面,你敢于去尝试很多你在现实世界里面不敢尝试的路况实验。

这样全栈式的解决方案,我们思考的这样一个技术路径,是说未来基于计算,基于人工智能,基于数据,它一定会使得未来的交通出行产生革命性的影响,从技术来讲,一个核心的观念的转变是说,我们要去打造云端结合的这种自主学习的汽车,而不是说是被训练的汽车。从软件的思考来讲,我们一定要去思考软件系统的透明性,不仅仅是说它预测是不是准,我们一定要知道人跟机器的共存,要求我们让我们知道充分能够掌握这个机器它所背后,他所做的每一个动作背后的原因。第四点就是说,软件跟硬件的协同的优化,是获得我们这个在车载端的实施最佳性能的一个充分的性能的必要性的保障。地平线希望能够去做这方面的一些工作,使得我们充分地去面对在中国的交通出行的路况下面所面对的挑战,同时也充分地去扮演一个技术供应商这样一个角色,为我们出行运营的服务商,以及政府相应的法律法规决策提供支撑,为行业复制赋能。

[责任编辑:刘斌]

  • 好文
  • 钦佩
  • 喜欢
  • 泪奔
  • 可爱
  • 思考

热点推荐

热点聚焦

凤凰新闻 天天有料
分享到: