【今日头条】华体会体育龚建伟:多元大数据迁移学习类人驾驶决策与控制技术
华体会体育(中国):2017-12-14 供稿:来源:今日头条 编辑:薛乔丹 审核:王征 阅读次数:
原文标题:华体会体育龚建伟:多元大数据迁移学习类人驾驶决策与控制技术
非常高兴有这么一个机会和大家一起分享,我今天演讲的题目是多元大数据迁移学习类人驾驶决策与控制技术。那为什么要提多元大数据呢?我们前面一直在说个性化的学习,就是如何利用一些小样本的数据来达到学习效果,之所以一直利用小样车数据,这实际上有一个障碍没有克服,那就是不知道怎么样如何去利用海量数据进行学习训练,数据量一多也就不知道怎么样处理了。现在我们的数据越来越多了,我们在进行数据采集时,单一行驶场景下的少量数据,我们很快就可以处理下来,用于机器学习也可以达到一定的学习效果。但是如果是一台车跑一天,数据量就非常多,那这些数据该如何利用,用来进行提升无人驾驶车辆的智能水平,如何进行学习训练?
小样本数据学习,就不可能实现持续的优化学习,还有可能会造成学习的负迁移,比如刚开始一个驾驶技术很好的驾驶员数据学习,但是又把一个很差的驾驶员的数据放进来的话,这个样本就可能把前面的训练结果损坏,那么怎么样去做这个工作?此外,成百上千个驾驶员,怎么样去实现自动驾驶智能水平的提升?数据如何采集?数据如何分类?怎么样分析这些数据,这是大量数据处理并用于机器学习时很关键的一个问题。
下面我结合一些研究实践来介绍我们数据来源。华体会体育机械与车辆学院车辆系有无人车技术工业和信息化的重点实验室、地面无人机动武器平台国防科技创新团队、电动车辆工程实验室、新能源车辆国家监管平台等,随着新能源车辆的发展,结合无人驾驶车辆领域二十多年的研究积累,我们有条件采集大量驾驶员行为数据,以后更可以把行驶场景数据结合起来?目前可以得到北京市部分公共交通车辆驾驶行为数据,再结合我们团队自动驾驶测试车辆数据,具备了进行大量数据学习研究的基本条件。
将来如果实现5G无线通信,目前这些研究成果就完全可以把道路场景、包括实时检测结果都放进来。类人驾驶行为学习的整体架构,也是我们准备了很长时间的问题,现在从环境数据到交通场景的理解、运动规划和车辆状态数据都能够结合起来,一方面进行基于我们前期的研究成果,进行基于模型的学习;另一方面我们也在尝试端到端的学习方法,但是目前端到端的输出结果,还不是确定性的,无法实现预期的输出,目前只是做一些简单的尝试。
在实现方法上,测试车辆具备自动驾驶能力,能够感知周围行驶场景数据,并把这些数据进行在线或离线的分析、提取,同时采集驾驶员操作控制信息,以及车辆状态特性数据。测试车辆并不一定需要自动驾驶,我们可以让驾驶员去开车,这样的话,就可以得到大量的样本数据,分析人类驾驶员在各种行驶场景下的行为决策和操纵控制。我们通过数据平台的采集,一直是利用单个驾驶员数据来进行学习,现在正在采集更多的驾驶员的数据,实现多元大数据的机器学习。
数据来源,一方面我们从大量智能驾驶测试项目开发工作中采集,另一方面利用实际道路和交通场景,进行有目的的人类驾驶员数据采集。可以直接采集,也可以利用网联车辆的数据。结合行驶场景,特别是地图数据,比如北京市北三环路段的数据,还有京承高速的数据,有了这些地图数据场景加上直接的数据来源,也可以做很多的机器学习工作。
近期我们完成了一些专线运营场景的示范运行,同时在一些测试试验场。
自动驾驶系统的构成,包括环境感知、规划决策与控制、人机交互、电动线控底盘等子系统。其中有一个很重要的问题,就是车辆如何实现精确定位,而且能够做到低成本,位置信息结合周围环境数据,对数据的学习利用非常重要。
常用导航定位方式有很多,包括标线/标志、卫星导航、航迹推算、地图导航等。每一种导航定位方式都有自己的优缺点。视觉车道线检测受环境影响较大、卫星定位则容易受到遮挡和多路径效应影响,比如桥洞、隧道、楼群等场景就可能没有信号,还有航迹推算大部分情形下需要用高精度惯导,成本太高,也不是非常合适的定位方式。如果自动驾驶系统的决策规划与控制技术完全依赖高精定位,那就无法实现了。
再就是高精度的地图,如果不是长期运营,成本也非常大,目前我们可以用数据采集的工作,后期处理工作较多,更多是依靠人工处理。同时要进行精定位数据我们都要进行定位的工作,还要进行精确的测点,例如用人工每一个点定位五分钟,就可以得到该点较为精确的坐标,找几个点能够形成所谓的定位闭环,定位精度可以就高了。
我们之所以要特别强调定位,因为我们数据学习对位置高精度的依赖性比较高,较高的位置精度可以充分利用车载传感器的检测信息,方便离线处理。最终的方案实现多源信息的综合定位,充分利用激光雷达、视觉传感器等信息,结合地图定位,包括矢量地图、特征地图和点云地图,实现低成本的精确定位。
目前关键技术问题是动态干扰对定位结果影响比较大,解决这个问题,有可能形成一套低成本的定位系统,目前的高清度卫星惯导组合导航定位系统动则五六十万。
其他交通要素的检测,包括周围车辆检测,目的是对周围车辆的行为进行分析。样本数据中其他车辆的换道等行为,对本车行为决策结果是会有影响的。自动驾驶车辆如何和周围的车辆进行协作,目前的工作还是比较肤浅的。比如是有人驾驶时候,我们一个手势就可以做到交互了,但要机器去理解这些情景就非常困难,今后有可能通过车车交互数据去实现。
另一个数据来源是仿真数据。这些仿真数据包括超车换道等行为数据。仿真数据也可以是完全的由软件来做,目前我们的仿真架构和嵌入式的软件完全是一模一样的。
道路模型、地图属性是环境模型的重要组成部分,我们在学习的样本里面都是需要用到数据模型,包括这些数据和环境检测识别结果。还需要结合车辆网联数据,网联信息例如路基的红绿灯信息通过广播,自动驾驶车辆得到路口数据,能够实现自动速度规划和避让,从节能和交通效率优化的角度来进行评价。
在共性优化基础上的个性化,所谓的个性化,我们希望每一台自动驾驶车辆,能够学会每个驾驶员的优点,经验和知识越来越丰富。同时能够适应某个驾驶员特定的驾驶风格,实现所谓的个性化。
我们现在要实现多个驾驶员在多个场景下的学习,对这些数据的处理,首先是基元建模。提出了一个驾驶基元的概念,我们把所有的数据分为一个一个的数据基元,可以把各种甚远数据进行组合,通过组合优化,就可以实现其他的场景的迁移。比如说一个道路的环境,我可以根据道路的曲率和弯道分几种基元,通过驾驶员的操控数据,把基础的基元利用起来,再把这些基元进行组合,我们就可以进行相应的学习。这是包括了横向、转向、纵向的速度可以对应起来,再和环境的数据对应起来,很多的数据都可以进行不同的组合优化。
一些非常简单的场景,也在做端到端的场景输出,这个还很不靠谱,所以目前我们主要是基于学习的模型来做,希望可以做出比较好的水平。
那关键的问题,组合优化的算法怎么样达到比较好的学习效果,怎么样实现在不同的场景里,有一个度量和迁移的关系,分层的进行学习,包括一些端到端的方法进行学习、仿真和构建。
这是我们整个的基元的提取,到基元的迁移和组合的优化,目前已经走了两三年的时间了,这对于整个后续系统的提升会有很大的帮助和提升。
我今天就先分享这些,谢谢大家!
分享到: