导语:为了早日实现主动驾驶,各家厂商投进了大批人力物力。不外,密歇根大学的研究人员却认为靠计算机模拟就可以完成对深度神经网络的训练,这样的方法靠谱吗?
本文作者:大壮旅
想要获得安然可靠的途径行驶能力,主动驾驶汽车必需对其四周环境有全景式的懂得。它不只要要认出周边呼啸而过的轿车、卡车、摩托车,同时还要发明慢吞吞的自行车和行人。
另外,交通信号灯、路牌和路上的阻碍物它们也不克不及放过。不外,这还不是最考验主动驾驶汽车的事物,让各家公司花费大批时间和资源搜集数据的各种天气和光照条件才是主动驾驶能否真正上路的最高门坎。毕竟假如不克不及穷尽每种可能性,谁也不敢担保上路的主动驾驶汽车会不会惹出什么乱子。
一般来讲,想让主动驾驶汽车实现眼不雅六路耳听八方,研究人员必需对大批数据进行标志,而这些标志过的数据将成为机械学习算法的养料。
对数据做标志可不是件轻松的工作,每家厂商城市派成百上千的工作人员措置惩处车辆拍摄的照片或视频,他们需要用方框圈出旁边的车辆、路标等物体,同时还得给它们贴上响应的标签。令工作人员尽眺望的是,这个标志数据的过程需要一遍又一遍的反复。
密歇根大学的研究人员想出了更好的解决打算:在模拟中完成全部过程。对于本身的想法,研究人员也是底气十足,因为他们已证实这种方法比人工标志实在数据要高效的多。
不外,机械人专家们其实不看好模拟的方式,因为模拟事实上是简化版的现实世界,在模拟中取得成功其实不代表在现实世界中能实现百分之百的安然。
密歇根大学的研究人员其实不服输,在上周新加坡举办的 IEEE 机械人与主动化国际会议上,他们就寻来了游戏鸿文《侠盗猎车手5》,试图通过该游戏证实虚拟世界也能训练深度学习系统识别物体。这种方法靠谱吗?且听雷锋网(公众号:雷锋网)为您详细说明:
《侠盗猎车手5》中一系列用于目标识另外图片
通过模拟的方式来完成训练其实可以一举三得:
首先,速度可以获得大幅提升,并且与真车在路上采集数据比拟费用要少很多。
其次,在模拟中数据标志就变成现成的,毕竟游戏程序对画面中呈现的物体属性非常清晰。
最后,在模拟环境中你可以设定任何的刁钻路况或天气情况,而在加州路上做测试,你会发明这里老是阳光明媚,底子没什么挑战。
另外,在模拟环境中你乃至可以为同一路段设定不同的天气或路况,实现事半功倍的效果。
在同一路段模拟不同的天气情况
为了检测虚拟世界中的训练效果,研究人员在游戏中生成了 3 个模拟数据集,它分别包孕 1 万、5 万和20 万张不同的游戏图片。
随后,深度学习目标探测系统开始以这些数据集为基础进行训练。固然,研究人员还准备了别的一个实车拍摄的数据集,名为 Cityscapes 的数据集包孕有 3000 张颠末手动标注的图片,一样的深度学习系统也会以该数据集为基础进行训练。
训练完成后,两套系统需要对名为 KITTI(也是实车实拍,但与 Cityscapes 不同)的数据集中 7500 张图片进行目标识别测试。
成效显示,在模拟环境中训练出来的深度神经网络识别效果更好:用 5 万和 20 万张图片训练出来的深度神经网络暗示要好过 3000 张的数据集。研究人员解释称,单张的模拟图片价值其实不高,但假如它们的数量足够多,效果就会非常棒。
确实,单张模拟图片的训练效果不如单张实拍图片,毕竟现实世界中的光源、颜色和纹理信息变化是电脑模拟无法比力的,因此模拟图片只能以量取胜。
不外,只有有足够的计算能力,我们就可以生成超多的模拟图片,最主要的是这些图片不再需要待遇标志了。
模拟图片(上)中的误报明显更少
除以上优势,在虚拟世界中训练出来的神经网络在识别较远和模糊车辆的能力上也更胜一筹。同时,这种方式也能削减误报。也许这种优势也是拜模拟图片巨大的数量所赐,它包孕的数据更宽泛,能为训练提供加倍多样化的输进。
固然,用模拟图片训练神经网络也有其内在缺陷:首先,虚拟世界不同于现实世界,一些难以预测的情况它模拟不出来,而这些情况是主动驾驶最大的安然杀手。
不外,虽然我们无法靠《侠盗猎车手5》来解决所有标题问题,但密歇根大学的研究人员确实给我们指了条明路,它能大大落低各家厂商的成本,提升训练效率。
雷锋网原创文章,网站转载请至雷锋网官网申请受权。欢迎热情探讨,转发分享~