来自用户 物品师 的文献。
当前共找到 1 篇文献分享。
1.
物品师
(2022-02-21 05:03):
#paper doi.10.48550 [arxiv.2111.08575] 标题GRI: General Reinforced Imitation and its Application to Vision-Based Autonomous Driving作者Raphael Chekroun, Marin Toromanoff, Sascha Hornauer, Fabien Moutarde领域Robotics (cs.RO); Computer Vision and Pattern Recognition (cs.CV).链接https://arxiv.org/abs/2111.08575引用arXiv:2111.08575 [cos.RO](or arXiv:2111.08575v1 [cs.RO] for this version) https://doi.org/10.48550/arXiv.2111.08575摘要:深度强化学习 (DRL) 已被证明对自动驾驶和机器人等多种复杂决策应用程序有效。 然而,众所周知,DRL 因其高样本复杂性和缺乏稳定性而受到限制。 先验知识,例如 作为专家演示,通常可用,但难以利用来缓解这些问题。 在本文中,我们提出了通用强化模仿 (GRI),这是一种结合了探索和专家数据的好处的新方法,并且可以直接在任何非策略 RL 算法上实现。 我们做了一个简化的假设:专家演示可以被视为完美的数据,其基础策略会获得持续的高回报。 基于这个假设,GRI 引入了离线演示代理的概念。 该代理发送专家数据,这些数据与来自在线 RL 探索代理的经验同时处理且无法区分。 我们表明,我们的方法可以在城市环境中对基于视觉的自动驾驶进行重大改进。 我们进一步验证了具有不同离策略 RL 算法的 Mujoco 连续控制任务的 GRI 方法。 我们的方法在 CARLA 排行榜上排名第一,并且比之前最先进的 World on Rails 的性能高出 17%。
arXiv,
2021.
DOI: 10.48550/arXiv.2111.08575
Focus to learn more
Abstract:
No abstract available.