文献收藏与分享平台

Necessary Cookies: Essential for the website to function properly, such as CSRF tokens.
Analytics Cookies: Help us understand how our website is used and how we can improve it.
Personalization Cookies: Enhance your experience by remembering your preferences.

来自用户物品师的文献。

当前共找到 1 篇文献分享。

物品师 (2022-02-21 05:03):

#paper doi.10.48550 [arxiv.2111.08575] 标题GRI: General Reinforced Imitation and its Application to Vision-Based Autonomous Driving作者Raphael Chekroun, Marin Toromanoff, Sascha Hornauer, Fabien Moutarde领域Robotics (cs.RO); Computer Vision and Pattern Recognition (cs.CV).链接https://arxiv.org/abs/2111.08575引用arXiv:2111.08575 [cos.RO](or arXiv:2111.08575v1 [cs.RO] for this version) https://doi.org/10.48550/arXiv.2111.08575摘要：深度强化学习 (DRL) 已被证明对自动驾驶和机器人等多种复杂决策应用程序有效。然而，众所周知，DRL 因其高样本复杂性和缺乏稳定性而受到限制。先验知识，例如作为专家演示，通常可用，但难以利用来缓解这些问题。在本文中，我们提出了通用强化模仿 (GRI)，这是一种结合了探索和专家数据的好处的新方法，并且可以直接在任何非策略 RL 算法上实现。我们做了一个简化的假设：专家演示可以被视为完美的数据，其基础策略会获得持续的高回报。基于这个假设，GRI 引入了离线演示代理的概念。该代理发送专家数据，这些数据与来自在线 RL 探索代理的经验同时处理且无法区分。我们表明，我们的方法可以在城市环境中对基于视觉的自动驾驶进行重大改进。我们进一步验证了具有不同离策略 RL 算法的 Mujoco 连续控制任务的 GRI 方法。我们的方法在 CARLA 排行榜上排名第一，并且比之前最先进的 World on Rails 的性能高出 17%。

arXiv, 2021. DOI: 10.48550/arXiv.2111.08575 Focus to learn more

GRI: General Reinforced Imitation and its Application to Vision-Based Autonomous Driving

翻译

Abstract: No abstract available.