Real Time Path Planning of Robot using Deep Reinforcement Learning

* Authors: [[Jeevan Raajan]], [[P V Srihari]], [[Jayadev P Satya]], [[B Bhikkaji]], [[Ramkrishna Pasumarthy]]


初读印象

comment:: 本文考虑从给定初始位置到目标位置的机器人实时找到一条路径。假定环境是映射的(完全已知),并且所得路径应避免在映射环境中静态和动态的所有障碍。假定机器人的(代理)动力学是带有过程噪声的离散LTI,并通过一组有限的输入来控制。为该问题提供了MDP公式和基于深入增强学习框架的解决方案。使用DQN算法对所提出的方法进行了数值实验,并将结果与基于静态和动态环境的基于最新采样的路径计划算法进行了比较。结果表明,即使提出的算法提供了一条次优路径,但与传统的路径计划方法相比,计算时间的明显更快

文章骨架

%%创新点到底是什么?%%
novelty:: 使用RL进行实时路径规划

%%有什么意义?%%
significance::

%%使用了什么方法?%%
usage method::
#RL
状态:1.传感器值;2.当前位置;3.障碍物位置;4.目标位置;
动作空间:八叉树搜索。
奖励:实现目标时的终端奖励:+10。采取的每个步骤都会处以罚款:-0.01。但是,如果代理与障碍物或环境边缘相撞,则给出:-10,并终止情节。
![[Pasted image 20220816205205.png]]
%%优点和缺点?%%
![[Pasted image 20220816205222.png]]
merits :: 速度方面优于传统方法

demerits::路径不顺滑

%%机构&作者%%
who::Raajan Jeevan — Indian Institute of Technology Madras

%%未来展望%%
prospect::未来的工作涉及开发更好的编码方法来处理可变数量的障碍。

参考文献

[1] Raajan J, Srihari P V, Satya J P, et al. Real time path planning of robot using deep reinforcement learning[J]. IFAC-PapersOnLine, 2020, 53(2): 15602-15607.