Fork me on GitHub

深度强化学习算法 DDPG 如何使用高维数据输入?

看了文章之后发现文章中并没有很明确的给出采用高维的像素输入应该如蛇涉及网络的结构,不知是否是自己没有阅读仔细。看了很多网上关于DDPG的例子,包括使用DDPG玩赛车游戏TORCS,也是使用的地位的传感器数据。