最近学习了一下深度强化学习算法,用 CNN+DDPG 算法做了一个玩微信跳一跳的 AI
和 GitHub 上的基于 OpenCV 的方法有本质的区别,实现了端到端的自动学习
有兴趣的同学可以看一看,或者帮忙改进改进一下,目前参数调优和训练量都还不足
1 Heigum 2018-06-15 14:24:20 +08:00 via Android 我跳一跳的排行榜都没人了 |
![]() | 2 nine99 2018-06-15 14:57:52 +08:00 好奇这个训练起来会有多慢 |
![]() | 3 ynyounuo 2018-06-15 15:01:35 +08:00 跳一跳距离和按压时间正相关,你这样意义不大。 |
![]() | 4 hijkzzz OP |
![]() | 5 takato 2018-06-15 16:32:50 +08:00 via iPad |
![]() | 6 tsaoyu 2018-06-15 18:16:03 +08:00 做的还是很有意思的。 @takato 可以继续往稀疏奖励和高维状态的方向上去做,应用方面的话机器人,能源规划以及资产管理都有一些可以继续深入的点。 |