![]() | 1 kn007 2016-03-12 15:42:31 +08:00 ...你没看第 2 场么? alphago 消耗完 2 小时,有 3 次 60 秒读秒,他基本每 30 秒左右必下一步。 |
2 SilentDepth OP @kn007 确实没看第二场。那这种时间有限的应对策略,是 AlphaGo 自己学习到的呢,还是科学家人为添加的规则? |
![]() | 3 Tink PRO 有读秒的啊,怎么可能用完呢?进入读秒阶段机器人也是在 60s 内落子啊 |
![]() | 4 zhujinliang 2016-03-12 16:51:39 +08:00 可能算法里带有时间预期判断,将耗时、剩余时间等也作为参数带入决策部分 实际表现看,像是人为地对参数进行调优,像 PBKDF2 似的,调整递归次数,将计算耗时控制在一定范围内 再者,进入读秒已经是中后盘了,计算量已经下来了 之前欧洲的比赛有提到,樊麾和 AlphaGo 除了常规比赛外,还下了 5 盘快棋,樊麾胜 2 盘 |
![]() | 5 chlx 2016-03-12 17:05:11 +08:00 没有什么时间概念。寻找落子位置就是个优化的过程,时间少的话求解的结果就没那么好 |
![]() | 6 chlx 2016-03-12 17:06:35 +08:00 也可以理解为时间是一个超参数,人为设置的。比如给 30s 让机器去优化, 30s 到了给出个当前最优解 |
![]() | 7 wuhanchu 2016-03-12 17:07:28 +08:00 可能他有个清单吧,如果时间到没有更好的方案出来,就选择已有最好的方案。 |
![]() | 8 chiangdm 2016-03-12 21:33:00 +08:00 我更好奇让两台 alphago 互搏是什么结果 |