好奇 AlphaGo 用完了所有时间会有什么反应？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 3499 天前的主题，其中的信息可能已经有所发展或是发生改变。

AlphaGo 对比赛时间有概念吗？会不会 AlphaGo 本身对时间无概念，赛方计算到时后直接忽略 AlphaGo 的后续动作？
如果要给 AlphaGo 添加时间相关规则，会不会让它在时间有限的情况下采取快速落子的策略，这算不算是一种 AI 「紧张」的表现？

alphago

赛方

落子

时间

8 条回复 2016-03-12 21:33:00 +08:00

kn007

2016-03-12 15:42:31 +08:00

...你没看第 2 场么？

alphago 消耗完 2 小时，有 3 次 60 秒读秒，他基本每 30 秒左右必下一步。

SilentDepth

2016-03-12 15:45:36 +08:00

@kn007 确实没看第二场。那这种时间有限的应对策略，是 AlphaGo 自己学习到的呢，还是科学家人为添加的规则？

Tink

PRO

2016-03-12 15:49:07 +08:00

有读秒的啊，怎么可能用完呢？进入读秒阶段机器人也是在 60s 内落子啊

zhujinliang

2016-03-12 16:51:39 +08:00

可能算法里带有时间预期判断，将耗时、剩余时间等也作为参数带入决策部分
实际表现看，像是人为地对参数进行调优，像 PBKDF2 似的，调整递归次数，将计算耗时控制在一定范围内
再者，进入读秒已经是中后盘了，计算量已经下来了

之前欧洲的比赛有提到，樊麾和 AlphaGo 除了常规比赛外，还下了 5 盘快棋，樊麾胜 2 盘

chlx

2016-03-12 17:05:11 +08:00

没有什么时间概念。寻找落子位置就是个优化的过程，时间少的话求解的结果就没那么好

chlx

2016-03-12 17:06:35 +08:00

也可以理解为时间是一个超参数，人为设置的。比如给 30s 让机器去优化， 30s 到了给出个当前最优解

wuhanchu

2016-03-12 17:07:28 +08:00

可能他有个清单吧，如果时间到没有更好的方案出来，就选择已有最好的方案。

chiangdm

2016-03-12 21:33:00 +08:00

我更好奇让两台 alphago 互搏是什么结果