很好奇两台 AlphaGo 对战,会是怎样的厮杀场面? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kalman03
V2EX    AlphaGo

很好奇两台 AlphaGo 对战,会是怎样的厮杀场面?

  •  
  •   kalman03 2016-03-14 10:36:14 +08:00 2358 次点击
    这是一个创建于 3497 天前的主题,其中的信息可能已经有所发展或是发生改变。
    这样训练是不是更好?
  • alphago
  • 厮杀
  • 对战
  • 好奇
    21 条回复    2016-03-15 12:11:56 +08:00
    ngloom
        1
    ngloom  
       2016-03-14 10:39:36 +08:00
    好像是会自我对弈做训练的 :P
    Sequencer
        2
    Sequencer  
       2016-03-14 10:53:36 +08:00
    貌似有一个阶段就是这样训练的...
    jackwow
        3
    jackwow  
       2016-03-14 11:04:30 +08:00
    它和人在下棋的时候,当人落子之后, AlphaGo 就是在自己和自己下后面的几步,然后判断落子在哪里接下去胜率最大。
    dxwwym
        4
    dxwwym  
       2016-03-14 11:09:35 +08:00 via iPhone
    其实每走一步都在和自己下来预演,个人感觉应该是这样
    alex321
        5
    alex321  
       2016-03-14 11:09:55 +08:00
    人家已经明说有 18 个 AlphaGo 版本了,和李对战的是第 18 个版本,并且是单机模式。
    此前 Google 一直在用 18 个 AlphaGo 做相互之间的对战训练的。。
    AlphaGo 虽然是 AI ,但是是无形的,就像机器宝宝,最终那个小盒子也不过是它临时的容身之所罢了,本质上就是个应用。
    hahastudio
        6
    hahastudio  
       2016-03-14 11:16:10 +08:00
    https://deepmind.com/alpha-go.html
    "..., and by reinforcement learning from games of self-play."
    "This program was based on general-purpose AI methods, using deep neural networks to mimic expert players, and further improving the program by learning from games played against itself."
    Sivan
        7
    Sivan  
       2016-03-14 11:18:03 +08:00
    详见微软小冰 vs 微博聊天机器人
    Jackiepie
        8
    Jackiepie  
       2016-03-14 11:18:42 +08:00
    @alex321 记者会上我听到的是分布式版本
    clino
        9
    clino  
       2016-03-14 11:36:25 +08:00
    @alex321
    http://sports.sina.com.cn/go/2016-03-11/doc-ifxqhmve9078783.shtml
    "这次比赛我们使用的是分布式版的 AlphaGo ,并不是单机版。分布式版对单机版的 AlphaGo 胜率大约是 70%。"
    alex321
        10
    alex321  
       2016-03-14 12:00:53 +08:00
    @Jackiepie
    @clino

    单机是这里看到的: http://www.techweb.com.cn/column/2016-03-08/2291955.shtml 呃。。。。。
    我看完那个之后就没看后续的了。
    Jackiepie
        11
    Jackiepie  
       2016-03-14 12:56:11 +08:00
    @alex321 之前看那些报道也是说用的单机版,但是昨天狗狗的爸爸明确的说了,虽然单击也不错,但是正式比赛只用分布式版。
    birdccc
        12
    birdccc  
       2016-03-14 13:22:00 +08:00
    会死机吧
    imdoge
        13
    imdoge  
       2016-03-14 14:38:13 +08:00
    @alex321 好像是记者误报了,人家说的是为了避免作弊嫌疑,没有连互联网(但是是连到了服务器集群的),结果被说成了单机版
    charlie21
        14
    charlie21  
       2016-03-14 14:46:39 +08:00
    木遥:关于 AlphaGo 论文的阅读笔记
    http://songshuhui.net/archives/93895
    RyNex
        15
    RyNex  
       2016-03-14 14:53:06 +08:00 via iPhone
    @alex321 和李对战的是分布式
    menc
        16
    menc  
       2016-03-14 14:55:53 +08:00   4
    若干月后, alphago 和 betago 两台 AI 对弈,人们已经做好看不懂两位 AI 下棋的思路的准备,可是结果还是出人意料。



    alphago 执黑先走一子, betago 思考良久,认输。
    picasso250
        17
    picasso250  
       2016-03-14 15:30:46 +08:00
    @menc 按照现在的贴目规则,更有可能是:
    alphago 执黑先走一子, betago 应了一手, alphago 思考良久,认输
    strwei
        18
    strwei  
       2016-03-14 19:17:26 +08:00
    期待中。。。。。。
    firstinout
        19
    firstinout  
       2016-03-15 09:10:07 +08:00
    @alex321 U R being watched
    alex321
        20
    alex321  
       2016-03-15 09:18:26 +08:00
    @firstinout 哈哈,后面撒玛利亚人上线的时候就变成 We are being watched 了,然后两个交叉在片首出来。
    firstinout
        21
    firstinout  
       2016-03-15 12:11:56 +08:00
    @alex321 太赞的片子 有空二刷
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2609 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 15:18 PVG 23:18 LAX 08:18 JFK 11:18
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86