请教机器学习中关于学习速率的选取 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Dx2619
V2EX    问与答

请教机器学习中关于学习速率的选取

  •  
  •   Dx2619 2017-09-05 15:35:14 +08:00 2833 次点击
    这是一个创建于 3037 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题: 最近初步接触了一下机器学习,其中关于学习速率的有个疑问。就是关于学习速率的选取问题。 从网络上的示例,大多都是一个一个固定值,或者给出的建议就是从某个值开始不断尝试。 请问除了试试,有没有一种更好的选取方式呢?

    7 条回复    2017-09-06 10:21:11 +08:00
    brightguo
        1
    brightguo  
       2017-09-05 15:38:14 +08:00   1
    写代码让他不断试吧,试多了就知道大概范围了,哇咔咔
    Suddoo
        2
    Suddoo  
       2017-09-05 15:45:11 +08:00   1
    不断尝试吧,好像没有更好的办法,有些复杂神经网络我用过 1e-7 的学习率,一般是 1e-4 的学习率,然后慢慢调
    Hzzone
        3
    Hzzone  
       2017-09-05 15:47:54 +08:00 via iPhone   1
    loss 不收敛就向下调一个数量级吧,learning rate 本身对网络性能没什么影响,主要是训练过程中 loss 收敛的问题。
    Dx2619
        4
    Dx2619  
    OP
       2017-09-05 15:58:40 +08:00
    @brightguo
    @Suddoo
    @Hzzone 多谢各位回复,还想追问一个比较入门的问题。就是迭代次数的选择又是怎么取值的呢,是一直尝试到 loss 收敛嘛? loss 收敛的判断是下降幅度同ε比较吧吧,ε的取值也是靠经验来选取的吗?
    congeec
        5
    congeec  
       2017-09-05 16:37:33 +08:00 via iPhone   1
    grid search
    TuSDK
        6
    TuSDK  
       2017-09-05 17:17:16 +08:00   1
    还是得试试啊!
    wzha2008
        7
    wzha2008  
       2017-09-06 10:21:11 +08:00   1
    迭代次数的选择,其实可以用验证集来做 early stopping,否则只看训练集 loss 的话容易过拟合
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5264 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 01:25 PVG 09:25 LAX 17:25 JFK 20:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86