Thrift/Zookeeper 连接数过多导致新连接请求被拒 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
monkeylyf
V2EX    Hadoop

Thrift/Zookeeper 连接数过多导致新连接请求被拒

  •  
  •   monkeylyf 2015-03-10 15:11:28 +08:00 17320 次点击
    这是一个创建于 3872 天前的主题,其中的信息可能已经有所发展或是发生改变。

    症状:
    小型集群在部署后12到48小时就会有应用报错, 说和HBse在创建链接时超时. 这时候去查看Zookeeper的日志是发现已经有大量链接创建并且达到了设置的数值(60).

    环境:
    Cloudera. 大部分应用使用 Python Happybase 通过Thrift service来和Zookeeper进行通信, 由于集群的规模非常小, 所以只有一个Thrift gateway.另外有一些Java应用是mapreduce来对HBase进行put, 用的是native Hadoop HBase API.

    临时解决方案:
    1. 把Zookeeper的max # of connections设置成200
    2. 每12小时重启Zookeeper一次
    这2个办法现在可以基本把症状消除 但是在我看来并不解决问题因为根本没找到问题在哪. 而且Zookeeper的重启会导致有60秒的真空期 如果这个时候应用给zookeeper发出请求也是各种报错。

    请问各位英雄豪杰有没有类似的经历? 小弟跪求指点

    9 条回复    2015-03-12 01:12:58 +08:00
    signifox
        1
    signifox  
       2015-03-10 20:08:07 +08:00
    我一般连接设置成8000.
    monkeylyf
        2
    monkeylyf  
    OP
       2015-03-11 00:58:22 +08:00
    @signifox 感谢回复
    我现在设成了200 重启了zookeeper 暂时还没有看到问题
    我的担心是 如果这些链接是某些应用创建不当造成的僵尸链接 那么设成2000也总有一天会max out 我很好奇真正的root cause
    signifox
        3
    signifox  
       2015-03-11 08:10:56 +08:00 via iPhone
    @monkeylyf 可以计算zk所需连接数,region master server client都会占用zk链接,至于僵尸链接不用担心,zk都有session的会超时自己销毁。
    monkeylyf
        4
    monkeylyf  
    OP
       2015-03-11 10:48:06 +08:00
    @signifox 现在就是感觉僵尸链接没有被销毁 zk的session timeout设置的是60000ms 总感觉里面有什么东西在搞鬼
    xurubin
        5
    xurubin  
       2015-03-11 18:51:22 +08:00
    寂寞
    xurubin
        6
    xurubin  
       2015-03-11 18:56:42 +08:00   1
    Google "HBase client leaking connections"有没有看上去符合的。[/kb]
    XadillaX
        7
    XadillaX  
       2015-03-11 20:38:57 +08:00
    我只是来吐槽 Lucy 的。
    monkeylyf
        8
    monkeylyf  
    OP
       2015-03-12 01:12:40 +08:00
    @XadillaX mew mew lied!
    monkeylyf
        9
    monkeylyf  
    OP
       2015-03-12 01:12:58 +08:00
    @xurubin 同寂寞
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5851 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 02:39 PVG 10:39 LAX 19:39 JFK 22:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86