
目前有 100 台阿里云服务器的机器的信息需要监控 我的想法是使用 Python 获取到服务器的信息然后,在服务端通过 socket 获取. 但是因为服务器数量比较多的原因,不知道时效性能不能保证. 自己不是做运维的对这方面没什么经验,想请教各位大牛这种需求的最佳实践是什么?
1 Immortal 2018 年 3 月 9 日 有成熟的开源监控方案 为啥要自己造轮子 我不是做运维的 |
2 yunlzheng 2018 年 3 月 9 日 搭一套 Promethues,轻松搞定 |
3 nicolas0caser 2018 年 3 月 9 日 如果是服务器基础设施监控无非以下几个指标:内存、cpu、磁盘(占用、IO )、网络 IO 等,无论是自己写 Python 脚本实现或者使用成熟的开源的软件都可以的。我司目前服务器 70 台左右,使用 telegraf+influxdb+grafana:telegraf 做 agent 收集服务器基础数据,发送到 influxdb,grafana 做前端展示,基本符合需求了。当然也存在单点故障的问题,再就是 influxdb 隔断时间会异常退出,有点蛋疼。 |
4 iappled 2018 年 3 月 9 日 Promethues |
5 dreampython 2018 年 3 月 9 日 via iPhone 搜下 zabbix 等开源监控系统是不是你需要的 |
6 likexian 2018 年 3 月 9 日 https://github.com/likexian/stathub-go 要简单就这个(好久没更新了,新版本难产中) |
推荐 zabbix 支持自定义设置阈值报警 支持自定义监控项 支持 api ... |
8 awhane 2018 年 3 月 9 日 同推荐 Prometheus。。。很简单了。 貌似不提供 aliyun 的 SD,可以用 file_sd.. |
9 ywgx 2018 年 3 月 9 日 安利下 https://xabcloud.com 你需要 |
10 opengps 2018 年 3 月 9 日 应该可以直接使用阿里云的接口吧 |
11 popoer 2018 年 3 月 9 日 直接用阿里云监控有什么问题吗?还有免费的短信提醒 |