高危操作强制投屏怎么样?让大家一起盯着点
1 pingdog 2023-02-01 23:09:03 +08:00 via Android 处理故障谁还有空看群。。 |
![]() | 2 MuscleOf2016 2023-02-01 23:16:39 +08:00 小范围修改验证灰度 |
![]() | 3 perfectlife 2023-02-01 23:46:24 +08:00 via Android 这时候就凸显运维的经验和水平了 |
![]() | 4 darkengine 2023-02-01 23:52:59 +08:00 预算足的话准备一台一模一样的备机,需要现场敲命令的现在备机上运行一遍,没问题再复制粘贴到生产服务器上执行 |
5 GopherDaily 2023-02-01 23:55:55 +08:00 故障处理是很考验人的,不要寄希望有人能给你 review ,我个人觉得核心的几点: - 胆大,其实这个是前提,遇到大问题,脑子直接宕机的人是不适合的 - 心细,在得出判断后,再想:如果是 xxx ,那么 yyy ,尽量再去找 yyy 的证据,然后采信 xxx - 日常积累 |
6 8zip 2023-02-01 23:56:59 +08:00 via Android 核心是避免应急场景 紧急情况翻车才是常见的 |
![]() | 7 opengps 2023-02-02 00:23:05 +08:00 既然已经是在线开发,那么要做的恐怕也就是多备份了。 联机开发错误必然直接影响线上,多个人看一遍比你单独找人测试一遍效率质量都要更低 |
![]() | 8 idblife 2023-02-02 07:50:40 +08:00 via iPhone 这是真正考验个人水平的时候 |
![]() | 9 echo1937 2023-02-02 08:41:48 +08:00 1 、危险操作先报告,批准后再操作; 2 、解决方案测试环境上先测过,再上生产环境执行; 3 、现场执行 2 人作业,一人作业一人监护(参考电力作业) |
![]() | 10 sparkssssssss 2023-02-02 11:37:17 +08:00 我们有紧急情况的时候,都是一人工作 n 人围观. |
![]() | 11 killva4624 2023-02-02 16:04:24 +08:00 找那么几个关键的人一起帮你 review 命令; 另外一个个人经验是,涉及到文件覆盖类的话,尽可能保持回滚能力,不能一把梭之后无法回头。 比如要手改代码或者覆盖二进制文件、配置文件,先 cp 一个备份; |