1 ntedshen 2024-09-12 10:07:13 +08:00 |
![]() | 2 tommyzhang 2024-09-12 10:10:06 +08:00 ![]() 我们都已经第一时间把服务迁到另外 2 个机房了 你没签吗? 主要是大火把一些基建烧没了 网络需要重新弄 设备都要检修 |
3 qoo2019 2024-09-12 10:11:27 +08:00 ![]() 说明服务也没那么重要 |
4 Jinnrry 2024-09-12 10:12:14 +08:00 via iPhone ![]() 什么三地两中心,秒级扩容迁移,x 个 9 可用率,全都是扯淡啊 |
![]() | 5 luojianxhlxt 2024-09-12 10:15:12 +08:00 @tommyzhang #2 大佬,小弟请教下这个云服务器机房故障不是应该自动迁移吗?还需要用户自己去迁移吗?那什么容灾之类的就是这么设计的吗? |
![]() | 6 qweruiop 2024-09-12 10:16:40 +08:00 上次 hk 出事,aliyun 也没赔钱。。。之后,就吸取教训了,现在宁肯用 aws ,也不会用 aliyun 了。。。 |
![]() | 8 vjnjc 2024-09-12 10:19:07 +08:00 幸好我们海外在 hk , 不够之前已经被坑过一次了 0 0 |
![]() | 9 processzzp 2024-09-12 10:20:18 +08:00 |
![]() | 10 106npo 2024-09-12 10:21:06 +08:00 via Android ![]() @luojianxhlxt 数据都在火里“上云”了吧,得自己用镜像迁。 单可用区的 ecs 硬盘可没说放在多可用区,数据就算还在也得等可用区恢复。 |
![]() | 11 la2la 2024-09-12 10:22:47 +08:00 @luojianxhlxt 自动迁移那是另外的价钱,大客服云服务商会有人驻场 24 小时值班的 |
![]() | 12 8n1AfdFQWA5CWTNQ 2024-09-12 10:23:31 +08:00 @Jinnrry 那你自己要做这些方案的,不是云厂商帮你做. 比如说你自己把数据放在三个地方 |
![]() | 13 tommyzhang 2024-09-12 10:29:41 +08:00 @luojianxhlxt 我不是 aliyun 的哈 也不是大佬 你说的这个迁移理论上是 aliyun 要做的吧 但是实际下来业务遇到问题我们想的都是先赶紧跑掉 |
14 Jinnrry 2024-09-12 10:29:58 +08:00 via iPhone @iammecn 我如果要自己做,那我还要毛云服务啊?两地三中心,异地多活,x 个 9 ,秒级迁移,业务无需关注灾备和迁移,这些话都是阿里云自己说的啊 |
15 Jerry23333 2024-09-12 10:30:14 +08:00 @luojianxhlxt #5 看你买什么级别的服务呀。贴一下我在另一个帖子下的回复: 云服务也分单可用区部署和多可用区。以数据库为例,购买分了基础版和高可用版,高可用版又分了单可用区部署和多可用区部署。如果你买的是高可用版本,且是多可用区的,一旦出现主实例不可用,是自动会切换的。进度里也提到了“ [进展更新] 截至 11:30 按照产品调度策略,云数据库 Redis/MongoDB/RDS MySQL 、对象存储 OSS 、表格存储 OTS 等云产品的**高可用版本**已陆续完成容灾切换。”。但如果你买的基础版,服务器出问题了那谁也没办法,自己部署也是一样的。 花多少钱,干多少事。 |
![]() | 16 nicoljiang PRO @luojianxhlxt iaas 不会做这个,paas 或 saas 会做。 |
17 lilyou 2024-09-12 10:31:18 +08:00 两天了还没弄好,组里同事熬了俩通宵,太坑了 |
18 Jerry23333 2024-09-12 10:31:43 +08:00 @Jinnrry #4 得看你买的版本呀大哥,基础版的不带这些,高可用版肯定会切的。花多少钱,干多少事。 |
19 exiaohao 2024-09-12 10:33:01 +08:00 因为 UPS 换了锂电池,锂电烧起来 灭火都灭不下来… 另外就是因为一个成熟的服务商 搞太多的骚操作想降本增笑,好了现在火都灭不掉了 其实最崩溃的是 Digital Reality ,楼都被烧废了,新加坡一栋楼啊 楼主还是要学一下字节,阿里云被烧了就光速转移到马来,需要狡兔三窟 |
20 sphawkcn 2024-09-12 10:33:54 +08:00 自动灭火装置难道是摆设? |
21 superrichman 2024-09-12 10:35:01 +08:00 您好,您的服务器已经(烧)上云了 |
![]() | 22 phithon 2024-09-12 10:36:42 +08:00 早说了云实际上就是 vps 换了个名字,其实没啥区别。 |
![]() | 23 wqhui 2024-09-12 10:41:14 +08:00 物理层面出事了就不是几天能恢复的,该迁移迁移 |
24 willli 2024-09-12 10:44:09 +08:00 总结一下,那些吹的服务都是要加钱的,没有买那些服务,就跟你的个人电脑一样,坏了就坏了 |
![]() | 25 proxytoworld 2024-09-12 10:53:32 +08:00 ![]() 火烧云哈哈哈 |
![]() | 30 opengps 2024-09-12 11:22:42 +08:00 @Jinnrry 另一个帖子我刚回复过对于这句话的理解偏差:你买的服务器只是一个可用区下的云资源,不是两地三中心的云资源,想要多中心化,你的软件架构还需要很多东西 |
31 deplives 2024-09-12 11:22:55 +08:00 有没有只种可能阿里云的高可用指的是 新加坡不行了我们还有北京的机房可用 |
![]() | 32 panzhc 2024-09-12 11:25:03 +08:00 ![]() " 昨晚 20:23 ,消防部门仍在处理大楼现场风险中,运维工程师正在等待获准进入机房大楼。如现场评估后不具备原地恢复的物理条件,应急小组将执行服务器设备迁移恢复预案。 " 看起来依然任重道远。 |
![]() | 33 qweruiop 2024-09-12 11:36:20 +08:00 ![]() @Jerry23333 高级版的也不会切的,上次 hk 出事,后台都打不开了。。。你想多了。。。 |
![]() | 34 Jhma 2024-09-12 11:59:44 +08:00 重要业务要么云上多区域自建高可用,要么干脆自建私有云多地多活高可用而且故障转移可自主处理,以为上云是很轻松的事情实际更考研运维的能力 |
35 vpsvps 2024-09-12 12:45:22 +08:00 via iPhone ![]() 火烧云 |
![]() | 36 f0101 2024-09-12 12:57:51 +08:00 几十块钱的东西,就别想着有什么三地两中心,秒级扩容迁移, 跟你没关系. |
![]() | 37 bagel 2024-09-12 13:06:06 +08:00 你看看阿里云的历史事故总结,对比 aws 的,云泥之别。亚马逊的总结都是工程师写的,就事论事记录得非常清楚,还会给你科普技术背景,比如迁移技术架构导致出的事故,来龙去脉都有。阿里云的就一句话,公关口吻的事故发生了,事故解决了,抱歉噢,完了。 |
![]() | 38 lizytalk 2024-09-12 13:06:20 +08:00 人家机房烧了,咋给你马上恢复啊。唯一的路就是把服务迁移到别的 AZ 呗 |
![]() | 39 lizytalk 2024-09-12 13:06:54 +08:00 @luojianxhlxt 当然有支持多 AZ 容灾的产品,但是价钱不一样 |
40 twl007 2024-09-12 13:09:12 +08:00 via iPhone @tommyzhang 阿里云做了 你要掏钱 你可以看很多服务会有额外的一个多可用区域的选项 这个选了才是多可用区 |
![]() | 41 xiaoshouchen OP @f0101 确实钱不够多,但是一年也好几万,并不是几十块钱的服务。而且也不是不能接受出现故障,而是不能接受这么久的故障,一般几个小时,忍忍也就过去了,这次是两天多,快 3 天了 |
![]() | 42 f2A2RUpR2HgfHg5a 2024-09-12 14:16:42 +08:00 还好烧的不是在腾讯云购买的新加坡服务器所在的机房。 |
![]() | 43 ETiV 2024-09-12 14:25:36 +08:00 via iPhone ![]() 能迁就迁,全当它不存在了吧,机房的某些楼层已经成危楼了 罗央大道一座数据中心起火,消防员仍在现场进行浇湿工作。虽然大楼整体结构未受影响,新加坡建设局仍对大楼的部分楼层区域发出危楼和封闭令,以策安全。https://zb.sg/VHkV |
![]() | 44 tomatocici2333 2024-09-12 16:48:54 +08:00 = =要是锂电池一点办法都没有。ups 敢用锂电池也是牛 |
![]() | 45 8n1AfdFQWA5CWTNQ 2024-09-12 17:00:38 +08:00 @Jinnrry 对的,他是说他可以做到,但你没有买这个服务啊. 比如数据库,他是支持异地备份的,但你没有买,当然没有了.并不是所有服务都能做到完全的多地多活的,这个成本很高. 比如这么说吧,你一个月 100 元买了一个核 1G 的主机,他怎么可能给你默认做到三个地方都存在一个活跃的点? 这三个点还要实时数据传输,出了问题,还要实时恢复?这个不可能的.不要说三个异地了,就是本地也做不到,你一般来说,一台主机就是在一台物理机上,不可能给你放在三台物理机的,但这台物理机出了问题,他可以给你迁移到其它机器上,相比于传统的物理机恢复是快了.但他这个是整个机房出问题了,没有办法的. |
46 ZZ74 2024-09-12 17:03:47 +08:00 ![]() @bagel 事情已经发生,损失已经产生,总结写得好有什么...aws 该崩照样崩。这不是哪家技术好不好的问题。说到底都是买卖。忽悠你上云,然后收割你 |
![]() | 47 3wY4ZelqS1uYD4NJ 2024-09-12 17:08:35 +08:00 @qweruiop 来来来,用 aws |
![]() | 48 neptuno 2024-09-12 17:17:10 +08:00 这次最严重的还不是自己服务挂了,我们当天就迁移完成了,但上下游都用的阿里云,他们搞了好久没恢复! |
![]() | 49 zhuanggu 2024-09-12 17:51:58 +08:00 锂电池起火了 |
![]() | 50 qweruiop 2024-09-12 17:56:40 +08:00 @qq1427168550 已经迁移了几个客户了,还有几个差钱的,也正在迁移中。 也给楼上的同学说没花钱的提个醒。我们很多项目都是花了钱买了多可用区域了。事实证明,信了就输了。无论是之前 hk ,还是这次。出事的时候,他们的 很多控制台要么打不开,要么不可用。现在想来,他们连自己的业务都做不到高可用,还可以怎么弄呢。。。而且他们处理故障的时间。。。基本上,你要是 2b 的话,你的客户是等不到他们恢复的。。。 |