[进展更新] 异常因新加坡机房发生火灾导致升温,消防人员已到达现场处置中,云网络大部分产品及云安全产品于 10:55 已完成主动切换,其他云产品服务仍在处理中。请您尽快迁移业务。
尊敬的客户:您好!北京时间 2024 年 09 月 10 日 10:20 ,阿里云监控发现新加坡地域可用区 C 网络访问出现异常,部分云产品服务出现异常,阿里云工程师正在紧急处理中。若有任何问题,请随时联系我们。
![]() | 1 daxy223 2024-09-10 13:15:05 +08:00 OSS 现在还是不可用 |
2 tabliu 2024-09-10 13:25:58 +08:00 听说可能会停电 |
![]() | 3 huangzhiyia 2024-09-10 13:32:46 +08:00 aws 和 阿里云不在一个机房? |
4 quan01994 2024-09-10 13:33:41 +08:00 网站功能受到影响 。 |
![]() | 5 wusheng0 2024-09-10 13:37:19 +08:00 22 年香港宕机仿佛历历在目 |
![]() | 6 Felldeadbird 2024-09-10 13:39:31 +08:00 所以云计算机不是机房发生爆炸后,(整体业务)自动迁移到容灾机房吗? |
7 YiCheng88 2024-09-10 13:44:15 +08:00 系统崩了一半 |
![]() | 8 glcolof 2024-09-10 13:45:49 +08:00 集中度越高的系统,抗风险能力越差。现在的“云计算”就是一个不断增加集中度的系统,随着设备老化和人员更迭,以后“云计算”的问题会越来越多、越来越严重…… |
![]() | 9 janwarlen 2024-09-10 13:46:06 +08:00 ,好几个小时了,现在在做迁移可用区,但是迁移这个进度也靠他们的人操作 这个也不知道要多久 崩溃了 |
![]() | 10 tyrone2333 2024-09-10 14:12:06 +08:00 公司上午就把人都叫在会议室救火, 充值用不了老板急死了 连都连不上救个毛线 |
![]() | 11 colinlikepotatos 2024-09-10 14:14:31 +08:00 吓我一跳,仔细看了 新加坡的服务器在亚马逊 |
12 newmancity 2024-09-10 14:41:47 +08:00 @zmaplex 都有各自的数据中心吧 |
![]() | 13 daimaosix 2024-09-10 14:50:54 +08:00 via Android @tyrone2333 快想办法兄弟 |
![]() | 14 mb4555 2024-09-10 14:57:55 +08:00 真的是日了狗了 |
&nsp; 15 MozzieW 2024-09-10 15:05:28 +08:00 感谢。花了 20 分钟检查 |
16 MozzieW 2024-09-10 15:07:32 +08:00 没打完发出去了 感谢。花了 20 分钟检查影响,10 分钟向上报告,30 分钟迁移。 得到评价“还好你看到了这个”。 话说你们那里看到公告到?今天摸鱼少,差点没看到。 |
17 Jerry23333 2024-09-10 15:17:13 +08:00 ![]() @Felldeadbird #6 也要看买的服务了,以数据库为例,分了基础版和高可用版,高可用版是一主一从的,如果主出了问题是会做 HA 切换的。但是如果买的基础版或者是主从在一个可用区,这时候就算是重新找个机房进行恢复,那也是很慢的,需要进行备份恢复。 |
18 PerFectTime 2024-09-10 15:20:50 +08:00 ![]() 防火墙没起作用吗?[:/doge] |
![]() | 20 CJAmoy 2024-09-10 15:25:37 +08:00 via Android 估计大部分都能用吧,不然早挂热搜了 |
21 coderxy 2024-09-10 15:27:19 +08:00 oss 的本地冗余版挂了。。。 还好其它组件都是多可用区高可用的。 |
22 hliman 2024-09-10 15:30:23 +08:00 hologres 现在还没恢复 |
23 MozzieW 2024-09-10 15:36:15 +08:00 @pkxutao 我们受到影响的是几个 OSS ,创建新的 bucket ,上传文件上去,修改 DNS 把流量切过去就可以了。 有一些文件暂时没有,或者不重要,就先不管。 楼上有说连不上救不了的,那是因为数据都是服务器上,连不上没有办法了。如果有备份的话,可以创建新服务器,重新把服务跑起来就可以了。 “迁移”这个词,对应的意思,差不多是新租(买)一个家,把原来家里的东西都搬过去,以后就去新家。 |
![]() | 24 hyseiya 2024-09-10 15:50:36 +08:00 22 年香港宕机后,阿里云从此是路人 |
![]() | 25 Kiske 2024-09-10 15:53:53 +08:00 ![]() “人心若是烧没了,修好一座破庙又有什么用呢?” |
![]() | 26 Tink PRO 轻量云分区域吗,也是新加坡 |
![]() | 27 bzw875 2024-09-10 15:54:38 +08:00 我们公司也受影响了 |
![]() | 29 xclimbing 2024-09-10 16:09:42 +08:00 ![]() 真是可笑,云服务的本意就是避免这种单点故障的,那它这个跟托管服务器有啥区别呢? |
![]() | 30 kenneth104 2024-09-10 16:12:51 +08:00 火熄了没?服务器泡水了没? |
31 dyllen 2024-09-10 16:15:05 +08:00 @MozzieW 连不上原来的机房你怎么迁移?拿自己的备份数据在新机房重新启动一个?丢失一段时间的数据?还是等原来的可以了再人工合并数据? |
![]() | 32 tyrone2333 2024-09-10 16:18:49 +08:00 @hyseiya 阿里云是真小丑国内外都是, 一年起码 2 次特大事故, 老板天天说要换其他厂商,东西太多一直没迁移 |
35 Plutooo 2024-09-10 16:23:12 +08:00 阿里云画的饼两地三中心怎么不好使 |
![]() | 38 qqjt 2024-09-10 16:49:31 +08:00 这故障是越来越离谱了 |
![]() | 39 pkxutao PRO @MozzieW #23 请问“修改 DNS ”是什么意思?你们能控制客户端的 DNS 吗?为什么不直接改域名映射呢 |
![]() | 40 huangzhiyia 2024-09-10 17:42:31 +08:00 |
41 MozzieW 2024-09-10 17:49:10 +08:00 ![]() @pkxutao #39 修改 DNS 解析,就是把域名指向新的地址,客户端用的 DNS ,数据是服务器端配置的。应该就是你理解的“域名映射”。 |
![]() | 42 crc8 2024-09-10 17:55:41 +08:00 ![]() 火烧云 |
44 zictos 2024-09-10 18:15:24 +08:00 用的量,还能用,轻量好像没有可用区一说 |
![]() | 45 mb4555 2024-09-10 18:18:23 +08:00 cjb |
47 Maser 2024-09-10 21:45:54 +08:00 阿里云这恢复没那么快吧 |
![]() | 48 flyqie 2024-09-10 22:37:04 +08:00 ![]() 上次是香港消防水灾 这次是新加坡火灾 阿里云这是跟水火杠上了? |
![]() | 49 daxy223 2024-09-11 03:04:25 +08:00 via iPhone OSS 现在还是不可用 |
51 Jerry23333 2024-09-11 08:43:40 +08:00 @xclimbing #29 云服务也分单可用区部署和多可用区。以数据库为例,购买分了基础版和高可用版,高可用版又分了单可用区部署和多可用区部署。如果你买的是高可用版本,且是多可用区的,一旦出现主实例不可用,是自动会切换的。进度里也提到了“ [进展更新] 截至 11:30 按照产品调度策略,云数据库 Redis/MongoDB/RDS MySQL 、对象存储 OSS 、表格存储 OTS 等云产品的**高可用版本**已陆续完成容灾切换。”。但如果你买的基础版,服务器出问题了那谁也没办法,自己部署也是一样的。 花多少钱,干多少事。 |
![]() | 52 corcre 2024-09-11 09:08:47 +08:00 @tyrone2333 怎么在会议室救火, 去新加坡救火啊 |
![]() | 53 iyahd 2024-09-11 09:28:06 +08:00 售后工程师 2024-09-11 08:37:41 您好,截至目前,得到工程师最新的消息:暂不影响数据,我们会全力进行保障,目前仅是业务不可访问。 只想数据别丢,还没来得及备份,哭死 |
![]() | 54 yb2313 2024-09-11 09:29:43 +08:00 阿里 25 岁了 |
![]() | 55 vone 2024-09-11 09:37:22 +08:00  |
59 iceprosurface 2024-09-11 10:47:15 +08:00 |
61 ninja911 2024-09-11 11:25:29 +08:00 会不会赔偿啊? 以自己损失评估,而不是阿里补充使用时长 |
62 polo3584 2024-09-11 11:28:54 +08:00 昨天恢复了,今天又不行了 |
![]() | 63 Features 2024-09-11 11:30:39 +08:00 又是哪位高管要销账呢? |
64 YiCheng88 2024-09-11 11:40:33 +08:00 24h 都没恢复 麻了 |
![]() | 65 EthanLau 2024-09-11 13:50:38 +08:00 ![]() 我们把数据库和服务器全迁到了可用区 B ,搞了一个晚上 |
66 hoythan 2024-09-11 14:09:45 +08:00 是不是没有请大师过来做法事导致的,按照阿里的佛性来说,这种大型的业务都必须找几个和尚才对。 |
![]() | 67 fengfisher3 2024-09-11 14:22:34 +08:00 @EthanLau 具体是怎么迁移的。是哪些产品?真学习脸。 |
68 jfds 2024-09-11 14:51:45 +08:00 买的是两地三中心的规格嘛?你不会以为所有实例都支持跨地域容灾吧 |
![]() | 70 EthanLau 2024-09-11 17:20:34 +08:00 ![]() @fengfisher3 也没有特别复杂,RDS 和 redis 阿里云有直接提供迁移可用区的功能,ECS 直接拿快照打个镜像重新在其他可用区开新的服务器就行了,我们服务器不多所以搞了一个晚上基本就弄完了,万幸是 OSS 和 SLB 没有受到影响 |
![]() | 72 fengfisher3 2024-09-11 17:41:27 +08:00 @EthanLau 数据没丢就好。 |
73 cndns 2024-09-11 20:22:12 +08:00 阿里云的 IDC 基建这么差的吗 |
74 byweilong 2024-09-11 20:53:32 +08:00 阿里的通知了,c 区搬走,还得几天时间恢复。。我们 50p 数据 业务全挂 |
75 mytsing520 PRO 更新了,内容要点: 1.大部分已恢复正常服务; 2.现场团队尚未被获准进入机房; 3.做好物理迁移服务器的应急准备,确定无法恢复后立即迁移 |
![]() | 76 MrDavidJones 2024-09-11 22:05:07 +08:00 每年都有重大事故 已经变成年货了 |
77 kenvix 2024-09-11 22:05:46 +08:00 数据上云了,乐 |
![]() | 78 8n1AfdFQWA5CWTNQ 2024-09-12 01:39:07 +08:00 via iPhone 上云後,公安一就拷去了 |
81 zhupite2 2024-09-12 09:31:29 +08:00 10 号这天下午,我测试恢复过一会,第二天发现又不行了,说是大楼断电。 然后直到现在,都是不可用状态! 我寻思难道鸡蛋都放这一栋楼里? |
![]() | 84 3wY4ZelqS1uYD4NJ 2024-09-12 17:19:13 +08:00 @tyrone2333 alyunflc ,aws 或者大陆华为云都可以看看 |
![]() | 85 3wY4ZelqS1uYD4NJ 2024-09-12 17:32:48 +08:00 @EthanLau 可以交流看看,商务折扣,阿里 aws 都涉及 |
![]() | 86 shakaraka PRO [进展更新] 09 月 12 日 17:25 ,运维人员已获准进入大楼一层区域,正在现场评估安全迁移条件,并对硬件设备进行紧急保全。 https://status.aliyun.com/#/eventDetail?eventId=21 |