ECS 重启后无法远程连接。通过 VNC 远程连接后画面一直停留在进入系统的进度条,快照已经恢复到 1 月 14 日,依然无法连接。
怀疑是磁盘空间满了,用系统盘快照镜像创建了一个新的 ECS,新的 ECS 从之前的数据盘创建新的云盘。
发现还是连不上。
发送远程命令(云助手)无响应。
请问有没有好的解决办法?
如果恢复不了,数据盘的文件有没有办法弄出来?
求教
1 Attan 2021-01-23 15:17:58 +08:00 ![]() 最好的办法是提工单 响应解决更妥当 |
2 fredcc 2021-01-23 15:29:58 +08:00 via Android ![]() 创建一个同样系统的 ecs 实例,将原实例关机,对数据盘做快照,分离数据盘,挂到新实例上,mount 下 |
3 yunhui 2021-01-23 16:22:47 +08:00 发帖别有瘾啊,你这点发帖等待的时间,阿里云的工单技术已经给你解决了 |
![]() | 4 polyang 2021-01-23 16:47:37 +08:00 提工单 |
![]() | 5 weifan 2021-01-23 16:52:48 +08:00 当然提工单啊.....有什么能比工单稳? |
![]() | 6 62D0oo7AxBv8qn17 2021-01-23 16:56:10 +08:00 现在阿里云提工单都没人工回复的,都是一些所谓的不知所云的智能回复系统,想人工回答的话,出钱吧 |
![]() | 8 opengps 2021-01-23 17:56:46 +08:00 阿里云有人工,只不过实在机器人后面,胡乱输入下,然后低下可能会出现转人工的连接 |
10 Mirana 2021-01-23 18:05:37 +08:00 提工单 有专门值班技术解决 |
![]() | 11 mcone 2021-01-23 18:49:05 +08:00 @simonzhd 这么惨了吗? 我一年前买的 ECS 出了些使用中的问题(其实跟他们 wiki 更新缓慢也有关系),不属于影响使用的大问题,只属于可回复不可回复的那种,他们也有真人回复了,从提交到完全解决响应时间不到一周,我当时觉得还可以的样子,虽然 ECS 贵了些…… |
![]() | 12 UUZ 2021-01-23 19:22:54 +08:00 抖机灵 等阿里云售后注册 V2EX |
![]() | 13 chijince OP 已经提交工单了 授权了 ECS 的权限 现在看看阿里的工程师能不能帮我解决了 哎 太闹心了 |
![]() | 16 zx900930 2021-01-24 02:14:17 +08:00 昨天,腾讯云从云控制台更新 ssh 证书后系统崩溃,VNC 查看无限重启,grub 尝试了几个内核都无效。 国内时间的 12 点半提交的工单,从提交工单到解决花了 5 个小时还不能催单,就是 /usr/分区直接被移走了,chroot 进去移回来就恢复了,给你参考一下。 你要是业务很重要就得掏钱,不重要你可以慢慢等。 当然不管用不用人工交不交钱,核心数据一定要多处备份。 如果只用快照,备份策略得设置好,不然出事的时候要恢复发现一堆坏快照就惨了。 |
18 40EaE5uJO3Xt1VVa 2021-01-24 08:54:01 +08:00 有在这里问的功夫,提工单呀 |
![]() | 19 ChenXuting 2021-01-24 08:56:57 +08:00 via Android 之前出现问题,工单解决了。 |
![]() | 20 gricn 2021-01-24 09:30:58 +08:00 via Android 阿里云曾经在凌晨 2 点回复我工单,且不像是机器回复的 |
21 jjx 2021-01-24 09:49:29 +08:00 |
![]() | 22 dream4ever 2021-01-24 11:09:57 +08:00 我们公司用的阿里云 ECS 和你出现过类似的问题,一台运行了四年多的 Windows Server 2012,业务需要装过各种软件,也经常安装系统更新,结果有一天 IIS 下面的网站都无法访问了,重启之后就卡在那个“疑难解答”界面,进不去系统,给阿里云提交了工单,他们的技术工程师尝试了各种办法也没解决。 最后给系统盘创建了一个快照,用来把上面的数据库文件之类的拷出来。然后在系统盘上重新安装的系统,数据盘还都在,不放心的话也可以给数据盘做个快照,有备无患。 尽管给阿里云提交工单就行,我们现在有相关问题都提交工单,回复都还算及时,服务挺不错的。 |
23 CoderLife 2021-01-24 11:43:08 +08:00 上上周遇到同样的问题: 空间满了, 删掉文件后, Postgres 无法启动, 重启后无法 ssh, 后面提的工单, 经工单查询原因, 因为导致挂载出问题了, 经过一个小时的解决. 终于解决 总结: 1. 定期自动测试磁盘空间大小, 发邮件. 2. 买单独盘, 定期备份关键数据到单独盘. |
24 lbyxiaolizi 2021-01-24 11:56:38 +08:00 去机器人那边随便说两句,然后发工单让他帮你解决,可能一个下午就好(划掉 |
![]() | 25 chijince OP |
![]() | 26 chijince OP 我的数据都在 RDS 上,所以重新获得数据盘的文件即可,系统无所谓。数据和 WEB 服务器分离、系统和网站文件磁盘分离,这是有必要的。 其实在发帖之前已经提交了工单了,就是等了好久,后来阿里云的工程师的回复是这样的: -------------------------------------- 您的服务器系统在启动过程中会卡住,不能正常启动完成。 在系统启动时,设置用单用户模式可以正常进入系统,单用户模式进去,检查系统里边也没有发现异常,尝试把 /etc/rc3.d/ 下边开机启动的服务都取消了,重启服务器还是会卡在,目前没能修复系统启动的问题。 当前是单用户模式进去的,您也可以从控制台登录服务器里,检查一下系统里的启动服务情况。 可以备份一下服务器里的数据,考虑给服务器重新初始化系统,恢复到最初正常的系统启动。 --------------------------------------- 我后来重新创建了一个 ECS,使用和故障机器一样的系统版本,增加一块数据盘,数据盘以此前备份的快照创建。 启动后,fdisk -l 查看分区,使用 mount /dev/vdb1 /mnt 挂载成功。 到这里心里基本有底,备份故障机器,重新装系统,直接用 mount /dev/vdb1 /mnt 挂载成功。 |
27 jeriyeh 2021-01-24 12:40:36 +08:00 你这问题还不算太严重,我们前段时间用微软的 azure 云服务器, 硬盘空间只用了一半,一切看似都很正常,通过服务器管理面板添加网站都时候卡住了,重启了下,就整个硬盘( vhd )都没了, 启动诊断截图显示 “no boot device”,什么文件都找不到的那种,复制挂载查看就是个空盘,微软的技术支持也搞不了,只能恢复 1 天前的镜像,瞬间对云也失去了信心,因为这种问题看似硬件级别的错误,很像是以前那种启动扇区坏道的问题,但 vhd 文件就是无法修复 |
28 QBzzz 2021-01-24 15:33:05 +08:00 装监测应用撒,等出问题再解决麻烦得很 |
![]() | 29 matrix67 2021-01-24 16:00:15 +08:00 大佬们都不监控吗,推荐监控宝啊!!!快满了给你短信 |
![]() | 30 TophTab 2021-01-24 21:17:48 +08:00 via Android 最近几天,我的轻量服务器在我折腾之下,死机了 3 次,两次都是 reboot 后连不上了,停止后再开机有几机率能用。 |