PVE 今天突然故障了,请教下如何处理?现象如下:
1 yc8332 268 天前 是不是额外的磁盘没挂上,重新挂一下看看,不然就是磁盘有问题 |
![]() | 2 xiaoranj 268 天前 no such logical volume pve/data(500) 磁盘掉了/坏了 ? |
3 991547436 268 天前 实体机看看 raid 挂了没 |
![]() | 4 qW7bo2FbzbC0 268 天前 开 ssh ,我帮你远程看下 |
![]() | 5 coldle 268 天前 感觉是盘挂了,建议描述下硬件情况 |
8 jonsmith OP @qW7bo2FbzbC0 内网机器不方便远程呢 |
10 aru 268 天前 看下主机在线时间,如果没重启过,就是硬盘坏了 |
11 aru 268 天前 大概率硬盘挂了,重新接下 m2 再开机吧 如果开不了,那只能换硬盘重装系统了 |
![]() | 12 totoro625 268 天前 目测 SSH 能连接,fdisk 把 locla-lvm 分区容量扣 10G 下去 |
15 jonsmith OP |
![]() | 16 kokutou 268 天前 df -h pvs vgs lvs -a fdisk -l lsblk blkid 都贴一下吧 |
![]() | 17 kkk123 268 天前 dmesg journalctl -e 看看日志里的 error |
18 jonsmith OP pve 宿主机 journalctl 日志 报错日志: https://minio.hoopan.net/lobe/files/482478/6a07683c-ce64-489b-8df0-3d6ff4e666d4.png |
20 aru 268 天前 @jonsmith -bash: /usr/bin/*: Input/output error 这就是硬盘读取失败最明显的信息 硬盘坏了,但是常用文件在内存缓存内,所以直接读内存返回了 别挣扎了,就是硬盘故障。如果有重要的小文件,可以尝试备份下 然后关机重新接下硬盘,看能不能恢复(有时候接口问题或硬盘、控制器过热,重新接下可能会恢复) |
21 aru 268 天前 你的日志也指向了硬盘故障 不信群里大佬的分析,你就让 AI 分析日志吧 |
![]() | 22 guanzhangzhang 268 天前 终端上 Input/output error 就是盘坏掉了,而且你这前面的路径是系统盘路径。 vm 上能 ssh 就 ssh 上去把数据备份下。然后准备一个 ISO 的 Linux 启动到内存修复下 pve 的系统盘试试 |
![]() | 23 1462326016 268 天前 前段时间刚坏过一块硬盘,也是一样的 Input/output error ,只不过我的是数据盘,不是系统盘,也是一块固态,所以确定是硬盘坏了,不要重启,抓紧时间备份换硬盘吧,重启了可能就起不来了 |
![]() | 24 snoopygao 267 天前 有一定概率重启自动 fsck 就好了 |
25 jonsmith OP @1462326016 测试机,倒没什么重要数据,就是要重新安装一遍,烦。这吊固态没有 nas 的机械盘稳 |
![]() | 27 SSang 267 天前 大概率是你改了 ip 或者 hostname 导致的 |
![]() | 28 SSang 267 天前 不对,应该就是磁盘掉了,不一定是磁盘问题,也有可能是主板问题。 你应该 fsck 先尝试修复,不行的话,试试换到别的主板上。如果别的主板也不行,那就是磁盘换了 |
![]() | 29 kkk123 267 天前 pve -> Disk/磁盘下看看 SMART 状态,有可能是死期到了 |
30 jonsmith OP @kkk123 强制关电源重启,又恢复正常了,哈哈。SMART 状态健康,硬盘没问题。这个问题真奇怪。 https://minio.hoopan.net/lobe/files/482485/5772a536-3060-4df4-9b41-5d9de1cf306f.png |
31 XiaoBu1 267 天前 推荐用 pbs ,出问题直接删了虚拟机再恢复 |
![]() | 32 comlewin 267 天前 你这问题我前两天刚遇到过,报错日志一样,不过宿主机无法 ssh 登录,只能重启,重启后恢复正常。网上查了下资料应该是掉盘了,要么是硬盘问题要么是电源的问题,ssd 是三星的 990OPRO 新的用了不到一个月,网上有反馈 990pro 有掉盘的缺陷,但是我的应该是电源问题,我前段时间在主板 bios (华硕 b650M )上开启了最大节省电能的开关。 |
![]() | 35 ko20 37 天前 woc 我刚刚也遇到了,我家里的 pve 主机执行各种命令都报错 `bash: Input/output error` 执行 poweroff 报错 Failed to open initctl fifo: No such device or address Failed to talk to init daemon. 回家看看了…… 是一块 128GB ssd |