Astra SE 1.6. Возникла ошибка при загрузке сервера. Что могло выйти из строя?

Здравствуйте!

У меня есть сервер на базе Intel Server Board S2600WF с двумя RAID-массивами: RAID 1 и RAID 10. После резкого отключения электричества сервер не загрузился и не доходит до GRUB после интеграции BIOS. 

После переустановки Astra возникли следующие проблемы: при выборе Astra 4.15.3-1 появляется строка "Error parsing PCC subspace from PCCT", и загрузка останавливается. Если выбрать режим recovery mode, то процесс заканчивается на следующих строках:

```
[    2.130621] pci 0000:85:1.6: hash matches workqueue: hash matches 920550
[    2.130246] rtc_cos 00:00: setting system clock to 2024-08-29 08:35
[    2.130434] BIOS EDD facility v0.16 2004-Jun-25, 8 devices found
[    2.130525] EDD information not available.
[    2.131170] digsig_verif: loading out-of-tree module taints kernel.
[    2.131367] digsig_verif: module verification failed: signature and key missing - tainting kernel
[    2.132059] DIGSIG: Initializing module ...
[    2.132149] DIGSIG: Registered DigSig hooks
[    2.132152] DIGSIG: Have loaded main key with id=@xdb069ff5
[    2.132325] DIGSIG: ignore_i_mode 0x0
[    2.133891] PARSEC: Initializing...
[    2.133897] PARSEC: Initialized
[    2.298349] ata5: SATA link down (SStatus 0 SControl 300)
[    2.298468] ata6: SATA link down (SStatus 0 SControl 300)
[    2.382553] ata12: SATA link down (SStatus 0 SControl 300)
[    2.390910] ata14: SATA link down (SStatus 0 SControl 300)
```

Каковы возможные причины этой проблемы?
  • 29 августа 2024 г. 7:24
Ответы на вопрос 2
Здравствуйте!

На основе вашего описания проблемы при загрузке сервера на базе Intel Server Board S2600WF можно выделить несколько возможных причин:

1. **Проблемы с файловой системой:** Резкое отключение питания часто приводит к повреждению файловой системы. Это может быть одной из причин, по которой сервер не загружается должным образом. Попробуйте использовать Live CD/USB и запустить утилиты проверки файловой системы, такие как `fsck`, для проверки, исправления возможных ошибок.

2. **Проблемы с RAID-массивами:** Возможно, один или оба RAID-массива могли выйти из строя или получить повреждения. Зайдите в BIOS RAID-контроллера (обычно при загрузке серверов есть возможность войти в интерфейс RAID) и проверьте состояние массивов. Если массив перестал быть доступным или находится в состоянии degraded, это может приводить к проблемам при загрузке.

3. **Проблемы с аппаратным обеспечением:** Поскольку сервер подвергался резкому отключению, возможны аппаратные сбои, такие как:
   - Проблемы с оперативной памятью (RAM). Попробуйте протестировать память с помощью `memtest86`.
   - Проблемы с жесткими дисками. Ваша информация об "ata:x: SATA link down" может указывать на то, что некоторые жесткие диски не распознаются. Проверяйте соединения SATA и электропитания, а также состояние жестких дисков.
   - Возможно, сбой в блоке питания (БП), который после отключения мог дать сбой.

4. **Проблемы с BIOS:** Иногда проблемы с настройками BIOS могут вызвать подобные проблемы. Попробуйте сбросить настройки BIOS на заводские или обновить BIOS, если доступно.

5. **Ошибки ядра или драйверов:** Сообщения, такие как "Error parsing PCC subspace from PCCT" и "signature and key missing - tainting kernel", могут указывать на ошибки в ядре или наличие проблем с загружаемыми модулями. Если это возможно, попробуйте загрузиться с более ранней версии ядра или загрузить безопасный режим (recovery mode).

6. **Журнал загрузки:** Если у вас есть доступ к логам системы, попытайтесь ознакомиться с ними (например, `dmesg` или `/var/log/syslog`), чтобы выявить более конкретные ошибки.

Для начала я рекомендую проверить состояние RAID и жестких дисков, а также провести диагностику оборудования. Если вам понадобится помощь на любом из этих этапов, дайте знать!
Похожие вопросы