Вход | Регистрация
 
Информационные технологии :: Администрирование

Нужна помощь по RAID на NVMe

Нужна помощь по RAID на NVMe
Я
   mrMixa
 
19.05.21 - 08:16
Всем доброго времени суток!

Год назад был куплен сервер Dell r720xd, с такими характеристиками:
процессор: Gold 6254 3.1GHz
память: DIMM,32GB,2933,2RX4,16G,DDR4,r (256Gb)
raid контроллер: PERC H740P, 8 Гбайт,
дисковая подсистема: Dell 1,6 Тбайт, NVMe, Mixed Use Express Flash, 2,5", малый форм-фактор, U.2, PM1725b (2шт) и Жесткий диск 2 Тбайт, 7 200 об/мин, SATA 6 Гбит/с (4шт)
На данном оборудовании были установлена 1С+SQL
Соответственно на первом NVMe диске Dell расположена система и 1С, на втором NVMe диске Dell установлены базы SQL вместе со служебными и temp базами, на 4-х обычных дисках собран raid 10 для бэкапов и файловой шары.
Резервирование данных осуществляется только по средствам ежедневных бэкапов, естественно такая ситуация не может считаться хорошей. В этом году после долгих переговоров с дистрибьютерами Dell и одного запроса в службу поддержки были приобретены 4 NVMe диска SAMSUNG MZWLL1T6HAJQ-00005 для сборки Raid 10 средствами встроенного raid контроллера S140.
На этапе сборке Raid возникли проблемы, nvme с маркировкой dell видятся S140 контроллером raid и на них без проблем собирается raid 1 или 0, а nvme Samsung, контроллер не обнаруживает, хотя платформа данные устройства определяет и установить OS на них возможно.
По данному вопросу было написано письмо в техподдержку Dell с приложением логов idrac, их официальный ответ: No matter if the NVMEs are from DELL or not… the fact is that the S140 is only supported in the 24x2,5” BP with 24xNVMEs
As you know customer has the 12xNVMEs flavor (not supporting the S140)
“Not supported” means the system isn’t ready to work with those devices, so the result is unpredictable
If customer wants to create a Raid with the NVMes, he must use a supported Raid controller  H740p
Естественно поставщики так же умыли руки и сказали, что ничем помочь не могут.

Что я уже пробовал:
1. Вставлял диски в отсеки с дисками Dell;
2. Менял салазки самих дисков на оригинальные Dell (была подобная история с сервером HP и в тот раз это помогло);
3. Обновлял драйвера S140 на новые и откатывал их на старые версии;
4. Пробовал установить диски в сервер с подобной конфигурацией;
5. Проверил последовательно эти прошивки perc H740P
51.13.2-3714, A14 11 нояб. 2020
50.9.4-3025, A11 09 янв. 2020
50.9.3-2949, A10 19 нояб. 2019
50.5.1-2818, A07.1 27 авг. 2019

Основная проблема в том, что на сегодняшний день есть в наличии сервер в описанной конфигурации с дисковой подсистемой:
Dell 1,6 Тбайт, NVMe, Mixed Use Express Flash, 2,5", малый форм-фактор, U.2, PM1725b (SAMSUNG MZWLL1T6HAJQ-00AD3) 2шт.
SAMSUNG MZWLL1T6HAJQ-00005  4шт.
2 Тбайт, 7 200 об/мин, SATA 6 Гбит/с 4шт.
Денег из бюджета больше не выбить до конца года. Из этого всего нужно собрать работоспособный сервер 1С+SQL, сервер терминалов и тонкий клиент установлены на другой машине.

Какие варианты я вижу:
1. Найти возможность собрать raid 10 на SAMSUNG MZWLL1T6HAJQ-00005  4шт. на них установить 1С+SQL и разместить там же базы (не представляется возможным)
2. Установить Hyper-v, средствами windows собрать raid5 из SAMSUNG MZWLL1T6HAJQ-00005 3шт, на него установить систему, 1С+SQL и базы, четвёртый диск выделить под системные базы 1С и логи баз (беспокоит в данном варианте скорость rebild-а raid, она может быть излишне велика)
3. Собрать raid 1 из двух дисков Dell 1,6 Тбайт, NVMe, Mixed Use Express Flashна него установить систему и 1С+SQL, базы вынести на отдельный диск (вариант на сегодняшний день представляется самым надёжным, но при тестировании получаем заметную просадку по скорости записи данных)
4. Оставить конфигурацию без изменений, только вынести служебные и temp файлы на другой диск SAMSUNG MZWLL1T6HAJQ-00005 (вариант может оказаться не таким плохим как выглядит на первый взгляд, если предусмотреть возможность с архивацией windows раз в сутки и так же например раз в сутки обновлять данные на аналогичном SAMSUNG MZWLL1T6HAJQ-00005, чтобы иметь возможность при выходе из строя системного диска подменить его, понятно что это придётся делать в ручную, базы из бэкапа если он находится на nvme восстанавливаются довольно быстро.

Может быть кто-то уже пользуется каким-то похожим вариантом и может рассказать о своих наблюдениях, нужны любые советы по данной теме.
 
 Партнерская программа EFSOL Oblako
   Провинциальный 1сник
 
1 - 19.05.21 - 08:18
"Резервирование данных осуществляется только по средствам ежедневных бэкапов, естественно такая ситуация не может считаться хорошей"
Что мешает бэкапить транзакции на другой носитель хоть через каждые 5 минут?
   mrMixa
 
2 - 19.05.21 - 08:26
(1) Согласен, что бэкапить транзакции можно и нужно, но у меня вопрос по схеме восстановления транзакций, несколько раз пробовал восстанавливать их на тестовый сервер, и практически всегда были неудачи, поэтому на бэкап транзакций в случае аварии у меня мало надежды, хоть он и есть наз в 30 минут.
   Провинциальный 1сник
 
3 - 19.05.21 - 08:31
(2) Непонятно что вы там с ними делаете, что у вас не получается. Там же всё тривиально и просто. При восстановлении восстанавливаешь пакет из последнего бэкапа БАЗЫ и цепочки бэкапов транзакций.
   stopa85
 
4 - 19.05.21 - 08:43
1. резервное копирование - это ежедневное полное резервное копирование копирование логов каждые 5-15 минут. Если у Вас на этом этапе что-то не получается, вы делаете что-то не так.
2. Отказоустойчивость на уровне серверов достигается наличием реплики БД на соседнем сервере. Если основной сервер сдохнет - будет запасной, готовый к работе
3. Отказоустойчивость самого сервера - это уже raid и дублирование БП

А то что диски Samsung с контроллером Dell не работают - это классический VendorLock. Увы.
   Asmody
 
5 - 19.05.21 - 08:52
Я бы продолжил тему ветки так: ".. не имеет практического смысла".
А в некоторых случаях даже вредит.
   mrMixa
 
6 - 19.05.21 - 08:55
(4) Про VendorLock тоскливо, что техподдержка не говорит прямо, в одном из писем они ответили что с нашим BP 12хNVME работать не будет, а на вопрос будет ли работать если сменить платформу на аналогичную но с BP 24xNVMEs сказали что они гарантий дать не могут.
При первичном вопросе нb техподдержка ,ни продажники не сказали, данная конфигурация работать не будет берите только оригинальные dell
   Garykom
 
7 - 19.05.21 - 09:10
https://forum.ixbt.com/topic.cgi?id=66:12494

перепрошить со сменой маркировки ssd диски
   mrMixa
 
8 - 19.05.21 - 09:15
(3) Скажем так, я слукавил, база восстанавливается предупреждений о ошибках не выходит, но несколько контрольно заведённых документов могли отсутствовать
(5) Согласен, что для большинства данная тема не имеет смысла, но некоторые находясь в среднем сегменте рынка хотят вместо SATA или SAS SSD со скоростью работы 540Mb на один диск, использовать NVMe на 3500Mb

Оборудование уже есть и оно должно работать максимально эффективно...
Дублирование на уровне серверов звучит красиво, пока мы не сталкиваемся с лицензиями (для среднего бизнеса это уже практически неподъёмные затраты)
   mistеr
 
9 - 19.05.21 - 10:47
(0) Энтерпрайз вендоры они такие, конкурентов не любят.

Если NVMe RAID нужен позарез, покупайте делловские диски (на деньги от продажи Самсунга :).

Но по-моему, при нормальной схеме бэкапов и допустимом дайнтайме вполне можно жить и без RAID. Самсунги используйте для темпов и профилей.

Да, и запасной диск идентичной модели на замену обязательно должен быть.
   Провинциальный 1сник
 
10 - 19.05.21 - 11:28
(8) "но несколько контрольно заведённых документов могли отсутствовать"
Только если они были введены после последнего бэкапа транзакций
   mrMixa
 
11 - 20.05.21 - 09:24
(9) Спасибо за совет, уже сам пришёл к решению №4
А насчёт продажи дисков скажу так 1 Новый Samsung с маркировкой Dell стоит как 3 новых диска Samsung без маркировки и это без учёта новых тенденций на рост цен в связи с майнингом на дисках.

Список тем форума
 
ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку "Обновить" в браузере.