RAID массивы — краткий ликбез — Записки IT специалиста

Содержание
  1. Что такое RAID и для чего он используется?
  2. Какие преимущества дают RAID массивы
  3. Негативные стороны применения RAID массивов
  4. RAID-контроллеры: аппаратные и не очень
  5. Что можно подключать к RAID-контроллеру
  6. RAID массивы — краткий ликбез
  7. Чем является и чем не является RAID-массив
  8. BAD-блоки и неисправимые ошибки чтения
  9. MTBF — наработка на отказ
  10. Немного терминологии
  11. Настройка «RAID»
  12. Подобные технологии
  13. Что такое RAID и зачем оно нужно?
  14. Почему так сложилось в общем и целом
  15. Что такое RAID в физическом смысле
  16. Важное примечание, которое стоит помнить
  17. Что такое RAID массив
  18. RAID 0, что это такое?
  19. RAID 1
  20. RAID 2
  21. RAID 3
  22. RAID 4
  23. RAID 5
  24. RAID 5E
  25. RAID 5EE
  26. RAID 6
  27. RAID 6E
  28. Вложенные уровни
  29. RAID 10 (RAID 1+0)
  30. RAID 01 (RAID 0+1)
  31. RAID 03 (RAID 0+3)
  32. RAID 50 (RAID 5+0)
  33. Аппаратные RAID-контроллеры
  34. Дополнительные функции RAID-контроллеров
  35. Сравнение уровней RAID
  36. Программный RAID
  37. Hybrid RAID
  38. RAIDIX
  39. Matrix
  40. Дальнейшее развитие идеи RAID
  41. Коррелированные сбои
  42. Несовместимость конфигураций
  43. Какой выбрать RAID массив?
  44. Какой тип RAID лучше всего использовать
  45. Что делать, если данные потеряны
  46. Особенности
  47. Практические советы
  48. Выводы

Что такое RAID и для чего он используется?

RAID – это дисковый массив из нескольких жестких дисков. Он используется для повышения надежности хранения данных или для увеличения скорости чтения / записи (или того и другого). Вы можете создать программный RAID (используя функции операционной системы) и аппаратный RAID, используя совместимую материнскую плату, контроллер или NAS.

Для установки RAID-массива потребуется материнская плата с поддержкой рейд-технологии или аппаратный контроллер и как минимум два жестких диска одного типа (совпадающие по всем параметрам), подключенных к материнской плате.

Почему мы настоятельно рекомендуем использовать жесткие диски одинаковые по всем параметрам? Если вы подключите два жестких диска с разным объемом памяти, на каждом HDD RAID будет использовать дисковое пространство, равное наименьшему из дисков, и на втором HDD останется неиспользуемое дисковое пространство. Кроме того, при использовании разных жестких дисков существует вероятность преждевременного выхода из строя одного из них, что может привести к потере важных данных.

RAID также часто используется в серверах NAS, которые, по сути, представляют собой компьютер с дисковым массивом, подключенный к сети (обычно локальной) и поддерживающий протоколы, принятые в сети. Несколько таких компьютеров можно объединить в одну систему.

Отметим, что при создании или удалении RAID удаляется вся информация на дисках. То есть очень желательно сделать резервную копию важных данных.

Какие преимущества дают RAID массивы

Экономическая составляющая.
В RAID массиве вы можете использовать несколько дешевых жестких дисков, получая в результате большие объемы памяти с минимальными затратами. Идеально для хранения личной информации, такой как, например, фильмы или семейные фотографии.

Производительность.
Используя RAID массив с несколькими жесткими дисками, вы получаете гораздо более высокую производительность, чем при одном активном устройстве. До уровня SSD, конечно, диски не дотянут, но скорость чтения-записи существенно возрастет. Как следствие, если ваша система установлена на HDD, скорость запуска компьютера будет выше.

Надежность.
Шанс того, что информация на вашем компьютере будет повреждена и недоступна для восстановления стремительно падает. Ведь чем больше суммарный объем памяти, тем большему количеству секторов надо сломаться прежде чем ситуация станет критической. А шанс того, что будет поврежден нужный вам файл вообще мизерный.

Отказоустойчивость.
Если вы используете массива RAID 5 с функцией “отзеркаливания”, вы можете свободно иметь два диска с идентичными данными. Повредился один — не проблема, все хранится в целости и сохранности на втором устройстве.

Негативные стороны применения RAID массивов

Высокая стоимость.
Помимо обычных RAID массивов существуют и гибридные, “Nested” массивы. Они могут содержать, например RAID 1+0, 0+3 и другие комбинации. Стоимость таких устройств ощутимо выше и может ударить по карману.

Риск цепного самоуничтожения.
Несмотря на то, что RAID массивы надежны и шанс повреждения дисков довольно низок, всегда есть вероятность старта цепной реакции “смерти”. Например, если один из дисков вышел из строя, вполне вероятно, что и другие тоже скоро постигнут его участь. Обратите внимание, что такие риски существуют только при полном отказе. Пара битых секторов должны вас насторожить, но не должны вгонять в панику.

Особенности производства.
Некоторые уровни RAID, например RAID 1 и 5, могут выдержать отказ только одного диска. И все остальные устройства в массиве находятся в серьезной опасности до тех пор, пока поврежденный диск не будет заменен новым.

RAID-контроллеры: аппаратные и не очень

По исполнению контроллеры делятся на программные и аппаратные. Программные реализуются непосредственно средствами операционной системы или на уровне материнской платы. Последние также известны как интегрированные, а также Fake-RAID. Они работают быстрее чисто софтверных решений за счет специального чипа для управления массивом. Недавно публиковался текст о развертывании таких технологий. Дополнительной железки при этом никакой нет и в любом случае будут использоваться ресурсы вычислительной машины.

Аппаратные RAID-контроллеры выполняются в форм-факторе платы PCIe либо в составе внешнего автономного устройства — дискового массива.

Они имеют на борту собственные процессор, память, BIOS и специальный интерфейс для конфигурации. Платы PCIe также комплектуются дополнительными модулями, сохраняющими данные, если произойдет сбой в электропитании: BBU с Li-Ion аккумулятором и ZMCP на базе суперконденсатора.

Оба модуля позволяют сделать сэйв содержимого кэша. После восстановления работы эти данные будут немедленно записаны на диск. Дисковый массив, будучи автономным, располагает собственными блоком питания и системой охлаждения.

Накопители подключаются к плате либо кабелями напрямую, либо через платы расширения. Автономные дисковые массивы содержат все накопители внутри себя, а наружу смотрит все тот же интерфейс PCIe (есть и другие варианты, например, USB 3.2 и Thunderbolt 3). Кстати, известный вид дисковых массивов — сетевое хранилище данных (NAS).

Что можно подключать к RAID-контроллеру

Следующий важный параметр, по которому различаются RAID-массивы, это поддержка интерфейсов накопителей. Не будем тревожить склеп с IDE-дисками, а констатируем, что по большому счету применяются три типа: SATA, SAS и NVMe. SAS — удел серверов, а вот остальные применяются повсеместно.

Есть программные и аппаратные RAID-контроллеры, которые умеют управлять массивом дисков с одним из интерфейсов. В формате PCIe есть и такие платы, которые реализуют режим Tri-Mode, позволяющий работать со смешанным составом накопителей.

RAID массивы — краткий ликбез

RAID-массивы давно и прочно вошли в повседневную деятельность администраторов даже небольших предприятий. Трудно найти того, кто никогда не использовал хотя бы «зеркало», но тем не менее очень и очень многие с завидной периодичностью теряют данные или испытывают иные сложности при эксплуатации массивов. Не говоря уже о распространенных мифах, которые продолжают витать вокруг вроде бы давно избитой темы. Кроме того, современные условия вносят свои коррективы и то, чтобы было оптимальным еще несколько лет назад сегодня утратило свою актуальность или стало нежелательным к применению.

Чем является и чем не является RAID-массив

Наиболее популярен миф, что RAID предназначен для защиты данных, многие настолько верят в это, что забывают про резервное копирование. Но это не так. RAID-массив никоим образом не защищает пользовательские данные, если вы захотите их удалить, зашифровать, отформатировать — наличие или отсутствие RAID вам абсолютно не помешает. Две основных задачи RIAD-массивов — это защита дисковой подсистемы от выхода из строя одного или нескольких дисков и / или улучшение ее параметров по сравнению с одиночным диском (получение более высокой скорости обмена с дисками, большего количества IOPS и т.д.).

Здесь может возникнуть некоторая путаница, ведь сначала мы сказали, что RAID не защищает, а потом выяснилось, что все-таки защищает, но никакой путаницы нет. Основную ценность для пользователя представляют данные, причем не некоторые абстрактные нули-единицы, кластеры и блоки, а вполне «осязаемые» файлы, которые содержат необходимую нам информацию, иногда очень дорогостоящую. Мы будем в последствии называть это пользовательскими данными или просто данными.

RAID-контроллер о данных ничего не знает, он оперирует с блочными устройствами ввода-вывода. И все что поступает к нему от драйвера — это просто поток байтов, который нужно определенным образом разместить на устройствах хранения. Сам набор блочных устройств объединенных некоторым образом отдается системе в виде некоторой виртуальной сущности, которую принято называть массивом, а в терминологии контроллера — LUN, для системы это выглядит как самый обычный диск, с которым мы можем делать все что угодно: размечать, форматировать, записывать данные.

Как видим, работа RAID-контроллера закончилась на формировании LUN и предоставлении его системе, поэтому защита контроллера распространяется только на этот самый LUN — т.е. логическая структура массива, которую система видит как жесткий диск, должна уцелеть при отказе одного или нескольких дисков составляющих этот массив. Ни более, ни менее. Все что находится выше уровнем: файловая система, пользовательские данные — на это «защита» контроллера не распространяется.

Простой пример. Из «зеркала» вылетает один из дисков, со второго система отказывается грузиться, так как часть данных оказалась повреждена (скажем BAD-блок). Сразу возникает масса «претензий» к RAID, но все они беспочвенны. Главную задачу контроллер выполнил — сохранил работоспособность массива. А в том, что размещенная на нем файловая система оказалась повреждена — это вина администратора, не уделившего должного внимания системе.

Поэтому следует запомнить — RAID-массив защищает от выхода из строя одного или нескольких дисков только самого себя, точнее тот диск, который вы видите в системе, но никак ни его содержимое.

BAD-блоки и неисправимые ошибки чтения

Раз мы коснулись содержимого, то самое время разобраться, что же с ним может быть «не так». Начнем с привычного зла, BAD-блоков. Есть мнение, что если на диске появился сбойный сектор — то диск «посыпался» и его надо менять. Но это не так. Сбойные сектора могут появляться на абсолютно исправных дисках, просто в силу технологии, и ничего страшного в этом нет, обнаружив такой сектор контроллер просто заменит его в LBA-таблице блоком из резервной области и продолжит нормально работать дальше.

Дальше простая статистика, чем выше объем диска — тем больше физических секторов он содержит, тем меньше их физический размер и тем выше вероятность появления сбойных секторов. Грубо говоря, если взять произведенные по одной технологии диски объемом в 1ТБ и 4 ТБ, то у последнего вероятность появления BAD-блока в четыре раза выше.

К чему это может привести? Про ситуацию, когда администратор не контролирует SMART и у диска давно закончилась резервная область мы всерьез говорить не будем, тут и так все понятно. Это как раз тот случай, когда диск реально посыпался и его нужно менять. Большую опасность представляет иная ситуация. Согласно исследованиям, достаточно большие объемы данных составляют т.н. cold data — холодные или замороженные данные — это массивы данных доступ к которым крайне редок. Этом могут быть какие-нибудь архивы, домашние фото и видеоколлекции и т.д. и т.п., они могут месяцами и годами лежать не тронутыми никем, даже антивирусом.

Если в этой области данных возникнет сбойный сектор, то он вполне себе может остаться необнаруженным до момента реконструкции (ребилда) массива или попыток слить данные с массива с отказавшей избыточностью. В зависимости от типа массива такой сектор может привести от невозможности выполнить ребилд до полной потери массива во время его реконструкции. По факту невозможность считать данные с еще одного диска в массиве без избыточности можно рассматривать как отказ еще одного диска со всеми вытекающими.

Кроме физически поврежденных секторов на диске могут быть логические ошибки. Чаще всего они возникают, когда контроллер без резервной батарейки использует кеширование записи на диск. При неожиданной потере питания может выйти, что контроллер уже сообщил системе о завершении записи, но сам не успел физически записать данные, либо сделал это некорректно. Попав в область с холодными данными, такая ошибка тоже может жить очень долго, проявив себя в аварийной ситуации.

Ну и наконец самое интересное: неисправимые ошибки чтения — URE (Unrecoverable Read Error) или BER (Bit Error Ratio) — величина, показывающая вероятность сбоя на количество прочитанных головками диска бит. На первый взляд это очень большая величина, скажем для бытовых дисков типичное значение 10^14 (10 в 14 степени), но если перевести ее в привычные нам единицы измерения, то получим примерно следующее:

  • HDD массовых серий — 10^14 — 12,5 ТБ
  • HDD корпоративных серий — 10^15 — 125 ТБ
  • SSD массовых серий — 10^16 — 1,25 ПБ
  • SSD корпоративных серий — 10^17 — 12,5 ПБ

В данном случае в качестве единицы измерения мы использовали десятичные единицы измерения объема, т.е. те, что написаны на этикетке диска, исходя из того, что 1 КБ = 1000 Б.

Что это значит? Это значит, что для массовых дисков вероятность появления ошибки чтения стремится к единице на каждые прочитанные 12,5 ТБ, что по сегодняшним меркам не так уж и много. Если такая ошибка будет получена во время ребилда — это, как и в случае со сбойным сектором, эквивалентно отказу еще одного диска и может привести к самым печальным последствиям.

MTBF — наработка на отказ

Еще один важный параметр, который очень многими трактуется неправильно. Если мы возьмем значение наработки на отказ для современного массового диска, скажем Seagate Barracuda 2 Тб ST2000DM008, то это будет 1 млн. часов, для диска корпоративной серии Seagate Enterprise Capacity 3.5 2 Тб ST2000NM0008 — 2 млн. часов. На первый взгляд какие-то запредельные цифры и судя по ним диски никогда не должны ломаться. Однако этот показатель определяет не срок службы устройства, а среднее вермя между отказами — MTBF ( Mean time between failures ) — а в качестве времени подразумевается время работы устройства.

Если у вас есть 1000 дисков, то при MTBF в 1 млн. часов вы будете получать в среднем один отказ на 1000 часов. Т.е. большие значения оказываются не такими уж и большими. Для оценки вероятности отказа применяется иной показатель — AFR (Annual failure rate) — годовая частота отказов. Ее несложно рассчитать по формуле, где n — количество дисков:

AFR = 1 - exp(-8750*n/MTBF)

Так для одиночного диска массовой серии годовая частота отказов составит 0,87%, а для корпоративных дисков 0,44%, вроде бы немного, но если сделать расчет для массива из 5 дисков, то мы получим уже 4,28% / 2,16%. Согласитесь, что вероятность отказа в 5% достаточно велика, чтобы сбрасывать ее со счетов. В тоже время такое знание позволяет обоснованно подходить к закупке комплектующих, теперь вы можете не просто апеллировать к тому, что вам нужны корпоративные диски, потому что они «энтерпрайз и все такое…», а грамотно обосновать свое мнение с цифрами в руках.

Но в реальной жизни не все так просто, годовая величина отказов не является статичной величиной, а подчиняется законам статистики, учитывающим совокупность реальных факторов. Не углубляясь в теорию мы приведем классическую кривую интенсивности отказов:

Как можно видеть, в самом начале эксплуатации вероятность отказов наиболее велика, постепенно снижаясь. Этот период, обозначенный на графике t0 — t1, называется периодом приработки. В этот момент вскрывается производственный брак, ошибки в планировании системы, неверные режимы и условия эксплуатации. Повышенная нагрузка увеличивает вероятность отказов, так как позволяет быстрее выявить брак и ошибки эксплуатации.

За ним следует период нормальной эксплуатации t1-t2, вероятность отказов в котором невелика и соответствует расчетным значениям (т.е. тем показателям, которые мы вычислили выше).

Правее отметки t2 на графике начинается период износовых отказов, когда оборудование начинает выходить из строя выработав свой ресурс, повышенная нагрузка будет только усугублять этот показатель. Также обратите внимание, что функция износа изменяется не линейно, по отношении ко времени, а по логарифмической функции. Т.е. в периоде износа отказы будут увеличиваться постепенно, а не сразу, но, с какого-то момента стремительно.

К чему это может привести? Скажем, если вы эксплуатируете массив, находящийся в периоде износовых отказов и у него выходит из строя один из дисков, то повышенная нагрузка во время ребилда способна привести к новым отказам, что чревато полной потерей массива и данных.

Для жестких дисков и SSD, согласно имеющейся статистики, период приработки где-то равен 3-6 месяцам. А период износовых отказов следует начинать отсчитывать с момента окончания срока гарантии производителя. Для большинства дисков это два года. Это хорошо укладывается в ту же статистику, которая фиксирует увеличение количества отказов на 3-4 году эксплуатации.

Мы не будем сейчас делать выводы и давать советы, приведенных нами теоретических данных вполне достаточно, чтобы каждый мог самостоятельно оценить собственные риски.

Немного терминологии

Прежде чем двигаться дальше — следует определиться с используемыми терминами, тем более что с ними не все так однозначно. Путаницу вносят сами производители, используя различные термины для обозначения одних и тех же вещей, а перевод на русский часто добавляет неопределенности. Мы не претендуем на истину в последней инстанции, но в дальнейшем будем придерживаться описанной ниже системы.

Весь входящий поток данных разбивается контроллером на блоки определенного размера, которые последовательно записываются на диски массива. Каждый такой блок является минимальной единицей данных, с которой оперирует RAID-контроллер. На схеме ниже мы схематично представили массив из трех дисков (RAID 5).

Каждая шайба на схеме представляет один такой блок, для обозначения которого используют термины: Strip, Stripe Unit, Stripe Size или Chunk, Сhunk Size. В русскоязычной терминологии это может быть блок, «страйп», «чанк». Мы, во избежание путаницы с другой сущностью, предпочитаем использовать для его обозначения термин Chunk (чанк, блок), в тоже время встроенный во многие материнские платы Intel RAID использует термин Stripe Size.

Группа блоков (чанков) расположенная по одинаковым адресам на всех дисках массива обозначается в русскоязычных терминах как лента или полоса. В англоязычной снова используется Stripe, а также «страйп» в переводах, что в ряде случаев способно внести путаницу, поэтому при трактовании термина всегда следует учитывать контекст его употребления.

Каждая полоса содержит либо набор данных, либо данные и их контрольные суммы, которые вычисляются на основе данных каждой такой полосы. Глубиной или шириной полосы (Stripe width/depth) называется объем данных, содержащийся в каждой полосе.

Так если размер чанка равен 64 КБ (типовое значение для многих контроллеров), то вычислить ширину полосы мы можем, умножив это значение на количество дисков с данными в массиве. Для RAID 5 из трех дисков — это два, поэтому ширина полосы будет 128 КБ, для RAID 10 из четырех дисков — это четыре и ширина полосы будет 256 КБ.

Настройка «RAID»

«RAID» обычно используется на серверах, «мэйнфреймах» («mainframe» – большой универсальный высокопроизводительный отказоустойчивый сервер, используемый для обработки огромного объема пакетных ресурсов с высочайшей рабочей нагрузкой на ввод-вывод данных) и других компьютерных системах, где важно иметь избыточное и защищенное пространство для сохранения данных. «RAID» не часто используется на обычных стационарных настольных компьютерах и ноутбуках, однако многие образцы готовых корпусных компьютеров поставляются с контроллерами «RAID». И при соответствующем желании или возникшей потребности, пользователи могут настроить конфигурацию «RAID 1» с двумя дисками, чтобы обеспечить зеркальное отображение данных на них и добиться гарантированной сохранности информации.

Для организации собственного «RAID» массива на основе двух, установленных на компьютере, жестких дисков пользователи могут использовать два возможных варианта настройки и последующего управления: «аппаратный RAID» или «программный RAID». При использовании аппаратного метода, «RAID-контроллер», представляющий собой плату расширения или внешне размещенное устройство, выполнит за пользователей всю основную работу с массивом «RAID» и его последующим представлением. Например, если пользователи, обладающие компьютером, укомплектованным аппаратным «RAID-контроллером», настроят два диска для функционирования в конфигурации «RAID 1», то ответственный «RAID-инструментарий» будет отображать два диска массива в пользовательской операционной системе как один жесткий диск. Все основные последующие действия, связанные с зеркалированием данных, разделение и упорядоченное распределение информационных материалов на жесткие диски и другие сопутствующие операции, будут выполнены аппаратным контроллером «RAID». И операционная система, установленная на компьютере и используемая для управления всеми процессами даже не будет обладать сведениями, что на самом деле в качестве запоминающего устройства выступает массив «RAID 1».

Для реализации программного варианта «RAID» не используются аппаратные средства, а полностью задействуются программные компоненты, и вся основная нагрузка по организации «RAID» приходится на операционную систему. Например, пользователи могут создать «программный RAID» при установке операционной системы «Linux» на свой компьютер – ядро «Linux» обладает достаточным инструментарием для создания «RAID» и будет выполнять всю работу без какого-либо специального оборудования. Также можно создать «программный RAID» и в операционной системе «Windows» (предлагаемый «Windows» формат представления жестких дисков не использует традиционную для «RAID» систем уровневую маркировку «0», «1», «5», «10» и т.д., однако заложенные возможности системы позволяют объединять диски в единое пространство, чередовать порционно информацию при записи на разные диски для повышения производительности или зазеркалить данные, дополнительно создавая файлы четности, необходимые для восстановления).

Чтобы полноценно настроить аппаратный «RAID», пользователям необходимо использовать программное обеспечение, управляющее «RAID-контроллером», доступ к которому можно получить из микропрограммы базовой системы ввода-вывода компьютера «BIOS». Предварительно, перед непосредственной настройкой, пользователи должны ознакомиться с документацией установленного аппаратного «RAID-контроллера», чтобы избежать нежелательных или необратимых последствий, способных повлиять на сохранность данных и работоспособностью компьютера в целом.

Подобные технологии

Популярные операционные системы имеют дополнительные, встроенные изначально, технологии, которые функционируют аналогично стандарту представления и организации запоминающих устройств «RAID». Так, например, в операционной системе «Windows 8» и ее последующей, более продвинутой и совершенной, версии «Windows 10», присутствует функция «Дисковые пространства», а в системе «Linux» доступен инструмент «Управление логическими томами» («LVM»). Обе озвученные технологии позволяют группировать несколько физических дисков в один логический диск, чтобы зеркалировать пользовательские данные, для гарантированного восстановления при сбое или неисправности отдельного запоминающего устройства, или совокупно объединять диски в общее единое вместительное хранилище, отображая доступное внутреннее дисковое пространство в ответственных приложениях операционных систем в виде единственного диска, выделяя весь объем для хранения данных.

Что такое RAID и зачем оно нужно?

RAID — это дисковый массив (т.е. комплекс или, если хотите, связка) из нескольких устройств, — жестких дисков. Как я и говорил выше, этот массив служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации (или и то и другое).

Собственно, то чем именно занимается оная связка из дисков, т.е ускорением работы или повышением безопасности данных, — зависит от Вас, а точнее, от выбора текущей конфигурации рейда(ов). Разные типы этих конфигураций как раз и отмечаются разными номерами: 1, 2, 3, 4 и, соответственно, выполняют разные функции.

Рейды ощутимо удобнее и эффективнее использования одного диска в системе. Я бы даже рекомендовал их всем поголовно, не смотря на то, что приходится использовать два (а то и все четыре) устройства вместо одного. Подробнее я писал в статье: «Бутылочное горлышко» в производительности Вашего компьютера

Просто, например, в случае построения 0-вой версии (описание вариаций 0, 1, 2, 3 и пр., — читайте ниже) Вы получите ощутимый прирост производительности. Да и вообще жесткий диск нынче как раз таки узкий канал в быстродействии системы.

Почему так сложилось в общем и целом

Ну судите сами, — процессоры обзаводятся ядрами, частотами, кэшем и архитектурой; видеокарты, — числом пиксельных конвейеров, количеством и разрядностью памяти, шейдерными блоками, частотами видеопроцессоров и кое-где даже количеством этих процессоров; оперативная память, — частотами и таймингами.

Жесткие диски же растут разве что в объеме ибо скорость оборота головки оных (за исключением редких моделей типа Raptor‘ов) замерла уже довольно давно на отметке в 7200, кэш тоже не то чтобы растет, архитектура остается почти прежней.

В общем в плане производительности диски стоят на месте (ситуацию могут спасти разве что развивающиеся SSD), а ведь они играют весомую роль в работе системы и, местами, полновесных приложений.

В случае же построения единичного (в смысле за номером 1) рейда Вы чуток потеряете в производительности, но зато получите некую ощутимую гарантию безопасности Ваших данных, ибо оные будут полностью дублироваться и, собственно, даже в случае выхода из строя одного диска, — всё целиком и полностью будет находится на втором без всяких потерь.

Что такое RAID в физическом смысле

Физически RAID-массив представляет собой от двух до n-го количества жестких дисков подключенных к мат.плате поддерживающей возможность создания RAID (или к соответствующему контроллеру, что реже ибо оные дороги для рядового пользователя (контроллеры обычно используются на серверах в силу повышенной надежности и производительности)), т.е. на глаз ничего внутри системника не изменяется, никаких лишних подключений или соединений дисков между собой или с чем-то еще попросту нет.

В общем в аппаратной части всё почти как всегда, а изменяется лишь программный подход, который, собственно, и задает, путем выбора типа рейда, как именно должны работать подключенные диски.

Программно же, в системе, после создания рейда, тоже не появляется никаких особенных причуд. По сути, вся разница в работе с рейдом заключается только в небольшой настройке в биосе, которая собственно организует рейд (см.ниже) и в использовании драйвера. В остальном ВСЁ совершенно тоже самое – в «Мой компьютер» те же C, D и прочие диски, всё те же папки, файлы.. В общем и программно, на глаз, полная идентичность.

Установка массива не представляет собой ничего сложного: просто берем мат.плату, которая поддерживает технологию RAID, берем два полностью идентичных, — это важно!, — как по характеристикам (размеру, кэшу, интерфейсу и пр) так и по производителю и модели, диска и подключаем их к оной мат.плате. Далее просто включаем компьютер, заходим в BIOS и выставляем параметр SATA Configuration: RAID.

После этого в процессе загрузки компьютера (как правило, до загрузки Windows) появляется панель отображающая информацию о диска в рейде и вне него, где, собственно нужно нажать CTR-I, чтобы настроить рейд (добавить диски в него, удалить и тд и тп). Собственно, вот и все. Дальше идет установка Windows и прочие радости жизни, т.е, опять же, всё как всегда.

Важное примечание, которое стоит помнить

При создании или удалении рейда (1-го рейда это вроде не касается, но не факт) неизбежно удаляется вся информация с дисков, а посему просто проводить эксперимент, создавая и удаляя различные конфигурации, явно не стоит. Посему, перед созданием рейда предварительно сохраните всю нужную информацию (если она есть), а потом уже экспериментируйте.

Что до конфигураций.. Как я уже говорил, RAID массивов существует несколько видов (как минимум из основного базиса, — это RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Для начала я расскажу о двух, наиболее понятных и популярных среди обычных пользователей:

  • RAID 0 — дисковый массив для увеличения скоростизаписи.
  • RAID 1 — зеркальный дисковый массив.

Что такое RAID массив

RAID – это технология, которая позволяет объединить несколько устройств, а именно, жестких дисков, в нашем случае идет что-то вроде их связки. Таким образом, мы повышаем надежность хранения данных и скорость чтения/записи. Возможно и что-то одно из этих функций.

Так что, если вы хотите или ускорить свой диск или просто обезопасить информацию зависит лишь от вас. Точнее сказать, зависит от выбора нужной конфигурации «Рейда», эти конфигурации и отмечены порядковыми номерами 1, 2, 3…

Рейды очень полезная функция и я ее рекомендую использовать всем. Например, если использовать 0-вую конфигурацию, то вы ощутите прирост в скорости жесткого диска, все-таки, жестких диск, это почти самое низкоскоростное устройство.

Если вы спросите почему, то тут, я думаю, все ясно. Процессоры с каждым годом становятся все мощнее, их обзаводят и более высокой частотой, большим количеством ядер, и многим другим. То же самое с оперативной памятью и видеокартами. А жесткие диски растут пока что только в объеме, а скорость оборота как была 7200, так и осталась. Конечно есть и более редкие модели. Ситуацию пока что спасают так называемые SSD-диски, которые ускоряют систему в несколько раз.

Допустим, вы заходили построить RAID 1, в этом случае вы получите высокую гарантию защиты ваших данных, так как, они будут дублироваться на другое устройство (диск) и, если один жесткий диск откажет, вся информация останется на другом.

Как видите из примеров, рейды очень важны и полезны, их нужно использовать.

Итак, RAID-массив физически представляет собой связку от двух жестких дисков, подключенных к системной плате, можно и три, и четыре. Кстати говоря, материнская плата тоже должна поддерживать создание RAID-массивов. Подключение жестких дисков проводиться по стандарту, а создание рейдов проходит на программном уровне.

Когда мы программно создали рейд, на глаз особо ничего не изменилось, вы всего лишь поработаете в BIOS, а все остальное как было, так и останется, то есть, заглянув в Мой компьютер, вы увидите все те же подключённые диски.

Чтобы создать массив нужно не так много: материнская плата с поддержкой RAID, два идентичных жестких диска (это важно). Они должны быть одинаковы не только в объеме, но и по кэшу, интерфейсу и т. д. Желательно, чтобы и производитель был один и тот же. Теперь включаем компьютер и заходим в BIOS, там ищем параметр SATA Configuration и ставим на RAID. После перезагрузки компьютера должно появится окно в которой мы увидим информацию о дисках и рейдах. Там мы должны нажать CTRL+I, чтобы начать настройку рейда, то есть, добавлять или удалять из него диски. Потом начнется установка Windows и ее настройка.

Хочу сказать важную вещь, что при создании рейдов с жестких дисков полностью удаляется вся информация, поэтому, перед их созданием рекомендуется куда-нибудь перенести данные, а потом уже пробовать создавать рейды. (по некоторой информации к 1-му рейду это не относится, но лучше не рисковать и сохранить данные).

Сколько всего этих рейдов? Их несколько, а именно RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6. Более подробно я расскажу только о двух из них.

  1. RAID 0 – позволяет создавать дисковый массив для того, чтобы увеличить скорость чтения/записи.
  2. RAID 1 – позволяет создавать зеркальные дисковые массивы для защиты данных.

RAID 0, что это такое?

Массив RAID 0, который еще называют «Striping» использует от 2 до 4 жестких дисков, редко больше. Работая совместно, они повышают производительность. Таким образом, данные при таком массиве разбивается на блоки данных, а потом записываются сразу на несколько дисков.

Производительность повышается из-за того, что на один диск записывается один блок данных, на другой диск, другой блок и т. д. Думаю понятно, что 4 диска больше увеличат производительность, чем два. Если говорить о безопасности, то она страдает на всем массиве. Если один из дисков выйдет из строя, то в большинстве случаев, вся информация пропадет безвозвратно.

Дело в том, что в массиве RAID 0 информация располагается на всех дисках, то есть, байты какого-то файла, расположены на нескольких дисках. Поэтому, при выходе из строя одного диска, пропадет и какое-то количество данных, восстановление при этом невозможно.

Из этого следует, что необходимо делать постоянные резервные копии данных на внешние носители.

RAID 1

Принцип работы массива — зеркалирование. Такая конфигурация состоит минимум из двух дисков, которые дублируют хранящуюся друг на друге информацию. Чередование недопустимо. Повышена скорость чтения, поскольку оба диска можно считывать одновременно. На скорость записи данный массив никак не влияет.

Преимущества: Высокая надежность.

Недостатки: Дорого.

RAID 2

Принцип работы массива — чередование. Главное отличие от RAID 0 заключается в том, что в данном массиве некоторые диски хранят информацию о проверке и исправлении найденных ошибок (ECC). Кроме того, RAID 2 использует специальный код Hamming, применяемый для эффективного исправления сбоев. RAID 2 не имеет преимуществ перед RAID 3 и больше не используется.

Преимущества: Массив больше не используется.

Недостатки: Массив больше не используется.

RAID 3

Принцип работы массива — чередование. В процессе работы данного массива один диск используется специально для хранения информации о четности, которая помогает равномерно заполнять пространство всех HDD. Восстановление данных осуществляется путем индивидуальных вычислений для всех установленных устройств.

Поскольку операция ввода-вывода выполняется всеми дисками одновременно, устройство лучше всего подойдет для однопользовательских систем. То есть, данным массивом не смогут пользоваться два устройства одновременно.

Преимущества: Высокая производительность.

Недостатки: Возможность работы только с одним устройством. Низкая скорость передачи данных малого объема.

RAID 4

Принцип работы массива — чередование. Данный уровень очень похож на RAID 3, но отличается от него тем, что данные теперь разбиваются на блоки, а не на байты. Таким образом создатели массива смогли справиться с проблемой низкой скорости передачи файлов небольшого объема. Главным недостатком же стала низкая скорость записи данных.

Преимущества: Повышенная скорость передачи данных, в сравнении с RAID 3.

Недостатки: Низкая скорость записи файлов.

RAID 5

Данный массив базируется на чередовании на уровне блоков четности. Информация о четности чередуется по каждому диску индивидуально и позволяет массиву функционировать даже в случае отказа одного из подключенных устройств. Архитектура же дает возможность операциям чтения и записи охватить сразу несколько дисков. Результатом становится более высокая производительность, чем если бы было подключено только одно устройство.

RAID 5 требует как минимум 3 диска для полноценной работы. Тем не менее, желательно все же начинать с 5. Ведь 3 — это самый необходимый минимум при котором массив в принципе может функционировать.

Массивы RAID 5 считаются плохим выбором для использования в системах с интенсивной записью из-за принципа работы четности. Когда диск выходит из строя, восстановления данных может занять очень много времени.

Преимущества: Высокая скорость чтения. Экономичность.

Недостатки: В случае повреждения данных, время их восстановления может занять довольно внушительный срок.

RAID 5E

Как мы уже успели выяснить, ситуация с отказом одного из дисков является для RAID 5 критической — массив переходит в режим деградации с серьезным падением производительности и существенным ростом нагрузки на диски, а его надежность падает до уровня RAID 0 и любая ошибка способна полностью разрушить массив с полной потерей данных. Поэтому чем быстрее мы заменим сбойный диск — тем скорее выведем массив из зоны риска.

Первоначально этот вопрос решался, да и решается до сих пор, выделением диска горячей замены. Такой диск может быть выделенным, т.е. привязанным к указанному массиву, или разделяемым, тогда в случае отказа он будет использован одним из отказавших массивов. Но у этого подхода есть серьезный недостаток — фактически мы никак не используем резервный диск, а так как отказы происходят не каждый день, то его ресурс просто тратится впустую.

RAID 5E предлагает иной подход, пространство резервного диска разделяется между остальными дисками и остается неразмеченным в конце каждого диска массива.

Такой подход связан с некоторыми ограничениями, а именно — один раздел на один массив. Из плюсов — более высокая производительность за счет использования дополнительного диска. Что происходит при отказе? Массив автоматически начинает реконструкцию размещая данные в неразмеченной области (производит сжатие), после чего массив фактически превращается в простой RAID 5 и способен выдержать отказ еще одного диска (но не во время перестроения).

При замене неисправного диска массив переносит данные из резервной области на новый диск и снова начинает работать как RAID 5E (производит развертывание), при этом операция развертывания не сопряжена с дополнительными рисками, отказ диска или ошибка в данной ситуации не будут фатальными.

RAID 5EE

Дальнейшее развитие RAID 5E, в котором отказались из за размещения резервной области в конце диска (самая медленная его часть), а разбили ее на блоки и также как и блоки четности начали чередовать между дисками. Основное преимущество такого подхода — это более быстрый процесс реконструкции, а так как в этом состоянии массив особо уязвим, то уменьшение времени ребилда — это повышение надежности всего массива.

Кроме того, такой подход позволяет выровнять нагрузку по дискам, что должно положительно сказываться на надежности. Ограничения остались те же — один раздел на один массив.

Также ни RAID 5E, ни RAID 5EE не лишились недостатка простого RAID 5 — на современных объемах массивов вероятность успешного ребилда такого массива очень невелика.

RAID 6

Похож на RAID 5, но обладает более высокой надежностью. Использование дополнительной схемы четности позволяет массиву продолжать функционировать даже в случае отказа двух дисков одновременно. Однако, что-то хорошее редко случается просто так и за все нужно платить. Такая дополнительная защита обойдется вам несколько дороже, чем в случае с массивом предыдущего уровня.

Преимущества: Высокая надежность.

Недостатки: Пониженная скорость записи, в сравнении в RAID 5.

RAID 6E

По сути, тоже самое, что и RAID 5E. Резервный диск точно также распределяется в виде неразмеченного пространства в конце дисков, с теми же самыми ограничениями — один раздел на один массив. Ну и добавьте еще один диск в минимальное количество для массива, для RAID 5E это было 4, для RAID 6E — 5.

Вложенные уровни

Некоторые уровни RAID массивов называют вложенными, по-английски Nested. Это связано с тем, что принцип их работы основан на комбинировании разных уровней RAID в один массив. Давайте рассмотрим несколько примеров.

RAID 10 (RAID 1+0)

Объединив уровни 1 и 0, массив стали называть RAID 10. Главное его преимущество заключается в более высокой производительности относительно RAID 1. Тем не менее за это придется платить, поскольку стоимость массива становится несколько выше.

RAID 01 (RAID 0+1)

Данный массив очень похож на RAID 10. Исключение составляет сам метод организации данных на дисках. Вместо того, чтобы использовать метод зеркал и создавать копии данных, в массиве применяется набор полос, который в свою очередь подвергается зеркалированию.

RAID 03 (RAID 0+3)

RAID 03 так же часто могут называть и RAID 53, поскольку схема работы этих комбинаций массивов идентична. На этом уровне используется метод чередования типа 0 для блоков виртуальных дисков RAID 3. Такая комбинация обеспечивает более высокую производительности в сравнении с одиночными массивами. К сожалению, цена возрастает вместе с производительностью.

RAID 50 (RAID 5+0)

Данная конфигурация объединяет распределенную четность RAID 5 с чередованием RAID 0 для повышения производительности первого массива без снижения защиты данных. Идеальное сочетание.

Аппаратные RAID-контроллеры

Представляют собой плату расширения, либо размещаются вне сервера (например, в составе внешней дисковой подсистемы либо NAS). Имеют собственный процессор, многие имеют кэш-память для ускорения работы. В устройства подороже опционально устанавливаются батареи (Battery Backup Unit, сокр. BBU, химические, либо конденсаторные) для сохранения данных в кэше в случае аварийного отключения электропитания. Конденсаторные батареи более современные, но более дорогие, поскольку дополнительно требуют наличия модуля энергонезависимой FLASH-памяти, куда при аварии будет копироваться кэш. Такие батареи не портятся со временем и, в отличие от химических, не требуют замены в течение срока службы сервера.

Для подключения дисков контроллер может иметь внутренние, либо внешние порты, либо и те, и другие. Порты могут быть выполнены по различным стандартам (см. для примера список внутренних и внешних разъёмов SAS, а также SFF-8639).

Контроллеры различных производителей, как правило, не совместимы и не взаимозаменяемы между собой — это следует иметь в виду в случае выхода из строя платы контроллера. Информация о конфигурации RAID-массива хранится на дисках, но прочитать её, даже с полностью исправных дисков, и воссоздать массив сможет только контроллер того же производителя. Для предотвращения подобных проблем существуют кластерные дисковые системы. Программные RAID-массивы также лишены этого недостатка.

Дополнительные функции RAID-контроллеров

Многие RAID-контроллеры оснащены набором дополнительных функций:

  • «Горячая замена» (hot swap)
  • «Горячий резерв» (hot spare)
  • Проверка на стабильность.

Сравнение уровней RAID

Уровень Количество
дисков
Эффективная
ёмкость*
Допустимое количество
вышедших из строя дисков
Надёжность Скорость
чтения
Скорость
записи
Примечание
0 от 2 S * N нет очень низкая высокая высокая Потеря данных при выходе из строя любого из дисков!
1 от 2 S N-1 дисков очень высокая средняя средняя N-кратная стоимость дискового пространства; максимально возможная надёжность; минимально возможный размер, скорость чтения/записи одиночного диска
1E от 3 S * N / 2 от 1 до N/2-1 дисков высокая высокая низкая Потеря данные при одновременном выходе из строя любых двух соседних дисков, либо первого с последним
10 от 4, чётное S * N / 2 от 1 до N/2 дисков** высокая высокая высокая двойная стоимость дискового пространства
01 от 4, чётное S * N / 2 от 1 до N/2 дисков** высокая высокая высокая двойная стоимость дискового пространства
5 от 3 S * (N − 1) 1 диск средняя высокая средняя
50 от 6, чётное S * (N − 2) от 1 до 2 дисков*** средняя высокая высокая
51 от 6, чётное S * (N − 2) / 2 от 2 до N/2+1 дисков**** высокая высокая низкая двойная стоимость дискового пространства
5E от 4 S * (N − 2) 1 диск средняя высокая высокая резервный накопитель работает
на холостом ходу и не проверяется
5EE от 4 S * (N − 2) 1 диск средняя высокая высокая резервный накопитель работает
на холостом ходу и не проверяется
6 от 4 S * (N − 2) 2 диска высокая высокая низкая или средняя

(см. примечание)

скорость записи в зависимости от реализации

(может соответствовать скорости записи RAID 5)

60 от 8, чётное S * (N − 4) от 2 до 4 дисков*** средняя высокая средняя
61 от 8, чётное S * (N − 2) / 2 от 4 до N/2+2 дисков**** высокая высокая низкая двойная стоимость дискового пространства

* N — количество дисков в массиве, S — объём наименьшего диска.
** Информация не потеряется, если выйдут из строя диски в пределах разных зеркал.
*** Информация не потеряется, если выйдет из строя одинаковое кол-во дисков в разных stripe’ах.
**** Информация не потеряется, если выйдут из строя диски в пределах одного зеркала.

Программный RAID

Для реализации RAID можно применять не только аппаратные средства, но и полностью программные компоненты (драйверы). Например, в системах на ядре Linux поддержка существует непосредственно на уровне ядра. Управлять RAID-устройствами в Linux можно с помощью утилиты mdadm. Программный RAID имеет свои достоинства и недостатки. С одной стороны, он ничего не стоит (в отличие от аппаратных RAID-контроллеров, цена которых от $150). С другой стороны, программный RAID использует некоторое количество ресурсов центрального процессора.

Ядро Linux 2.6.28 (последнее из вышедших в 2008 году) поддерживает программные RAID следующих уровней: 0, 1, 4, 5, 6, 10. Реализация позволяет создавать RAID на отдельных разделах дисков, что аналогично описанному ниже Matrix RAID. Поддерживается загрузка с RAID.

ОС семейства Windows NT, такие как Windows NT 3.1/3.5/3.51/NT4/2000/XP/2003 изначально, с момента проектирования данного семейства, поддерживают программный RAID 0, RAID 1 и RAID 5 (см. Dynamic Disk). Более точно, Windows XP Pro поддерживает RAID 0. Поддержка RAID 1 и RAID 5 заблокирована разработчиками, но, тем не менее, может быть включена, путём редактирования системных бинарных файлов ОС, что запрещено лицензионным соглашением. Windows 7 поддерживает программный RAID 0 и RAID 1, Windows Server 2003 — 0, 1 и 5. Windows XP Home не поддерживает RAID.

В ОС FreeBSD есть несколько реализаций программного RAID. Так, atacontrol, может как полностью строить программный RAID, так и может поддерживать полуаппаратный RAID на таких чипах, как ICH5R. Во FreeBSD, начиная с версии 5.0, дисковая подсистема управляется встроенным в ядро механизмом GEOM. GEOM предоставляет модульную дисковую структуру, благодаря которой родились такие модули как gstripe (RAID 0), gmirror (RAID 1), graid3 (RAID 3), gconcat (объединение нескольких дисков в единый дисковый раздел). Также существуют устаревшие классы ccd (RAID 0, RAID 1) и gvinum (менеджер логических томов vinum). Начиная с FreeBSD 7.2 поддерживается файловая система ZFS, в которой можно собирать следующие уровни RAID: 0, 1, 5, 6, а также комбинируемые уровни.

OpenSolaris и Solaris 10 используют Solaris Volume Manager, который поддерживает RAID 0, RAID 1, RAID 5 и любые их комбинации, как 1+0. Поддержка RAID 6 осуществляется в файловой системе ZFS.

Hybrid RAID

«Hybrid RAID» — это некоторые из обычных уровней RAID, но в сочетании с дополнительным ПО и твердотельными накопителями (SSD), которые используются как кэш для чтения. В результате производительность системы повышается, так как SSD обладают значительно лучшими скоростными характеристиками по сравнению с HDD. Существует несколько реализаций, например Crucial Adrenaline, либо некоторые контроллеры Adaptec бюджетного класса. На данный момент Hybrid RAID не рекомендуется использовать в серверах ввиду малого ресурса SSD, исключение составляют специальные серверные SSD с повышенным ресурсом.

RAIDIX

RAIDIX — программа для создания систем хранения на основе имеющегося оборудования, разработка компании «РЭЙДИКС». Кроме стандартных уровней RAID, содержит несколько проприетарных, например, RAID 7.3 и RAID N+M, где второе число означает количество дисков, выделяемых для хранения контрольной информации (M — произвольное число).

Matrix

Схема Intel Matrix RAID

Matrix RAID — это технология, реализованная фирмой Intel в южных мостах своих чипсетов, начиная с ICH6R. Эта технология не является новым уровнем RAID и не имеет аппаратной поддержки. Средства BIOS позволяют организовать несколько устройств в логический массив, дальнейшая обработка которого именно как RAID-массива, возлагается на драйвер. Технология позволяет организовывать на разных разделах дисков одновременно несколько массивов уровня RAID 1, RAID 0 и RAID 5. Это позволяет для одних разделов выбрать повышенную надёжность, для других — высокую производительность.

Позднее, Intel объявила о переименовании технологии Matrix RAID в Intel Rapid Storage Technology (Intel RST).

Список контроллеров, поддерживающих Intel RST:

  • Intel PCHM SATA RAID/AHCI controller hub
  • Intel PCH SATA RAID/AHCI controller hub
  • Intel ICH10R/DO SATA RAID/AHCI controller hub
  • Intel ICH10D SATA AHCI controller hub
  • Intel ICH9M-E SATA AHCI/RAID controller hub
  • Intel ICH9M AHCI controller hub
  • Intel 82801IR I/O Controller Hub—RAID and AHCI
  • Intel 82801HEM I/O Controller Hub—RAID and AHCI
  • Intel 82801HBM I/O Controller Hub—AHCI only
  • Intel 82801HR/HH/HO I/O Controller Hub—RAID and AHCI
  • Intel 631xESB/632xESB I/O Controller Hub—RAID and AHCI
  • Intel 82801GHM I/O Controller Hub—RAID only
  • Intel 82801GBM I/O Controller Hub—AHCI only
  • Intel 82801GR/GH I/O Controller Hub—RAID and AHCI

Дальнейшее развитие идеи RAID

Синий разъём PCI-X на материнской плате сервера FSC Primergy TX200 S2 специально предназначен для платы ноль-канального RAID (zero-channel RAID, ZCR). Установлен MegaRAID 320-0 Zero Channel RAID Controler фирмы LSI)
 
Идея RAID-массивов — в объединении дисков, каждый из которых рассматривается как набор секторов, и в результате драйвер файловой системы «видит» как бы единый диск и работает с ним, не обращая внимания на его внутреннюю структуру. Однако, можно добиться существенного повышения производительности и надёжности дисковой системы, если драйвер файловой системы будет «знать» о том, что работает не с одним диском, а с набором дисков.

Более того, при разрушении любого из дисков в составе RAID 0 вся информация в массиве окажется потерянной. Но если драйвер файловой системы разместил каждый файл на одном диске, и при этом правильно организована структура каталогов, то при разрушении любого из дисков будут потеряны только файлы, находившиеся на этом диске; а файлы, целиком находящиеся на сохранившихся дисках, останутся доступными. Схожая идея «повышения надёжности» реализована в массивах JBOD.

Размещение файлов по принципу «каждый файл целиком находится на одном диске» сложным/неоднозначным образом влияет на производительность дисковой системы. Для мелких файлов латентность (время позиционирования головки над нужным треком + время ожидания прихода нужного сектора под головку) важнее, чем время собственно чтения/записи; поэтому если мелкий файл целиком находится на одном диске, доступ к нему будет быстрее, чем если он разнесён на два диска (структура RAID-массивов такова, что мелкий файл не может оказаться на трёх и более дисках). Для крупных файлов размещение строго на одном диске может оказаться хуже, чем размещение на нескольких дисках; однако, это проявится только если обмен данными производится большими блоками; либо если к файлу делается много мелких обращений в асинхронном режиме, что позволяет работать сразу со всеми дисками, на которых размещён этот файл.

Коррелированные сбои

Накопители в массиве, за исключением запасных («spare»), первое время часто имеют одинаковый возраст, подвергаются одинаковой нагрузке и воздействию окружающей среды, это нарушает предположения о независимой вероятности отказа дисков; сбои на самом деле статистически коррелированы. На практике шанс второго отказа перед первым восстановлением выше, чем вероятность случайных сбоев.

Несовместимость конфигураций

Несмотря на то, что конфигурация массива хранится непосредственно на физических дисках, не существует общепринятого стандарта для её кодирования и хранения. При поломке контроллера пользователь вынужден приобретать совместимый контроллер, чтобы восстановить доступ к данным, а не создавать заново пустой массив.

Какой выбрать RAID массив?

Допустим, что вы часто устанавливаете различные программы, игры и копируете много музыки или фильмов, тогда вам рекомендуется к использованию RAID 0. При выборе жестких дисков будьте внимательные, они должные быть очень надежными, чтобы не потерять информацию. Обязательно делайте резервные копии данных.

Есть важная информация, которая должна быть в целости и сохранности? Тогда на помощь приходит RAID 1. При выборе жестких дисков, также их характеристики должны быть идентичными.

Какой тип RAID лучше всего использовать

При выборе RAID все зависит от того, что важнее в вашем случае: производительность или отказоустойчивость (или то и другое). Выбор типа RAID также зависит от того, на какой машине он будет установлен (ПК, сервер, NAS и т. д.), поскольку для одних лучше подходят аппаратные, а для других – программные RAID. Программные поддерживают меньше уровней RAID, а для аппаратных RAID возможные типы массива определяются отдельно для каждого случая. Разные контроллеры поддерживают разные уровни RAID и ограничивают выбор дисков, которые можно будет использовать в массиве: SAS, SATA или SSD.

Если говорить о производительности сервера, вы можете выбрать RAID 0, потому что в таких массивах читают и записывают данные сразу несколько дисков, тем самым ускоряя операции ввода-вывода. Для создания массива требуется как минимум два диска. Уровень поддерживают как программные, так и аппаратные RAID.

Недостаток в том, что такие системы не отличаются отказоустойчивостью. Если один диск выходит из строя, это влияет на весь массив и увеличивает вероятность потери или повреждения данных.

Если нужна отказоустойчивость и при этом скорость для вас не является критически важным параметром, вы можете выбрать RAID 1, потому что данные в нем всегда копируются одновременно на два диска, образуя копию или «зеркало». Если один диск выходит из строя, другой продолжает работать, и все данные остаются на нем, в полном объеме. Это самый простой способ реализации отказоустойчивой и относительно недорогой системы. Ее недостаток лишь в том, что RAID 1 обладает сниженной производительностью.

RAID 1 может быть реализован как в программной, так и в аппаратной версии.

RAID 5 является наиболее распространенной конфигурацией RAID для бизнес-серверов и корпоративных устройств NAS, поскольку обеспечивает лучшую производительность, чем «зеркала», и при этом показывает хорошую отказоустойчивость. В RAID 5 хранимая информация и данные четности (дополнительные данные, используемые для восстановления) распределяются между тремя или более дисками. Если диск выходит из строя, информация воссоздается из распределенных данных и блоков четности автоматически. Система продолжит работать, даже если один из носителей будет поврежден. Другое преимущество RAID 5 заключается в том, что вы можете заменить поврежденный диск, не выключая сервер и не прерывая доступ пользователей к серверу.

Обратной стороной RAID 5 является то, что он снижает производительность серверов, выполняющих несколько операций записи. Например, когда много сотрудников работают на сервере с RAID 5, может наблюдаться заметное торможение в выполнении операций.

RAID 6 также является отличным выбором для бизнеса. Для повышения надежности системы имеет смысл использовать RAID 6 с двумя дисками для блока четности. Такой массив продолжит работать даже в случае выхода из строя двух жестких дисков. Главный недостаток такого решения – его дороговизна. Вот почему RAID 6 больше подходит для бизнеса, чем для домашнего использования.

RAID 10 идеально подходит для интенсивно используемых серверов баз данных или любого сервера, который выполняет несколько операций записи. RAID 10 может быть реализован как аппаратный или программный, но очевидно, что многие его преимущества (в частности, производительность) теряются при использовании программного обеспечения RAID 10.

RAID 50, как и RAID10, являются наиболее предпочтительными для работы с приложениями, где требуется высокая производительность в сочетании с приемлемой надежностью. Однако RAID 50 считается наиболее подходящим для больших дисков – он более надежен, чем RAID 5, и более экономичен, чем RAID 10. Этот тип массива рекомендуется для работы с приложениями, которым требуется повышенная надежность хранения информации, высокая скорость обработки запросов и передачи данных, большой объем памяти.

Массив RAID 60 идеально подходит для онлайн-обслуживания клиентов, что требует высокой отказоустойчивости. Обладая многими преимуществами RAID 50, он также может выдерживать в два раза больше отказов дисков. Благодаря этому такие системы являются оптимальными для использования в системах видеонаблюдения. Еще один положительный момент в выборе RAID 60 – отличная производительность при последовательном доступе, что является особенностью потокового видео.

Выбор между RAID 50/60 и RAID 10, скорее всего, будет зависеть от доступного бюджета, емкости сервера и потребностей в защите данных. В целом, когда мы говорим о SSD-решениях (как корпоративного, так и потребительского класса), на первый план выходит именно стоимость.

Что делать, если данные потеряны

В современном мире данные имеют большую ценность. К сожалению, никто не может дать стопроцентной гарантии безопасности данных, и довольно часто приходится сталкиваться с потерей важной информации.

Хотя RAID разработан для повышения безопасности хранения, и он действительно обеспечивает дополнительную защиту от потери данных в случае сбоя жесткого диска, он, в то же время, не может обеспечить защиту от случайного удаления, форматирования, повреждения файловой системы, вирусов и многих других причин исчезновения данных. Для восстановления данных в подобных случаях вы можете использовать RS Partition Recovery.

В случае аппаратного сбоя (отказ / замена контроллера и т. д.) используйте RS RAID Retrieve.

Программа, как в ручном, так и в автоматическом режиме, сможет найти RAID на дисках, подключенных к компьютеру, определить его тип и вернуть все данные, которые подлежат восстановлению.

Особенности

В случае, когда происходит поломка РЕЙД-контроллера, восстановить информацию практически невозможно (не относится к «Зеркалу»). Даже если купить точно такой же контроллер, высока вероятность, что RAID будет собран из других секторов диска, а значит информация на дисках будет потеряна.

Практические советы

Как правило, диски для настройки RAID закупают одной партией. Соответственно и срок работы у них может быть примерно одинаковый. На этот случай рекомендуется сразу, в момент закупки дисков для массива закупить некоторый избыток. Например, для настройки RAID 10 из 4 дисков — стоит купить 5 дисков. Так, в случае выхода из строя одного из них, вы сможете оперативно заменить его на новый до того, как «посыпятся» другие диски.

Выводы

На практике чаще всего используют только три вида RAID-массивов. Это RAID 1, RAID 10 и RAID 5.

С точки зрения соотношения стоимость / производительность / отказоустойчивость рекомендуется использовать:

  • RAID 1 (зеркалирование) для формирования дисковой подсистемы для пользовательских операционных систем.
  • RAID 10 для данных, имеющих высокие требования к скорости записи и чтения. Например, для хранения баз 1С:Предприятие, почтового сервера, AD.
  • RAID 5 используют для хранения файловых данных.

Идеальным серверным решением по мнению большинства системных администраторов является сервер с шестью дисками. Два диска «зеркалируют» и на RAID 1 устанавливается операционная система. Четыре оставшихся диска объединяют в RAID 10 для быстрой, безотказной, надежной работы системы.

Источники

  • https://recovery-software.ru/blog/what-is-raid.html
  • https://zen.yandex.ru/media/starusrecovery/chto-takoe-raid-massiv-i-kak-on-rabotaet-5ebd32cfe49ceb1a8333cd9d
  • https://club.dns-shop.ru/blog/t-129-setevyie-hranilischa-nas/29764-chto-takoe-raid-massiv-i-zachem-on-nujen/
  • https://interface31.ru/tech_it/2019/05/raid-likbez.html
  • https://zen.yandex.ru/media/hetmansoftware/sozdaem-raid-massiv-ili-kak-po-maksimumu-ispolzovat-neskolko-diskov-5f39aa496431630279d41b68
  • https://sonikelf.ru/chto-takoe-raid-massivy-i-zachem-oni-nuzhny/
  • https://computerinfo.ru/chto-takoe-raid-massiv-i-dlya-chego-on-nuzhen/
  • https://ru.wikipedia.org/wiki/RAID
  • https://integrus.ru/blog/tipy-raid-massivov.html

Понравилась статья? Поделиться с друзьями:
Переход на цифровое телевидение в России 2019
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: