Технологии

Что такое RAID массивы и как с пользой использовать своё хранилище данных?

Хотели бы увеличить емкость, мощность и долговечность жестких дисков? Это возможно, а способ вы узнаете из данной статьи. В частности, мы разберем, что такое RAID массивы. Ответ на этот вопрос и дополнительная полезная информация помогут вам усовершенствовать работу своего сервера.

О технологии

Чтобы увеличить дисковое пространство, а вместе с этим, быстродействие компа, логично установить еще один хард. Ведь так? Однако мало лишь иметь несколько накопителей — нужно наладить между ними взаимодействие. Но вдруг в дальнейшем один из них выйдет из строя, тогда потеряются данные на всех из них?

Если вы предавались таким рассуждениям, можете расслабиться, так как есть решение данной проблемы — технология RAID.

Благодаря ей несколько хардов объединяются в один логический узел, происходит виртуализация данных. Часть памяти в нем остается закрытой для пользователя: она используется только для служебных задач. Это позволило добиться отказоустойчивости накопителей.

Производительность работы сервера повышается посредством одновременной и гармоничной работы нескольких устройств сразу. Чем их больше (но всему есть границы), тем лучше.

Расшифровка: что было и стало?

Когда разработчики Гибсон, Петтерсон и Катц предложили в 1987 году технологию RAID, под аббревиатурой подразумевалась такая расшифровка:

«Избыточный (резервный) массив недорогих дисков». Последними считались HDD для старых ПК.

Но в наше время ситуация изменилась: начали использовать дорогостоящие материалы для производства контроллеров и самих жестких дисков, поэтому в упомянутом определении слово «недорогие» заменено на «независимые».

Однако это не значит, что теперь RAID не может позволить себе простой человек. В настоящий момент технология популярна. Ведь некогда доступные только крупным предприятиям сервера с SCSI-накопителями сейчас распространены и среди небольших организаций. Также некоторые производители материнок, такие как Asus, Gigabyte, уже впаивают в свои продукты RAID-контроллеры.

Как взаимодействуют накопители?

Чтобы организовать устройствам слаженную работу, могут использоваться 2 способа:

  • Параллельный доступ. Дисковое пространство разделяется на блоки, куда помещаются файлы. Во время записи они тоже делятся на такие же полоски, которые отправляются на несколько дисков сразу. За счет этого увеличивается производительность записи данных.

Допустим, вам нужно записать информацию весом 64 кб, а емкость одной полоски на диске составляет 8 кб. Значит, данные будет поделены на 8 частей и размещены в такое же количество блоков. Если при этом в массиве имеется 4 накопителя, то одновременно могут быть записаны 4 блока, то есть 32 кб за раз. Как видно, продуктивность дискового пространства увеличена в 4 раза.

Таким образом, параллельный способ может применяться только, если объем запроса на запись превышает емкость одного блока. Но выше приведен пример идеальной ситуации. Редко получается поделить данные на части, соответствующие объему блоков. В таких случаях применяется второй способ организации взаимодействия накопителей.

  • Независимый доступ. Запись осуществляется на одно устройство из массива. Преимущество способа в том, что если понадобится одновременная запись разной информации, она будет выполняться на разные накопители: операции не помешают друг другу и не снизят быстродействие системы.

Уровни RAID

Что такое raid массивы думаю ясно. Теперь поговорим о том что можно из этого всего собрать. В зависимости от того, какой используется способ организации дискового пространства, существуют разные типы массивов. Правильно их называть уровнями:

RAID 0

0 — Самый эффективный, но и наиболее уязвимый уровень. При записи файлы разделяются на блоки в соответствии с количеством дисков. Это увеличивает их пропускную способность. Однако при сбое в одном из накопителей могут утратиться материалы и на других.

Применяется, в основном, для увеличения скорости работы диска. HDD уже давно достигли своего предела передачи и приёма по скорости данных. Так вот, для того чтобы увеличить этот показатель и делают этот уровень. Суть заключается в том, что два диска соединяются в один. Получается так, что один и тот же объём данных диски обрабатывают вместе — тем самым практически вдвое увеличивается скорость работы.

RAID 1

Этому массиву присуща 100-процентная избыточность. Запись данных осуществляется по принципу зеркала.

Они не делятся на полоски, а просто копируются на несколько дисков сразу. Это значит, что при поломке одного из них, найти информацию можно на другом. Также повышается быстрота отклика, ведь инфа может считываться одновременно с нескольких накопителей.

Однако  в RAID 1 есть и недостаток — высокая стоимость. Вам крайне важно не потерять ценные файлы? Тогда затраты на этот массив будут оправданы.

RAID 2

В этом уровне применяются коды исправления ошибок Хемминга, благодаря чему корректируются одиночные и обнаруживаются двойные сбои. Причем происходит это молниеносно.

Вам нужно быстро передавать файлы больших объемов? Этот массив подойдет. Но он тоже обойдется вам недешево. Также он не способен обрабатывать большое количество запросов, поступающих одновременно.

RAID 3

Это отказоустойчивый вариант, при котором передача данных осуществляется параллельно.

Принцип работы таков: файлы делятся на байты и размещаются по всем хардам, кроме одного, где хранится контрольная инфа.

Следовательно, при выходе из строя какого-либо из накопителей, вы все равно не потеряете важные материалы. Вдобавок вы получаете высокую скорость обмена. Этот тип массива подойдет для использования приложений большого объема при нечастых обращениях.

RAID 4

Суть этой версии та же, что и предыдущей.

Различие между ними состоит в том, что у RAID 4 более объемные блоки, превосходящие размер записываемых на них данных. Здесь действует схема независимого доступа, поэтому HDD могут быстро обрабатывать несколько операций одновременно.

RAID 5

В данном случае должно быть минимум 3 диска.

Массив схож с предшествующим вариантом архитектурой независимого доступа и большой емкостью. Отличается тем, что контрольная сумма данных записывается не на отдельный хард, а на все сразу.

Но вам дается в пользование дисковое пространство, объемом на один диск меньше. То есть если у вас установлены 3 накопителя по 10 Гб, то вы сможете работать только с 20 Гб.

RAID 6

То же, что и 5 версия, но с двумя блоками четности.

Это значит, что при поломке, к примеру, двух дисков вы все еще сможете восстановить свои материалы. Однако такое решение отняло часть дискового пространства, а также от предшественника массив унаследовал низкую скорость работы.

RAID 7

Технология похожа на 4 уровень, но усовершенствована: добавлен кэш данных и быстрый контроллер для обработки запросов.

За счет этого снижено число обращений к хардам  при вычислении контрольной суммы, благодаря чему повысилось быстродействие системы.

Остальные

Существуют еще комбинированные массивы, которые дополняют друг друга не только преимуществами, но и недостатками. Например, RAID 5+0 так же остается не особо надежным, однако обладает большей производительностью, чем просто 5 версия. Также существуют объединенные уровни 1+5, 1+0, 3+0 и т. д.

Физическое исполнение RAID

Какие накопители вы будете использовать для организации взаимосвязи между ними, не имеет значения.

Это могут быть SATA, SSD, SAS, SCSI и пр. Вдобавок к ним вам понадобится RAID-контроллер, который выступит в роли связующего звена между дисками и сервером.

Он будет генерировать избыточную информацию во время записи, распределять ее среди хардов согласно заданному способу и проверять данные при чтении.

Эти устройства бывают внешними, внутренними или интегрированными в системную плату. Также они отличаются интерфейсами: SATA покупают, в основном, для серверов начального уровня, а SCSI — более высокого.

У контроллеров может быть разное количество каналов для подсоединения HDD. Имейте в виду, что к одному из них можно подключить сразу несколько дисков. Но лучше не делать этого, особенно в случае с IDE RAID-приборами, потому что подключенные к одному каналу 2 жестких диска все равно не смогут работать параллельно.

Еще одно различие: версия SCSI поддерживает все уровни, а IDE, как правило, только 0 и 1, иногда 5 и 0+1.

На этом всё. Надеюсь, на вопрос о том, что такое RAID массивы ответил понятно.

RU/KZ