Что такое RAID-массивы: преимущества, типы
10:46, 16.03.2022
И дома, и в офисе, и в крупных дата-центрах – везде может быть востребован так называемый RAID массив. Подобный массив из дисков может заметно повысить скорость обработки и надежность хранения больших объемов данных. Но только при одном условии: если вы подобрали оптимальную для ваших условий систему. Чтобы не ошибиться при создании RAID массива, стоит оценить плюсы и минусы каждого его типа. А разобраться в них вам поможет статья от специалистов компании HostZealot!
Что собой представляет RAID?
Если говорить строго, то RAID (Redundant Array of Independent Disks) – это способ объединения независимых дисковых накопителей в единый логический модуль за счет виртуализации данных. Сам по себе термин был предложен еще в 1987 году. Данная технология должна была решить ряд проблем HDD-дисков: вроде потерь времени при записи и чтении больших файлов и невысокой отказоустойчивости. И хотя сегодня такие массивы порой делают из твердотельных SSD, чаще создание RAID-систем опирается именно на классические «винты».
Важно понимать, что RAID может быть организован по двум основным схемам:
- Аппаратная. В таком случае жесткие диски подключаются к материнской плате через RAID-контроллер со своим микропроцессором. Это устройство может быть встроенными в материнку и выполненным отдельным. Первый способ немного дешевле, зато второй заметно эффективнее в работе.
- Программная. В этой ситуации вместо контроллера применяются утилиты, что помогает экономить. Эти программы есть для Windows и Linux. Главный минус: для управления массивом они используют центральный процессор и оперативную память системы, что снижает ее производительность в целом.
И хотя определение одной из описанных схем, как и выбор HDD- или SSD-дисков, имеют значимость, в реальности больше внимания уделяют уровням массивов – RAID 0, RAID 1 и т.д. Они отличаются алгоритмами в создании и распределении данных между дисковыми пространствами. У всех уровней есть свои достоинства и недостатки, потому о каждом из них стоит рассказать отдельно.
RAID 0
Это базовый тип создания массива RAID. Он базируется на принципе striping, или чередование. Представьте, что у вас есть книга из нескольких глав. При подобном принципе объединения дисков первая глава книги отправляется на первый диск, вторая в тот же самый момент на второй – и так далее. Причем можно подключать в систему разные по объему и скорости HDD (общую скорость определяет самый медленный «винт» в группе, хотя могут быть ограничения еще на уровне SATA).
RAID 0 имеет несколько плюсов:
- Рост скорости переноса файлов – кратно количеству подключенных дисков.
- Полное использование имеющегося в массиве дискового пространства.
- Включение в массив фактически неограниченного количества дисков.
Но эти достоинства может с головой перекрыть главный недостаток RAID 0. Если будет повреждено хоть одно хранилище, то вы потеряете все данные. Вернемся к аналогии с книгой. В ней не будет смысла, поскольку нет отдельных глав, которые содержались на том самом отказавшем диске – хотя остальные главы у вас есть. Поэтому лучше использовать массивы нулевого уровня лишь для временных или некритичных файлов в системах с высокими требованиями по скорости.
RAID 1
Еще один простейший уровень объединения дисковых пространств. В его основе – принцип mirroring, или зеркалирование. В таком случае ваша книга отправляется по главам на все диски сразу. Их может быть как 2, так и 22 – лишь бы количество было четным. Фактически в RAID 1 постоянно выполняется бэкап всех имеющихся данных: вы имеет полные копии, «зеркала», своих файлов.
К преимуществам такого типа RAID-массива можно отнести:
- Полное сохранения всех данных при отказе любого отдельного диска.
- Выигрыш в скорости чтения при распараллелировании запроса к «винтам».
Но и недостатков у первого уровня тоже хватает:
- Скорость записи не отличается от базовой скорости у одиночного диска.
- Уменьшение дискового пространства вдвое в силу резервирования данных.
Если подвести итог по такому массиву, то он является противоположностью RAID 0: не быстрый, зато надежный. Потому он отлично подойдет для хранения особо ценных данных, к которым обращаются не так часто. В таком случае переплата за «клонированные» диски целиком оправдана.
RAID 10
Такой уровень относят к группе Nested, «вложенные». По сути, это гибрид из двух вложенных друг в друга уровней RAID 1 и RAID 0, берущий лучшее от каждого из них. Для его создания потребуется от 4 дисков. Вся система работает следующим образом: первая глава из книги записывается на первый и второй «винты» (как в первом уровне), вторая глава на третий и четвертый (как в нулевом), третья глава отправляется на первый и второй – и далее по списку.
RAID 10 дает серьезный выигрыш по двум ключевым факторам:
- Скорость записи и чтения файлов удваивается по сравнению с базовой.
- Сохранность информации за счет фактического резервного копирования.
Что касается обратной стороны медали подобного массива, то надо отметить:
- Доступный объем хранилища вдвое меньше от суммарного всех «винтов».
- Комплексное усложнение и удорожание всей организуемой системы.
Кстати, у этого типа RAID есть «собрат» с индексом 01, где вложенность уровней 0 и 1 меняется местами. Такая схема достигает аналогичных показателей объема хранилища и скорости, но уступает в отказоустойчивости – а потому непопулярна.
RAID 5
Суть этого уровня похожа на RAID 1, но с известной доработкой. Возвращаемся к примеру-книге. Ее первая глава записывается на первый диск, вторая на второй, а на третий отправляется так называемая четность – по сути резервная копия блока данных. При этом для четности поочередно выбирается каждый из «винтов», что повышает отказоустойчивость системы. Правда, эксперты считают: 3 диска – это не лучшее количество для такого RAID. В идеале их нужно хотя бы 4-5.
Основные достоинства пятого уровня объединенных массивов – это:
- Высокая скорость при параллельной работе дисков (но ниже, чем у RAID 0).
- Экономия хранилища для резервирования на фоне RAID 10 на 25% и выше.
- Гарантии сохранности всей информации при отказе одного из дисков.
По традиции, нельзя обойти вниманием и недостатки такого подхода:
- Для корректной работы системы требуется особый и дорогой контроллер.
- Из-за особенности технологии восстановление данных может быть долгим.
Обобщая информацию по RAID 5, можно сказать: это достаточно хорошее, но все же специальное, а не универсальное решение для объединения накопителей.
RAID 6
Это развитие идеи из RAID 5: информация все так же поблочно раскидывается по дискам, но резервирование идет уже не одиночной четностью, а двойной – на два накопителя. Соответственно, минимальное количество «винтов» у такого массива – уже 4. Хотя опять же: лучше, если в модуле у RAID 6 их будет еще больше.
Главный плюс такого уровня очевиден: он будет работоспособен даже при выходе из строя двух дисков. Это максимально надежная из описанных система. Правда, надо разумно оценивать вероятность двойного сбоя «винтов» – и сопоставлять ее с имеющимися у этого RAID минусами. Среди них основными являются:
- Снижение скорости чтения и записи на фоне других «сложных» массивов.
- Необходимость в дополнительном пространстве для двойного копирования.
- Производительность во много зависит от сложного и мощного контроллера.
В силу этого сочетания характеристик шестой уровень – достаточно редкий, хотя в определенных ситуациях незаменимый метод.
Что можно сказать про уровни RAID 2, 3, 4 и 7?
Если кратко ответить на вопрос подзаголовка: это практически не востребованные RAID-системы. Основная причина – специфические технические нюансы в работе массива. Все эти RAID действуют по принципу чередования, но с особенностями:
- Во втором уровне используется так называемый код Хэмминга, а на дисках хранятся данные о проверке и исправлении ошибок. При этом оправданным по производительности и надежности модуль становится аж с 7 дисков.
- В RAID 3 информация бьется по байтам – и есть диск для блоков четности. Стоит отметить высокую скорость чтения и записи – но только для больших файлов. А еще массив однозадачный – доступ с двух устройств затруднен.
- Что до четвертого, он похож на третий, но без побайтной разбивки. С одной стороны, это решает проблему медленной передачи малых файлов. Однако запись в целом не быстрая – из-за отправки четности на один и тот же диск.
- Седьмой RAID похож на четвертый, но с дополнительным кэшированием на уровне оперативной памяти. Этот метод надежный и быстрый, но массиву обязательно нужен ИБП – при перебоях питания данные повреждаются.
Также следует отметить: кроме указанных в статье способов объединения дисков есть и другие, еще более экзотические, малораспространенные. Среди них можно упомянуть RAID 61, RAID 03 и RAID-DP. Но они интересны узким специалистам и встречаются гораздо реже, чем базовые RAID 0 и RAID 1…
Как найти быстрое надежное хранилище для своего проекта?
Если вы собираете массив для домашнего фотоархива, то справитесь с выбором оснащения. Но если речь о бизнес-решениях для онлайн-проекта или баз данных – стоит обратиться к профессионалам, как компания HostZealot. При проектирования решения для вас мы можем создать любые типы массивов: от RAID 0, RAID 1 и выше. При этом мы как инфраструктурный провайдер готовы к реализации и индивидуальных проектов для специфических задач. А потому имеем возможность собрать массивы даже уровня RAID 1E или RAID 50, если будет такое требование. Это позволит вам подобрать оптимальное исполнение и обеспечить высокую скорость чтения и записи файлов и их сохранность. Причем у наших дата-центров широчайшая география: от США до Гонконга, от Стокгольма до Тель-Авива. И не забываем о множестве услуг хостинга выделенные серверы, VPS, веб-хостинг, колокация, гибкой тарифной сетке и круглосуточной, грамотной и внимательной техподдержке – нам можно доверять!