Информационно-справочный портал MorePC.ru

09.08.2007 Преимущества и недостатки RAID 6

Гюнтер Штегнер

LAN #07/2007

Избежать потери доступа к данным при отказе компонентов призваны помочь различные инструменты и технологии. Однако многие из них предлагают невысокую производительность за большие деньги, поэтому необходимо разобраться в их преимуществах и недостатках.

Избыточный массив независимых дисков (Redundant Array of Independent Disks, RAID) предусматривает сохранение идентичных данных в разных местах на нескольких жестких дисках. Простейшая модель — чередование, или RAID 0 — не предлагает никакой избыточности. Она обеспечивает повышенную производительность, но не отказоустойчивость. При выходе из строя хотя бы одного диска в составе группы теряются все данные.

RAID 5, напротив, предлагает комбинацию чередования и контроля четности. Информация о данных и четности распределяется по жестким дискам таким образом, что при отказе одного диска находившиеся на нем данные при помощи математической операции “исключающее или” могут быть восстановлены на основании дополнительных сведений о четности, хранящихся на остальных дисках. Поэтому RAID 5 осуществляет непрерывное резервирование всех данных.

МАССИВ RAID 6

RAID 6 представляет собой расширение RAID 5. При использовании этой технологии даже отказ сразу двух жестких дисков в одной группе не приведет к потере данных. В случае RAID 6 для восстановления информации необходимо провести две математические операции. Первая та же, что и в случае технологии RAID 5 (“исключающее или”), вторая требует наличия дополнительного жесткого диска Q, поэтому и сама технология называется проверкой четности P+Q. Некоторые производители утверждают, что с введением технологии RAID 6 — особенно при использовании их собственной реализации RAID 6 — устраняются все проблемы, связанные с готовностью. Действительно, RAID 6 предлагает высокий уровень защиты при отказе двух жестких дисков сразу, однако во многих возможных сценариях применения, к примеру, в случае пользовательских ошибок — эта технология не является оптимальным решением для обеспечения максимальной готовности данных.

В средах, где требуется обеспечить высокий уровень готовности данных, RAID 6 может рассматриваться — вне зависимости от затрат и влияния на производительность — в качестве дополнительной возможности решения хранения высокой готовности. Однако необходимо учитывать и недостатки
RAID 6:

КОЛИЧЕСТВО ПОДДЕРЖИВАЕМЫХ ДИСКОВ

Реализация с двойными значениями четности RAID 6 иногда ограничивает количество дисков в системе RAID простым числом. RAID 5, напротив, поддерживает в распространенных на рынке продуктах от трех до 30 дисков в одной системе и не предъявляет требования по ограничению числа жестких дисков в соответствии с предполагаемой областью применения. Такую возможность устройства RAID 6 предложить все еще не могут.

RAID 6 ПО СРАВНЕНИЮ С ДРУГИМИ УРОВНЯМИ RAID

По сравнению с RAID 10 и RAID 5 технология RAID 6 представляет собой уровень RAID с самой низкой производительностью. Хотя при нормальных условиях скорость чтения для всех этих уровней примерно одинакова, продолжительность записи сильно отличается. А при восстановлении, когда система никогда не работает на полную мощность, отличия еще более заметны:

КАК RAID 6 ВЛИЯЕТ НА ЕМКОСТЬ?

RAID 6 предлагает больше полезной емкости, чем RAID 1, где половина имеющихся ресурсов задействуется для обеспечения контроля четности, но полезная емкость RAID 6 все же меньше, чем у RAID 5. Конфигурация, в которой под данные отводится пять жестких дисков, в случае RAID 5 (5+1) использует для хранения данных о четности 16% всего дискового пространства, в то время как в случае RAID 6 эта величина достигает 29%. Кроме того, добавление лишь одного дополнительного диска в систему RAID в конфигурации RAID 6 ведет к увеличению вероятности отказа диска на 17%, из-за чего восстановление придется проводить чаще, да еще мириться с увеличением длительности процесса и снижением производительности. Поставщики решений RAID 6 утверждают, что создание крупных систем RAID позволяет сократить протокольные издержки на контроль четности. Однако у этого подхода имеются и подводные камни, поскольку крупные системы RAID более подвержены отказам дисков, а их восстановление занимает больше времени, что означает длительную работу с низкой производительностью.

РЕАЛИЗАЦИЯ RAID 6

Итак, как же реализуется RAID 6? Эта технология представляет собой систему двух независимых линейных уравнений. В принципе, есть две возможности построения RAID 6:

В большинстве классических реализаций P+Q используется первый метод (поле Галуа) (см. Рисунок 1). Проблемой является “простой и быстрый” выбор подходящих множителей (полином). Первый полином очень прост: 0x1. Таким образом, первое уравнение выглядит так же, как и в случае RAID 5:
данные о четности сохраняются на жестком диске Р. Все имеющиеся аппаратные ускорители для RAID 5 будут работать и в этом случае. Однако второй полином сложнее и требует значительных вычислительных издержек. В лю-бом случае речь идет об операции “исключающее или” с множителем, которая в RAID 5 не применяется, но может быть получена путем незначительной модификации аппаратного обеспечения для функции “исключающее или”.


Второй метод — двойной контроль четности (Dual Parity, Double Parity) (см. Рисунок 2), когда обычные “горизонтальные” полосы комбинируются с “вертикальными” рядами. Любая вертикальная полоса использует не более одной горизонтальной полосы от каждого жесткого диска. Благодаря двум разным наборам данных о четности система RAID может быть восстановлена при отказе одного или двух жестких дисков. Данные о четности для горизонтальных и вертикальных полос обрабатываются так же, как и в современных системах RAID 5 (при помощи операции “исключающее или”). Но сложные алгоритмы вычисления вертикальной четности, а также нетривиальные механизмы обработки ошибок и исключений ведут к тому, что такие реализации RAID 6 работают заметно медленнее, чем P+Q RAID 6.


В зависимости от того, где хранятся данные, для их восстановления может потребоваться несколько итераций, как минимум три, но чаще их число равно квадрату количества жестких дисков. В принципе, система RAID 6 с двойным контролем четности всегда предлагает удовлетворительную производительность, но восстановление данных при отказе двух жестких дисков ведет к неприемлемому сокращению производительности. В качестве побочного эффекта возможна даже перегрузка оперативной памяти из-за адаптера, что еще более снижает производительность. Хотя подходы отдельных производителей и различаются, реализация P+Q считается отраслевым стандартом, поскольку в любых условиях она гарантирует целостность данных и высокую производительность (см. Рисунок 3). LSI и Intel совместно работали над стандартизацией полинома MDS для спецификации формата диска данных (Disk Data Format, DDF), которой занимается Отраслевая ассоциация сетевых систем хранения данных (Storage Networking Industry Association, SNIA). Эта спецификация уже зарегистрирована Международным комитетом по стандартам информационных технологий (International Committee for Information Technology Standards, INCITS). Стандартов для реализации DP не существует, поэтому системы разных производителей весьма отличаются друг от друга.

КАК RAID ИСПОЛЬЗУЕТСЯ СЕГОДНЯ?


RAID 1 и RAID 5 являются проверенными технологиями, и все производители реализуют их одинаково. Они используются в производственных системах хранения данных уже более 15 лет. Специалисты знают, как реализуются эти уровни RAID и каким образом в таких конфигурациях и решениях достигаются оптимальные производительность, емкость и готовность. Что же касается RAID 6, то это сравнительно молодая технология, и подходы, применяемые к ней, очень различны.

Постоянная готовность данных имеет решающее значение для успешной работы предприятия. Поэтому системы хранения данных должны обладать большим количеством функций, чтобы предлагать высокий уровень готовности. При помощи одного только инструмента этой цели не достичь. Построить систему хранения данных высокой готовности возможно лишь при наличии стратегической комбинации целого ряда инструментов, функций и возможностей конфигурации.

Гюнтер Штегнер — директор подразделения Engenio Storage Group компании LSI Logic в регионе Central EMEA.