Операционные системы/Управление внешними устройствами. Организация RAID систем, основные решения, характеристики
Материал из eSyr's wiki.
(Новая: Существуют проблемы с организацией больших потоков данных. В общем случае для дисковых систем имеют ...) |
(Новая: Существуют проблемы с организацией больших потоков данных. В общем случае для дисковых систем имеют ...) |
Текущая версия
Существуют проблемы с организацией больших потоков данных. В общем случае для дисковых систем имеют место как минимум две проблемы:
- Эффективность. Допустим, в системе присутствуют все уровни КЭШ, но производительности не хватает, так как обмены, которые производятся на дисковых устройствах, медленные.
- Надежность. Является одним из основных качеств любого программного решения. Соответственно, есть необходимость создания надежных дисковых систем.
Все это обусловило появление так называемых RAID-систем (RAID – Redundant Array of Independent (Inexpensive) Disks). Вначале RAID переводили как избыточный массив недорогих дисков. Со временем понятие RAID системы изменилось и на сегодняшний день оно переводится как избыточный массив независимых дисков. Итак, RAID система представляет собой набор независимых дисков, которые рассматриваются ОС как единое дисковое устройство, где данные представляются в виде последовательности записей, которые называются полосы. /*Полосы цилиндрически распределены по дисковому устройству. */ Рассмотрим модели организации многодисковых систем, которые относятся к классу RAID.
[править] Семь уровней RAID систем
[править] RAID 0 (без избыточности)
Не является настоящим RAID уровнем, поскольку не использует избыточность для повышения эффективности. Пользовательские и системные данные распределяются по всем дискам массива. Это лучше, чем использовать один большой диск, так как появляется вероятность того, что два различных блока памяти, к которым поступили два различных запроса ввода\вывода, размещены на различных дисках, вследствие чего эти два запроса могут обрабатываться параллельно.
Все пользовательские и системные данные рассматриваются как хранящиеся на одном логическом диске. Диск делится на полосы, которые могут быть физическими блоками, селекторами или другими единицами хранения. Полосы циклически размещаются на последовательных дисках массива. В n-дисковом массиве первые n полос располагаются как первые полосы каждого из n дисков; вторые n- как вторые полосы каждого из n дисков и т.д.
- «+» Если один запрос ввода\вывода обращается к множеству логически последовательных полос, то параллельно может быть обработано до n полос. Уменьшается время обработки.
[править] RAID 1 (зеркалирование)
Предполагает наличие массивов устройств. 1ая группа – циклическое распределение устройств по уровням 2ая группа-копия первой. Запись идет параллельно и независимо.
«+»
- Запрос на чтение может быть обслужен любым из двух дисков, содержащих необходимые данные; для обслуживания выбирается диск, у которого минимальное время поиска.
- Для запроса на запись необходимо обновление обеих полос, что может быть выполнено в параллельном режиме. Поэтому скорость записи определяется самой медленной из них (т.е. той, для которой время поиска оказывается большим). Однако никаких дополнительных расходов на запись не требуется.
- Простота восстановления данных в случае сбоя
RAID первого уровня это достаточно дорогостоящая конструкция, потому что получается двойное резервирование, но тем не менее эта система наиболее просто организована.
[править] RAID 2 (избыточность с кодами Хэмминга (Hamming))
Исправляет одинарные и выявляет двойные ошибки. Также используется разделение на полосы. Полосы оказываются очень малыми; нередко они соответствуют одному байту или слову. Обмен с синхронизацией головок чтения записи. Часть дисковых устройств предназначены для хранения содержательной части информации. Существует несколько дисковых устройств, в которых реализованы коды Хэмминга.
При считывании осуществляется одновременный доступ ко всем дискам. Данные запроса и код коррекции ошибок передаются контролеру массива. При наличии однобитовой ошибки контролер способен быстро ее откорректировать, так что доступ для чтения в этой схеме не замедляется.
При записи происходит одновременное обращение ко всем дискам массива.
Имеют место 2 проблемы:
- Соответственно, избыточность меньше, чем у RAID 1, но все равно она присутствует.
- Есть зависимые обмены, т.е. обмены, которые организованы на специализированных движениях головок. И соответственно информация сильно распределена по RAID массиву. Т.е. последовательная информация за счет маленького размера полосок распределена. Т.е. одновременно происходит обращение ко всей цепочке. Т.е. нет независимых обменов в каждом дисковом устройстве.
[править] RAID 3 (четность с чередующимися битами)
4 диска содержательные – для размещения логических данных. 5ый – контрольная избыточная информация.
Суть. Представим, что модель RAID состоит из 5 дисков. В этих 5 дисках 4 диска содержательные, т.е. для размещения логического диска с соответствующими полосками. 5-й диск – это контрольная избыточная информация. Содержимое пятого диска выражается по формулам через содержимое первых 4. То есть определенный разряд 5-го диска представляется как «исключающее или» для соответствующих ему содержательных разрядов. В случае гибели какого-нибудь из устройств утверждается, что информацию на этом устройстве можно восстановить по второй, приведенной ниже, формуле. Т.е. имеет место избыточность, которая с одной стороны дает синхронизированный параллельный доступ, а с другой имеется функция, которая восстанавливает информацию в случае гибели устройства.
[править] RAID 4 (четность с чередующимися блоками)
Он не синхронизированный, т.е. в этом плане он аппаратно организован проще, чем предыдущие. Схема примерно та же самая: имеется 4 устройства для логического диска, на которых располагаются полосы, и 5-е устройство, в котором находятся контрольные суммы. Контрольная сумма вычисляется по той же самой формуле, что и в RAID 3. И здесь есть проблема работы в случае независимого обмена.
Пример: 4 диска данных, один – четности:
При независимом обмене происходит обновление следующим образом: предположим, что обновление произошло на первом диске.
X4(i)=X3(i)XOR X2(i)XOR X1(i)XOR X0(i)
все разряды на 4-м будут обновлены по следующей формуле:
X4new(i)=X4(i)XOR X1(i)XOR X1new(i)
Восстановление информации проходит по предыдущей схеме (это схема обновления, потому что обмены могут быть независимыми, т.е. обмен может происходить только по одной полоске, но для этого необходимо скорректировать содержимое контрольной полоски и использовать ее для восстановления).
[править] RAID 5 (распределенная четность – циклическое распределение «четности»)
RAID 5 - это использование циклического распределения контрольного диска.
Суть: в RAID 3 и RAID 4 есть некоторая диспропорция в распределении потока обмена, т.е. сильно нагружено последнее устройство (это плохо тем, что рано или поздно это устройство выйдет из строя первым), на котором находится контрольная сумма. Т.о. контрольный диск циклически распределен по всем устройствам, т.е. вся работа равномерно распределяется.
[править] RAID 6 (двойная избыточность – циклическое распределение четности с использованием двух схем контроля: N+2 дисков)
RAID 6 – это двойная избыточность. Делается еще одно дополнительное устройство для хранения избыточной информации.
Какие-то из RAID массивов можно реализовать чисто программно. Какие-то из них можно реализовать только аппаратно. Какие-то из них можно реализовать в зависимости от решения. Это все относится к проблеме управления внешними устройствами: качеством и свойством работы внешних устройств в системе.
[править] Сравнение уровней RAID-систем
Категория | Уровень | Описание | Скорость обработки запросов | Скорость передачи данных | Типичное применение |
Расщепление | 0 | Без избыточности | Большие полосы: отлично | Малые полосы: отлично | Приложения с некритическими данными, требующие высокой производительности |
Зеркалирование | 1 | Зеркалирование | Хорошо/ удовлетворительно | удовлетворительно/ удовлетворительно | Системные диски, важные файлы |
Параллельный доступ | 2 | Избыточность с кодами Хэмминга | Плохо | Отлично | |
3 | Четность с чередующимися битами | Плохо | Отлично | Приложения с большими запросами ввода/вывода (графич. редакторы, САПР) | |
Независимый доступ | 4 | Четность с чередующимися блоками | Отлично/ удовлетворительно | Удовлетворительно/ плохо | |
5 | Распределенная четность с чередующимися блоками | Отлично/ удовлетворительно | Удовлетворительно/ плохо | Высокая скорость запросов, интенсивное чтение, поиск данных | |
6 | Двойная распределенная четность с чередующимися блоками | Отлично/плохо | Удовлетворительно/ плохо | Приложения, требующие исключительно высокой надежности |
См. также про RAID в Википедии.