35151

Методы повышения надёжности хранения данных. Технология RAID

Доклад

Информатика, кибернетика и программирование

Технология RID Одна из причин ведущих к утрате информации аппаратные сбои и поломки. RID это акроним от Redundnt rry of Independent Disks. Этим набором устройств управляет специальный RIDконтроллер контроллер массива который инкапсулирует в себе функции размещения данных по массиву; а для всей остальной системы позволяет представлять весь массив как одно логическое устройство ввода вывода. В зависимости от уровня RID проводится или зеркалирование или распределение данных по дискам.

Русский

2013-09-09

50.5 KB

4 чел.

  1.  Методы повышения надёжности хранения данных. Технология RAID

Одна из причин, ведущих к утрате информации, — аппаратные сбои и поломки.

Наиболее известным способом повышения общей надежности системы, состоящей из относительно ненадежных элементов, является резервирование.

Однако важно, чтобы информация сохранилась при отказе одного привода из всего массива. Значит, должна быть обеспечена минимальная избыточность, которая не слишком обременяет дополнительными расходами, но спасает важную информацию.

RAID - это акроним от Redundant Array of Independent Disks.

Данная технология родилась в результате решения проблемы, связанной с нарушением функционирования вычислительного комплекса в результате потери данных, находящихся в памяти, иными словами, решения проблемы отказоустойчивости.

Дисковый массив - это набор дисковых устройств, работающих вместе, чтобы повысить скорость и надежность системы ввода/вывода. Этим набором устройств управляет специальный RAID-контроллер (контроллер массива), который инкапсулирует в себе функции размещения данных по массиву; а для всей остальной системы позволяет представлять весь массив как одно логическое устройство ввода/вывода. За счет параллельного выполения операций чтения и записи на нескольких дисках, массив обеспечивает повышенную скорость обменов по сравнению с одним большим диском.

Массивы также могут обеспечивать избыточное хранение данных, с тем, чтобы данные не были потеряны в случае выхода из строя одного из дисков. В зависимости от уровня RAID, проводится или зеркалирование или распределение данных по дискам.

RAID-массивы как раз и призваны повысить производительность дисковой подсистемы. Но еще одной задачей является снижение зависимости надежности подсистемы от надежности диска. То есть такая организация работы, при которой надежность выше, чем у одиночного диска. С ростом числа устройств, согласно теории вероятности, значительно падает надежность системы, но отказоустойчивость призвана бороться с этим. Все это делается с помощью специальным образом организованной работы массива из жестких дисков. Это и есть RAID.

Уровень 0 подразумевает отсутствие избыточности. Данные разбиваются на блоки, и каждый следующий блок записывается на следующий диск в кольцевом порядке. Работа идет параллельно с несколькими дисковыми контроллерами, поэтому производительность чтения/записи достигается очень высокая. Никакой избыточной информации нет, поэтому контроллер работает с максимальной скоростью и минимальной нагрузкой. Основной недостаток проистекает из достоинства — при выходе из строя одного диска полностью теряется вся информация, имевшаяся в массиве.

Уровень 1 — это знакомое со времен Novell NetWare SFT зеркальное отображение дисков. Обладает удвоенной скоростью чтения, так как последовательные блоки параллельно считываются двумя дисковыми контроллерами. При отказе одного диска скорость чтения хотя и снижается вдвое, но остается на уровне скорости отдельного устройства. Механизм восстановления синхронизации после замены отказавшего диска предельно прост. Еще одно уникальное свойство уровня 1 — возможность продолжения работы при отказе более чем одного диска, при этом, правда, все отказавшие устройства должны находиться по одну сторону «зеркала».

Сфера применения RAID уровня 2  лежит там, где при не очень большом объеме данных требуется высокая надежность и обеспечение быстрого доступа к данным, например в бухгалтерии, при выписке счетов и т.д. При своевременном переносе устаревшей информации на ленты можно ограничиться небольшой емкостью дисков, сведя, таким образом, расходы на двойное резервирование к небольшой в абсолютном исчислении сумме.

При использовании RAID уровня 2 записываемые данные «распыляются» по дискам бит за битом. При этом вычисляются коды Хэмминга для коррекции ошибок и записываются на отдельные диски. При чтении коды Хэмминга используются для проверки и исправления данных. Таким образом, коррекция производится «на лету», и используется преимущество параллельного чтения с нескольких устройств сразу. Ускорению чтения данных способствует и простота алгоритма работы контроллера. Однако из-за несовершенства системы кодов Хэмминга для их хранения требуется довольно много места, то есть избыточность становится выше теоретически достижимой, что повышает стоимость системы. Скорость записи в лучшем случае, то есть при синхронизации дисков, равна скорости записи на одиночный диск. Этот уровень RAID применяется не очень часто, однако по области применения он универсален.

В RAID уровня 3  блоки записываемых данных разбиваются на подблоки меньшего размера (так называемые полосы). Эти полосы записываются на разные диски параллельно. Одновременно рассчитываются и записываются на отдельный диск контрольные суммы. Этот уровень обеспечивает высокую скорость чтения из-за параллельной работы всех устройств и меньшую избыточность по сравнению с уровнем 2. Даже при отказе одного диска скорость чтения снижается ненамного. Скорость записи маленьких файлов также очень высока, но падает при росте их размеров, так как узким местом становится диск четности. Обычно массив этого уровня состоит из четырех-пяти дисков, один из которых выделен для хранения контрольных сумм. Из-за высокой скорости чтения может быть рекомендован для применения в тех же областях, что и RAID 0.

Примерно так же организован RAID уровня 4 , только блоки не разбиваются на полоски, а распределяются целиком по разным дискам массива. Контрольные суммы также хранятся на отдельном диске. Из-за принятого алгоритма работы преимущества хранения данных на нескольких дисках проявляются только при чтении больших файлов. Если в массиве уровня 3 диски начинают работать параллельно при запросе на чтение размером более одной полоски, то в уровне 4 параллельная работа начинается при запросе на чтение более чем одного блока. Скорость записи у массивов этого уровня наименьшая, а восстановление после замены отказавшего диска происходит долго и мучительно. RAID 4 следует применять только в тех случаях, когда требуется быстро считывать большие объемы данных, смирившись с медленной записью.

Наконец, RAID уровня 5  является компромиссом между достоинствами RAID Level 3 и RAID Level 4. По дискам распределяются блоки данных, так что скорость чтения велика только для больших файлов, но алгоритм работы контроллера упрощается. Но упрощается он только для того, чтобы контроллер успевал справляться с другой задачей — распределением по дискам контрольных сумм. RAID 5 не имеет специального диска для хранения контрольных сумм. Минимальна избыточность — всегда только один лишний диск. Да и эстетически полностью симметричная система воспринимается лучше. Однако при отказе любого из дисков неизбежно замедление (уровни 2-4 при отказе диска четности работают даже быстрее), так как контроллер вынужден собирать недостающие данные по всем оставшимся дискам. Восстановление после замены отказавшего диска происходит легче, чем в уровне 4, но не так просто, как в уровне 1. Тем не менее этот уровень остается наиболее гибким, экономичным и поэтому широко применяемым в тех случаях, когда не предъявляется специальных требований типа ускоренного чтения гигантских файлов.


 

А также другие работы, которые могут Вас заинтересовать

18578. Прикладные протоколы и телекоммуникационные информационные услуги 65.5 KB
  Прикладные протоколы и телекоммуникационные информационные услуги Прикладные протоколы и телекоммуникационные информационные услуги Основные услуги телекоммуникационных технологий электронная почта передача файлов телеконференции справочные службы доски о
18579. Системы распределенных вычислений 42.5 KB
  Системы распределенных вычислений При выполнении проектных процедур с использованием более чем одного узла сети различают режимы удаленного узла и дистанционного управления рис. 5.1. В режиме удаленного узла основные процедуры приложения исполняются на терминальн...
18580. Информационная безопасность. Симметричную и асимметричную схемы шифрования 38 KB
  Информационная безопасность При обмене информацией между участниками проектирования возможны как утечка конфиденциальных данных так и нарушение целостности данных. Поскольку в САПР зачастую используются связи со смежными предприятиями через сети общего пользовани
18581. Основные функции и проектные процедуры, реализуемые в ПО САПР 40 KB
  Основные функции и проектные процедуры реализуемые в ПО САПР В состав развитых машиностроительных САПР входят в качестве составляющих системы CAD САМ и CAE. Функции CADсистем в машиностроении подразделяют на функции двумерного и трехмерного проектирования. К функциям 2D...
18582. Автоматизированные системы управления Автоматизация управления предприятиями 42 KB
  Автоматизированные системы управления Автоматизация управления предприятиями Системы управления в промышленности как и любые сложные системы имеют иерархическую многомодульную структуру. Если предприятие является концерном научнопроизводственным объединение
18583. Логистические системы 36 KB
  Логистические системы Сложность задач управления которые приходится решать в современных производственных системах обусловливает интерес к логистике и развитию логистических систем. Традиционно логистику связывали с управлением процедурами движения сырья от исто
18584. Автоматизация управления технологическими процессами 45.5 KB
  Автоматизация управления технологическими процессами В автоматизированных системах управления технологическими процессами часто называемых системами промышленной автоматизации можно выделить свои иерархические уровни. На верхнем диспетчерском уровне АСУТП ос...
18585. Автоматизированные системы делопроизводства 37 KB
  Автоматизированные системы делопроизводства Информационные технологии и АСУ документами и документооборотом пользуются все возрастающим вниманием среди предприятий и фирм различного профиля поскольку организация работы с документами существенно влияет на эффекти...
18586. Инструментальные средства концептуального проектирования автоматизированных систем 41.5 KB
  Инструментальные средства концептуального проектирования автоматизированных систем В современных информационных технологиях важное место отводится инструментальным средствам и средам разработки АС в частности системам разработки и сопровождения их ПО. Эти технол