77690

Способы кодирования данных

Лекция

Информатика, кибернетика и программирование

Эти моменты изменения полярности называются сменой знака. Каждая смена знака приводит к тому что считывающая головка выдает импульс напряжения; именно эти импульсы устройство регистрирует во время чтения данных. Но при этом считывающая головка генерирует не совсем тот сигнал который был записан; на самом деле она создает ряд импульсов каждый из которых соответствует моменту смены знака. Это устройство преобразует двоичные данные в электрические сигналы оптимизированные в аспекте размещения зон смены знака на дорожке записи.

Русский

2015-02-05

121 KB

3 чел.

Способы кодирования данных

Запись данных

Данные на магнитном носителе хранятся в аналоговой форме. В то же время сами данные представлены в цифровом виде, так как являются последовательностью нулей и единиц. При выполнении записи цифровая информация, поступая на магнитную головку, создает на диске магнитные домены соответствующей полярности. Если во время записи на головку поступает положительный сигнал, магнитные домены поляризуются в одном направлении, а если отрицательный — в противоположном. Когда меняется полярность записываемого сигнала, происходит также изменение полярности магнитных доменов.

Воспроизведение данных

Если во время воспроизведения головка регистрирует группу (или несколько групп) магнитных доменов одинаковой полярности, она не генерирует никаких сигналов; генерация происходит только тогда, когда головка обнаруживает изменение полярности положения доменов. Эти моменты изменения полярности называются сменой знака. Каждая смена знака приводит к тому, что считывающая головка выдает импульс напряжения; именно эти импульсы устройство регистрирует во время чтения данных. Но при этом считывающая головка генерирует не совсем тот сигнал, который был записан; на самом деле она создает ряд импульсов, каждый из которых соответствует моменту смены знака.

Кодером/декодером

Чтобы оптимальным образом расположить импульсы в сигнале записи, необработанные исходные данные пропускаются через специальное устройство, которое называется кодером/декодером (encoder/decoder). Это устройство преобразует двоичные данные в электрические сигналы, оптимизированные в аспекте размещения зон смены знака на дорожке записи. Во время считывания кодер/декодер выполняет обратное преобразование: восстанавливает из сигнала последовательность двоичных данных. Существуют различные методы кодирования данных, причем главной целью разработчиков было достижение максимальной эффективности и надежности записи и считывания информации.

Синхронизация  данных

При работе с цифровыми данными особое значение приобретает синхронизация. Во время считывания или записи очень важно точно определить момент каждой смены знака. Если синхронизация отсутствует, то момент смены знака может быть определен неправильно, в результате чего неизбежна потеря или искажение информации. Чтобы предотвратить это, работа передающего и принимающего устройств должна быть строго синхронизирована.

Два способа реализации синхронизации. Во-первых, синхронизировать работу двух устройств, передавая специальный сигнал синхронизации (или синхросигнал) по отдельному каналу связи. Во-вторых, объединить синхросигнал с сигналом данных и передать их вместе по одному каналу. Именно в этом и заключается суть большинства способов кодирования данных. Если данные и синхросигнал передаются по одному каналу, то можно осуществить их взаимную временную привязку при передаче между любыми двумя устройствами. Простейший способ сделать это — перед передачей ячейки данных послать синхронизирующий сигнал. Применительно к магнитным носителям это означает, что, например, ячейка, содержащая один бит информации, должна начинаться с зоны смены знака, которая выполняет роль заголовка. Затем следует (или не следует) переход, в зависимости от значения бита данных. Заканчивается рассматриваемая ячейка еще одной зоной смены знака, которая одновременно является стартовой для следующей ячейки.

Преимущество этого метода состоит в том, что синхронизация не нарушается даже при воспроизведении длинных цепочек нулей (или единиц), а недостаток — в том, что дополнительные зоны смены знака, необходимые только для синхронизации, занимают место на диске, которое могло бы использоваться для записи данных.

Поскольку количество зон смены знака, которые можно записать на диске, ограничено возможностями технологий производства носителей и головок, при разработке дисковых накопителей изобретаются такие способы кодирования данных, с помощью которых можно было бы уместить как можно больше битов данных в минимальное количество зон смены знака. При этом приходится учитывать то неизбежное обстоятельство, что часть из них все равно будет использоваться только для синхронизации.

Из множества разнообразных методов синхронизации (кодирования), на сегодняшний день реально используются только три :

  •  частотная модуляция (FM);
  •  модифицированная частотная модуляция (MFM);
  •  кодирование с ограничением длины поля записи (RLL).

Далее эти методы рассматриваются на примере ASCII-кода символа “X”.

Частотная модуляция (FM) и модифицированная частотная модуляция (MFM)

Метод кодирования FM (Frequency Modulation — частотная модуляция) был разработан прежде других и использовался при записи на гибкие диски так называемой одинарной плотности (single density) в первых ПК. Сейчас от него полностью отказались.

Основной целью разработчиков метода MFM (Modified Frequency Modulation — модифицированная частотная модуляция) было сокращение количества зон смены знака для записи того же объема данных по сравнению с FM-кодированием и соответственно увеличение потенциальной емкости носителя. При этом способе записи количество зон смены знака, используемых только для синхронизации, уменьшается. Синхронизирующие переходы записываются только в начало ячеек с нулевым битом данных и только в том случае, если ему предшествует нулевой бит. Во всех остальных случаях синхронизирующая зона смены знака не формируется. Благодаря такому уменьшению количества зон смены знака при той же допустимой плотности их размещения на диске информационная емкость по сравнению с записью по методу FM удваивается.

Поэтому, записанные по методу MFM, часто называют дисками двойной плотности (double density). Поскольку при рассматриваемом способе записи на одно и то же количество зон смены знака приходится вдвое больше “полезных” данных, чем при FM-кодировании, скорость считывания и записи информации на носитель также удваивается.

При записи и воспроизведении данных по методу MFM требования, предъявляемые к точности синхронизации, более жесткие, чем при FM-кодировании. Однако все сложности были успешно преодолены, и MFM стал самым популярным методом кодирования на долгие годы.

В табл. приведено соответствие между битами данных и зонами смены знака.

Таблица 1. Последовательность зон смены знака при записи по методу MFM

Бит данных

Последовательность зон смены знака

1

NT*

0 с предшествующим 0

TN

0 с предшествующей 1

NN

* T — смена знака есть; N — смены знака нет.

Кодирование с ограничением длины поля записи (RLL)

На сегодняшний день наиболее популярен метод кодирования с ограничением длины поля записи (Run Length Limited — RLL)1. Он позволяет разместить на диске в полтора раза больше информации, чем при записи по методу MFM, и в три раза больше, чем при FM-кодировании.  При использовании этого метода происходит кодирование не отдельных битов, а целых групп, в результате чего создаются определенные последовательности зон смены знака, т.е. при записи по методу RLL одновременно кодируются целые группы битов.

Термин Run Length Limited (с ограничением длины пробега) составлен из названий двух основных параметров, которыми являются минимальное (длина пробега) и максимальное (предел пробега) число ячеек перехода, которые можно расположить между двумя зонами смены знака. Изменяя эти параметры, можно получать различные методы кодирования, но на практике используются только два из них: RLL 2,7 и RLL 1,7.

Методы FM и MFM, в сущности, являются частными вариантами RLL. Так, например, FM-кодирование можно было бы назвать RLL 0,1, поскольку между двумя зонами смены знака может располагаться максимум одна и минимум нуль ячеек перехода. Соответственно метод MFM в этой терминологии можно было бы обозначить RLL 1,3, так как в этом случае между двумя зонами смены знака может располагаться от одной до трех ячеек перехода. Однако при упоминании этих методов обычно используются более привычные названия FM и MFM.

До последнего времени самым популярным был метод RLL 2,7, поскольку он позволял достичь высокой плотности записи данных (в 1,5 раза больше по сравнению с методом MFM) и достоверности (надежности) их воспроизведения. При этом соотношение размеров зон смены знака и участков с постоянной намагниченностью оставалось тем же, что и при методе MFM. Однако для накопителей очень большой емкости метод RLL 2,7 оказался недостаточно надежным. В большинстве современных жестких дисков высокой емкости используется метод RLL 1,7, который позволяет увеличить плотность записи в 1,27 раза по сравнению с MFM при оптимальном соотношении между размерами зон смены знака и участков с постоянной намагниченностью. За счет некоторого снижения плотности записи (по сравнению с RLL 2,7) удалось существенно повысить надежность считывания данных. Это особенно важно, поскольку в накопителях большой емкости носители и головки уже приближаются к пределу возможностей современной технологии. И так как при разработке современных жестких дисков приоритет принадлежит надежности считывания данных, можно ожидать, что в ближайшем будущем метод RLL 1,7 достигнет наибольшего распространения.

Еще один редко используемый вариант RLL — метод RLL 3,9. Иногда его называют усовершенствованным RLL, или ARRL (Advanced RLL). С его помощью можно достичь еще большей плотности записи информации, чем при использовании метода RLL 2,7. Но, к сожалению, надежность ARRL-кодирования очень невысока; его пытались использовать в некоторых контроллерах, но их выпуск был вскоре прекращен.

Рассмотрим сущность RLL-кодирования на примере метода RLL 2,7. Даже для этого конкретного варианта можно построить множество таблиц перекодировки различных последовательностей битов в серии зон смены знака. Согласно этой таблице группы данных длиной 2, 3 и 4 бит преобразуются в серии зон смены знака длиной 4, 6 и 8 битовых ячеек соответственно. При этом кодирование последовательностей битов происходит так, чтобы расстояние между зонами смены знаков было не слишком маленьким, но и не слишком большим.

Первое ограничение вызвано тем, что величины разрешений головки и магнитного носителя, как правило, являются фиксированными. Второе ограничение вызвано необходимостью обеспечения синхронизации передачи данных при работе устройства устройств.

В табл. 2  приведена схема кодирования по методу RLL 2,7, разработанная компанией IBM при создании кодеров/декодеров.

Таблица 2. Последовательность зон смены знака при записи по методу RLL 2,7

Бит данных

Последовательность зон смены знака

10

NTNN*

11

TNNN

000

NNNTNN

010

TNNTNN

011

NNTNNN

0010

NNTNNTNN

0011

NNNNTNNN

* T — смена знака есть; N — смены знака нет.

При внимательном изучении этой таблицы можно заметить, что кодировать, например, байт 00000001 нельзя, поскольку его нельзя составить из комбинации приведенных в таблице групп битов. Однако на практике при этом никаких проблем не возникает. Дело в том, что контроллер не оперирует байтами, а формирует сразу целые секторы записи. Поэтому, если ему попадается такой байт, он просто начинает искать подходящую для разбивки на группы комбинацию с учетом следующего байта последовательности. Затруднение может возникнуть только в том случае, если указанный байт последний в секторе. В этой ситуации кодер, установленный в контроллере, просто дописывает в конец последнего байта несколько дополнительных битов. При последующем считывании они отбрасываются, и последний байт воспроизводится таким, каким он должен быть.

Сравнение способов кодирования

На рис.  показаны диаграммы сигналов, формируемых при записи на жесткий диск ASCII-кода символа “X” для трех различных способов кодирования.

В верхней строке каждой из этих диаграмм показаны отдельные биты данных (01011000) в битовых ячейках, границами которых являются синхронизирующие сигналы, обозначенные точками. Под этой строкой изображен сам сигнал, представляющий собой чередование положительных и отрицательных значений напряжения, причем в моменты смены полярности напряжения происходит запись зоны смены знака. В нижней строке показаны ячейки перехода, причем T обозначает ячейку, содержащую зону смены знака, а N — ячейку, в которой зоны смены знака нет.

Разобраться в FM-кодировании очень просто. В каждой битовой ячейке содержится две ячейки перехода: одна для синхронизирующего сигнала, другая для самих данных. Все ячейки перехода, в которых записаны сигналы синхронизации, содержат зоны смены знака. В то же время ячейки перехода, в которых записаны данные, содержат зону смены знака только в том случае, если значение бита равно логической единице. При нулевом значении бита зона смены знака не формируется. Поскольку в примере значение первого бита — 0, он будет записан в виде комбинации TN. Значение следующего бита равно 1, и ему соответствует комбинация TT. Третий бит тоже нулевой (TN) и т.д. С помощью приведенной выше диаграммы FM-кодирования легко проследить всю кодирующую комбинацию для рассматриваемого примера байта данных. При таком способе записи зоны смены знака могут следовать непосредственно одна за другой; в терминах RLL-кодирования это означает, что минимальный “пробег” равен нулю. С другой стороны, максимально возможное количество пропущенных подряд зон смены знака не может превышать единицы; вот почему FM-кодирование можно обозначить как RLL 0,1.

Рис.Сигналы, формируемые во время записи ASCII-кода   символа “X” при способах кодирования FM, MFM и RLL 2,7

При MFM-кодировании в ячейках также записывается синхросигнал и биты данных. Но, как видно из схемы, ячейки для записи синхросигнала содержат зону смены знака только в том случае, если значения и текущего и предыдущего битов равны нулю. Первый бит слева — нулевой, значение же предыдущего бита в данном случае неизвестно, поэтому предположим, что он тоже равен нулю. При этом последовательность зон смены знака будет выглядеть как TN. Значение следующего бита равно единице, которой всегда соответствует комбинация NT. Следующему нулевому биту предшествует единичный, поэтому ему соответствует последовательность NN. Аналогичным образом можно проследить процесс формирования сигнала записи до конца байта. Легко заметить, что минимальное и максимальное число ячеек перехода между любыми двумя зонами смены знака равно 1 и 3 соответственно. Следовательно, MFM-кодирование в терминах RLL может быть названо методом RLL 1,3.

Поскольку в данном случае используется только половина зон смены знака (по сравнению с FM-кодированием), частоту синхронизирующего сигнала можно удвоить, сохранив при этом то же расстояние между зонами смены знака, которое использовалось при методе FM. Это означает, что плотность записываемых данных остается такой же, как при FM-кодировании, но данных кодируется вдвое больше.

Сложнее реализован  метод RLL 2,7, поскольку в нем кодируются не отдельные биты, а их группы. Первая группа слева, совпадающая с одной из приведенных в табл. 2 комбинаций, состоит из трех битов: 010. Она преобразуется в такую последовательность зон смены знака: TNNTNN. Следующим двум битам (11) соответствует комбинация TNNN, а последним трем (000) — NNNTNN. Как видите, в данном примере для корректного завершения записи дополнительные биты не потребовались.

В этом примере минимальное и максимальное число пустых ячеек перехода между двумя зонами смены знака равно 2 и 6 соответственно, хотя в другом примере максимальное количество пустых ячеек перехода может равняться 7. Именно поэтому такой способ кодирования называется RLL 2,7. Поскольку в данном случае записывается еще меньше зон смены знака, чем при MFM-кодировании, частоту сигнала синхронизации можно увеличить в 3 раза по сравнению с методом FM и в 1,5 раза по сравнению с методом MFM. Это позволяет на таком же пространстве диска записать больше данных. Но необходимо отметить, что минимальное и максимальное физическое расстояние на поверхности диска между любыми двумя зонами смены знака одинаково для всех трех упомянутых методов кодирования.

Декодеры PRML (Partial-Response, Maximum-Likelihood)

В последнее время в накопителях вместо традиционных усилителей считывания с пиковыми детекторами стала использоваться так называемая технология PRML (Partial-Response, Maximum-Likelihood — частичное определение, максимальное правдоподобие). Это позволяет  повысить плотность расположения зон смены знака на диске в среднем на 40% и на столько же увеличить емкость носителя.

Увеличение плотности записи приводит к тому, что пиковые значения напряжения при считывании данных могут накладываться друг на друга. При использовании метода PRML контроллер анализирует поток данных с головки посредством фильтрации, обработки и алгоритма определения (элемент частичного определения), а затем предсказывает последовательность битов, которые этот поток данных наилучшим образом представляет (элемент максимального правдоподобия). Обработка данных осуществляется цифровыми методами.

В настоящее время в самых новых накопителях на жестких дисках с успехом используется описанная схема PRML.

1 Метод RLL был разработан IBM и сначала использовался в дисковых накопителях больших машин. В конце 1980-х годов его стали использовать в накопителях на жестких дисках ПК, а сегодня он применяется почти во всех ПК.

PAGE  4


 

А также другие работы, которые могут Вас заинтересовать

41655. Техника аудиовизуальных средств информации 11.25 MB
  В видеомонтаже важным понятием является понятие рендеринга. Рендеринг видео video rendering это процесс построения изображения каждого кадра по его описанию которое пользователь создает в процессе монтажа фильма. В видеоредакторах рендеринг производится для предварительного просмотра фильма или при его экспорте во внешний файл.
41657. Техника аудиовизуальных средств информации 17.18 MB
  Спецэффекты Для создания качественных видео фильмов в программе dobe Premiere имеется значительное количество различных спецэффектов. При этом существует два основных типа эффектов: статические и динамические. Перед тем как начать процесс редактирования клипов с помощью эффектов необходимо активировать соответствующие вкладки в окнах Medi Browser вкладка Effects и Source вкладка Effect Controls. На следующем этапе выделите нужный клип в монтажной области с помощью инструмента выделения в результате чего во вкладке Effect Controls...
41658. Защита информации, антивирусная защита. Эксплуатационные требования к компьютерному рабочему месту 185.58 KB
  Лист № докум. Подпись Дата Лист 1 Лабораторная работа № 3 Разраб. Листов 3 47Э1 Цель работы Ознакомиться с теоретическими аспектами защиты информации от вредоносных программ: разновидности вирусов способы заражения и методы борьбы. Лист № докум.
41659. РАБОТА В ПРОГРАММНОЙ СРЕДЕ MICROSOFT OUTLOOK 757.34 KB
  Программная среда Microsoft Outlook пришла на смену разнообразным видам бумажных носителей которые использовали руководители и секретари для организации своей работы. Сегодня для организации документов и отправки почты планирования задач встреч событий и собраний ведения списка контактов а также учета всех выполненных работ используется программа Microsoft Outlook. Информация в среде Outlook организована в виде папок аналогичных по назначению своим бумажным предшественникам.
41660. Поверка средств измерений 39.3 KB
  Поверка средств измерений Цели и задачи работы: Изучение правил организации и порядка проведения поверки средств измерения. Краткие сведения из теории: Поверкой средств измерений называют совокупность действий выполняемых для определения и оценки погрешностей средств измерений. Вид поверки определяют в зависимости от того какой метрологической службой проведена поверка от характера поверки инспекционная экспертная каков этап работы средства измерений первичная периодическая внеочередная. Организацию и поверку средств измерений...
41661. Косвенные измерения. Определение показателей точности косвенных измерений 587.13 KB
  Косвенные измерения. Определение показателей точности косвенных измерений Цели и задачи работы: изучение методов измерения при которых искомое значение физической величины находят путем согласованных наблюдений других величин определяемых опытным путем связанных с искомой физической величиной известной зависимостью; ознакомление с правилами оценивания погрешностей косвенных измерений. При выполнении работы необходимо практически ознакомиться с системой допусков и посадок требованиями к точности линейных и угловых параметров изделий...
41662. Вставка и редактирование формул в редакторе WORD 73.64 KB
  Вставка и редактирование формул. Вставка формул. Вставка формул в редакторе WORD осуществляется с помощью формульного редактора. Вызов формульного редактора Eqution Editor из Word можно осуществить следующей последовательностью действий: поместите курсор в то место где должна быть вставлена формула; в меню вставка выберите команду обьект ; выберите закладку создание ; В окне тип обьекта выберите Microsoft Eqution 3.
41663. Теория электрической связи 263.74 KB
  Получение характеристик частотного модулятора при воздействии на его вход моногармонического сигнала. Напряжение смещения Есм являющееся постоянной составляющей модулирующего сигнала позволяет установить несущую частоту модулированного сигнала а переменная составляющая т. сам модулирующий сигнал поданный на гнезда КТ1 обеспечивает девиацию частоты fmx зависящую от амплитуды модулирующего сигнала. В схеме модулятора имеется блок автоматической регулировки усиления поддерживающий постоянную амплитуду ЧМ сигнала на схеме не показан.