14010

Компрессия аудиоданных Сжатие информации без потерь (Lossless)

Лекция

Музыка

Компрессия аудиоданных Сжатие информации без потерь Lossless Алгоритмы выискивающие повторяющиеся последовательности в двоичных данных и заменяющих эти последовательности кодами Методы ЛемпелаЗиваУэлча LZW встречавшаяся ранее последовательность заменяется сс...

Русский

2013-05-20

98 KB

4 чел.

Компрессия аудиоданных

Сжатие информации без потерь (Lossless)

Алгоритмы, выискивающие повторяющиеся последовательности в двоичных данных и заменяющих эти последовательности кодами

Методы Лемпела-Зива-Уэлча LZW (встречавшаяся ранее последовательность заменяется ссылкой-маркером), дефляция, Берроуза-Уиллера Burroughs-Wheeler основаны на поиске повторяющихся последовательностей байтов.

Методы Хаффмана (1-самое часто встречающееся значение, 01-следующее и т.д.) и арифметическое кодирование основаны на поиске часто встречающихся значений байтов.

Плюсы: точное восстановление исходных данных. Минусы: непредсказуемая степень сжатия, низкая эффективность.

FLAC — см. ниже; APE - Monkey’s Audio (официально под Windows, есть и др.)

Сжатие информации с потерей качества (Lossyless)

Нелинейная ИКМ

Основана на том, что потеря точности для слабых звуков острее, чем для громких. Наиболее распространенный формат, использующий мю-функцию (μ-Law) сжимающий 12-битные отсчеты в 8-битные

Дифференциальная ИКМ (дельта-модуляция)

Основана на том, что соседние отсчеты обычно мало отличаются друг от друга. Если приращение значения превышает диапазон, то промежуточные значения искажаются.

Нелинейная дельта-модуляция.

Код

-8

-7

-6

-5

-4

-3

-2

-1

0

1

2

3

4

5

6

7

Фибоначчи

-34

-21

-13

-8

-5

-3

-2

-1

0

1

2

3

5

8

13

21

Экспонента

-128

-64

-32

-16

-8

-4

-2

-1

0

1

2

4

8

16

32

64

Адаптивная ДИКМ

Вместо использования заранее заданных приращений используется набор на основе предварительного анализа данных (обычно масштабного коэффициента). Наиболее распространено компрессирование 4:1.

IMA ADPCM (Interactive Multimedia Association) адаптивная дифференциальная импульсно-кодовая модуляция. Алгоритмы: Microsoft для WAVE и Apple для AIFF-C и QuicTime.

Методы компрессии с прогнозированием

Моделирование данных позволяет «предсказать» последующие значения. При использовании одинакового алгоритма моделирования в устройствах кодирования и декодирования можно передавать информацию о величине ошибки. Чем точнее данные моделируются, тем меньше ошибка и объем информации. Минусы: необходимость очень сложного алгоритма снижающего скорость вычислений.

Кодирование в частотных поддиапазонах

Разделение сигнала на частотные поддиапазоны позволяет использовать оптимальные для различных частот алгоритмы. В низкочастотных сигналах преобладают малые приращения, а в высокочастотных – большие. Точность в полосе высокой чувствительности слуха должна быть выше, чем в полосах, где чувствительность слуха ниже. MPEG-аудио, Dolby AC, Sony MiniDisk (ATRAC).

mp3 - формат сжатия с потерей качества

Кодеки mp-3:

  •  Fraunhofer-IIS Формат МР3 был создан исследователями Института Фраунгофера (Германия) в начале прошлого десятилетия. Срок действия патентов на технологию истек в 2010 году, теперь формат MP3 любой производитель сможет бесплатно. Наилучшее качество до 128 кбит/с
  •  Кодеры Xing Technologies – высокая скорость при минимальном качестве.
  •  Кодеры на основе стандарта ISO/IEC 11172-3 (LAME-codec) создают наилучшие по качеству MP3 файлы для битрейтов 128 – 320 кбит/с.

битрейт - величина потока информации. Качество зависит не только от битрейта, но и от кодека.

Constant Bit Rate - постоянный битрейт (битрейт кратен 16)

Average Bit Rate - то есть усредненный битрейт (подгоняет под заданный)

Variable Bit Rate - то есть изменяющийся битрейт или переменный битрейт (максимальное качество)

Mp-3 Pro – наивысшее качество, но плееры, не поддерживающие формат, воспроизводят их без ВЧ.

wma - лицензируемый формат файла с более высокими характеристиками, чем mp3, но нестойкий к ошибкам (последние версии без потери качества)

aac - Advanced Audio Coding — патентованный формат аудиофайла с увеличенным размером «окна» в 2048 пунктов, частотами дискретизации до 96 кГц и до 48 каналов (.aac, .mp4, .m4a, .m4b, .m4p, .m4r)

VQF - Vector Quantization — векторное квантование, Япония (на 30-35 % компактнее MP3при равном качестве за счет загрузки процессора)

ogg - контейнер для различного типа медиа. Открытый бесплатный стандарт. В контейнере Ogg можно хранить звук и видео в различных форматах (таких как MPEG-4, Dirac, MP3 и другие), но обычно Ogg используется со следующими:

  •  Speex — для сжатия речевого сигнала на низких битрейтах (~8—32 кбит/канал);
  •  Vorbis — для сжатия звука на средних и высоких битрейтах (~16—500 кбит/канал).
  •  FLAC — мультиплатформенный кодек сжатия без потерь для обработки звуковых архивов и других аудиоданных высокого качества воспроизведения.

Компрессия речи

Моделирование звуков на основе анализа параметров и пауз позволяет сохранить хорошее качество при сжатии 100:1 и выше. На основе алгоритмов компрессии были разработаны алгоритмы модификации голоса. Speex см. выше.

Опорные точки

При сжатии звука используется накопление информации. Для возможности использования в потоковом аудио необходимо периодически создавать опорные точки.

Прогрессивная компрессия

В условиях переменной полосы пропускания используется прогрессивная компрессия:

  •  Блок данных с максимальной компрессией исходных данных
  •  Блок данных с максимальной компрессией данных об ошибке компрессии
  •  Блок данных об ошибке второго порядка
  •  Блоки данных об ошибках 3 и т.д. порядков.


 

А также другие работы, которые могут Вас заинтересовать

48604. Проектування автоматичного пристрою 1.54 MB
  КИЇВ – 2006 НАЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ КАФЕДРА Обчислювальної техніки ЗАВДАННЯ на курсову роботу з дисципліни: Комп’ютерна електроніка Виконала: Кадет Марія Василівна Група 201 Факультет ФКС Тема проекту “Розробка автоматичного пристрою†Вхідні дані: серія мікросхем елементна база структурна схема Завдання видано Термін здачі проекту Керівник Андрєєв В. Тригер це запам’ятовуючий елемент з двома стійкими станами котрі змінюються під дією вхідних сигналів. Тригери що...
48605. Анализ предприятия торгово-бытового обслуживания “Универсам” 78.5 KB
  Кладка стен выполнить из глиняного каркасного кирпича М75 на цементнопесчаном растворе М50 толщиной 640мм с утеплителем – пеноизол группы Л24. Кирпичные перегородки выполнить толщиной 120мм из каркасного кирпича М50 на растворе М25 под штукатурку армировать через три ряда кладки по высоте. Стойки козырьков выполнить из металлических труб грунтовать ГФ21 окрасить эмалью по металлу колер RL 5005серый. Экраны козырьков выполнить из панелей фасадной ПФ1А фирмы â€ИНСИ†колер RL 1014.
48606. Проектування комп’ютерної мережа 231 KB
  Класифікація комп’ютерних мереж По ступеню розсередження комп’ютерні мережі поділяються на локальні регіональні і глобальні. Локальні мережі поєднують компютери що розташовані недалеко один від одного. Регіональні обчислювальні мережі розташовуються в межах визначеного територіального регіону групи підприємств міста області і т. Регіональні обчислювальні мережі мають багато спільного з ЛОМ але вони по багатьох параметрах більш складні і комплексні.
48607. Расчет состояния рабочего тела и энергетических характеристик газотурбинного двигателя 425 KB
  В результате работы определены: характеристики воздуха на заданной высоте полета оптимальная степень сжатия воздуха в компрессоре состав продуктов сгорания и основные параметры в характерных точках цикла. Условные обозначения индексы Определение характеристик воздуха на заданной высоте полета Определение кopt оптимальной степени сжатия в компрессоре Определение коэффициента избытка воздуха Расчет состава продуктов сгорания адиабатное сжатие воздуха в...
48608. РОЗРАХУНОК СТІЙКОСТІ ГЕНЕРАТОРІВ, ДВИГУНІВ І ВУЗЛІВ НАВАНТАЖЕННЯ 984.5 KB
  Робота з пакетом прикладних програм проводиться у діалоговому режимі, оскільки результати розрахунків, отримані за допомогою одних програм, служать вхідною інформацією для інших
48610. Структуры магистральной, вертикальной и горизонтальной подсистем варианта СКС 306 KB
  Анализ технических требований выбор архитектуры локальной вычислительной сети.2 Выбор архитектуры локальной вычислительной сети8 4. Выбор и определение структуры технических средств локальной вычислительной сети альтернативные варианты построения логической структуры сети.2 Альтернативные варианты построения сети.
48611. Сокращение трудоемкости статистического моделирования 789.5 KB
  Результаты аналитического решения использовать для проверки результатов статистического моделирования и для обоснования построения рациональной схемы моделирования
48612. Расчёт структуры электромагнитных полей 279 KB
  Цель работы -– расчет структуры полей внутри и вне шара а также в волноводе для приведенных в задании геометрических и электрических параметров. Метод исследования – метод разделения переменных при интегрировании дифференциальных уравнений для получения аналитических выражений потенциалов и напряженностей полей с последующим построением на ЭВМ структуры этих полей. Для заданной геометрии и параметров среды получены аналитические выражения значений потенциалов и напряженностей полей внутри и вне шара а также расчетное...