36281

Мультимедиа технология. Синтез звука. Форматы звуковых файлов

Доклад

Информатика, кибернетика и программирование

Синтез звука. Синтез звука Создание звука средствами электроники дело нехитрое. В отношении звуков представляющих собой комбинации тонов различной частоты была установлена плодотворная закономерность суть которой сводится к тому что для создания любого звука необходимо только найти правильную комбинацию частот В современных синтезаторах нашли широкое применение два метода: частотная модуляция и синтез с использованием таблицы форм сигналов. Синтез с вычитанием Первые настоящие музыкальные синтезаторы использовали аналоговую технологию.

Русский

2013-09-21

72 KB

41 чел.

71 Мультимедиа технология. Синтез звука. Форматы звуковых файлов.

Синтез звука

Создание звука средствами электроники — дело нехитрое. В конце концов, любой сигнал переменного тока с частотой, находящейся в частотном диапазоне человеческого слуха, создает шум в громкоговорителе. Даже до наступления эпохи электроники Герман Гельмгольц обнаружил, что любой музыкальный тон создавался колебаниями в воздухе, которые соответствовали периодическому (но сложному) сигналу.

Основное устройство для генерирования сигнала определенной частоты — генератор — создает очень чистый тональный сигнал, настолько чистый, что он звучит неправдоподобно — электронное звучание. Естественные звуки представляют собой не одиночные гармоники, а совокупность многих  частот, связанных и несвязанных между собой, с различной интенсивностью.                                                              

Звук музыкального инструмента, например, содержит одну характерную частоту (соответствующую воспроизводимой ноте), которая называется основным тоном, и множество других частот, кратных основному тону, которые ученые и некоторые музыканты называют обертонами. Соотношение громкости звучания различных обертонов является отличительным признаком различных музыкальных инструментов — их тембр звучания, что позволяет отличить звук одной и той же ноты, сыгранной на скрипке и на флейте.

 Тембр – это результат множества резонансов в музыкальном инструменте, которому свойственно усиливать одни обертоны и ослаблять другие.

Шумы отличаются от музыкальных тонов тем, что они содержат множество не связанных между собой частот. Белый шум, например, является случайной совокупностью всех частот.

В отношении звуков, представляющих собой комбинации тонов различной частоты, была установлена плодотворная закономерность

суть которой сводится к тому, что для создания любого звука необходимо только найти правильную комбинацию частот

В современных синтезаторах нашли широкое применение два метода: частотная модуляция и синтез с использованием таблицы форм сигналов.

Синтез с вычитанием

Первые настоящие музыкальные синтезаторы

использовали аналоговую технологию. Первые из этих устройств были созданы в конце 50-х г.г. и были основаны на принципе синтеза с вычитанием

Вместо чистых тонов, характеризуемых синусоидальным сигналом, они генерировали прямоугольные сигналы, пилообразные сигналы и нечетные промежуточные формы сигналов. Сами  по себе эти насыщенные гармониками комплексные сигналы, формируемые каждым из генераторов, имели собственное характерное звучание.

Эти начальные сигналы затем смешивались и преобразовывались благодаря применению фильтров, которые усиливали сигналы одних частотных диапазонов и ослабляли сигналы с другими частотами.

Иногда один тональный сигнал использовался для модуляции другого сигнала, что позволяло создавать сигналы, которые звучали так странно, как будто они пришли к нам из других миров.

Аналоговый синтез зародился в эпоху экспериментирования, когда творческие музыканты исследовали возможности новой музыки. Они не пытались имитировать звучание обычных музыкальных инструментов — в конце концов, это уже могли делать и обычные инструменты, а авангардисты стремились вырваться далеко за пределы обычной музыки. Цель аналогового синтеза состояла в том, чтобы создать новые звуки, звуки, которые не существовали в природе

Аналоговые синтезаторы имели явно электронное звучание. По сравнению с обычными музыкальными инструментами звук электронных синтезаторов мог быть довольно резким — именно это и было желательным как для композиторов серьезной музыки, так и музыкантов стиля рок - музыки, так как придавало их произведениям особое звучание.

Первые цифровые синтезаторы предназначались просто для дублирования функций аналоговых устройств, но с применением альтернативной технологии — транзисторов вместо электронных ламп. Внезапно установки размером с комнату удалось сжать до блоков размером с человеческий рост, и теперь можно было втиснуть даже больше схем управления звуком. Цифровой синтез обеспечивает такие возможности управления звуком, что теперь можно не только создавать новые звуки, но также создавать любой звук.

Аддитивный - синтез

Аддитивный синтезатор формирует звуки путем сложения частот, которые образуют музыкальный звук. Если при использовании аналоговой схемы этот процесс был труден, если не невозможен, то обеспечиваемая цифровой электроникой точность позволила претворить настоящий аддитивный синтез в действительность. Цифровой аддитивный синтезатор создал математическую модель, которая должна была обеспечить смешивание тональных сигналов. Получаемый результирующий цифровой сигнал затем предполагалось преобразовать в аналоговый сигнал (с использованием цифро-аналогового преобразователя) для последующего его воспроизведения громкоговорителем или для записи.

Практический синтез звука для периферийных устройств ПК основан на использовании значительно более скромной технологии, чем чисто аддитивный синтез. Два основных варианта приобрели коммерческое применение в синтезаторах, содержащихся в звуковой плате ПК. Это FM-синтез и синтез с использованием таблицы сигналов.

FM-синтез

Суть FM-синтеза состоит в том, что процесс начинается с одной частоты или тона которая называется несущей, а затем заменяется другой частотой, называемой модулятором. Когда в качестве модулятора используется низкая частота (нескольких герц), несущая частота возрастает и спадает, напоминая вой сирены. Если величины несущей частоты и модулятора близки, образуется сложный сигнал. Изменение интенсивности сигнала модулятора изменяет смесь частот в результирующем сигнале, т. е. тембр его звучания.

Для работы основной системы FM-синтеза необходимо иметь только 2 генератора синусоидальных сигналов

Каждый создаваемый FM-синтезато-ром синусоидальный сигнал называется оператором. Популярные синтезаторы имеют 4-6 операторов.

+ FM-синтеза: 

дешевизна его реализации ( Необходимо только иметь микросхему).

  •  FM-синтеза: 

не позволяет достаточно хорошо копировать реальные звуки. Звуки, созданные с применением FM-синтеза, — распознаваемы это то, что вы хотели смоделировать, и в то же время это синтезированные звуки.

Синтез с использованием таблицы сигналов

Альтернативная методика, используемая для создания звуков, это синтез с использованием таблицы сигналов. Синтез с использованием таблицы сигналов начинает не с чистых тонов, а с представительных сигналов для определенных звуков. Такими представлениями являются соответствующие определенным звукам точные сигналы, причем все сигналы, которые могут быть созданы инструментом, сохраняются в электронной таблице, отсюда и название этой технологии. Характерные для данного прибора или звука сигналы это только шаблоны, которыми синтезатор управляет для создания музыки или того, что должно сойти за музыку. Например, таблица сигналов может содержать краткий пакет тонов флейты, играющей какую-то одну ноту. Синтезатор затем может изменить частоту этой ноты, чтобы проиграть всю гамму, и изменить продолжительность ее звучания, чтобы воспроизвести соответствующий ритм.

Хотя синтез с использованием таблицы сигналов создает звуки, более естественные, чем при использовании FM-синтеза, они еще недостаточно реалистичны, потому что рассматриваемый процесс не воспроизводит полное изменение музыкальных звуков от начала их звучания до затухания, и не учитывает слабого изменения тембра звука при изменении высоты тона, создаваемого синтезатором

С другой стороны, синтез с использованием таблицы сигналов это удовольствие для разработчиков аппаратных средств ПК. Поскольку все сигналы сохраняются в цифровом виде

то они могут быть повторно составлены без любых специальных аппаратных средств, таких как микросхемы синтезаторов. Все, что для этого необходимо, это цифро-аналоговый преобразователь аудио сигналов, который должен быть введен в состав любого ПК с мультимедиа. Программист может создавать необходимые сигналы для любого звука, который он может себе представить, чисто программным способом. Единственная трудность состоит в том, что для собирания воедино необходимых сигналов в цифровой форме требуется процессор высокой производительности

Существует три основных формата звуковых файлов:

  •  Waveform audio - WAV или WAVE (wave-файлы, имеют расширение wav)
  •  Musical Instrument Digital Inrerface - MIDI или MID (midi-файлы, имеют расширение mid)
  •  MPEG - на компьютере пользователя имеют расширение .mp3

WAV-файлы - это полный аналог записи на магнитофонную ленту, только значения амплитуды сигнала записывается не в аналоговом виде, а в виде последовательности цифровых кодов, соответствующих значению амплитуды звукового согнала в каждый момент времени сигнала

Для записи WAV-файла необходима специальная  аппаратура, как правило это дополнительная звуковая плата компьютера, включающая  - аналого - цифровой преобразователь, который в последовательные моменты времени замеряет амплитуды сигнала и записывает их в память компьютера в виде 8-ми или 16-ти разрядных кодов, и для воспроизведения цифро- аналоговый преобразователь, который по записанным кодам, восстанавливает амплитуду согнала, т.е. приводит его к исходному виду. Поскольку звуковой сигнал записывается в памяти компьютера в виде цифр, его можно корректировать - изменять амплитуду, а значит громкость, отсеивать шумы, изменять тембр и т. д.

Файлы с расширением .WAV, к сожалению, довольно громоздки - занимают сотни Кбайт на каждую минуту записи. Так например, знакомый всем звук аккорда, который проигрывается при завершении загрузки ОС WINDOWS 95 и звучит 6,12 секунды, занимает 135 876 байт.

Информация при записи WAVE-файлов сжимается как аппаратными входящими в состав звуковой платы, так и программными, входящими в состав операционной системы, средствами для уменьшения размеров файла.

Размер файлов зависит прежде всего от частоты квантования, задающей число выборок (отсчетов) звукового сигнала в единицу времени. Именно эти выборки представляются АЦП в виде двоичных чисел, несущих информацию о мгновенном значении сигнала в моменты выборок. Звуковые компакт-диски, к примеру, имеют частоту квантования 44.1 кГц. Считается (приближенно), что частота квантования должна быть вдвое выше высшей частоты спектра звуковых сигналов. Практически частота квантования в 44.1 кГц позволяет записывать (и затем воспроизводить) весь частотный диапазон звуковых сигналов - от 20 до 20 000 Гц.

Однако для записей умеренного качества достаточен более узкий диапазон частот - например для разборчивой речи от примерно 400 до 3 500 Гц. Поэтому при записи WAVE-файлов предусматривается ряд частот квантования, чаще всего от 5 Кгц до 44-45 Кгц., а точность измерения уровня сигнала может быть выбрана 8 или 16 разрядов. Чем ниже частоты квантования, чем меньше точность измерения тем меньше (пропорционально) размер WAVE-файлов и хуже качество воспроизведения звука.. Переход от двухканальной (стереофонической) записи с одноканальной (монофонической) уменьшает длину звуковых файлов вдвое. Проигрыватели WAVE-файлов обычно автоматически распознают тип записи и частоту квантования.

WAV-файлы обычно используются для записи и воспроизведения речи или голоса певца, так как они имеют индивидуальную окраску и искусственно создать голос с характеристиками голоса  Шаляпина невозможно, а вернее очень трудно. Хотя в прессе появляются сообщения, что разработаны программы, которые могут говорить голосом любого человека. Они сначала анализируют записанные тексты, выявляют индивидуальные особенности индивидуума, а затем могут синтезировать произвольную речь или даже песню голосом этого человека.

MIDI-файлы не являются непосредственной записью звуков, а представляют собой набор команд, какой музыкальный инструмент, какую ноту, какой длительности (и некоторые другие характеристики) использовать Реальной звуковой информации такие файлы не несут. Они просто указывают, когда и в какой момент должен звучать тот или иной музыкальный инструмент, по какому каналу, с какой громкостью и какими иными звуковыми параметрами. Словом, MIDI-файлы являются набором инструкций для синтезатора музыкальных звуков. Можно сказать, что они подобны нотам, по которым исполняется музыкальное произведение - не случайно есть программы, которые по таким файлам действительно воссоздают нотные записи музыки!

Однако как и сами ноты это не музыка и для получения ее нужен исполнитель и музыкальный инструмент,  так и MIDI-файлы требуют для получения музыки своего инструмента - синтезатора музыки - в постом случае это звуковая плата компьютера. Принцип синтеза здесь следующий - в памяти звуковой платы записываются образцы звучания всех нот нескольких инструментов, от трех до двадцати инструментов. В соответствии с командами из файла, извлекается тот или иной эталон, возможно модифицируется - изменяется тембр, громкость, высота и преобразуется в аналоговый сигнал и подается на выходной усилитель.

Эти файлы используются для записи и воспроизведения инструментальной музыки и генерации музыкального сопровождения и аранжировки музыкальных произведений.

Такой подход приводит к тому, что MIDI-файлы имеют значительно меньший размер, чем файлы с информацией о реальных звуках. С частотным диапазоном и частотами квантования размеры MIDI-файлов никоим образом не связаны. В результате запись даже довольно длинного музыкального произведения занимает обычно десятки Кбайт (редко до 150-200 Кбайт). Если преобразовать MIDI- файл размером в 20 кб. В WAV-файл, то последний будет около 3 мб. MIDI-файлы поддерживают работу как обычных музыкальных синтезаторов, использующих частотную модуляцию FM (Frequense Modulation), так и более новых волновых синтезаторов WS.

Файлы MPEG

Существует четыре версии алгоритма сжатия файлов MPEG, которые обозначаются как MPEG-1 - MPEG-4. В Internet наиболее часто используется версия MPEG-1, хотя по мере развития коммуникационных технологий будут внедряться и остальные варианты. Стандарт MPEG-1 определяет три уровня, каждому из которых соответствует свой собственный формат. Усложненные алгоритмы более высокого уровня требуют более длительного времени работы, однако обеспечивают более высокие степени сжатия при сохранении практически точного соответствия оригиналу. Уровень I обеспечивает самую высокую скорость кодирования, а уровень III дает наибольшую степень сжатия при сопоставимом качестве звука. Для звуковых  файлов наиболее часто используется MPEG-1 уровня III (расширения файлов .МР3) Все  уровни основаны на психоакустических моделях, которые обосновывают выбор частотных составляющих сигнала, которые могут быть отброшены без ущерба для субъективного восприятия качества звучания. Файлы MPEG-1 уровня III сохраняют практически неотличимое от несжатого оригинала качество звучания при степени сжатия  до 12:1.

Эта система кодирования звуковых файлов , чрезвычайно широко распространенной в Internet. Существуют специальные музыкальные сервера или отдельные музыкальные страницы на которых имеются ссылки на музыкальные произведения. Например в России есть сервер www.music.ru  с обширным музыкальным архивом CD-ROMов различных российских и зарубежных групп. Пользователь может зайти на этот сервер, выбрать любимую музыкальную группу, диск, произведение и щелкнуть мышью на значок  рядом с названием, после этого на компьютер пользователя будет загружаться по частям звуковой файл в специальном формате и воспроизводиться с хорошим или не очень хорошим качеством, - в зависимости от скорости работы линии связи,  которая используется для соединения с Internet.

Предварительно пользователь должен загрузить и установить у себя на компьютере специальную программу - Real Radio плейер или другую. Ее можно взять бесплатно на сервере www.mpeg3.org. Там есть две версии этой программы - бесплатная и за 30$. Платная версия обладает более широкими возможностями. Программа скачивается в виде exe-файла, после его переписи на компьютер пользователя это файл надо запустить на выполнение и плеер будет установлен.

Преимущества данной технологии в том, что информация передается клиенту непосредственно с транслирующего сервера без предварительной загрузки и сохранения на жестком диске компьютера. Однако, качество воспроизведения сильно зависит от скорости канала и качества связи по нему. На линии 14.4 кб/сек - нормальное воспроизведение монофонной программы, на 28.8 кб/сек - стереопрограммы с качеством близким к УКВ приему, на ISDN линиях качество близко к компакт-диску.


 

А также другие работы, которые могут Вас заинтересовать

66034. Разработка и оптимизация конструкции регулирующего клапана (РК) DN125 для системы САОЗ ВД энергоблока АЭС с ВВЭР-1000 малой серии 7.73 MB
  Цель работы: обеспечение безопасности работы реакторных установок В-320 и В-338 при речах 1 контура, компенсируемых работой САОЗ ВД на основе подхода управляемого снижения давления 1 контура с регулированием расхода впрыска борного расхода...
66035. Глобализация финансов 17.21 KB
  В глобализации финансов часто усматривают причину роста спекуляций и отвлечения со спекулятивными целями капитала от производства и создания новых рабочих мест. Процесс финансовой глобализации сконцентрирован прежде всего в трех основных центрах мировой экономики...
66036. Бюджетный дефицит. Виды и меры по его ликвидации в России 52 KB
  Виды дефицита бюджета В тех случаях когда имеющиеся у бюджета доходы недостаточны для осуществления расходов говорят о возникновении бюджетного дефицита.Бюджетный дефицит не обязательно свидетельствует о каком-то чрезвычайном положении в экономике страны.
66038. НАЛОГОВЫЕ СИСТЕМЫ ЗАРУБЕЖНЫХ СТРАН 18.27 KB
  Отличительная черта налоговой системы Франции высокая доля взносов в фонды социального назначения ФСН. Эластичность налоговой системы заключается в том что ежегодно в соответствии с изменениями политической и экономической конъюктуры законодательно уточняются ставки налогов.
66040. Органы управления финансами в разных странах 65.02 KB
  В России главными властными структурами по управлению финансами являются Федеральное Собрание, Президент и Правительство. Именно эти органы принимают окончательное решение при утверждении федерального бюджета и отчета о его исполнении. Участие Президента...