47376

Работа с аудио- и видеофайлами

Лекция

Информатика, кибернетика и программирование

При кодировании звука этот сигнал надо представить в виде последовательности нулей и единиц. На качество воспроизведения закодированного звука в основном влияют два параметра: частота дискретизации - количество измерений амплитуды за секунду в герцах и глубина кодирования звука (битрейт)...

Русский

2014-03-30

48.32 KB

4 чел.

Тема 8. Работа с аудио- и видеофайлами

Работа с аудио файлами

Звук - это колебание частиц воздуха, непрерывный сигнал с меняющейся амплитудой.

При кодировании звука этот сигнал надо представить в виде последовательности нулей и единиц. На качество воспроизведения закодированного звука в основном влияют два параметра: частота дискретизации - количество измерений амплитуды за секунду в герцах и глубина кодирования звука (битрейт) - размер в битах, отводимый под запись значения амплитуды. Чем больше значения обоих показателей, тем точнее представление звука. Но при этом увеличивается размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения. Для компьютерной обработки такой аналоговый сигнал нужно преобразовать в последовательность двоичных чисел.

Форматы аудиофайлов

В процессе развития индустрии звукозаписи для решения различных задач были разработаны различные физические методы хранения аудиоданных, например виниловые пластинки, магнитная лента, компакт-диски, теперь — DVD, и т. д., точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных (форматов аудиофайлов). На сегодняшний день их известно около четырехсот2.

Схема 5. Разновидности цифровых аудиоформатов.

Аудиоформаты без сжатия являются исторически первыми. AIFF и WAV были разработаны Apple и Microsoft соответственно, для хранения звуковых данных на ПК. Сейчас применяются реже, в силу значительного занимаемого места. Другой сферой применения данного типа форматов является профессиональное производство музыкальных треков, аудиозаписей (такие как, DSD и DXD, оба разработаны фирмой Sony).

Среди аудиоформатов со сжатием без потерь имеются свободные форматы (WavPack - .wv, FLAC - .flac). Подобные форматы применяются для хранения данных на ПК, в интернет магазинах, как потоковое мультимедиа и другое.

Чаще пользователи сталкиваются с аудиоформатами со сжатием и потерей. Среди них следует отметить формат MP3, позволяющий с очень большим качеством и степенью сжатия кодировать музыку. При этом вместо 18-20 музыкальных композиций на стандартный компакт-диск (CD-ROM) помещается около 200. Одна песня занимает примерно 3,5 Mb, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями. Существуют другие аналогичные форматы, которые считают превосходящими MP3: ACC, AC3, Vorbis (ogg). Эти форматы превосходят MP3 по частоте дискретизации и битрейту, что делает эти форматы более качественными3.

Программное обеспечение

Любой из указанных выше форматов может быть воспроизведен только тогда, когда на компьютере установлены определенный кодеки. Именно кодеки определяют обеспечивают степень сжатия информации с потерей или без потери. Большинство аудиокодеков представлены в виде программных библиотек, которые взаимодействуют с одним или несколькими аудиоплеерами (например, QuickTime Player, XMMS, Winamp, VLC media player, MPlayer или Windows Media Player).

В настоящее время существует огромное множество медиаплееров. Большинство современных операционных систем по умолчанию содержит в своём составе медиаплееры: например, Windows - Windows Media Player, Mac OS X - QuickTime Player (для воспроизведения видео в формате QuickTime) и iTunes (для некоторых других форматов), Linux - Amarok, Rhythmbox или иные (в зависимости от дистрибутива). Пользователь имеет возможность установить на свой компьютер более одного медиаплеера. Существует достаточно значительное предложение аналогичных программных продуктов, многие из них распространяются бесплатно или как СПО. В настоящий момент подавляющее большинство плееров способно воспроизводить как аудио, так видеофайлы.

Полезными в работе могут быть редакторы аудиофайлов, которые могут укоротить слишком длинный звуковой файл, нарезать звуковые фрагменты, произвести сглаживание звучания, добавить какие-либо звуковые эффекты к оригинальному треку, и многое другое. Среди таких программ можно отметить: Volume2 – удобная программа по управлению уровнем громкости; Soundboard 4 Voice Chat – программа может помочь при озвучивании каких-либо видеофрагментов, позволяет создавать свои и загружать аудиопакеты, Mixxx - программа для микширования различных типов звуковых файлов, поддерживает работу с плейлистами, имитацию аналоговых регуляторов и проигрывания виниловых пластинок, есть возможность синхронизации скорости треков, изменения темпа музыки и регулировки частотных характеристик и т.д.

Полезными могут быть программы способные преобразовать аудиозаписи на CD в, например, mp3 треки или любые другие форматы. Подобные программы называются CD-ripper (или CD-grabber, CD-extractor). Для ОС Windows существуют бесплатные программы Audiograbber (http://www.audiograbber.org/) - последняя доступная версия 2010 года, Exact Audio Copy (http://www.exactaudiocopy.de/) популярна за её высокую точность и способность копировать серьёзно повреждённые аудио компакт-диски, можно выбрать любую аналогичную по функциональности программу.

Работа с видео данными

Параметры цифрового видео

Размер кадра (frame size) любой видеосигнал имеет разрешение, горизонтальное и вертикальное, измеряемое в пикселях. Обычное аналоговое телевизионное разрешение составляет 720×576 пикселей для стандартов PAL и SÉCAM, при частоте кадров 50 Герц; и 720×480 пикселей для NTSC, при частоте 60 Герц. В выражении 720×480 первым числом обозначается количество точек в горизонтальной линии (горизонтальное разрешение), а вторым числом количество самих линий (вертикальное разрешение). Новый стандарт цифрового телевидения HDTV высокого разрешения предполагает разрешения до 1920×1080 при частоте мелькания 60 Герц с прогрессивной развёрткой.

Число кадров в секунду (frames per second, fps) - это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду. Верхняя пороговая частота мелькания, воспринимаемая человеческим мозгом, в среднем составляет 39-42 кадров в секунду. Некоторые современные профессиональные камеры могут снимать с частотой до 120 кадров в секунду.

Битрейт (Bit Rate, поток данных) показывает, сколько бит занимает одна секунда видео. Иногда битрейт указывают в байтах в секунду. Для передачи несжатого видео требуется очень большой битрейт. Например, для несжатого видео 640x480 30 кадров/сек при глубине цвета 24бит потребуется битрейт около 26 Мбайт/сек. Чтобы уменьшить битрейт (и, следовательно, размер фильма), необходимо сжать (кодировать) видео при записи, а при воспроизведении декодировать. Эту работу выполняют различные кодеки.

Тип развертки может быть прогрессивным (построчным) или чересстрочной. При прогрессивной развёртке все горизонтальные линии (строки) изображения отображаются поочередно одна за другой. А вот при чересстрочной развёртке показываются попеременено то все чётные, то все нечётные строки (называемые также полями кадра). Чересстрочная развёртка была изобретена для показа изображения на кинескопах и используется сейчас для передачи видео по «узким» каналам, не позволяющим передавать изображение во всём качестве. Системы HDTV предусматривают прогрессивную развёртку (современные видеокамеры и фотоаппараты с функцией видеозаписи поддерживают сохранение изображения в формате mpeg4, который использует прогрессивную разверстку).

Соотношение ширины и высоты кадра - важнейший параметр в любом видеоматериале. С начала XX века кинофильмы имели соотношение сторон экрана 4:3 (иногда записывается как 1,33:1 или просто 1,33). Считалось что, с учетом наличия у человека двух глаз, зрителю удобнее смотреть фильм на экране такой формы. Это соотношение унаследовали телевидение и мониторы.

Ещё в середине прошлого века представление о 4:3 в корне изменилось, так как поле зрения человека имеет соотношение отнюдь не 4:3. Ведь у человека 2 глаза, расположенных на одной горизонтальной линии - следовательно, поле зрения человека приближается к соотношению 2:1. Чтобы приблизить форму кадра к естественному полю зрения человека был введён стандарт 16:9 (1,78), почти соответствующий так называемому «Золотому сечению». Цифровое телевидение в основном тоже ориентируется на соотношение 16:9. К концу XX века, после ряда дополнительных исследований в этой области, стали появляться даже и более радикальные соотношения сторон кадра: 1,85, 2,20 и вплоть до 2,35 (почти 21:9). Всё это, по словам создателей, призвано глубже погрузить зрителя в атмосферу просматриваемого видеоматериала.

Количество цветов и цветовое разрешение видеосигнала описывается цветовыми моделями. В компьютерной технике применяется в основном RGB (и αRGB). Количество цветов, которое может отобразить монитор или проектор зависит от качества монитора или проектора. Человеческий глаз может воспринять, по разным подсчётам, от 5 до 10 миллионов оттенков цветов. Количество цветов в видеоматериале определяется числом бит, отведённым для кодирования цвета каждого пикселя (о различных цветовых моделях и определении битности цвета см. в Теме 5. Компьютерная графика).

Форматы видео 

Качество видеокартинки напрямую зависит от формата видеозаписи. Формат записи может быть аналоговым и цифровым.

Самым ранним методом передачи видеосигналов является аналоговый метод. Главным недостатком данного метода является то, что при копировании дубль всегда уступает по качеству оригиналу. Потеря качества при копировании видеоматериала аналогична фотокопированию - копия никогда не бывает такой же четкой и яркой, как оригинал. К аналоговым форматам относятся форматы видеокассет VHS (Video Home System) и др.

Цифровые форматы имеют ряд преимуществ перед аналоговыми: возможность многократной перезаписи без потери качества, высококачественный стереозвук, возможность передачи видеосигнала по цифровым каналам без потери качества, высокую помехоустойчивость. Существуют цифровые форматы видеокассет (Digital Betacam, DV, miniDV, DIGITAL 8). Наиболее распространенным является формат DV (Digital Video), который характеризуется большим видеопотоком и, соответственно, большим размером выходного видеофайла. Файл с записью видео продолжительностью 1 час займет 12-13Гб. полученное видео нужно сжать для последующего просмотра на компьютере. Наиболее современным цифровым форматом видео, используемом в HD-камерах является AVCHD (Advanced Video Coding High Definition).

Существуют определенные стандарты сжатия видеофайлов. Один из основных и общепринятых получил название MPEG (Moving Pictures Expert Group) – это аббревиатура названия международного комитета, который и занимается разработкой данного стандарта. У данного стандарта есть разновидности MPEG 1,2,4,7,21.

MPEG-1 - формат сжатия для компакт-дисков (CD-ROM). Качество видео - как у обычного видеомагнитофона, разрешение 352х240, диск с фильмом в таком формате обычно обозначается VCD (VideoCD).

MPEG-2 - формат для DVD-дисков, цифрового телевидения. В этом формате снимают видео DVD-, HDD-, Flash-камеры.

MPEG-3 - сейчас не используется (не путать с MP3 (MPEG Audio Layer 3) - технологией сжатия звука)

MPEG-4 - это формат, получаемый с помощью известных кодеков DivX, XviD, H.264 и др. Часто его называют просто MP4. Уменьшает видеопоток еще сильнее, чем MPEG-2, но картинка еще достаточно хорошего качества, поэтому этот формат поддерживает большинство современных DVD-плееров. Особо нужно отметить высокое качество видео, сжатого кодеком последнего поколения H.264.

MPEG-7 и MPEG-21 – форматы будущего, они не усовершенствуют предыдущие форматы сжатия, а определяют различные языки описания. MPEG-7 – стандарт индексации мультимедиа-содержимого. Может описывать информацию, представленную в любой форме (в том числе в аналоговой) и не зависит от среды передачи данных. Использует многоуровневую структуру описания аудио и видео информации. На высшем уровне прописываются свойства файла, такие как название, имя создателя, дата создания и т.д. На следующем уровне описания указываются особенности сжимаемой аудио или видео информации – цвет, текстура, тон или скорость. Одной из отличительных особенностей MPEG 7 является его способность к определению типа сжимаемой информации. Если это аудио или видео файл, то он сначала сжимается с помощью алгоритмов MPEG 1, MPEG 2, MPEG 4, а затем описывается при помощи MPEG 7. Такая гибкость в выборе методов сжатия значительно снижает объем информации и ускоряет процесс сжатия.

MPEG-21 – мультимедийная среда разработки, находится в стадии разработки

Расширения видеофайлов.

Расширений видеофайлов существует огромное множество, рассмотрим только наиболее часто используемые.

AVI (Audio-Video Interleaved) разработан Microsoft для хранения и воспроизведения видеороликов, представляет собой контейнер, в котором могут храниться потоки 4-х типов: видео, аудио, текст и midi. Причем видеопоток (любого стандарта сжатия: mpeg-1 или mpeg-2) может быть только один, тогда как аудио (разных форматов) - несколько. AVI может содержать и только один поток - либо видео, либо аудио. AVI не накладывает никаких ограничений на тип используемого кодека, ни для видео, ни для аудио.

Чтоб определить содержимое данного контейнера, нужно воспользоваться одной из многочисленных программ от мощной Adobe Premiere до простенькой VideoToolBox.

MKV - (Матрешка или Matroska) - контейнер, который может содержать видео, аудио, субтитры, меню и пр. Имеет открытый код, весьма перспективен для дальнейшего развития.

MOV - формат Apple Quicktime, может содержать кроме видео, также графику, анимацию.

WMV (Windows Media Video) – видеоформат от Microsoft, в котором получается видеоролик, сделанный с помощью MovieMaker

.3gp (сокращение от англ. 3rd generation (mobile) phone) видеофайлы для мобильных телефонов 3-го поколения. 3gp сохраняет видео как Mpeg4 или H.263, аудио сохраняется в форматах AMR-NB или AAC-LC. Готовые видео ролики в формате 3gp имеют малый размер и низкое качество.

Расширение видеофайлов, которые применяются в сети Internet

RM, RA, RAM (RealVideo) – формат используется для живой телевизионной трансляции в Интернете. Обладает небольшим размером файла и самым низким качеством.

ASF (Active Streaming Format) - потоковый формат от Microsoft.

FLV (Flash Video) - формат файлов, используемый для передачи видео через Интернет. Используется такими сервисами, как YouTube, Google Video, RuTube, Tube.BY, Муви, Obivu и другими. Хотя описание формата контейнера было открыто, кодеки защищены патентами, и остаются собственническими. Файлы в формате FLV можно просматривать в большинстве операционных систем, поскольку он использует широко распространённый Adobe Flash и плагины к большинству браузеров, а также поддерживается многими программами для воспроизведения видео.

Для воспроизведения видеофайла важную роль играет наличие соответствующего кодека. Видео кодеки (как и аудио) бывают с потерей качества и без. Для бытовой видеозаписи используются в основном кодеки с потерей качества, чтобы получать приемлемый размер готового файла. Кодеки с потерей качества, в свою очередь, делятся на кодеки с покадровым сжатием и кодеки с межкадровым сжатием.

В кодеках с покадровым сжатием каждый кадр записывается как отдельная фотография. К таким кодекам относятся кодеки группы DV (Digital Video). К кодекам с межкадровым сжатием в первую очередь относятся кодеки стандартов MPEG. В кодеках с межкадровым сжатием только часть кадров (т.н. I-frame или ключевые кадры) содержит полную информацию об изображении. Остальные кадры (промежуточные кадры, P-frame) содержат только отличия этого кадра от предыдущего. Иногда применяют двунаправленные кадры (B-frame), информация в которых кодируется на основании предыдущего и последующего кадров, что позволяет дополнительно повысить степень сжатия видео. Последовательность между двумя ключевыми кадрами называется группой кадров (GOP, Group Of Pictures).

Очевидно, межкадровое сжатие позволяет дополнительно сократить битрейт в несколько раз при сохранении качества. Особенностью кодеков с межкадровым сжатием является зависимость битрейта или качества видео от «динамичности» сцены. Например, при кодировании с постоянным битрейтом, статичные сцены, где соседние кадры мало отличаются друг от друга, будут смотреться лучше, чем динамичные. При кодировании с переменным битрейтом кодек будет автоматически увеличивать битрейт на динамичных сценах, чтобы обеспечить примерно одинаковое качество.

Если какой-то кодек отсутствует в системе, то при попытке воспроизведения файла, закодированного этим кодеком, появится сообщение об ошибке.

Существуют программы, позволяющие выявить, какой кодек необходим для воспроизведения конкретного файла. Например, программа Codeclnstaller (http://www.jockersoft.com/) анализирует систему и детектирует установленные аудио- и видеокодеки. Кроме этого, при необходимости проводит анализ видеофайла и предлагает необходимый для его просмотра кодек (установить недостающий кодек можно - при подключении к интернету - прямо из окна программы Codeclnstaller).

Чтобы протестировать систему на отсутствующие кодеки, можно скачать программу DriverScan c ресурса http://www.liutilities.com/

Наибольшей популярностью пользуется набор кодеков Codec Pack от K-Lite. Включает следующие наборы: Basic, Standard, Full, Corporate, Mega.

Для воспроизведения видеофайла необходимо воспользоваться видеоплеером, их существует на рынке достаточно много. Перечислены ниже исключительно бесплатные плееры light Alloy 4.4 (http://www.light-alloy.ru/) работа над программой приостановлена в 2009 году; Gom Player (Greetech Online Movie Player) (http://www.gomlab.com/ru/) последняя версия программы вышла в декабре 2012 года, главным достоинством проигрывателя является поддержка недокачанных и поврежденных файлов, плеер BS.Player (http://www.bsplayer.com/) отличается продвинутой функциональностью в работе с субтитрами: умеет самостоятельно загружать субтитры на нужном языке, одновременно выводить на экран две пары субтитров, автоматически подстраивать отображение субтитров при рассинхронизации субтитров и видео.

На сегодняшний день одной из проблем при работе с видео является сложность получения файла из сети, если он был загружен на один из популярных ресурсов. Для решения данной проблемы можно воспользоваться сервисом http://videosaver.ru/, который поможет скачать видео с YouTube, Rutube, Mail.Ru, VKontakte, LoadUp.

Можно использовать бесплатную программу-граббилку мультимедиафайлов TubeMaster++, (http://www.tubemaster.net/down.html), которая позволяет сохранять на жёсткий диск компьютера файлы форматов FLV, MP3, MP4 и другие. Любые файлы, сохраненные при помощи TubeMaster Plus, могут быть сконвертированы в популярные аудио и видео форматы, такие как AVI, MPEG, MP3, MP4, IPod, PSP.

Если необходимо сделать копию DVD, на котором записано видео размером более 4,7Гб, то можно использовать простую программу 1Click DVD Copy, которая может сжать файл до 4.7Gb без потери качества и скопировать DVD диск на жесткий диск компьютера или записать на чистый диск.

Полезными могут оказаться видео конверторы.

Самое распространенное направление конвертирования это из DVD в AVI. При конвертировании файлов DVD размером 4,7Гб., на выходе получается файл 1,4Гб., при этом качество видео и звука ухудшается незначительно. Также, если необходимо редактировать файл (что-то вырезать или вклеить), то это проще сделать именно с файлом формата AVI.

Существует несколько бесплатных программ, умеющих выполнять подобные операции. Auto Gordian Knot (http://www.autogk.me.uk/) - последняя стабильная версия 2.55 (ноябрь 2009г.). Пакет представляет собой сборник программ: VirtualDubMod, AviSynth/AviSynth Filters, DGMPGDec, VobSub, кодек XviD и командной оболочки Auto Gordian Knot, позволяющей настраивать кодирование через графический интерфейс.

Коммерческие Avaide Video Converter (http://www.avaide.com/) - небольшой, но мощный конвертер видеофайлов, позволяет настраивать качество видеопотока и выбирать используемые кодеки. Имеется встроенный проигрыватель. Aone Ultra MPEG-4 Converter (http://www.aone-soft.com/) может конвертировать все видео файлы в формат MPEG4/AVC.

При необходимости редактировать видеофайл можно воспользоваться бесплатной программой VirtualDub (http://virtualdub.sourceforge.net/). Информацию о работе с этой программой можно получить на сайте: http://www.virt-dub.edusite.ru. Здесь можно посмотреть и несколько анимированных уроков.

Вопросы по теме:

1. Какие характеристики аудиофайла необходимо анализировать, чтобы сделать вывод о качестве?

2. Какое программное обеспечение необходимо установить, чтобы полноценно работать с аудиофайлами?

3. Перечислите и дайте характеристику основным параметрам цифрового видео.

4. В чем разница между видеоформатом, стандартом сжатия и контейнером файла.

5. Какова функция кодеков?

6. Какова функциональность видеоконвертеров?

2 Большая часть аудио форматов описано в справочнике Open-File.ru

3 Сравнение характеристик различных аудиоформатов можно посмотреть по ссылке в Wikipedia


 

А также другие работы, которые могут Вас заинтересовать

68795. Анализ реализации продукции для улучшения деятельности предприятия (на примере ОАО «Новогрудский маслодельный комбинат») 335.5 KB
  Согласно Закону о предприятиях в Республике Беларусь предприятия самостоятельно планируют свою деятельность на основе договоров заключенных с потребителями продукции и поставщиками материально-технических ресурсов и определяют перспективы...
68796. Реконструкция зданий и сооружений 55.5 KB
  Единственной рациональной альтернативной сносу являются модернизация и реконструкция рассматриваемых зданий методами градостроительного преобразования и переустройства которые должны быть произведены с учётом экономических социально функциональных технических эстетических и экологических...
68797. Прибыль предприятия как цель его функционирования 188.5 KB
  Использование средств производства работниками материальной сферы обеспечивает выпуск промышленной продукции. Для выявления финансового результата необходимо сопоставить выручку с затратами на производство и реализацию которые принимают форму себестоимости продукции.
68798. Технология изготовления металлических деталей светильника и его сборка 204.5 KB
  Для изготовления настольной лампы необходимы листы трубки и провода. Холодная штамповка нашла широкое применение на светотехнических заводах и различают следующие ее виды: 1 вырубку когда из листовой заготовки вырезается деталь заданного контура; 2 пробивку когда в заготовке детали производится...
68800. Маркетинговое исследование рынка сахара в городе Омске 189.26 KB
  Целью данного маркетингового исследования является изучение рынка сахара в городе Омске, ассортимента и предпочтений потребителей. Для достижения этой цели, необходимо решить следующие задачи: Изучить сущность маркетинговых исследований; Разработать опросный лист и провести опрос...
68801. Расчет передающего устройства магистральной радиосвязи 6.62 MB
  Мощность сигнала в нагрузке – 18 кВт Диапазон рабочих частот – 3 – 9 МГц Нагрузка – несимметричная, широкополосная сопротивлением 50 Ом Модуляция – А3J – однополосная телефония с подавленной несущей. Передача одноканальная. В возбудителе содержится синтезатор с шагом рабочих частот – 60 Гц.
68802. Устройства генерирования и формирования сигналов 4.71 MB
  Мощность которую должен обеспечивать один модуль выходного каскада можно оценить по формуле: ; Вт где КПД выходной колебательной системы и КПД систем сложения мощностей; M – число модулей в выходном каскаде. Каждый двухтактный ГВВ модуля выходного каскада должен выделять мощность 1235 4 = 30875 Вт.
68803. Механизация погрузо-разгрузочных работ 1.62 MB
  Время очистки полувагона от остатков сыпучего груза с помощью накладного вибратора ВРШ2 tоч=6мин. м; αn−коэффициент амортизации эстакады αn=003; γ – коэффициент учитывающий эффективность капиталовложений γ=01; tм− время выполнения маневров tм=03 ч.− подготовительно-заключительное время tп.=015 часа...