36830

Исследование разборчивости речи методом артикуляционных измерений при защите речевой информации различными видами маскирующих сигналов

Лабораторная работа

Информатика, кибернетика и программирование

Звуковые колебания в жидкой и газообразной среде воздухе представляют собой продольные колебания так как частицы среды колеблются вдоль линии распространения звука. Вследствие этого образуются сгущения и разряжения среды двигающейся от источника колебаний с определенной скоростью называемой скоростью звука. Скорость звука Скорость звука является постоянной величиной для данной среды и метеорологических условий и определяется по формуле ...

Русский

2013-09-23

201.5 KB

38 чел.

Лабораторная работа № 2

Исследование разборчивости речи
методом артикуляционных  измерений
при защите речевой информации
различными  видами маскирующих сигналов

1. Цель работы

Изучение метода определения разборчивости речи с помощью артикуляционных измерений и  практическое использование его для исследования защиты речевой информации маскирующими сигналами различных видов.

2. Теоретические сведения

2.1. Параметры и характеристики звукового поля

2.1.1. Звуковые волны

Звуковой волной называется процесс распространения деформаций сжатия или растяжения в сплошной среде, происходящий с конечной скоростью [1, 2].

Звуковая волна может возникать и распространяться только в такой среде, которая обладает определенной упругостью (сжимаемостью) и инерционностью (плотностью). Сплошная среда, обладающая только этими двумя физическими свойствами, называется идеальной. В отличие от нее реальная среда характеризуется еще и диссипативными свойствами, приводящими к потере энергии волнового движения.

Звуковой луч – это направление распространения звуковых волн, а поверхность, включающая смежные точки звукового поля с одинаковыми фазами колебания, называется фронтом волны.

Звуковое поле – это пространство, в котором происходит распространение звуковых колебаний. Звуковые колебания среды обычно возбуждаются за счет колебаний различных механических устройств или голоса. Звуковые колебания в жидкой и газообразной среде (воздухе) представляют собой продольные колебания, так как частицы среды колеблются вдоль линии распространения звука. Вследствие этого образуются сгущения и разряжения среды, двигающейся от источника колебаний с определенной скоростью, называемой скоростью звука.

2.1.2. Скорость звука

Скорость звука является постоянной величиной для данной среды и метеорологических условий и определяется по формуле

                                            ,                                  (2.1)

где   –   показатель адиабаты для воздуха (отношение удельных теплоемкостей воздуха при постоянном давлении и постоянном объеме, =1,41);

– статическое давление среды (=101325 Па при давлении 760 мм рт.ст.);

  –  плотность среды (для воздуха при 20°С и нормальном давлении   =1,22 кг/м3).

Скорость  звука в воздухе  при  нормальных  условиях равна 330 м/с. Для сравнения: скорость звука в воде равна 1500 м/с, а в стали – 6000 м/с. Связь между скоростью звука, длиной волны и частотой (периодом) колебаний определяется соотношением

                                  ,                                     (2.2)

где    – длина волны;

    – частота колебаний;

   – период колебаний.

Следует отметить, что  данное  соотношение справедливо   для плоской  и  сферической формы фронта звуковой волны.

2.1.3. Звуковое  давление  и  интенсивность  звука

Звуковое давление. Если считать, что давление среды в отсутствие звуковых колебаний равно Рст  (статическое давление), то при распространении звуковой волны в любой точке звукового поля полное давление будет изменяться, увеличиваясь при прохождении сжатий и уменьшаясь при следовании разряжений. Разность между мгновенным значением полного давления Рм и статическим давлением среды   называется звуковым давлением: .

Звуковое давление является знакопеременной величиной и определяется как сила, действующая на единицу площади. Звуковое давление измеряется в паскалях (1 Па=1 Н/м2 ).

Интенсивность звука. Интенсивностью звука называется количество звуковой энергии, проходящей в единицу времени через единицу площади, перпендикулярной к направлению распространения звуковой волны. Интенсивность звука измеряется в ваттах на метр квадратный и связана с действующим значением звукового давления соотношением

                                    ,                                         (2.3)

где - удельное акустическое сопротивление среды (для воздуха при нормальных атмосферных условиях ρс =412 кг/м2с).

Среднее количество звуковой энергии, приходящейся на единицу объема, называется плотностью энергии и  измеряется в джоулях на метр кубический.

Уровни интенсивности звука и звукового давления. Вследствие логарифмического закона восприятия звуковых колебаний (частот) слуховым анализатором (ухом) человека и широкого диапазона интенсивностей слышимых звуков для объективной оценки введено понятие уровня интенсивности:

                               ,                                 (2.4)

где  – интенсивность исходного звука;

 нулевой (пороговый) уровень интенсивности звука        (=10-12 Вт/м2).

В соответствии с квадратичной зависимостью между интенсивностью звука и звуковым давлением (2.3) уровень звукового давления определяется как

                                                              (2.5)

где  р– звуковое давление исходного звука;

 р0– нулевой   (пороговый)   уровень   звукового   давления (р0=Па).

За пороговый уровень интенсивности звука (звукового давления) принимается уровень звука на частоте 100 Гц, который воспринимается человеком с вероятностью 0,5. Уровни интенсивности звука и звукового давления являются относительными величинами и измеряются в децибелах.

Вычисление уровня интенсивности или звукового давления сложного звука следует производить, суммируя интенсивности (давления) компонент:

                                                                                                    (2.6)

Если известны уровни звуковых давлений в децибелах нескольких источников звука, то определение общего уровня осуществляется путем внесения соответствующей поправки, определяемой или путем вычисления, или на основе номограммы. Так, например, если =85 дБ, =82 дБ, то вначале определяется разность  дБ, а затем по номограмме с учетом этой разности определяется соответствующая поправка, которая составляет 1,7 дБ. Тогда общий уровень =85+1,7=86,7 дБ.

2.2. Характеристики  и  свойства  слухового  анализатора
человека

Слуховой анализатор человека состоит из уха, слухового нерва, сложной системы нервных связей и центров мозга. В аппарат, обозначенный термином «ухо», входит наружное (звукоулавливающий аппарат), среднее (звукопередающий аппарат) и внутреннее (звуковоспринимающий аппарат) ухо. Наружное ухо воспринимает определенные частоты звуков благодаря функциональной способности волокон его мембраны к резонансу. Физиологическое значение наружного и среднего уха заключается в проведении и усилении звуков.

Слуховой анализатор человека улавливает форму волны, частотный спектр чистых тонов и шумов, осуществляет анализ и синтез в определенных пределах частотных компонент звуковых раздражений, обнаруживает и опознает звуки в большом диапазоне интенсивностей и частот. Слуховой анализатор позволяет дифференцировать звуковые раздражения и определять направление звука, а также удаленность его от источника.

Слуховой анализатор человека воспринимает как слышимый звук колебания в диапазоне 20 Гц...20 кГц, что соответствует диапазону длин волн в воздухе 17 м…17 мм. Ухо наиболее чувствительно к колебаниям в области средних частот 1…4 кГц. Звуки  частот  ниже  20 Гц  называются  инфразвуками,  а  выше   20 кГц – ультразвуками. Инфразвуки и ультразвуки могут также оказывать воздействие на организм, но оно не сопровождается слуховым ощущением. Минимальное звуковое давление, обнаруживаемое нормальным слухом, составляет 20 мкПа, или  Па, что соответствует уровню звукового давления 0 дБ. Максимальный уровень звукового давления, воспринимаемого ухом, составляет  120 дБ, или в 106 раз больше, чем минимальное давление. Вот почему удобно использовать логарифмическую шкалу звуковых колебаний, которая позволяет сжать диапазон 1…106 до диапазона шириной 0…120 дБ.

Для справки можно привести уровни звуковых давлений в децибелах хорошо известных человеку звуков.

Звуки природы (лес, птицы)…………………………….10…20

Библиотека……………………………………………….30…40

Офис……………………………………………………...60…70

Речь человека……………………………………………65…75

Легковой автомобиль…………………………………...80…90

Грузовой автомобиль…………………………………...90…95

Пневматический инструмент………………………..100…105

Реактивный самолет (взлёт)…………………………120…125

К преимуществам логарифмической шкалы относится также то, что она более точно, чем линейная шкала, соответствует субъективному восприятию относительной громкости звука. Это обусловливается тем, что слух реагирует на процентные изменения интенсивности (давления) звука и, следовательно, на изменения его уровня. Уровень в 1 дБ является наименьшим обнаруживаемым слухом изменением уровня звука, отображающим идентичное относительное изменение в любой точке логарифмической шкалы.

Субъективное ощущение интенсивности звука (звукового давления) называется громкостью и измеряется в фонах (Ф). Уровень громкости звука в фонах численно равен интенсивности звука в децибелах для чистого тона частотой 1 кГц, воспринимаемого как равногромкий с данным звуком. Факторы, определяющие субъективную громкость звука, очень сложны. Одним из таких факторов является частотная зависимость чувствительности человеческого слуха, которая имеет максимальное значение в области средних частот и минимальное значение в области низких и высоких частот. Поэтому, чтобы обеспечить постоянную громкость звука, частота которого меняется, необходимо соответственно изменить его интенсивность или уровень звукового давления. Для этого используются графики кривых равной громкости в зависимости от уровня звукового давления и частоты. Так, например, звук с уровнем звукового давления  85 дБ и частотой 50 Гц оценивается как равный по громкости  звуку с уровнем  звукового  давления  70 дБ и частотой 1 кГц. Таким образом, в данном случае повышение частоты компенсируется снижением уровня звукового давления.

Оценка громкости и высоты тона (частоты) очень коротких звуков  затруднена.  При  длительности  синусоидального  тона 2…3 мс человек лишь отмечает его наличие как «щелчок», но не может определить его качеств. С увеличением длительности звука слуховое ощущение улучшается и человек начинает различать громкость и высоту тона. Минимальное время, необходимое для отчетливого ощущения уровня громкости и высоты тона, составляет примерно 50 мс.

Акустический анализатор позволяет определять расстояние до источника звука и направление на него. Важную роль в оценке изменения расстояния до источника звука играет различение изменений громкости. Звук, громкость которого увеличивается, воспринимается как приближающийся, и наоборот. Другим фактором оценки расстояний на слух является звуковысотное (звукочастотное) различение. При приближении источника звука к человеку частота звуковых колебаний увеличивается, а при его удалении – уменьшается (эффект Доплера). Это отражается в слуховых ощущениях в форме изменения высоты звука. Значительное влияние на оценку расстояния оказывает тембр. Тембрированный  звук,  имеющий  более  сложную  форму звуковой волны, оценивается как более удаленный, а менее тембрированный – как более близкий.

Точность определения направления зависит от положения источника звука относительно человека и от частоты звука. Наиболее точно определяется направление в горизонтальной плоскости. При этом на первом месте по точности оказывается правое направление, а затем левое. Достаточно хорошо определяется переднее направление. Но с ним часто смешивается верхнее и заднее. Точность оценки верхнего и заднего направления в два с лишним раза меньше по сравнению с левым и правым.

Для низких частот звука (до 800 Гц) точность определения направления  в  горизонтальной  плоскости  составляет  около 100.  С увеличением  частоты  она  уменьшается,  достигая  200 в районе 3 кГц, а затем вновь увеличивается до 130 в районе 10 кГц.

Главную роль в восприятии направлений звука играет взаимодействие сторон акустического анализатора человека. Благодаря чему возникает бинауральный эффект, который определяется разностью времен прихода звуковой волны к правому и левому уху и отношением амплитуд звуковой волны, поступающих на правое и левое ухо [1-4].

2.3. Восприятие  речевых  сигналов  и  их  характеристики

2.3.1. Восприятие  речи

Одним из наиболее эффективных исторически сложившихся средств передачи информации человеку является речь. Человеческая речь представляет собой шумоподобный акустический сигнал с амплитудной и частотной модуляцией.

Речь состоит из звуков, слогов, фраз и т.д.  Наименьшим элементом речи является звук, который, как правило, в изолированном виде не существует, за исключением нескольких союзов и междометий. Точного определения понятия звука не существует. Так, в зависимости от произношения (почерка) звук может иметь много оттенков, причем из-за индивидуальности произношения на слух он может не отличаться от другого звука.

Типизированные звуки речи в технике передачи речи называются  фонемами.  В  русском  языке  насчитывается  свыше 40 фонем. Таким образом, фонем несколько больше, чем букв, так как многие из согласных букв соответствуют двум звукам – твердому и мягкому. В то же время почти половина гласных букв представляет из себя двойной звук (й+гласный). Каждая из фонем имеет свои характерные признаки, легко различимые на слух. Однако даже при самом точном произношении ее в связной речи, вследствие влияния соседних звуков, она может приобретать те или иные оттенки. Речевой звук является сложным. Он включает ряд обертонов (гармоник), находящихся в гармоническом отношении к основному тону. Важным условием восприятия речи  является различение длительности произнесения отдельных звуков и их комбинаций. Среднее время длительности произнесения гласных равно примерно 0,35 с, а согласных – 0,02…0,3 с. При восприятии потока речи особенно важно различение интервалов между словами или группами слов. Исключение пауз или их неверная расстановка может привести к искажению смысла воспринимаемой речи. Восприятие и понимание речевых сообщений (аудирование) в значительной мере зависит от темпа их передачи. Оптимальным считается темп 120 слов/мин.

При восприятии отдельных слогов и слов существенное влияние оказывают фонетические закономерности. При восприятии словосочетаний в действие вступают синтаксические закономерности, а фонетические отступают на второй план. При переходе к фразам слушатель начинает ориентироваться уже не на отдельные элементы предложения, а на весь их сложный грамматический каркас.

Таким образом, аудирование представляет собой многоуровневый процесс, сочетающий фонетический (звуковой), синтаксический (словосочетательный) и семантический (смысловой)  уровни.  При этом вышележащие уровни играют ведущую  роль,  определяя  ход  всего  процесса  аудирования, что необходимо  иметь  в  виду при организации речевых сообщений [1-4].

2.3.2. Характеристики  речевого  сигнала

Звуковое давление речи – это сила, с которой звуковая волна, вызываемая звуками речи, давит на единицу площади поверхности, расположенной перпендикулярно к губам говорящего на расстоянии 1 м от него. Уровни звукового давления речи лежат в диапазоне 0…65 дБ (негромкая речь) и 0…80 дБ (громкая речь, усиленная техническими средствами). С увеличением расстояния от говорящего уровень звукового давления речи падает. Так, например, увеличение расстояния в 2 раза приводит к  уменьшению  уровня  на  6 дБ,  в  4 раза – на 12 дБ,  в 8 раз – на 18 дБ и т.д.

Частота основного тона. Формирование значительной части звуков речи происходит с участием голоса. Голосообразование, или фонация, связано с работой голосовых связок, колебания которых вызывают периодические изменения площади голосовой щели. Так как голосовые связки обладают определенной инерцией, обусловленной их массой, то для их размыкания и смыкания требуется определенное время. Отрезок времени, необходимый для полного цикла колебаний голосовых связок, называется периодом колебаний. Он определяет так называемую частоту основного тона голоса речи, которая в свою очередь обусловливает высоту голоса. Эта частота для всех голосов лежит в пределах 70…450 Гц. При произнесении речи она непрерывно меняется в соответствии с ударением, подчеркиванием звуков и слов, а также при проявлении эмоций. Изменение частоты основного тона называют интонацией. У каждого человека свой диапазон изменения частоты основного тона и своя интонация. Основной тон, интонация, устный «почерк» и тембр (окраска) голоса могут служить для опознания человека. Частота основного тона определяет спектральный состав (гармоники) голоса конкретного человека.

Спектральная  плотность. Речевой сигнал представляет собой шумоподобный сигнал. Он состоит из звуковых волн различных частот с различными интенсивностями, которые представляют собой спектр сигнала. Спектральной плотностью интенсивности речевого сигнала называется отношение средней интенсивности сигнала в заданной полосе частот  к ширине этой полосы : .Спектральная плотность измеряется в ваттах на метр квадратный  на герц и численно равна интенсивности шума в полосе частот шириной 1 Гц.

«Белый шум» представляет собой случайный процесс, спектр которого равномерен по интенсивности шума в полосе частот от нуля до бесконечности, то есть спектральная плотность которого не зависит от частоты (в заданной полосе частот). Практически достаточно, чтобы это требование выдерживалось в полосе слышимых частот, если такой шум используется для исследований в данной области частот.

«Розовый шум» представляет собой случайный процесс, огибающая спектра которого спадает в сторону высоких частот со скоростью 3 дБ на октаву. Спектральный состав такого шума наиболее близок к спектральному составу речевого сигнала.

Высота звука (голоса) – это субъективная оценка восприятия звука по частотному диапазону. За объективную единицу высоты звука, приближенно отражающей субъективное восприятие, принята октава, которая характеризуется двукратным отношением частот – 1, 2, 4, 8, 16 и т.д. На практике октава может делиться на полуоктавы и третьоктавы. Если октавные частоты расположить на равных расстояниях по оси частот, то получится логарифмический масштаб, который соответствует субъективному восприятию звуков по частоте слуховым анализатором.

Динамический диапазон. В процессе произношения любого речевого сообщения уровень акустического сигнала непрерывно изменяется. Зависимость уровня сигнала от времени называется уровнеграммой. Динамический диапазон определяется как разность между максимальным и минимальным уровнем сигнала: . Динамический диапазон речи человека составляет 25…35 дБ, а телефонных разговоров – 35…45 дБ.

Пик-фактор определяется как разность между максимальным и средним уровнем сигнала:.

Форманты – это области концентрации энергии в речевом частотном диапазоне, получающиеся при произнесении каких-либо звуков речи. Обычно форманты полностью заполняют весь частотный диапазон речи от 125 до 8000 Гц. Но в зависимости от частоты повторения звука речи частота встречаемости формант в определенной полосе частот различна. Каждая из формант дает свою часть информации о звуке речи, и эти части независимы друг от друга. Это дает возможность арифметически суммировать вероятности появления формант. Спектр гласных определяется двумя-тремя формантами. Первая имеет диапазон 300…1000 Гц, вторая – 900…2300 Гц, третья – 2200...2500 Гц. Спектр согласных чаще всего имеет один достаточно расплывчатый минимум.

Слитность звучания. Слуховое ощущение звука исчезает не сразу, а постепенно, плавно уменьшаясь до нуля. Длительность задержки слухового ощущения характеризуется постоянной времени слуха, которая в среднем равна 150…200 мс. Вследствие этого свойства наблюдается интегрирование кратковременных звуковых импульсов в слитное восприятие звуков, запаздывающих друг относительно друга. Для слитного восприятия двух звуков необходимо, чтобы последующий звук запаздывал относительно предыдущего на промежуток времени не более 50 мс. Но и при большем запаздывании слитность звучания может не нарушаться, если последующий звук имеет уровень значительно ниже первого. Приближенно считается, что интенсивность звуков, запаздывающих на 60 мс и менее, полностью суммируется с интенсивностью основного звука, а звуки, запаздывающие более чем на 60 мс, полностью являются помехой. При больших интервалах запаздывания ощущение от первого звука уже становится малым и не маскирует второй. Поэтому оба звука воспринимаются раздельно.

Прямое и диффузное звучание. При распространении звуков речи в помещении звук, выходя из источника, распространяется прямолинейно до тех пор, пока не достигнет поверхности, от которой он отражается. Звук, распространяющийся прямолинейно до момента своего отражения, называется прямым звуком, а звуковое поле – свободным звуковым полем. В то же время звук, многократно отражающийся от поверхностей, создает в каждой точке звукового поля помещения звуковую энергию, одинаковую во всех направлениях. Такое звуковое поле и звуки в нем называются диффузными.

Индекс направленности слуха. При перпендикулярном падении звуковой волны на ухо имеет место отражение волны и ее дифракция. Соотношение между интенсивностями отраженной и дифрагирующей волн зависит от отношения длины звуковой волны и  размера  головы. Так как волна отражается от головы, то звуковое давление у уха повышается. Это повышение может составлять 1…6 дБ в зависимости от частоты. В случае падения звуковой волны спереди явление отражения почти не сказывается. При падении звуковой волны под различными углами, как это свойственно диффузному полю, на низких частотах звуковое давление возле ушей примерно равно звуковому давлению диффузного поля, а на высоких частотах это давление удваивается. Величина повышения звукового давления у уха слушателя, выраженная в децибелах, по сравнению с диффузным звуком в помещении называется индексом направленности слуха [1, 2].

2.3.3. Эффект  маскировки  речевых  сигналов

Маскировкой речевого сигнала называется явление, выражающееся в том, что восприятие звуков, несущих определенную информацию, ухудшается при одновременном звучании других мешающих звуков. В результате возникает потеря части или даже всей информации. Использование этого явления и лежит в основе одного из методов защиты речевой информации. Маскировка может быть нескольких видов: одновременная (помехой, действующей одновременно с сигналом), последовательная или остаточная (помехой, предшествующей сигналу), обратная (помехой, следующей после сигнала).

Количественно маскировка оценивается путем определения порога слышимости синусоидальных звуков в присутствии мешающего звука. Если изменять частоту испытательного тона и определять на каждой частоте уровень интенсивности, при которой он начинает прослушиваться наряду с мешающим звуком, то можно получить кривую порога слышимости  при наличии маскировки.

Эффект маскировки определяется разностью порогов слышимости (для чистого тона заданной частоты) в шумах и в тишине:

                                   ,                                 (2.7)

где  – уровень порога слышимости в шумах;

  –  уровень порога слышимости в тишине;

 –  интенсивность шума;

     –  интенсивность звука в тишине (без шума);

  I0  –   нулевой уровень (2·10-5 Па).

Эффект маскировки зависит от ряда факторов. В первую очередь он определяется уровнем маскирующего звука. Существенное влияние имеет и форма огибающей спектра шумов: низкочастотные составляющие шумов маскируют звуки высокой частоты лучше, чем высокочастотные составляющие шумов – звуки низкой частоты. Наиболее распространенным видом помехи является «белый шум». Его маскирующее действие в основном определяется относительно узкой полосой частот, лежащих вблизи маскируемого тона. Когда общая энергия, приходящаяся на критический участок «белого шума», равна энергии тона, происходит полное подавление полезного сигнала.

В случае дискретных шумовых спектров эффект маскировки получается наибольшим для звуков, частотные составляющие которых располагаются вблизи частот маскирующих составляющих. На этом основаны методы зашумления речи с помощью маскирующих сигналов. При тональной помехе маскирующее действие выражается тем больше, чем ближе ее частота к частоте сигнала.

Специфическим видом маскировки является речевая смесь (речевой хор, речевой коктейль), при которой на речевой сигнал накладывается несколько других речевых сигналов (разговор двух или нескольких человек одновременно).

Чтобы речевые звуки были понятными, их интенсивность должна превышать интенсивность шумов в общем случае примерно на 6 дБ. Однако обнаружить звуки можно даже в том случае, когда интенсивность речи меньше интенсивности шума (примерно также на 6 дБ).  

Понимание слов на фоне «белого шума» зависит от ряда факторов. Многосложные слова понимаются лучше, чем односложные. Это объясняется тем, что более длинное слово обладает большим числом опознавательных признаков, чем короткое. Слова, начинающиеся с гласного звука, понимаются лучше, чем начинающиеся с согласного. Определенное влияние на понимание оказывает место ударного слога. Слово понимается значительно лучше, если ударение находится в конце него. Длина фразы не влияет на понимание до уровня примерно в 11 слов, после чего понимание ухудшается. С увеличением глубины фразы понимание ухудшается, даже если длина фразы остается неизменной. При этом критической величиной является глубина фразы в 5…9 слов. Понимание в условиях «речевого коктейля» обусловлено также рядом факторов. Ухо способно различать нужный голос среди двух-трех абонентов. Из двух одновременных сообщений точнее воспринимается поступившее на 0,2…0,4 с раньше. Дифференцирование сообщений возможно разделением по смыслу, по индивидуальным голосовым характеристикам, по направлению звука на правое и левое ухо, использованием дополнительных визуальных индикаторов [1, 3, 4].

2.3.4. Основы  теории  разборчивости  речи

Разборчивость речи при защите речевой информации должна рассматриваться в двух аспектах. С одной стороны, при озвучивании какого-либо сообщения, предназначенного для определенных слушателей, необходимо стремиться к тому, чтобы оно было услышано и точно понято. В этом случае разборчивость речи должна быть максимальной. С другой стороны, для обеспечения защиты речевой информации от возможного перехвата необходимо сделать речевой сигнал минимально разборчивым. При этом уменьшение разборчивости необходимо обеспечивать в местах возможной установки прослушивающих устройств, куда будет падать звуковая волна речевого сигнала. При этом необходимо иметь в виду, что приемником речевого сигнала является слух человека, имеющий характеристики, которые отличаются от характеристик обычно используемых приемников сигналов.

При анализе условий передачи речи необходимо учитывать разницу в проведении ее оценки. В одних случаях речь оценивают только с точки зрения ее понятности, а в других – с точки зрения и разборчивости и качества звучания, поскольку кроме понятности речи необходима и узнаваемость голоса.

Разборчивостью речи называется относительное или процентное количество принятых специально подготовленными слушателями элементов речи из общего количества переданных по тракту. В качестве элементов речи принимают слоги, звуки, слова, фразы (команды) и цифры. Соответственно этому различают слоговую, звуковую, смысловую и цифровую разборчивость. В соответствии с измеренной разборчивостью устанавливаются классы качества разборчивости речи и нормы разборчивости звуков и односложных слов. В частности, для радио- и телефонной аппаратуры установлены пять классов качества по нормам разборчивости [5]. Классы качества и их характеристики приведены в таблице.

                                                                                                                                                      

Классы качества и нормы разборчивости речи

(в соответствии с ГОСТ Р50840-95)

Класс качества

Характеристика класса качества

Норма слоговой разборчивости речи, %

Высший

Понимание передаваемой речи без малейшего напряжения внимания

Более 93

I

Понимание передаваемой речи без затруднений

86…93

II

Понимание передаваемой речи с  напряжением внимания без переспросов и повторений

76…85

III

Понимание передаваемой речи с некоторым напряжением внимания, с редкими переспросами и повторениями

61…75

IV

Понимание передаваемой речи с большим напряжением, частыми переспросами и повторениями

45…60

Таким образом, для надежной защиты речевой информации в местах возможного ее перехвата необходимо обеспечивать разборчивость слов менее 60%.

2.3.5. Основные  методы  измерения  разборчивости  речи

Для измерения разборчивости речи используются следующие методы:

– метод артикуляционных измерений;

– расчетный метод остаточной разборчивости речи по формантной разборчивости;

– метод спектрального анализа речевого сигнала.

Метод артикуляционных измерений заключается в том, что слушатели воспринимают на слух определенное число односложных слов, фиксируют их, после чего проводится сравнение полученного результата с исходным текстом и определяется процент правильно принятых слов [1, 2, 5, 6].

Расчетный метод остаточной разборчивости речи по формантной разборчивости основан на том, что формантная разборчивость имеет однозначную связь со словесной разборчивостью для каждого конкретного языка. Поэтому, оценивая с помощью соответствующего расчета или измерения уровня ощущения формант, можно достаточно точно определить разборчивость речи в конкретных условиях ее произношения [1, 6].

Метод спектрального анализа речевого сигнала основан на том, что разборчивость формант определяется законами распределения вероятности формант по частотному и динамическому диапазону речи. Поэтому величина формантной разборчивости в практических условиях с достаточной степенью точности может быть определена произведением ширины частотного диапазона (в герцах) и средней величины эффективного динамического диапазона речи (в децибелах). После чего по формуле связи между словесной и формантной разборчивостями или по соответствующей таблице определяется словесная разборчивость.

Метод артикуляционных измерений является наиболее простым и не требует большого объема измерений и вычислений. Поэтому для определения разборчивости речи при исследовании защиты речевой информации с помощью маскирующих сигналов в данной практической работе используется указанный метод. Рассмотрим его более подробно.

2.3.6. Метод  артикуляционных  измерений

Для реализации этого метода необходимо наличие группы слушателей в составе не менее трех человек, трех и более дикторов, звукозаписывающей аппаратуры, источников маскирующих сигналов и шумомера для измерения уровней речи и шума. Слушатели принимают на слух некоторое число таблиц. Такие таблицы состоят из 50 односложных слов, например, «год», «док», «ток»,  «куб»,  «миг»,  «час»  и т.п. Примеры таблиц приведены в [5, 6].

Перед проведением контрольных измерений слушатели должны провести пробный прием нескольких таблиц слов с целью адаптации и освоения метода измерений. Методика разборчивости слов заключается в следующем [5, 6].

Воспроизводятся записанные предварительно на магнитный или другой носитель таблицы слов с соответствующим видом и уровнем маскирующих сигналов. Слова должны произноситься со скоростью 1 таблица за 3 минуты ровным голосом без подчеркивания начальных и конечных согласных. В одном измерении не допускается повторное чтение одной и той же таблицы.   Воспроизведение слов таблиц следует проводить при среднем уровне звукового давления 70 дБ, измеренного на расстоянии, на котором находятся слушатели от акустической системы. Уровни звукового давления маскирующих сигналов должны измеряться на том же расстоянии и меняться ступенчато через 3 дБ в диапазоне 60…80 дБ. При необходимости этот диапазон может быть расширен.

Слушатели записывают принятые слова в таблицы, в которых указывается номер таблицы, фамилия слушателя, дата, уровень полезного и маскирующего сигнала, вид маскирующего сигнала и, при необходимости, другие данные. Для удобства обработки таблиц слова необходимо записывать под своими порядковыми номерами. Пример такой таблицы приведен в [5, 6].

Проводится определение правильности записанных слов путем сравнения таблицы принятых слов и исходной таблицы.

Определяется разборчивость слов для каждой таблицы, принятой одним слушателем, по формуле

                              

                              ,                            (2.8)

где – количество правильно записанных слов;

общее количество воспроизведенных (записанных) слов.

Определяется среднее значение разборчивости слов и среднеквадратическое отклонение по формулам

                                          ;                                    (2.9)

                                  ,                         (2.10)

где  – общее число таблиц, принятых всеми слушателями;

 – число слушателей;

 k  – число переданных таблиц.

Если |SiSср| > 2s, то данные результаты измерений исключаются и повторно  проводятся  вычисления по формулам (2.8 – 2.10) с учетом уменьшенного числа измерений [6].

3. Порядок выполнения работы

1. Изучить теоретическую часть работы.

2. Провести самопроверку теоретических знаний, ответив на поставленные вопросы.

3. Провести запись воспроизводимых слов таблиц для различных уровней полезного и маскирующих сигналов и их видов.

4. Определить число правильно принятых слов путем сравнения полученных результатов с исходными данными.

5. Провести    расчет     разборчивости    слов    по    формулам
(2.8 – 2.10).

6. Определить по полученным результатам вид маскирующего сигнала, наиболее подходящего для защиты речевой информации.

7. Оформить отчет и защитить работу.

4. Описание программы для ЭВМ

Программа позволяет проверять теоретические знания студентов, определять количество правильно принятых слов, рассчитывать необходимые параметры разборчивости слов и проверять правильность выбора маскирующего сигнала, обеспечивающего наилучшую защиту речевой информации, для каждой группы аудиторов и соответствующих вариантов, включающих различные комбинации экспериментов.

При комплектации ЭВМ звуковой картой и наушниками возможно акустическое воспроизведение вариантов для каждого студента индивидуально. Имя программы SPEECH.

Литература

1. Сапожков М.А. Электроакустика. – М.: Связь, 1978. – 272 с.

2. Вахитов  Я.Ш.   Теоретические   основы    электроакустики  и

электроакустическая аппаратура. – М.: Искусство, 1982. – 415 с.

3. Основы инженерной психологии/ Под ред. Б.Ф.Ломова. – М.:

Высш. шк., 1986. – 448 с.

4.Справочник по инженерной психологии/Под ред. Б.Ф. Ломова. – М.: Машиностроение, 1982. – 368 с.

5. ГОСТ Р50840-95.  Передача  речи по  трактам  связи. Методы

оценки  качества,  разборчивости и узнаваемости. – М.: Госстандарт

России, 1995. – 230 с.

6. Алефиренко  В.М.,   Давыдов  Г.В.,   Шамгин Ю.В.   Расчет  и

измерение  разборчивости  речи  для  акустических  устройств РЭС:

Метод. указ. к практ. занятиям по курсу «Конструирование РЭС» для студ. спец. «Проектирование и производство РЭС». – Мн.: БГУИР, 1998.– 32 с.

PAGE  19


 

А также другие работы, которые могут Вас заинтересовать

26333. Северное Возрождение 27.83 KB
  Актуальность этой темы определяется огромной ролью которую Возрождение сыграло в формировании современной западной культуры. Название Нидерланды Нижние земли получил в средние века комплекс территорий расположенных в низовьях Рейна по побережью Северного моря и вдоль рек Шельды и Мааса. После отречения Карла V от престола страна в составе 17 провинций была унаследована в 1556 г. Распространение Реформации в том числе кальвинистской вызвало в Нидерландах при Филиппе II воинствующем католике особенно жестокие преследования...
26334. Английское Возрождение 38.59 KB
  Культура Возрождения с её идейной основой философией и эстетикой гуманизма возникает прежде всего на итальянской почве. Неудивительно что влияние Италии можно заметить у всех английских писателей эпохи Возрождения. Широкий народный фон английского Возрождения его основное достоинство источник таких достижений XVI столетия как Утопия Томаса Мора и театр Шекспира. Вслед за официальной реформацией поднимается новая волна религиозного фанатизма движение пуритан враждебных жизнерадостному светскому духу Возрождения гуманистической...
26335. Исторические предпосылки и характерные черты эпохи Просвещения 18.1 KB
  Исторические предпосылки и характерные черты эпохи Просвещения. Исторические предпосылки: Характерные черты эпохи Просвещения: 18 век важный этап в эволюции западноевропейской культуры. Идеология Просвещения возникла в 17 веке ее родоначальником считается английский философ Д. Представители Просвещения в своих политических философских культурологических взглядах отстаивали могущество разума и свет знаний которые должны победить тьму невежества заблуждений и предрассудков.
26336. Развитие естественнонаучной мысли эпохи Просвещения 12.77 KB
  Развитие естественнонаучной мысли эпохи Просвещения. В истории философской мысли 18 век обычно характеризуется как век Просвещения. Оптимизм Просвещения выражает менталитет крепнувшей буржуазии не случайно родиной Просвещения стала Англия раньше других стран вставшая на путь капиталистического развития. Развитие Просвещения в философии тесно связано с социальнополитическими идеями становлением идеологии.
26337. Английское Просвещение 33.19 KB
  Для просветителей же XVIII в. Философия Основоположник свободомыслия XVIII в. В течение всего XVIII в. Признание ощущения источником нашей мысли великая идея получившая дальнейшее развитие в материализме XVIII в.
26338. Французское Просвещение 48.01 KB
  Жан Жак Руссо Новым этапом в развитии французского Просвещения XVIII в. была деятельность Жан Жака Руссо 1712 1778 идеолога революционной мелкой буржуазии. значительное влияние на якобинцев провозгласивших Руссо своим идейным предшественником. Пройдя суровую жизненную школу Руссо с детства видел страдания народа.
26339. Американское Просвещение 40.96 KB
  Крупнейшие представители американского Просвещения: Франклин Джефферсон Пэйн и другие являются вместе с тем активными революционными деятелями руководящими фигурами в современной им политической борьбе. Представителями радикального якобинского крыла в американском деизме были Томас Пэйн и Этан Аллен. Близкий к взглядам Аллена круг идей но в более развернутом виде содержит вышедшая десять лет спустя книга Пэйна Age of reason Век разума. Томас Пэйн 1737 1809 гг.
26340. Германское Просвещение 14.68 KB
  Предметом теоретической философии по Канту должно быть не изучение самих по себе вещей природы мира человека а исследование деятельности установление законов человеческого разума и его границ. он написал тезисы Воспитание человеческого рода главная идея которых единство человеческого рода его всеохватной целостности. Но высокая оценка христианской святости по его мнению не означала что духовная эволюция человеческого рода завершается именно этой религией. Таким образом Немецкое Просвещение рассматривало движение человека к...
26341. Предпосылки и начало промышленной революции в Англии. Её экономические и социальные результаты 24.26 KB
  Предпосылки и начало промышленной революции в Англии. в Англии раньше чем в других странах начался промышленный переворот. Несомненно важным фактором стимулировавшим промышленную революцию в Англии была иностранная конкуренция. Эти капиталы и явились важным источником индустриализации Англии именно они позволили Англии ранее других стран совершить промышленную революцию.