75883

Проблеми створення комп’ютерних систем розпізнавання усного мовлення. Методи виділення й упізнавання елементів мови при обробці усного мовлення

Доклад

Иностранные языки, филология и лингвистика

Задача распознавания речи состоит в автоматическом восстановлении текста произносимых человеком слов фраз или предложений на естественном языке. Только в последние десятилетия компьютерная техника достигла такого уровня когда стала осмысленной задача распознавания слитной или даже спонтанной устной речи. На этом этапе выяснилось что для решения задачи распознавания речи недостаточно уметь распознавать отдельные звуки и слова команды с надежностью сравнимой с надежностью распознавания отдельных команд человеком. Поэтому задачу...

Украинкский

2015-01-26

29.83 KB

4 чел.

30. Проблеми створення комп’ютерних систем розпізнавання усного мовлення. Методи виділення й упізнавання елементів мови при обробці усного мовлення.

Задача распознавания речи состоит в автоматическом восстановлении текста произносимых человеком слов, фраз или предложений на естественном языке. К важным практическим задачам, связанным с распознаванием речи, можно отнести разработку систем диктовки текстов, систем речевого управления различными устройствами, систем речевого диалога (например, по телефону). 

Только в последние десятилетия компьютерная техника достигла такого уровня, когда стала осмысленной задача распознавания слитной или даже спонтанной устной речи. На этом этапе выяснилось, что для решения задачи распознавания речи недостаточно уметь распознавать отдельные звуки и слова (команды) с надежностью, сравнимой с надежностью распознавания отдельных команд человеком.

Поэтому задачу распознавания речи естественно разделить на две независимые задачи:

  1.  задачу локального распознавания речи (то есть распознавания отдельной команды)
  2.  задачу восстановления текста слитной речи по множеству возможных гипотез распознавания.

Основными характеристиками современных систем автоматического распознавания речи являются следующие:

  1.  словари размером в десятки и сотни тысяч слов;
  2.  распознавание слитной речи;
  3.  работа в реальном времени;
  4.  возможность работы как с предварительной настройкой на голос диктора, так и без настройки;
  5.  надежность работы 95–98% для грамматически правильных текстов.

Методы локального распознавания речи можно условно раз делить на две большие группы: непараметрические — с использованием непараметрических мер близости к эталонам (к ним можно отнести методы на основе формальных грамматик и методы на основе метрик на множестве речевых сигналов) — и параметрические (вероятностные — на основе метода скрытых марковских процессов, нейросетевые).

Первые устройства автоматического распознавания речи были аналоговыми и использовали пороговую логику, поэтому они не обладали высокой надежностью и были узкоспециализированными.

Следующим этапом стало развитие непараметрических подходов, основанных на мерах близости на множестве речевых сигналов.

В настоящий момент самыми сложными элементами при построении систем распознавания речи являются, как это не покажется странным, не распознающие алгоритмы, а построение акустической модели языка и начальное обучение эталонов слов словаря, чаще всего являющихся вероятностными автоматами. Для настройки параметров языковых моделей и эталонов фонетических единиц языка в качестве основы для обучения необходимы текстовые и речевые базы данных достаточно большого объема. Необходимо тщательно учесть все встречающиеся в современном языке слова и языковые обороты, типы голосов и акцентов, имеющихся у носителей языка.

При автоматизированном распознавании устной речи и рукописного текста на естественных языках возникают проблемы, близкие к проблемам машинного перевода.

То есть, существуют слова, близкие по звучанию, по набору фонем. Например, «шесть» и «шерсть». Человек достаточно легко справляется с различением таких слов за счет понимания контекста, в котором они произнесены, тогда как для компьютерных систем различить такие близкие наборы звуков составляет почти неразрешимую задачу. Следовательно, для распознавания речи нужно не только слышать ее, но еще и понимать о чем идет речь.

Наличие эти проблем обусловлено опять же механистическим подходом к распознаванию фонем и символов – делается попытка распознать их как дискретные элементы, не учитывая семантических взаимосвязей.

Здесь, как и в задаче перевода, проблема распознавания решается отражением семантического пространства для тех гипотез значений, которые наиболее вероятны для звучаний и написаний распознаваемых слов.

Одной из проблем современных систем распознавания является восстановление по распознанным фонемам исходного слова. Это связано с тем, что транскрипция (произношение) каждого слова не обязательно совпадает с его написанием, например лесница, здача, салома и т.д.

Основные методы распознавания речи

Одним из основных подходов, используемых при построении речевых распознавателей, является подход, основанный на обработке акустических сигналов, который опирается на следующее положение: поскольку речевой сигнал является особой формой сигнала (или вектором чисел), то к нему применимы общие методы обработки сигналов (например, анализ частотного спектра Фурье, анализ основных составляющих, процедуры статистических решений и другие математические методы). Эти методы используются для того, чтобы установить идентичность входного сигнала одному из шаблонов.

Использование скрытой Марковской модели

Наиболее часто и успешно при распознавании фонем и слов используется скрытая Марковская модель (НММ - hidden Markov modelling). 

НММ определяется как множество состояний и переходов из одного состояния в другое, то есть конечный автомат. Существует множество начальных и множество конечных состояний. Любая последовательность наблюдений является результатом перехода из одного из начальных состояний в одно из конечных.

НММ можно использовать для представления любой составляющей речевого сигнала – фонем или слов На тестах было доказано, что основанные на этом подходе системы распознавания речи оказались весьма надежными и эффективными.

Преобразования Фурье

Речевой сигнал представляется в виде двумерного спектрального временного образа (СВО), получаемого с помощью быстрого преобразования Фурье.

Результат отражает изменение по времени амплитуд заданных частотных составляющих речевого сигнала и четко выражает особенности речи, что даёт возможность его использовать для автоматического распознавания произносимых пользователем слов. СВО позволяет выделить местоположение резонансных частот, то есть локальных выбросов, что является определяющей особенностью речевого сигнала.

Вейвлет-преобразование

Вейвлет-преобразование сигналов является обобщением спектрального анализа. Вейвлет-анализ можно охарактеризовать как спектральный анализ локальных возмущений. На основе этого метода строится система распознавания речи. Исходный речевой сигнал сегментируется на фонемы и для каждого сегмента находится скелетон. Средний коэффициент распознавания составляет 73%.

Метод нечёткого сопоставления речевых образов

Для распознавания изолированных слов, нормализованных по времени, часто применяется метод нечёткого сопоставления с эталоном. Эталонные образы для каждого слова словаря формируются как среднее арифметическое различных вариантов произношения данного слова.

Разработанные методы позволяют идентифицировать слова из ограниченного словаря, произнесенные произвольным диктором. Независимость от диктора дает возможность на основе разработанных методов строить системы речевого управления прикладными программами. Ошибка распознавания при словаре в 200 слов не превышает 2 %


 

А также другие работы, которые могут Вас заинтересовать

52092. Африка 69.5 KB
  Проблемный вопрос Почему в природе трех материков – Африки Австралии и Южной Америки много общего Ответ: Потому что все эти материки являются частью единого материка – Гондвана. Какой материал мы будем изучать первым вы узнаете если отгадаете загадку: Этот материк по площади в 3 с лишним раза больше другого и почти такой же по площади как два других материка Какой это материк Ответ: Африка так как по площади он в 3 с лишним раза больше Австралии и почти такой же по площади как Южная Америка и Антарктида вместе взятые. Проблемный...
52093. Африка. Фізико-географічне положення. Історія відкриття й дослідження материка 51 KB
  Вивчення нового матеріалу Відкриття та дослідження Африки Час дослідження Дослідники Результати досліджень ІІІ тис. Експедиція під керівництвом португальця Бартоломеу Діама Здійснила плавання вздовж західних берегів Африки до м. Експедиція під керівництвом португальця Васко да Гама На шляху до Індії дісталася південних берегів Африки. Африки.
52094. Населення і народи Африки 55.5 KB
  Мета уроку: формування первинних знань учнів про етнічний склад населення Африки особливості його формування динаміку і розміщення; сприяти розумінню демографічних проблем Африки та шляхи їх вирішення.Формувати первинні практичні вміння характеризувати загальні риси населення материка; вдосконалювати практичні вміння працювати з тематичними картами атласу. Зміст курсу Географія материків і океанів передбачає не тільки вивчення природи материків але й ознайомлення з характеристиками населення материків та його господарською діяльністю.
52095. Тропічні пустелі та напівпустелі. Твердолисті вічнозелені ліси та чагарники 68.5 KB
  Навчальна мета: повторити вивчений матеріал; зясувати рівень оволодіння учнями навчальним матеріалом з попередніх тем; сформувати знання про особливості розміщення природних зон Африки; поглибити систему знань учнів про взаємозв'язки природних компонентів у складі природних зон; сформувати в учнів уміння складати характеристику природних зон у певній послідовності за типовим планом; удосконалювати практичні вміння учнів працювати з картами атласами. Обладнання: фізична карта Африки кліматична карта Африки карта природних зон Африки...
52096. Африка 63.5 KB
  Посовещавшись команды должны выбрать капитана и название команды можно предложить выбрать из названий стран Африки. Название команды пишут маркером на чистых табличках. За каждый правильный ответы команды получают красные жетоны 2 ВОСХОЖДЕНИЕ на Джомолунгму На доске магнитной нарисована гора с маршрутамиступеньками по количеству команд. Команды выбирают одного игрока – альпиниста который будет защищать честь команды при восхождении.
52097. Загальні особливості клімату Африки. Кліматичні пояси i типи клімату 43 KB
  Мета: повторите поняття клімат вірні чинники типи клімату кліматичний пояс; сформувати знання про загальні особливості клімату Африки про типи клімату в кожному кліматичному поясі Африки; продовжити формування навичок аналізу карти кліматичної карти Африки кліматичних діаграм; розвивати увагу спостережливість вміння робити висновки визначати головне. Найвища точка Африки: а г. Вам уже відомо що більша частина Африки розташована в тропічних широтах екватор перетинає материк майже посередині саме тому Африка протягом року...
52098. Фізико-географічне положення та берегова лінія Африки 49 KB
  Розмістити порядкові номери географічних об’єктів по океанам до яких вони належать Острів Камчатка Острів Шпіцберген Півострів Аравійський Острів Шрі-Ланка Півострів Скандинавський Острови Японські Острів НоваЗемля Острів Ісландія Хребет Ломоносова Острови Бермудські Острів Мадагаскар Море Червоне Острови Гавайські Море Карське Море Чорне Море Берингове Хребет Менделеєва Півострів Індостан Півострів Сомалі Острові Філіппінські Море Азовське Море Саргасове Острови Маріанські ...
52100. Общая характеристика климата Африки 5.32 MB
  Общая характеристика климата Африки Цель: формировать у учащихся систему знаний об общих особенностях климата Африки и основных климатообразующих факторах; совершенствовать практические умения объяснять особенности климата Африки характеризовать влияние климатообразующих факторов на его формирование развивать коммуникативные навыки воспитывать интерес к предмету. Оборудование: физическая карта Африки климатическая карта Африки учебники атласы шаблоны в рабочей тетради приготовлена картосхема Африки. В рабочей тетради вы должны были...