71499

Распознавание образов на базе нейронных сетей

Лабораторная работа

Информатика, кибернетика и программирование

Цель работы: разработать подсистему идентификации сигналов в системе MATLAB. Задание: Разработать подсистему распознавания сигналов. Разработать источники сигналов разной формы. Обучить нейрону сеть и выполнить распознавание сигналов.

Русский

2014-11-07

817.93 KB

25 чел.

МИНОБРНАУКИ РОССИИ

Государственное Образовательное учреждение

Высшего Профессионального Образования

Пензенский государственный технологический университет

Кафедра «Информационные технологии и системы»

Дисциплина «Методы идентификации сигналов и систем»

Отчет по лабораторной работе №5

«Распознавание образов на базе нейронных сетей»

Выполнила: студентка группы 09И

Соляникова Е.А.

Проверил: к.т.н., доцент кафедры ИТС

Жашкова Т.В.

Пенза, 2013 г.

Цель работы: разработать подсистему идентификации сигналов в системе MATLAB.

Задание:

1. Разработать подсистему распознавания сигналов.

2. Разработать источники сигналов разной формы.

3. Обучить нейрону сеть и выполнить распознавание сигналов.

Выполнение:

Программу для считывания 5-ти образцов записи голоса и отсечения нулей.

Листинг:

da = wavread('da.wav');

wavplay (da, 44100)      

da = da(:,1);

 

net = wavread('net.wav');

wavplay (net, 44100)

net = net(:,1);

 

ay = wavread('ay.wav');

wavplay (ay, 44100)

ay = ay(:,1);

 

poka = wavread('poka.wav');

wavplay (poka, 44100)

poka = poka(:,1);

 

cat = wavread('cat.wav');

wavplay (cat, 44100)

cat = cat(:,1);

 

da = da(4805:118519);

net = net(7033:134379);

ay = ay(8140:104448);

poka = poka(5533:131072);

cat = cat(5451:119008);

Разработаем Simulink-модель подсистемы распознавания сигналов, для получения массивов x1, x2, x3, x4 и x5, необходимых для формирования и обучения нейронной сети в дальнейшем.

Рис. 1 - Simulink-модель подсистемы распознавания сигналов.

Рис. 2 - Подсистема, содержащая источники сигналов.

Рис. 3 - Подсистема преобразования сигналов.

Рис. 4 – Параметры блока «Buffer».

Рис. 5 – Параметры блока «Analog Filter Design»

Значение полосы пропускания фильтра, равное 50265.48 рад/с было получено путем умножения средней частоты человеческого голоса, равной 8000 Гц, на 2π.

Рис. 6 – Параметры блока «Zero-Order Hold»

Значение шага дискретизации, равное 0.000625, является обратным к значению частоты дискретизации, равной 8000 Гц и умноженной на 2, т.е. 16000 Гц.

Рис. 7 – Изображения голосовых сигналов в блоке «Scope»

В результате моделирования массивы имеют трехмерную размерность, переводим их к двумерному виду и транспонируем с помощью программы.

Листинг:

z1 = x1(1,:);

z2 = x2(1,:);

z3 = x3(1,:);

z4 = x4(1,:);

z5 = x5(1,:);

z1 = z1';

z2 = z2';

z3 = z3';

z4 = z4';

z5 = z5';

Результат:

Рис. 8 – Полученные массивы z.

В начале массива имеют большое количество нулей, отсекаем их с помощью программы.

Листинг:

z1 = z1 (1026:80896);

z2 = z2 (1026:80896);

z3 = z3 (1026:80896);

z4 = z4 (1026:80896);

z5 = z5 (1026:80896);

Рис. 9 - Массивы z после отсечения нулей.

Меняем размер буфера с 1024 на 79871 (размер обучающих массивов) для того, чтобы обучить нейронную сеть распознавать сигналы по целому слову, т.к. разные слова могут иметь одни и те же буквы и звуки соответственно.

Рис. 10 – Измененный параметр блока «Buffer».

Программа для создания и обучения вероятностной нейронной сети, используя полученные значения массивов z1, z2, z3, z4 и z5.

Листинг:

P = [z1 z2 z3 z4 z5];

T = [1 2 3 4 5];

T_new = ind2vec(T)

T_new = full(T_new)

netset = newpnn(P,T_new);

netset.layers{1}.size

gensim(netset)

 

Результат:

T_new =

  (1,1)        1

  (2,2)        1

  (3,3)        1

  (4,4)        1

  (5,5)        1

T_new =

    1     0     0     0     0

    0     1     0     0     0

    0     0     1     0     0

    0     0     0     1     0

    0     0     0     0     1

ans =     5

Рис.11 - Разработанная вероятностная нейронная сеть.

Рис.12 - Строение разработанной вероятностной нейронной сети.

Копируем блок «Neural Network» и вставляем его в главную модель. Запускаем модель. Сигналы распознаются верно.

Рис. 13 – Распознавание первого голосового сигнала.

Рис. 14 – Распознавание второго голосового сигнала.

Рис. 15 – Распознавание третьего голосового сигнала.

Рис. 16 – Распознавание четвертого голосового сигнала.

Рис. 17 – Распознавание пятого голосового сигнала.


 

А также другие работы, которые могут Вас заинтересовать

58244. Клеточная теория. Клеточная мембрана 113.5 KB
  Клетки различных органов животных растений грибов внешне не очень похожи друг на друга. Все клетки сходны по строению химическому составу и жизненным функциям.
58245. Носовой гласный заднего ряда 117 KB
  Язык слегка оттянут назад, кончик языка опущен вниз у альвеол нижних резцов. Рот широко открыт, губы напряжены. [ɔ̃] сохраняет полную долготу перед согласным в конце ритмической группы, сокращает долготу в неударном положении и теряет долготу в абсолютном исходе...
58247. Военные походы фараонов 45.5 KB
  С какой целью фараон создавал войско Из кого состояло войско Развитие какого ремесла позволило создать хорошо вооруженное войско Войско состояло из пехоты и колесниц. Это позволило создать колесничное войско. Во всех важнейших сражениях он лично командовал войском. О если бы не его величество говорили они да живет он да здравствует да будет благополучен мы никогда бы не разгромили вражеское войско.
58248. Психологічна сумісність 53 KB
  Мета: учні повинні знати: Що таке психологічна сумісність; Значення понять: характер темперамент; Типи темпераменту характеру; Сумісність типів темпераменту характеру.
58249. Табличный процессор Microsoft Excel. Назначение и интерфейс 422.5 KB
  Образовательная цель урока: Изучение и первичное закрепление знаний; Актуализация ведущих знаний ;Ввести понятия табличный процессор и электронная таблица; Сформировать понятия: ячейка строка столбец адрес ячейки диапазон блок ячеек рабочий лист книга.
58250. Исследование процесса работы пользователей с информационной системы учета электропогружного оборудования скважин (ИС «ЭПОС») 3.02 MB
  В результате данной работы было спроектирована, разработана и внедрена подсистема оповещения в ИС «ЭПОС», устраняющая недостатки в работе ИС «ЭПОС». Разработаны и реализованы спецификации требований на внесение изменений в ИС «ЭПОС».
58252. Носовой гласный переднего ряда во французском языке 146.5 KB
  Положение всех органов речи то же, что и при [ε]. Язык должен упираться в нижние резцы, иначе звук будет похож на [α̃]. Нёбная занавеска отходит от стен фаринкса и включает носовой резонатор.