48876

ПРОГНОЗИРОВАНИЕ БУКМЕКЕРСКИХ КОЭФФИЦИЕНТОВ

Курсовая

Информатика, кибернетика и программирование

Но букмекерам приходится решать несколько иную задачу им необходимо оценить вероятность каждого исхода матча победу поражение какойлибо команды или ничейный результат и по итогам этой оценки определить какую сумму они готовы выплачивать победителю в случае если тот правильно сумел предугадать результат. Задача состоит в том чтобы с помощью нейронных сетей определить коэффициенты на матчи с возможными исходами: победа первой команды победа второй команды ничья. Ниже приводится их список: количество выигранных в прошлом сезоне...

Русский

2013-12-16

108.5 KB

33 чел.

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

МИНИСТЕРСТВА ОБРАЗОВАНИЯ И НАКУИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение

высшего профессионального образования

«Пермский государственный Педагогический университет»

Факультет информатики и экономики

Кафедра информатики

ПРОГНОЗИРОВАНИЕ БУКМЕКЕРСКИХ КОЭФФИЦИЕНТОВ

Курсовая работа

Студента 3 курса

Очного отделения

Заузолкова Никиты Анатольевича

Научный руководитель:

Ясницкий Леонид Нахимович

Пермь 2007


ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ………………………………………………………………………….3

ГЛАВА 1. НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ…………………………..….…5

ГЛАВА 2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ…………………………………………………………………….7

1. ПОСТАНОВКА ЗАДАЧИ…………………………………………………7

2. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ОБЛАСТИ……………………………8

3. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ……………………………11

ЗАКЛЮЧЕНИЕ……………………………………………………………...……13

Список используемой литературы……………………………………..………14


ВВЕДЕНИЕ

Искусственный интеллект – это раздел информатики, посвящённый моделированию интеллектуальной деятельности человека. Методы искусственного интеллекта на сегодняшний день применяются в тех областях деятельности человека, которые не поддаются либо с трудом поддаются формализации. Для подобных задач характерно наличие большого числа степеней свободы с огромным числом вариантов поиска решений. В настоящий момент выделяют несколько направлений развития искусственного интеллекта:

  •  Разработка интеллектуальных систем, основанных на знаниях;
  •  Нейросетевые и нейрокомпьютерные технологии;
  •  Распознавание образов;
  •  Игры и творчество;
  •  Компьютерная лингвистика;
  •  Интеллектуальные роботы;
  •  Компьютерные вирусы;
  •  Интеллектуальное математическое моделирование.

Остановимся на рассмотрении нейросетевых технологий. Для них главными принципами служат принципы работы головного мозга. Другими словами, нейротехнологии моделируют головной мозг человека. Исторически первой работой по созданию интеллектуальных устройств, которые моделируют не только работу, но и структуру, человеческого мозга, принято считать статью Мак-Каллока и Питтса. Эти авторы выдвинули гипотезу математического нейрона, моделирующего нейрон мозга человека. Далее Фрэнку Розенблатту удалось материализовать идею Мак-Каллока-Питтса, своё устройство он назвал персептроном, состоящим из сети математических нейронов. Его детище смогло решить сложнейшую интеллектуальную задачу: распознавание букв латинского алфавита. Далее была усложнена структура персептрона, усовершенствована модель математического нейрона, разработано множество алгоритмов обучения, созданы персептроны на основе гибридных нейросетей, а так же расширился круг задач, решаемых с помощью нейросетей.

Теперь, пользуясь некоторыми знаниями из области нейросетевых технологий, в своей курсовой работе я с помощью персептрона с одним скрытым слоем попытаюсь решить прикладную задачу из области, не поддающейся формализации. В ходе работы я старался выбрать такие задачи, для решения которых применение методов искусственного интеллекта пока ещё не распространено достаточно широко.


ГЛАВА 1. НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ

В этой главе будут приведены те понятия, которыми я воспользовался для решения поставленной задачи.

1. Нейронные сети, представляют собой сеть элементов — математических нейронов, связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов. Работа сети состоит в преобразовании входных сигналов во времени, в результате чего меняется внутреннее состояние сети и формируются выходные воздействия. Обычно нейронные сети оперирует цифровыми  величинами.

2. Многослойный персептрон – устройство, в основе которого лежит сеть с несколькими скрытыми слоями.

3. Математический нейрон. Он имеет несколько входов, на которые поступают сигналы. Поступающие сигналы умножаются на соответствующий входу весовой коэффициент, который моделирует силу синаптической связи. Далее нейрон суммирует полученные произведения от каждого входа и передаёт полученную сумму активационной функции, которая формирует выходной сигнал нейрона. В нашем случае мы будем использовать следующую функцию: , где S – это и есть получаемая от входных сигналов сумма. Эта функция получила название сигмоидной, так как имеет s-образную форму и является аппроксимацией пороговой активационной функции. Многослойный персептрон, имеющий сигмоидную активационную функцию, получил название мадалайн.

4. Для обучения мадалайна, проектированием которого я буду заниматься в дальнейшем, использую метод обратного распространения ошибки (Back Propagation). Ниже приводится алгоритм этого метода:

Пусть N – это количество входных сигналов, Нk – число нейронов в скрытом слое, M – число нейронов выходного слоя, K – количество слоёв нейронной сети.

  •  Инициализация синаптических весов. Её будем производить случайным образом в интервале [-1; 1].
  •  Получение из обучающей выборки очередного входного вектора Xq, и соответствующего ему желаемого выходного вектора Dq.
  •  Этот шаг называется прямым проходом. Меняя значения параметра k = 1, 2, …, K и параметра i = 1, 2, …, Нk вычисляются выходные сигналы i-ого нейрона в k-ом слое.

  •  Этот шаг называется обратным проходом. Меняя значения параметров k = K, К – 1, …, 1; i = 1, 2, …, Нk; j = 1, 2, …, Нk-1 вычисляются синаптические веса на новой эпохе:

- для выходного слоя           (3)

- для скрытого слоя  (4)

Теперь необходимо сформулировать теорему сходимости персептрона:

Если существует множество значений весов, которые обеспечивают конкретное различие образов, то в конечном итоге алгоритм обучения персептрона приводит либо к этому множеству, либо к эквивалентному ему множеству, такому, что данное различие образов будет достигнуто.


ГЛАВА 2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ

1. ПОСТАНОВКА ЗАДАЧИ

Как уже говорилось выше, нейросетевые технологии применяются при решении таких задач, в которых не существует чёткого алгоритма, точных действий либо формальных правил, позволяющих без каких-либо затруднений получить желаемый результат. Поэтому я остановил свой выбор на проблемах, возникающих у букмекеров, а именно, на проблеме формирования коэффициентов исхода спортивных матчей. На этот коэффициент и умножается поставленная сумма в случае выигрыша. Каждому человеку на сегодняшний день ясно, что не существует никаких алгоритмов, позволяющих со стопроцентной точностью заранее определить исход любого матча. Но букмекерам приходится решать несколько иную задачу, им необходимо оценить вероятность каждого исхода матча (победу, поражение какой-либо команды, или ничейный результат), и по итогам этой оценки определить, какую сумму они готовы выплачивать победителю в случае, если тот правильно сумел предугадать результат. На данный момент в мире существует великое множество различных видов спорта. Для того чтобы начать исследование, необходимо несколько сузить круг возможных исходов. Для этого будем рассматривать только парные виды спорта. Для уменьшения количества обучающей выборки, необходимо остановиться на каком-то одном виде спорта. Я решил выбрать хоккей. Мой выбор объясняется тем, что эта игра на данный момент считается самой популярной на планете, и поэтому не потребуется много усилий, чтобы собрать всю информацию, которая может понадобиться в ходе решения.

Итак, подведём итог всему выше сказанному. Имеется букмекерская контора, которая принимает ставки на результаты матчей чемпионата мира по хоккею. Задача состоит в том, чтобы с помощью нейронных сетей определить коэффициенты на матчи с возможными исходами: победа первой команды, победа второй команды, ничья.

2. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ОБЛАСТИ

Теперь предстоит выяснить, какие параметры наиболее существенно влияют на определение букмекерских коэффициентов.

Несомненно, что такими факторами являются данные о выступлении в прошедшем сезоне, то есть количество выигранных матчей, а так же матчей, закончившихся в ничью, в прошлом году. Так же не стоит забывать и о текущем положении команд: необходимо знать, сколько успешных встреч (под успешными будем понимать те встречи, которые принесли командам очки, то есть победные и ничейные) сыграно в текущем сезоне. Помимо всего этого, в спорте существует понятие «неудобного соперника», поэтому не стоит забывать о балансе встреч между командами. Если продолжить анализ спортивной статистики, то можно заметить так же фактор родного поля. Большинство команд одерживает победы именно в «домашних» матчах, поэтому этот параметр так же нужно учесть.

На этом исследование можно прекратить, но всё же не стоит забывать о последнем параметре, назовём его случайный фактор. Всем известно, что в спорте может случиться абсолютно всё: аутсайдеры с разгромным счётом выигрывают у лидеров и тому подобное. Включим в наш случайный фактор такие события, которые случаются крайне редко, но их появление может в корне повлиять на результат. К одному из таких событий можно отнести договорные матчи, травма ведущего игрока и многое другое.

В ходе этих рассуждений, мне удалось получить достаточное число параметров для решения поставленной задачи. Ниже приводится их список:

  1.  количество выигранных в прошлом сезоне матчей первой команды;
  2.  количество выигранных в прошлом сезоне матчей второй команды;
  3.  количество матчей, сыгранных в ничью, в прошлом сезоне первой команды;
  4.  количество матчей, сыгранных в ничью, в прошлом сезоне второй  команды;
  5.  количество выигранных в текущем сезоне матчей первой команды;
  6.  количество выигранных в текущем сезоне матчей второй  команды;
  7.  количество матчей, сыгранных в ничью, в текущем сезоне первой команды;
  8.  количество матчей, сыгранных в ничью, в текущем сезоне второй команды;
  9.  общее количество побед первой команды над второй;
  10.  общее количество побед второй команды над первой;
  11.  общее количество матчей, сыгранных вничью, между командами;
  12.  флаг домашней игры для первой команды;
  13.  флаг домашней игры для второй команды;
  14.  случайный фактор; 

Данные параметры будут подаваться на вход персептрона.

На выходе будем формировать результирующий вектор со следующими компонентами:

  1.  победа первой команды;
  2.  победа второй команды;
  3.  ничья;

Обучающая выборка составлена по итогам матчей чемпионатов мира 2003/2004/2005 с реальными коэффициентами букмекерских контор, она содержит 228 записей (См. приложение 1) и находится в файле «Выборка матчей по хоккею».

Таким образом, для решения задачи будем использовать персептрон, основанный на нейронной сети с 14-ю входами, 3-мя выходами и одним скрытым слоем, число нейронов которой можно определить по формулам (являющихся следствием теорем Арнольда-Колмогорова-Хехт-Нильсена): ; , где - размерность выходного сигнала, Q-число элементов обучающей выборки, - необходимое число синаптических весов, - размерность входного сигнала.

В нашем случае, число нейронов в скрытом слое может принимать значения от 5-ти до 57-ми. Пусть число нейронов в скрытом слое будет равно 20-ти.


АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

Одним из главных свойств персептрона является его способность к обобщению, то есть правильную реакцию на данные, которых не было в обучающей выборке (ещё такие данные называют зашумлёнными).

Для того, чтобы ввести количественную оценку данного свойства, нам потребуются реальные данные, результаты которых мы знаем, но в обучающую выборку они не вошли. По аналогии с вычислением ошибки обучения персептрона мы можем посчитать ошибку обобщения персептрона, заменив в формуле векторы из обучающей выборки на векторы из тестирующей выборки. Формула будет выглядеть следующим образом:

,

где d и y – это векторы, полученные на основе тестируемой выборки, Q – это количество элементов в ней, а M – это число выходных нейронов.

Результаты вычислений этой оценки приведены ниже на графике. Данные вычисления производились при различных скоростях обучения
(η = 0,1 и η = 0, 25), и с одинаковым количеством эпох обучения, равным 1000.

На данном рисунке по горизонтальной оси отложено число нейронов в скрытом слое, а по вертикали значение ошибки обобщения персептрона.

Глядя на этот график, мы можем видеть, что с ростом числа нейронов скрытого слоя, уменьшается погрешность обобщения, но только до какого-то определённого значения, после которого ошибка снова начинает увеличиваться.


ЗАКЛЮЧЕНИЕ

Подведём итог проделанной работы. В ходе её выполнения мне удалось создать персептрон с одним скрытым слоем, 14-ю входами, 3-мя выходами, с сигмоидной активационной функцией. При тестировании созданного приложения, я смог убедиться, что мадалайн успешно решает поставленную задачу. Подав на вход персептрона сигналы, которых не было в обучающей выборке, на выходе мы получаем адекватные результаты, то есть соответствующие действительности букмекерские коэффициенты на  реальные матчи чемпионата мира по хоккею 2007. То есть применение нейросетевых технологий в выбранной области можно считать перспективным. И если продолжить исследование в данной сфере, в итоге можно получить программу, успешно заменяющую целый штат сотрудников букмекерской конторы.


СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

2. Ясницкий Л.Н. Введение в искусственный интеллект. М.: Издательский центр «Академия», 2005.

14

1

2

2

1

Рис. 1. Схема нейронной сети для решения поставленной задачи

20

EMBED Excel.Chart.8 \s    Рис. 3. График ошибки обобщения персептрона.

1

19

2

3


 

А также другие работы, которые могут Вас заинтересовать

31483. Аналіз грошових потоків, оцінка грошових надходжень 121.5 KB
  Аналіз грошових потоків Лекція 11 2 год. Мета заняття: ознайомити студентів із балансовим методом оцінки грошових надходжень методикою аналізу грошових потоків із застосуванням системи коефіцієнтів поглибити їхні знання стосовно методів розрахунку обертання грошових потоків на підприємстві та їх ефективності розвивати логічне мислення студентів привчати творчо оперувати набутими знаннями виховувати інтерес до обраної професії. ПЛАН Оцінка динаміки грошових потоків по періодах. Балансовий метод оцінки грошових надходжень.
31484. Аналіз ліквідності і платоспроможності підприємства 243.5 KB
  Аналіз ліквідності і платоспроможності підприємства Лекція 12 2 год. Мета заняття: ознайомити студентів та поглибити їхні знання з питань необхідності та методики аналізу показників ліквідності і платоспроможності підприємства розвивати логічне мислення студентів привчати творчо оперувати набутими знаннями виховувати інтерес до обраної професії. ПЛАН Поняття ліквідності і платоспроможності підприємства. Основні показники ліквідності підприємства – порядок їх розрахунку та методи оцінки.
31485. Аналіз фінансової стійкості підприємства 104 KB
  Аналіз фінансової стійкості підприємства Лекція 13 2 год. Мета заняття: ознайомити студентів та поглибити їхні знання з питань сутності фінансової стійкості підприємства порядку оцінки та визначення основних показників і типів фінансової стійкості розвивати логічне мислення студентів привчати творчо оперувати набутими знаннями виховувати інтерес до обраної професії. ПЛАН Сутність фінансової стабільності та стійкості підприємства. Дидактична мета заняття: сформувати у студентів сучасне економічне мислення щодо поняття фінансової...
31486. Аналіз кредитоспроможності підприємства 153 KB
  Аналіз кредитоспроможності підприємства Лекція 14 2 год. Мета заняття: ознайомити студентів із класифікаційними моделями аналізу кредитоспроможності методикою оцінки кредитоспроможності позичальниківюридичних осіб згідно з методикою НБУ та методикою комплексного аналізу кредитоспроможності поглибити їхні знання щодо сутності кредитоспроможності підприємства розвивати логічне мислення студентів привчати творчо оперувати набутими знаннями виховувати інтерес до обраної професії. ПЛАН Сутність кредитоспроможності підприємства....
31487. Аналіз ділової активності підприємства 46.26 KB
  Аналіз ділової активності підприємства Лекція 15 2 год. Мета заняття: ознайомити студентів і поглибити їхні знання з питань основних напрямів оцінки ділової активності підприємства аналізу і порядку розрахунку показників ділової активності розвивати логічне мислення студентів привчати творчо оперувати набутими знаннями виховувати інтерес до обраної професії. Основні напрямки оцінки ділової активності підприємства. Показники що характеризують ділову активність підприємства – порядок їх розрахунку та методи оцінки.
31488. Комплексне оцінювання фінансового стану підприємства 93.99 KB
  Комплексне оцінювання фінансового стану підприємства Лекція 19 2 год. Студент повинен знати виховна мета: теоретичний матеріал досліджуваної теми методи створення рейтингу кластерного аналізу матричного аналізу та методи бальних оцінок методи порівняльної рейтингової оцінки метод рейтингового фінансового аналізу інтегральна рейтингова оцінка підприємства а також методи узагальнення результатів фінансового аналізу діяльності підприємства повинен навчитись практично застосовувати здобуті знання у подальшій практичній діяльності....
31489. Аналіз прибутковості та рентабельності підприємства 66.56 KB
  Аналіз прибутковості та рентабельності підприємства Лекція 16 2 год Актуальність теми: прибуток є головною метою та мотивом підприємницької діяльності матеріальним джерелом економічного та соціального розвитку інвестиційної та інноваційної діяльності. Дана тема дає можливість отримати уявлення про те які показники використовуються у процесі аналізу та оцінки прибутковості та рентабельності підприємства також осмислене вивчення даної теми дасть можливість оволодіти методикою розрахунку показників рентабельності та прибутковості та...
31490. Значення і теоретичні основи фінансового аналізу 166.5 KB
  Значення і теоретичні основи фінансового аналізу Лекція 1 2 год. Мета заняття: ознайомити студентів з питаннями необхідності та сутності фінансового аналізу; видами фінансового аналізу; привчати творчо оперувати набутими знаннями розвивати логічне мислення студентів. ПЛАН Необхідність та сутність фінансового аналізу. Предмет завдання напрями і принципи фінансового аналізу.
31491. Значення і теоретичні основи фінансового аналізу. Моделі фінансового аналізу 245.5 KB
  Значення і теоретичні основи фінансового аналізу Лекція 2 2 год. Мета заняття: ознайомити студентів з методами прийомами моделями та факторами фінансового аналізу; привчати творчо оперувати набутими знаннями розвивати логічне мислення студентів Методи і моделі фінансового аналізу. Прийоми фінансового аналізу. Суб’єкти і користувачі фінансового аналізу.