48876

ПРОГНОЗИРОВАНИЕ БУКМЕКЕРСКИХ КОЭФФИЦИЕНТОВ

Курсовая

Информатика, кибернетика и программирование

Но букмекерам приходится решать несколько иную задачу им необходимо оценить вероятность каждого исхода матча победу поражение какойлибо команды или ничейный результат и по итогам этой оценки определить какую сумму они готовы выплачивать победителю в случае если тот правильно сумел предугадать результат. Задача состоит в том чтобы с помощью нейронных сетей определить коэффициенты на матчи с возможными исходами: победа первой команды победа второй команды ничья. Ниже приводится их список: количество выигранных в прошлом сезоне...

Русский

2013-12-16

108.5 KB

32 чел.

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

МИНИСТЕРСТВА ОБРАЗОВАНИЯ И НАКУИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение

высшего профессионального образования

«Пермский государственный Педагогический университет»

Факультет информатики и экономики

Кафедра информатики

ПРОГНОЗИРОВАНИЕ БУКМЕКЕРСКИХ КОЭФФИЦИЕНТОВ

Курсовая работа

Студента 3 курса

Очного отделения

Заузолкова Никиты Анатольевича

Научный руководитель:

Ясницкий Леонид Нахимович

Пермь 2007


ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ………………………………………………………………………….3

ГЛАВА 1. НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ…………………………..….…5

ГЛАВА 2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ…………………………………………………………………….7

1. ПОСТАНОВКА ЗАДАЧИ…………………………………………………7

2. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ОБЛАСТИ……………………………8

3. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ……………………………11

ЗАКЛЮЧЕНИЕ……………………………………………………………...……13

Список используемой литературы……………………………………..………14


ВВЕДЕНИЕ

Искусственный интеллект – это раздел информатики, посвящённый моделированию интеллектуальной деятельности человека. Методы искусственного интеллекта на сегодняшний день применяются в тех областях деятельности человека, которые не поддаются либо с трудом поддаются формализации. Для подобных задач характерно наличие большого числа степеней свободы с огромным числом вариантов поиска решений. В настоящий момент выделяют несколько направлений развития искусственного интеллекта:

  •  Разработка интеллектуальных систем, основанных на знаниях;
  •  Нейросетевые и нейрокомпьютерные технологии;
  •  Распознавание образов;
  •  Игры и творчество;
  •  Компьютерная лингвистика;
  •  Интеллектуальные роботы;
  •  Компьютерные вирусы;
  •  Интеллектуальное математическое моделирование.

Остановимся на рассмотрении нейросетевых технологий. Для них главными принципами служат принципы работы головного мозга. Другими словами, нейротехнологии моделируют головной мозг человека. Исторически первой работой по созданию интеллектуальных устройств, которые моделируют не только работу, но и структуру, человеческого мозга, принято считать статью Мак-Каллока и Питтса. Эти авторы выдвинули гипотезу математического нейрона, моделирующего нейрон мозга человека. Далее Фрэнку Розенблатту удалось материализовать идею Мак-Каллока-Питтса, своё устройство он назвал персептроном, состоящим из сети математических нейронов. Его детище смогло решить сложнейшую интеллектуальную задачу: распознавание букв латинского алфавита. Далее была усложнена структура персептрона, усовершенствована модель математического нейрона, разработано множество алгоритмов обучения, созданы персептроны на основе гибридных нейросетей, а так же расширился круг задач, решаемых с помощью нейросетей.

Теперь, пользуясь некоторыми знаниями из области нейросетевых технологий, в своей курсовой работе я с помощью персептрона с одним скрытым слоем попытаюсь решить прикладную задачу из области, не поддающейся формализации. В ходе работы я старался выбрать такие задачи, для решения которых применение методов искусственного интеллекта пока ещё не распространено достаточно широко.


ГЛАВА 1. НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ

В этой главе будут приведены те понятия, которыми я воспользовался для решения поставленной задачи.

1. Нейронные сети, представляют собой сеть элементов — математических нейронов, связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов. Работа сети состоит в преобразовании входных сигналов во времени, в результате чего меняется внутреннее состояние сети и формируются выходные воздействия. Обычно нейронные сети оперирует цифровыми  величинами.

2. Многослойный персептрон – устройство, в основе которого лежит сеть с несколькими скрытыми слоями.

3. Математический нейрон. Он имеет несколько входов, на которые поступают сигналы. Поступающие сигналы умножаются на соответствующий входу весовой коэффициент, который моделирует силу синаптической связи. Далее нейрон суммирует полученные произведения от каждого входа и передаёт полученную сумму активационной функции, которая формирует выходной сигнал нейрона. В нашем случае мы будем использовать следующую функцию: , где S – это и есть получаемая от входных сигналов сумма. Эта функция получила название сигмоидной, так как имеет s-образную форму и является аппроксимацией пороговой активационной функции. Многослойный персептрон, имеющий сигмоидную активационную функцию, получил название мадалайн.

4. Для обучения мадалайна, проектированием которого я буду заниматься в дальнейшем, использую метод обратного распространения ошибки (Back Propagation). Ниже приводится алгоритм этого метода:

Пусть N – это количество входных сигналов, Нk – число нейронов в скрытом слое, M – число нейронов выходного слоя, K – количество слоёв нейронной сети.

  •  Инициализация синаптических весов. Её будем производить случайным образом в интервале [-1; 1].
  •  Получение из обучающей выборки очередного входного вектора Xq, и соответствующего ему желаемого выходного вектора Dq.
  •  Этот шаг называется прямым проходом. Меняя значения параметра k = 1, 2, …, K и параметра i = 1, 2, …, Нk вычисляются выходные сигналы i-ого нейрона в k-ом слое.

  •  Этот шаг называется обратным проходом. Меняя значения параметров k = K, К – 1, …, 1; i = 1, 2, …, Нk; j = 1, 2, …, Нk-1 вычисляются синаптические веса на новой эпохе:

- для выходного слоя           (3)

- для скрытого слоя  (4)

Теперь необходимо сформулировать теорему сходимости персептрона:

Если существует множество значений весов, которые обеспечивают конкретное различие образов, то в конечном итоге алгоритм обучения персептрона приводит либо к этому множеству, либо к эквивалентному ему множеству, такому, что данное различие образов будет достигнуто.


ГЛАВА 2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ

1. ПОСТАНОВКА ЗАДАЧИ

Как уже говорилось выше, нейросетевые технологии применяются при решении таких задач, в которых не существует чёткого алгоритма, точных действий либо формальных правил, позволяющих без каких-либо затруднений получить желаемый результат. Поэтому я остановил свой выбор на проблемах, возникающих у букмекеров, а именно, на проблеме формирования коэффициентов исхода спортивных матчей. На этот коэффициент и умножается поставленная сумма в случае выигрыша. Каждому человеку на сегодняшний день ясно, что не существует никаких алгоритмов, позволяющих со стопроцентной точностью заранее определить исход любого матча. Но букмекерам приходится решать несколько иную задачу, им необходимо оценить вероятность каждого исхода матча (победу, поражение какой-либо команды, или ничейный результат), и по итогам этой оценки определить, какую сумму они готовы выплачивать победителю в случае, если тот правильно сумел предугадать результат. На данный момент в мире существует великое множество различных видов спорта. Для того чтобы начать исследование, необходимо несколько сузить круг возможных исходов. Для этого будем рассматривать только парные виды спорта. Для уменьшения количества обучающей выборки, необходимо остановиться на каком-то одном виде спорта. Я решил выбрать хоккей. Мой выбор объясняется тем, что эта игра на данный момент считается самой популярной на планете, и поэтому не потребуется много усилий, чтобы собрать всю информацию, которая может понадобиться в ходе решения.

Итак, подведём итог всему выше сказанному. Имеется букмекерская контора, которая принимает ставки на результаты матчей чемпионата мира по хоккею. Задача состоит в том, чтобы с помощью нейронных сетей определить коэффициенты на матчи с возможными исходами: победа первой команды, победа второй команды, ничья.

2. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ОБЛАСТИ

Теперь предстоит выяснить, какие параметры наиболее существенно влияют на определение букмекерских коэффициентов.

Несомненно, что такими факторами являются данные о выступлении в прошедшем сезоне, то есть количество выигранных матчей, а так же матчей, закончившихся в ничью, в прошлом году. Так же не стоит забывать и о текущем положении команд: необходимо знать, сколько успешных встреч (под успешными будем понимать те встречи, которые принесли командам очки, то есть победные и ничейные) сыграно в текущем сезоне. Помимо всего этого, в спорте существует понятие «неудобного соперника», поэтому не стоит забывать о балансе встреч между командами. Если продолжить анализ спортивной статистики, то можно заметить так же фактор родного поля. Большинство команд одерживает победы именно в «домашних» матчах, поэтому этот параметр так же нужно учесть.

На этом исследование можно прекратить, но всё же не стоит забывать о последнем параметре, назовём его случайный фактор. Всем известно, что в спорте может случиться абсолютно всё: аутсайдеры с разгромным счётом выигрывают у лидеров и тому подобное. Включим в наш случайный фактор такие события, которые случаются крайне редко, но их появление может в корне повлиять на результат. К одному из таких событий можно отнести договорные матчи, травма ведущего игрока и многое другое.

В ходе этих рассуждений, мне удалось получить достаточное число параметров для решения поставленной задачи. Ниже приводится их список:

  1.  количество выигранных в прошлом сезоне матчей первой команды;
  2.  количество выигранных в прошлом сезоне матчей второй команды;
  3.  количество матчей, сыгранных в ничью, в прошлом сезоне первой команды;
  4.  количество матчей, сыгранных в ничью, в прошлом сезоне второй  команды;
  5.  количество выигранных в текущем сезоне матчей первой команды;
  6.  количество выигранных в текущем сезоне матчей второй  команды;
  7.  количество матчей, сыгранных в ничью, в текущем сезоне первой команды;
  8.  количество матчей, сыгранных в ничью, в текущем сезоне второй команды;
  9.  общее количество побед первой команды над второй;
  10.  общее количество побед второй команды над первой;
  11.  общее количество матчей, сыгранных вничью, между командами;
  12.  флаг домашней игры для первой команды;
  13.  флаг домашней игры для второй команды;
  14.  случайный фактор; 

Данные параметры будут подаваться на вход персептрона.

На выходе будем формировать результирующий вектор со следующими компонентами:

  1.  победа первой команды;
  2.  победа второй команды;
  3.  ничья;

Обучающая выборка составлена по итогам матчей чемпионатов мира 2003/2004/2005 с реальными коэффициентами букмекерских контор, она содержит 228 записей (См. приложение 1) и находится в файле «Выборка матчей по хоккею».

Таким образом, для решения задачи будем использовать персептрон, основанный на нейронной сети с 14-ю входами, 3-мя выходами и одним скрытым слоем, число нейронов которой можно определить по формулам (являющихся следствием теорем Арнольда-Колмогорова-Хехт-Нильсена): ; , где - размерность выходного сигнала, Q-число элементов обучающей выборки, - необходимое число синаптических весов, - размерность входного сигнала.

В нашем случае, число нейронов в скрытом слое может принимать значения от 5-ти до 57-ми. Пусть число нейронов в скрытом слое будет равно 20-ти.


АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

Одним из главных свойств персептрона является его способность к обобщению, то есть правильную реакцию на данные, которых не было в обучающей выборке (ещё такие данные называют зашумлёнными).

Для того, чтобы ввести количественную оценку данного свойства, нам потребуются реальные данные, результаты которых мы знаем, но в обучающую выборку они не вошли. По аналогии с вычислением ошибки обучения персептрона мы можем посчитать ошибку обобщения персептрона, заменив в формуле векторы из обучающей выборки на векторы из тестирующей выборки. Формула будет выглядеть следующим образом:

,

где d и y – это векторы, полученные на основе тестируемой выборки, Q – это количество элементов в ней, а M – это число выходных нейронов.

Результаты вычислений этой оценки приведены ниже на графике. Данные вычисления производились при различных скоростях обучения
(η = 0,1 и η = 0, 25), и с одинаковым количеством эпох обучения, равным 1000.

На данном рисунке по горизонтальной оси отложено число нейронов в скрытом слое, а по вертикали значение ошибки обобщения персептрона.

Глядя на этот график, мы можем видеть, что с ростом числа нейронов скрытого слоя, уменьшается погрешность обобщения, но только до какого-то определённого значения, после которого ошибка снова начинает увеличиваться.


ЗАКЛЮЧЕНИЕ

Подведём итог проделанной работы. В ходе её выполнения мне удалось создать персептрон с одним скрытым слоем, 14-ю входами, 3-мя выходами, с сигмоидной активационной функцией. При тестировании созданного приложения, я смог убедиться, что мадалайн успешно решает поставленную задачу. Подав на вход персептрона сигналы, которых не было в обучающей выборке, на выходе мы получаем адекватные результаты, то есть соответствующие действительности букмекерские коэффициенты на  реальные матчи чемпионата мира по хоккею 2007. То есть применение нейросетевых технологий в выбранной области можно считать перспективным. И если продолжить исследование в данной сфере, в итоге можно получить программу, успешно заменяющую целый штат сотрудников букмекерской конторы.


СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

2. Ясницкий Л.Н. Введение в искусственный интеллект. М.: Издательский центр «Академия», 2005.

14

1

2

2

1

Рис. 1. Схема нейронной сети для решения поставленной задачи

20

EMBED Excel.Chart.8 \s    Рис. 3. График ошибки обобщения персептрона.

1

19

2

3


 

А также другие работы, которые могут Вас заинтересовать

20144. Методы исследовательских испытаний на надёжность 27 KB
  для исследования надёжности приборов значение имеют неразрушающие методы испыт: метод акустической эмиссии кот. методы базир. методы базир. методы ультразвук.
20145. Определение оптимального уровня надежности 324.5 KB
  С=СрСпСэ Ср – затраты на разработку; Сп – затраты на производство; Сэ – затраты на эксплуатацию. Из приведенного графика видно что с ростом безотказной работы увеличиваются затраты на эксплуатацию.
20146. ПРЯМАЯ И ОБРАТНАЯ ЗАДАЧА ТЕОРИИ ТОЧНОСТИ 34 KB
  Многообразие направлений рассмотрения вопросов точности измерительных устройств в значительной мере определяющих погрешность измерения можно отнести к трем стадиям: Проектирование Производство Эксплуатация При проектировании осуществляется обеспечение точности при котором решаются прямая или обратная задача теории точности. Задачи теории точности: Прямая задача синтеза – выбор структуры устройства определение номинальных значений параметров пределов их допустимых значений номинальных отклонений т. Изучение методов решения прямой и...
20147. Однокоординатные механические приборы, работающие по принципу сравнения со штриховой мерой 125 KB
  Объединяет все штангенприборы единая конструкция отсчетных устройств основанных на применении линейного нониуса. Принцип действия нониуса состоит в совмещении соответствующих штрихов двух линейных шкал интервалы деления которых отличаются на определенную величину. Конструкция нониуса использует то обстоятельство что невооруженный человеческий глаз не способный непосредственно количественно оценивать малые значения несовмещения штрихов в то же время способен фиксировать наличие весьма малых смещений двух штрихов от их симметричного...
20148. Оптико-механические однокоординатные приборы, работающие по принципу сравнения со штриховой мерой 696.5 KB
  Длинномеры Окулярные длинномеры Спилярный окулярный микрометр В спиральном окулярном микрометре вместо микрометрической пары используется спиральная сетка с помощью которой определяются доли интервалов основной шкалы. Отсчетная часть Поток лучей от источника 1 с изображением штрихов основной шкалы 6 проходит объектив 7 проходит неподвижную пластину 8 со шкалой имеющей интервал 01мм. В месте изображения штрихов основной шкалы 6 и неподвижной шкалы 8 круговой шкалы 10 и витков двойной спирали поток лучей попадает в окуляр 11. В эту...
20149. Электрические и оптоэлектронные приборы, работающие по принципу сравнения со штриховой мерой 138.5 KB
  Длинномеры с аналоговым преобразованием. Длинномеры обеспечивают дискретность перемещения порядка 001002 мм за счет электронного интерполирования. Для линейных измерений преимущественное применение находят дифференциальные индуктивные длинномеры. Такие длинномеры содержат уже 2 сердечника 1 и 2 которые смещены относительно друг друга на величину Т 22к1 где к=1234 Тогда при перемещении якоря 3 относительно сердечников полное сопротивление Z и Zкатушек будут изменяться по закону близкому к синусоидальному причем эти зависимости...
20150. Однокоординатные механические приборы, работающие по принципу сравнения с концевой мерой 285 KB
  i=l2 l1 зубчатые головки шаг t=πm радиус R=mz 2 i=z2 z12Rстр mz3 погрешность колеблется 816 мкм. Если растягивать ленточку сечением 8x100 мкм на 1 мкм то стрелка повернётся на 30; если 5x80 мкм то на 70. Стрелочка – стеклянная трубочка у основания 60 мкм а у вершины 20 мкм на конце находится стрелочный указатель из алюминиевой фольги. Погрешность приборов: 08 мкм.
20151. Оптико-механические однокоординатные приборы работающие по принципу сравнения с концевой мерой 73 KB
  Методы исследовательских испытаний на надёжность. для исследования надёжности приборов значение имеют неразрушающие методы испыт: метод акустической эмиссии кот. методы базир. методы базир.
20152. Оптические однокоординатные приборы, работающие по принципу сравнения с концевой мерой 123.5 KB
  Последний может поворачиваться на оси 9 обеспечивая возможность наблюдения необходимого участка шкалы через середину окуляра при минимальных оптических искажениях. При освещении белым светом на фоне шкалы видна одна черная ахроматическая полоса и по обе стороны от нее несколько окрашенных полос убывающей интенсивности. Интерференционные полосы при освещении монохроматическим светом используются для определения цены деления шкалы прибора и для его поверки. Для получения необходимой цены деления с задаются к интерференционных полос и...