48876

ПРОГНОЗИРОВАНИЕ БУКМЕКЕРСКИХ КОЭФФИЦИЕНТОВ

Курсовая

Информатика, кибернетика и программирование

Но букмекерам приходится решать несколько иную задачу им необходимо оценить вероятность каждого исхода матча победу поражение какойлибо команды или ничейный результат и по итогам этой оценки определить какую сумму они готовы выплачивать победителю в случае если тот правильно сумел предугадать результат. Задача состоит в том чтобы с помощью нейронных сетей определить коэффициенты на матчи с возможными исходами: победа первой команды победа второй команды ничья. Ниже приводится их список: количество выигранных в прошлом сезоне...

Русский

2013-12-16

108.5 KB

34 чел.

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

МИНИСТЕРСТВА ОБРАЗОВАНИЯ И НАКУИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение

высшего профессионального образования

«Пермский государственный Педагогический университет»

Факультет информатики и экономики

Кафедра информатики

ПРОГНОЗИРОВАНИЕ БУКМЕКЕРСКИХ КОЭФФИЦИЕНТОВ

Курсовая работа

Студента 3 курса

Очного отделения

Заузолкова Никиты Анатольевича

Научный руководитель:

Ясницкий Леонид Нахимович

Пермь 2007


ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ………………………………………………………………………….3

ГЛАВА 1. НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ…………………………..….…5

ГЛАВА 2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ…………………………………………………………………….7

1. ПОСТАНОВКА ЗАДАЧИ…………………………………………………7

2. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ОБЛАСТИ……………………………8

3. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ……………………………11

ЗАКЛЮЧЕНИЕ……………………………………………………………...……13

Список используемой литературы……………………………………..………14


ВВЕДЕНИЕ

Искусственный интеллект – это раздел информатики, посвящённый моделированию интеллектуальной деятельности человека. Методы искусственного интеллекта на сегодняшний день применяются в тех областях деятельности человека, которые не поддаются либо с трудом поддаются формализации. Для подобных задач характерно наличие большого числа степеней свободы с огромным числом вариантов поиска решений. В настоящий момент выделяют несколько направлений развития искусственного интеллекта:

  •  Разработка интеллектуальных систем, основанных на знаниях;
  •  Нейросетевые и нейрокомпьютерные технологии;
  •  Распознавание образов;
  •  Игры и творчество;
  •  Компьютерная лингвистика;
  •  Интеллектуальные роботы;
  •  Компьютерные вирусы;
  •  Интеллектуальное математическое моделирование.

Остановимся на рассмотрении нейросетевых технологий. Для них главными принципами служат принципы работы головного мозга. Другими словами, нейротехнологии моделируют головной мозг человека. Исторически первой работой по созданию интеллектуальных устройств, которые моделируют не только работу, но и структуру, человеческого мозга, принято считать статью Мак-Каллока и Питтса. Эти авторы выдвинули гипотезу математического нейрона, моделирующего нейрон мозга человека. Далее Фрэнку Розенблатту удалось материализовать идею Мак-Каллока-Питтса, своё устройство он назвал персептроном, состоящим из сети математических нейронов. Его детище смогло решить сложнейшую интеллектуальную задачу: распознавание букв латинского алфавита. Далее была усложнена структура персептрона, усовершенствована модель математического нейрона, разработано множество алгоритмов обучения, созданы персептроны на основе гибридных нейросетей, а так же расширился круг задач, решаемых с помощью нейросетей.

Теперь, пользуясь некоторыми знаниями из области нейросетевых технологий, в своей курсовой работе я с помощью персептрона с одним скрытым слоем попытаюсь решить прикладную задачу из области, не поддающейся формализации. В ходе работы я старался выбрать такие задачи, для решения которых применение методов искусственного интеллекта пока ещё не распространено достаточно широко.


ГЛАВА 1. НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ

В этой главе будут приведены те понятия, которыми я воспользовался для решения поставленной задачи.

1. Нейронные сети, представляют собой сеть элементов — математических нейронов, связанных между собой синаптическими соединениями. Сеть обрабатывает входную информацию и в процессе изменения своего состояния во времени формирует совокупность выходных сигналов. Работа сети состоит в преобразовании входных сигналов во времени, в результате чего меняется внутреннее состояние сети и формируются выходные воздействия. Обычно нейронные сети оперирует цифровыми  величинами.

2. Многослойный персептрон – устройство, в основе которого лежит сеть с несколькими скрытыми слоями.

3. Математический нейрон. Он имеет несколько входов, на которые поступают сигналы. Поступающие сигналы умножаются на соответствующий входу весовой коэффициент, который моделирует силу синаптической связи. Далее нейрон суммирует полученные произведения от каждого входа и передаёт полученную сумму активационной функции, которая формирует выходной сигнал нейрона. В нашем случае мы будем использовать следующую функцию: , где S – это и есть получаемая от входных сигналов сумма. Эта функция получила название сигмоидной, так как имеет s-образную форму и является аппроксимацией пороговой активационной функции. Многослойный персептрон, имеющий сигмоидную активационную функцию, получил название мадалайн.

4. Для обучения мадалайна, проектированием которого я буду заниматься в дальнейшем, использую метод обратного распространения ошибки (Back Propagation). Ниже приводится алгоритм этого метода:

Пусть N – это количество входных сигналов, Нk – число нейронов в скрытом слое, M – число нейронов выходного слоя, K – количество слоёв нейронной сети.

  •  Инициализация синаптических весов. Её будем производить случайным образом в интервале [-1; 1].
  •  Получение из обучающей выборки очередного входного вектора Xq, и соответствующего ему желаемого выходного вектора Dq.
  •  Этот шаг называется прямым проходом. Меняя значения параметра k = 1, 2, …, K и параметра i = 1, 2, …, Нk вычисляются выходные сигналы i-ого нейрона в k-ом слое.

  •  Этот шаг называется обратным проходом. Меняя значения параметров k = K, К – 1, …, 1; i = 1, 2, …, Нk; j = 1, 2, …, Нk-1 вычисляются синаптические веса на новой эпохе:

- для выходного слоя           (3)

- для скрытого слоя  (4)

Теперь необходимо сформулировать теорему сходимости персептрона:

Если существует множество значений весов, которые обеспечивают конкретное различие образов, то в конечном итоге алгоритм обучения персептрона приводит либо к этому множеству, либо к эквивалентному ему множеству, такому, что данное различие образов будет достигнуто.


ГЛАВА 2. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ

1. ПОСТАНОВКА ЗАДАЧИ

Как уже говорилось выше, нейросетевые технологии применяются при решении таких задач, в которых не существует чёткого алгоритма, точных действий либо формальных правил, позволяющих без каких-либо затруднений получить желаемый результат. Поэтому я остановил свой выбор на проблемах, возникающих у букмекеров, а именно, на проблеме формирования коэффициентов исхода спортивных матчей. На этот коэффициент и умножается поставленная сумма в случае выигрыша. Каждому человеку на сегодняшний день ясно, что не существует никаких алгоритмов, позволяющих со стопроцентной точностью заранее определить исход любого матча. Но букмекерам приходится решать несколько иную задачу, им необходимо оценить вероятность каждого исхода матча (победу, поражение какой-либо команды, или ничейный результат), и по итогам этой оценки определить, какую сумму они готовы выплачивать победителю в случае, если тот правильно сумел предугадать результат. На данный момент в мире существует великое множество различных видов спорта. Для того чтобы начать исследование, необходимо несколько сузить круг возможных исходов. Для этого будем рассматривать только парные виды спорта. Для уменьшения количества обучающей выборки, необходимо остановиться на каком-то одном виде спорта. Я решил выбрать хоккей. Мой выбор объясняется тем, что эта игра на данный момент считается самой популярной на планете, и поэтому не потребуется много усилий, чтобы собрать всю информацию, которая может понадобиться в ходе решения.

Итак, подведём итог всему выше сказанному. Имеется букмекерская контора, которая принимает ставки на результаты матчей чемпионата мира по хоккею. Задача состоит в том, чтобы с помощью нейронных сетей определить коэффициенты на матчи с возможными исходами: победа первой команды, победа второй команды, ничья.

2. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ОБЛАСТИ

Теперь предстоит выяснить, какие параметры наиболее существенно влияют на определение букмекерских коэффициентов.

Несомненно, что такими факторами являются данные о выступлении в прошедшем сезоне, то есть количество выигранных матчей, а так же матчей, закончившихся в ничью, в прошлом году. Так же не стоит забывать и о текущем положении команд: необходимо знать, сколько успешных встреч (под успешными будем понимать те встречи, которые принесли командам очки, то есть победные и ничейные) сыграно в текущем сезоне. Помимо всего этого, в спорте существует понятие «неудобного соперника», поэтому не стоит забывать о балансе встреч между командами. Если продолжить анализ спортивной статистики, то можно заметить так же фактор родного поля. Большинство команд одерживает победы именно в «домашних» матчах, поэтому этот параметр так же нужно учесть.

На этом исследование можно прекратить, но всё же не стоит забывать о последнем параметре, назовём его случайный фактор. Всем известно, что в спорте может случиться абсолютно всё: аутсайдеры с разгромным счётом выигрывают у лидеров и тому подобное. Включим в наш случайный фактор такие события, которые случаются крайне редко, но их появление может в корне повлиять на результат. К одному из таких событий можно отнести договорные матчи, травма ведущего игрока и многое другое.

В ходе этих рассуждений, мне удалось получить достаточное число параметров для решения поставленной задачи. Ниже приводится их список:

  1.  количество выигранных в прошлом сезоне матчей первой команды;
  2.  количество выигранных в прошлом сезоне матчей второй команды;
  3.  количество матчей, сыгранных в ничью, в прошлом сезоне первой команды;
  4.  количество матчей, сыгранных в ничью, в прошлом сезоне второй  команды;
  5.  количество выигранных в текущем сезоне матчей первой команды;
  6.  количество выигранных в текущем сезоне матчей второй  команды;
  7.  количество матчей, сыгранных в ничью, в текущем сезоне первой команды;
  8.  количество матчей, сыгранных в ничью, в текущем сезоне второй команды;
  9.  общее количество побед первой команды над второй;
  10.  общее количество побед второй команды над первой;
  11.  общее количество матчей, сыгранных вничью, между командами;
  12.  флаг домашней игры для первой команды;
  13.  флаг домашней игры для второй команды;
  14.  случайный фактор; 

Данные параметры будут подаваться на вход персептрона.

На выходе будем формировать результирующий вектор со следующими компонентами:

  1.  победа первой команды;
  2.  победа второй команды;
  3.  ничья;

Обучающая выборка составлена по итогам матчей чемпионатов мира 2003/2004/2005 с реальными коэффициентами букмекерских контор, она содержит 228 записей (См. приложение 1) и находится в файле «Выборка матчей по хоккею».

Таким образом, для решения задачи будем использовать персептрон, основанный на нейронной сети с 14-ю входами, 3-мя выходами и одним скрытым слоем, число нейронов которой можно определить по формулам (являющихся следствием теорем Арнольда-Колмогорова-Хехт-Нильсена): ; , где - размерность выходного сигнала, Q-число элементов обучающей выборки, - необходимое число синаптических весов, - размерность входного сигнала.

В нашем случае, число нейронов в скрытом слое может принимать значения от 5-ти до 57-ми. Пусть число нейронов в скрытом слое будет равно 20-ти.


АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

Одним из главных свойств персептрона является его способность к обобщению, то есть правильную реакцию на данные, которых не было в обучающей выборке (ещё такие данные называют зашумлёнными).

Для того, чтобы ввести количественную оценку данного свойства, нам потребуются реальные данные, результаты которых мы знаем, но в обучающую выборку они не вошли. По аналогии с вычислением ошибки обучения персептрона мы можем посчитать ошибку обобщения персептрона, заменив в формуле векторы из обучающей выборки на векторы из тестирующей выборки. Формула будет выглядеть следующим образом:

,

где d и y – это векторы, полученные на основе тестируемой выборки, Q – это количество элементов в ней, а M – это число выходных нейронов.

Результаты вычислений этой оценки приведены ниже на графике. Данные вычисления производились при различных скоростях обучения
(η = 0,1 и η = 0, 25), и с одинаковым количеством эпох обучения, равным 1000.

На данном рисунке по горизонтальной оси отложено число нейронов в скрытом слое, а по вертикали значение ошибки обобщения персептрона.

Глядя на этот график, мы можем видеть, что с ростом числа нейронов скрытого слоя, уменьшается погрешность обобщения, но только до какого-то определённого значения, после которого ошибка снова начинает увеличиваться.


ЗАКЛЮЧЕНИЕ

Подведём итог проделанной работы. В ходе её выполнения мне удалось создать персептрон с одним скрытым слоем, 14-ю входами, 3-мя выходами, с сигмоидной активационной функцией. При тестировании созданного приложения, я смог убедиться, что мадалайн успешно решает поставленную задачу. Подав на вход персептрона сигналы, которых не было в обучающей выборке, на выходе мы получаем адекватные результаты, то есть соответствующие действительности букмекерские коэффициенты на  реальные матчи чемпионата мира по хоккею 2007. То есть применение нейросетевых технологий в выбранной области можно считать перспективным. И если продолжить исследование в данной сфере, в итоге можно получить программу, успешно заменяющую целый штат сотрудников букмекерской конторы.


СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

2. Ясницкий Л.Н. Введение в искусственный интеллект. М.: Издательский центр «Академия», 2005.

14

1

2

2

1

Рис. 1. Схема нейронной сети для решения поставленной задачи

20

EMBED Excel.Chart.8 \s    Рис. 3. График ошибки обобщения персептрона.

1

19

2

3


 

А также другие работы, которые могут Вас заинтересовать

44829. Источники загрязнения 27.5 KB
  В сельском хозяйстве следует сократить непроизводительное расходование воды в орошаемом земледелии реконструировать действующие ирригационные системы в целях снижения расхода воды. В коммунальном хозяйстве необходимо повысить технический уровень эксплуатации систем водоснабжения реконструировать их сократив удельный расход воды.
44830. Охрана природных вод от загрязнения 28.5 KB
  Водный кодекс. Цели водопользования: для целей питьевого и хозбыт водоснабжения сброса сточн вод и дренажных вод произва электрич Е водн и воздушн транспорта сплава древесины и иных целей. Виды водопользования: 1 совместное водопользование; 2 обособленное водопользование может осущся на водн объектах находящихся в собстви физ лиц юр лиц в гос или муницип собствти и предоставленных для обеспечения обороны страны и безопасности госва гос или муниципальных нужд обеспечение кот исключает испе водных объектов др физ лицами юр...
44831. Эпоха Средневековья V – XVI 19.42 KB
  Опыт средневековой школы лёг в основу всех современных педагогических систем составил неотъемлемый пласт культуры. Монастырские школы были и начальными и средними и высшими осуществляли воспитание духовных феодалов. Затем стали образовываться церковно-приходские школы из которых впоследствии развились начальные народные школы. В монастырских и соборных школах существовали внутренние школы где обучались мальчики которых готовили к пострижению в монахи и внешние школы в которых учились дети мирян.
44833. UN fordert besseren Schutz vor Gefahren aus dem All 25.5 KB
  Аuch die Bevölkerung müss besser informiert werden. Dies ist die grobe Grenze b der mn im Flle eines Einschlgs mit weltweiten Konsequenzen rechnen muss. Die Wissenschftler wollen nun ein llgemeines Netzwerk und verschiedene interntionle Expertengruppen etblieren die im Flle verschiedener Szenrios ktiv werden können. Wenn es dnn eine Bedrohung gibt muss mn nur die Schublde öffnen und ht die richtige Mission prt sgte der Vorsitzende des UNktionstems für kosmische Objekte Sergio Cmcho.
44834. Виды строительной продукции и их характеристики 25.13 KB
  Строительная продукция вводимые в действие и принятые в установленном порядке новые реконструированные или капитальноотремонтированные здания и сооружения с завершенными в них работами по монтажу и испытанию оборудованию.Предупредительный текущий ремонт систематически проводимые работы по предупреждению износа и устранение мелких неисправностей. В их состав включаются затраты на строительномонтажные работы приобретение оборудования инвентаря прочие капитальные работы и затраты. Капитальные вложения состоят из следующих основных...
44835. Растворы 25.67 KB
  Определение концентрации кислоты методом титрования Перед началом титрования бюретку сполосните раствором щелочи выданным для работы. Для этого в пипетку с помощью груши наберите 10мл приготовленного раствора кислоты. Каждый раз перед титрованием новой пробы кислоты подливайте щелочь в бюретку до нулевой отметки или до того уровня с которого начали титровать в первом опыте. Результаты опыта занесите в таблицу 1 Рассчитайте нормальную концентрацию раствора кислоты используя закон эквивалентов: вещества взаимодействуют друг с другом в...
44836. История культурного развития средневековой Западной Европы 16.91 KB
  После сдачи экзамена ученик становился подмастерьем после того как находились деньги на открытие своей школы он получал статус мастера. Лишь к концу XV века церковь осознала это принялась открывать духовные семинарии и школыи т. Монастырские школы были начальными средними и высшими осуществляли воспитание феодалов....
44837. Основные принципы государственной политики в области обращения с отходами 26 KB
  Отходы производства и потребления далее отходы остатки сырья материалов полуфабрикатов иных изделий или продуктов которые образовались в процессе производства или потребления а также товары продукция утратившие свои потребительские свойства. Отходы в зависимости от степени негативного воздействия на окружающую среду подразделяются в соответствии с критериями установленными федеральным органом исполнительной власти осуществляющим государственное регулирование в области охраны окружающей среды на пять классов...