49072

Использование нейронных сетей при прогнозе стоимости подержанных автомобилей

Курсовая

Информатика, кибернетика и программирование

Нейронные сети неожиданно открыли возможности использования вычислений в сферах до этого относящихся лишь к области человеческого интеллекта возможности создания машин способность которых учиться и запоминать удивительным образом напоминает мыслительные процессы человека [9]. Своей популярностью искусственные нейронные сети ИНС обязаны уникальному свойству заложенных в них идей: они способны обучаться на множестве примеров впоследствии узнавая в потоке информации черты ранее встреченных образов и ситуаций. По своей природе...

Русский

2013-12-20

553 KB

8 чел.

Министерство образования и науки Российской Федерации

ГОУ ВПО Пермский государственный педагогический университет

Факультет информатики и экономики

Кафедра информатики и вычислительной техники

Курсовая работа по дисциплине

«Интеллектуальные информационные системы»

Тема: «Использование нейронных сетей при прогнозе стоимости подержанных автомобилей»

                                                    

                                                                    Исполнитель: студентка гр.1243

                                         Н. Е. Леонтьева

                                                       Научный руководитель:

                                                            профессор Л. Н. Ясницкий

                                                    

                                                                                                     

Пермь 2007

Содержание

Введение

Время - это одно из самых загадочных понятий, которые интересуют человека с древних времен. Понять и подчинить себе время человечество стремилось всегда, потому что знание будущего дает невиданную силу принятия решений в различных областях человеческой деятельности. Вопрос определения будущего был и остается актуальным по сегодняшний день. Большой интерес представляют задачи прогнозирования погоды по результатам соответствующих атмосферных измерений, селекционирования новых видов растений и животных, определений возможностей индивидуумов в определенных областях с помощью соответствующей системы контрольных тестов и т.д. Особое значение прогнозирование имеет в таких областях, как индустрия, экономика, коммерция (прогнозирование экономических показателей, динамики цен на тот или иной продукт, курса акций на какое-то время вперед и т.д.) [13].

Однако создать машину времени человек не может, мы знаем, что было в прошлом, но совершенно точно знать о положении вещей в будущем, - не дано никому из нас. Несмотря на это, люди всегда стремились предугадать будущее, применяя при этом самые различные способы. У людей с давних времен популярны народные приметы, математики используют формальные методы и способы прогнозирования - они применяют статистические и вероятностные характеристики, по которым возможно с определенной вероятностью утверждать, что будущее событие произойдет или нет.

Наряду с традиционными методами прогнозирования сегодня бурно развивается теория искусственных нейронных сетей, которая хорошо зарекомендовала себя в области управления, там, где необходимо применение человеческого интеллекта, в частности при решении задач прогнозирования.

Это научное направление родилось на стыке таких наук как нейробиология, химия, физика, математика, информатика, философия, психология и др. интерес к нейронным сетям был вызван как теоретическими, так и прикладными достижениями в этой области. Нейронные сети неожиданно открыли возможности использования вычислений в сферах, до этого относящихся лишь к области человеческого интеллекта, возможности создания машин, способность которых учиться и запоминать удивительным образом напоминает мыслительные процессы человека [9].

Своей популярностью искусственные нейронные сети (ИНС) обязаны уникальному свойству заложенных в них идей: они способны обучаться на множестве примеров, впоследствии «узнавая» в потоке информации черты ранее встреченных образов и ситуаций. По своей природе искусственные нейронные сети напоминают деятельность человеческого мозга. Благодаря этой способности нейронными сетями пользуются военные и политики, медики и финансисты, специалисты по обработке изображений и представители многих других профессий, имеющих дело с неполной, неточной и неподдающейся анализу информацией.

Целью данной курсовой работы является попытка применить нейронные сети для оценки стоимости подержанных автомобилей.

Задача состоит в предсказании цены на автомобиль с помощью учета ряда факторов, учитывающих модель, возраст и состояние автомобиля. Прогноз имеет значительное влияние на принятие решений в бизнесе.

Для достижения указанной цели необходимо решить следующие задачи:

- провести анализ проблемы прогнозирования;

- реализовать обучающие и тестовые примеры для выбранной модели.

Структура курсовой  работы выглядит так:  

-содержание;

-вступление;

-основная часть, которая состоит из двух разделов;

-выводы;

-список литературы.


Глава 1 Нейросетевые технологии 

1.1 История развития нейронных сетей 

Людей всегда интересовало их собственное мышление. Это думанье мозга о себе самом является, возможно, отличительной чертой человека. Имеется множество размышлений о природе мышления, простирающихся от духовных до анатомических. Обсуждение этого вопроса, протекавшее в горячих спорах философов и теологов с физиологами и анатомами, принесло мало пользы, так как сам предмет весьма труден для изучения. Те, кто опирался на самоанализ и размышление, пришли к выводам, не отвечающим уровню строгости физических наук. Экспериментаторы же нашли, что мозг труден для наблюдения и ставит в тупик своей организацией. Короче говоря, мощные методы научного исследования, изменившие наш взгляд на физическую реальность, оказались бессильными в понимании самого человека.

Нейробиологи и нейроанатомы достигли значительного прогресса. Усердно изучая структуру и функции нервной системы человека, они многое поняли в «электропроводке» мозга, но мало узнали о его функционировании. В процессе накопления ими знаний выяснилось, что мозг имеет ошеломляющую сложность. Сотни миллиардов нейронов, каждый из которых соединен с сотнями или тысячами других нейронов, образуют систему, далеко превосходящую наши самые смелые мечты о суперкомпьютерах.

Лучшее понимание функционирования нейрона и картины его связей позволило исследователям создать математические модели для проверки своих теорий. Эксперименты теперь могут проводиться на цифровых компьютерах без привлечения человека или животных, что решает многие практические и морально-этические проблемы. В первых же работах выяснилось, что эти модели не только повторяют функции мозга, но и способны выполнять функции, имеющие свою собственную ценность. Поэтому возникли и остаются в настоящее время две взаимно обогащающие друг друга цели нейронного моделирования: первая – понять функционирование нервной системы человека на уровне физиологии и психологии и вторая – создать вычислительные системы (искусственные нейронные сети), выполняющие функции, сходные с функциями мозга.

Параллельно с прогрессом в нейроанатомии и нейрофизиологии психологами были созданы модели человеческого обучения. Одной из таких моделей, оказавшейся наиболее плодотворной, была модель Д. Хэбба, который в 1949г. предложил закон обучения, явившийся стартовой точкой для алгоритмов обучения искусственных нейронных сетей. Дополненный сегодня множеством других методов он продемонстрировал ученым того времени, как сеть нейронов может обучаться.

В пятидесятые и шестидесятые годы группа исследователей, объединив эти биологические и физиологические подходы, создала первые искусственные нейронные сети. Выполненные первоначально как электронные сети, они были позднее перенесены в более гибкую среду компьютерного моделирования, сохранившуюся и в настоящее время. Первые успехи вызвали взрыв активности и оптимизма. Минский, Розенблатт, Уидроу и другие разработали сети, состоящие из одного слоя искусственных нейронов. Часто называемые персептронами, они были использованы для такого широкого класса задач, как предсказание погоды, анализ электрокардиограмм и искусственное зрение. В течение некоторого времени казалось, что ключ к интеллекту найден, и воспроизведение человеческого мозга является лишь вопросом конструирования достаточно большой сети.

Но эта иллюзия скоро рассеялась. Нейросети не могли решать задачи, внешне весьма сходные с теми, которые они успешно решали. С этих необъяснимых неудач начался период интенсивного анализа. М.Минский, используя точные математические методы, строго доказал ряд теорем, относящихся к функционированию сетей. Его исследования привели к написанию книги, в которой он вместе с Пайпертом доказал, что используемые в то время однослойные сети теоретически неспособны решить многие простые задачи, в том числе реализовать функцию «Исключающее ИЛИ». Минский также не был оптимистичен относительно потенциально возможного здесь прогресса.

Блеск и строгость аргументации Минского, а также его престиж породили огромное доверие к книге – ее выводы были неуязвимы. Разочарованные исследователи оставили поле исследований ради более обещающих областей, а правительства перераспределили свои субсидии, и искусственные нейронные сети были забыты почти на два десятилетия.

Однако несколько наиболее настойчивых ученых, таких как Кохонен, Гроссберг, Андерсон продолжили исследования. Наряду с плохим финансированием и недостаточной оценкой, ряд исследователей испытывал затруднения с публикациями. Поэтому исследования, опубликованные в семидесятых и начале восьмидесятых годов, разбросаны в массе различных журналов, некоторые из которых малоизвестны. Постепенно появился теоретический фундамент, на основе которого сегодня конструируются наиболее мощные многослойные сети. За последние несколько лет теория стала применяться в прикладных областях, и появились новые корпорации, занимающиеся коммерческим использованием этой технологии [13].

1.2 Биологическая  нейронная сеть

Нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Все процессы передачи раздражений от нашей кожи, ушей и глаз к мозгу, процессы мышления и управления действиями - все это реализовано в живом организме как передача электрических импульсов между нейронами. Рассмотрим строение биологического нейрона. Каждый нейрон имеет отростки нервных волокон двух типов - дендриты, по которым принимаются импульсы, и единственный аксон, по которому нейрон может передавать импульс. Аксон контактирует с дендритами других нейронов через специальные образования - синапсы, которые влияют на силу импульса.

Рис. 1 Биологическая нейронная сеть

Можно считать, что при прохождении синапса сила импульса меняется в определенное число раз, которое мы будем называть весом синапса. Импульсы, поступившие к нейрону одновременно по нескольким дендритам, суммируются. Если суммарный импульс превышает некоторый порог, нейрон возбуждается, формирует собственный импульс и передает его далее по аксону. Важно отметить, что веса синапсов могут изменяться со временем, а значит, меняется и поведение соответствующего нейрона. Нетрудно построить математическую модель описанного процесса.

Рис. 2 Модель нейрона с тремя входами

На рисунке 2 изображена модель нейрона с тремя входами (дендритами), причем синапсы этих дендритов имеют веса w1, w2, w3. Пусть к синапсам поступают импульсы силы x1, x2, x3 соответственно, тогда после прохождения синапсов и дендритов к нейрону поступают импульсы w1x1, w2x2, w3x3. Нейрон преобразует полученный суммарный импульс x=w1x1+ w2x2+ w3x3 в соответствии с некоторой передаточной функцией f(x). Сила выходного импульса равна y = f(x) = f(w1x1 + w2x2 + w3x3).

Таким образом, нейрон полностью описывается своими весами wk и передаточной функцией f(x). Получив набор чисел (вектор) xk в качестве входов, нейрон выдает некоторое число y на выходе [12].

1.3 Искусственная нейронная сеть и ее обучение

Искусственная нейронная сеть (ИНС, нейронная сеть) - это набор нейронов, соединенных между собой. Как правило, передаточные функции всех нейронов в нейронной сети фиксированы, а веса являются параметрами нейронной сети и могут изменяться. Некоторые входы нейронов помечены как внешние входы нейронной сети, а некоторые выходы - как внешние выходы нейронной сети. Подавая любые числа на входы нейронной сети, мы получаем какой-то набор чисел на выходах нейронной сети. Таким образом, работа нейронной сети состоит в преобразовании входного вектора в выходной вектор, причем это преобразование задается весами нейронной сети [13].

Среди всех интересных свойств искусственных нейронных сетей ни одно не захватывает так воображения, как их способность к обучению. Их обучение до такой степени напоминает процесс интеллектуального развития человеческой личности, что может показаться, что достигнуто глубокое понимание этого процесса. Возможности обучения искусственных нейронных сетей ограниченны, и нужно решить много сложных задач, чтобы определить, на правильном ли пути мы находимся.

Нейросеть обучается, чтобы для некоторого множества входов давать желаемое (или, по крайней мере, сообразное с ним) множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал выходной вектор [8].

Различают стратегии обучения: "обучение с учителем" и "обучение без учителя". "Обучение с учителем" предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно нейросеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход нейросети и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в сеть и веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, вычисляются ошибки и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня.

Несмотря на многочисленные прикладные достижения, обучение с учителем критиковалось за свою биологическую неправдоподобность. Трудно вообразить обучающий механизм в мозге, который бы сравнивал желаемые и действительные значения выходов, выполняя коррекцию с помощью обратной связи. Если допустить подобный механизм в мозге, то откуда тогда возникают желаемые выходы? Обучение без учителя является намного более правдоподобной моделью обучения в биологической системе. Развитая Кохоненом и многими другими, она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса нейросети так, чтобы получались согласованные выходные векторы, т. е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов. Следовательно, выходы подобной сети должны трансформироваться в некоторую понятную форму, обусловленную процессом обучения. Это не является серьезной проблемой. Обычно не сложно идентифицировать связь между входом и выходом, установленную сетью.

Большинство современных алгоритмов обучения выросло из концепций Хэбба. Им предложена модель обучения без учителя, в которой синаптическая сила (вес) возрастает, если активированы оба нейрона, источник и приемник. Таким образом, часто используемые пути в сети усиливаются, и феномен привычки и обучения через повторение получает объяснение.

Оказывается, что после многократного предъявления примеров веса нейронной сети стабилизируются, причем нейронная сеть дает правильные ответы на все (или почти все) примеры из базы данных. В таком случае говорят, что "нейронная сеть выучила все примеры", "нейронная сеть обучена", или "нейронная сеть натренирована". В программных реализациях можно видеть, что в процессе обучения величина ошибки (сумма квадратов ошибок по всем выходам) постепенно уменьшается. Когда величина ошибки достигает нуля или приемлемого малого уровня, тренировку останавливают, а полученную нейронную сеть считают натренированной и готовой к применению на новых данных.

   Важно отметить, что вся информация, которую нейронная сеть имеет о задаче, содержится в наборе примеров. Поэтому качество обучения нейронной сети напрямую зависит от количества примеров в обучающей выборке, а также от того, насколько полно эти примеры описывают данную задачу. Так, например, бессмысленно использовать нейронную сеть для предсказания финансового кризиса, если в обучающей выборке кризисов не представлено. Считается, что для полноценной тренировки нейронной сети требуется хотя бы несколько десятков (а лучше сотен) примеров [9].

Таким образом, обучение нейронных сетей - сложный и наукоемкий процесс. Алгоритмы обучения нейронных сетей имеют различные параметры и настройки, для управления которыми требуется понимание их влияния.

1.4 Области применения нейронных сетей

Нейронные сети представляют собой мощный технологичный метод анализа и могут стать неоценимым инструментом в торговом арсенале. Также как и любой другой метод, нейросети имеют свои ограничения и преимущества. При этом они обладают уникальным свойством отслеживать едва уловимые взаимосвязи в доступных данных, чего не позволяет сделать ни один другой метод. Кроме того, их способность строить прогнозы, основываясь на данных анализа, выводит нейросети в разряд абсолютно уникальных методов и инструментов.

В настоящее время нейронные сети применяются для решения многих неформализуемых или трудно формализуемых задач:

  •  распознавания и синтеза речи;
  •  распознавания аэрокосмических изображений;
  •  прогнозирования котировки ценных бумаг и курса валют;
  •  предупреждения мошенничества с кредитными карточками;
  •  оценки стоимости недвижимости;
  •  оценки финансового состояния предприятий и риска невозврата кредитов;
  •  обработки радиолокационных сигналов;
  •  контроля движения на скоростных автомагистралях и железных дорогах;
  •  диагностики в медицине;
  •  добычи знаний из больших объемов данных в бизнесе, финансах и научных исследованиях;
  •  отслеживания межрыночных взаимосвязей.

Другими словами, можно получить инструмент, намного более эффективный, чем классические методики технического анализа для случаев, когда на рынке много шума или когда взаимосвязь данных не является очевидной и линейной. В данном случае нейросети могут решить проблему намного лучше, чем классическая статистика.

Нейросети необходимо комбинировать с другими инструментами технического анализа, а, кроме того, крайне важно особое внимание уделять подготовке данных (именно эта процедура является ключом к успеху при использовании нейростей). Поняв это, можно использовать нейросети эффективно, но для этого нужно время и опыт.

Нейронные сети можно использовать при следующих условиях:

  •  Если задачу может решать человек.
  •  Если при решении задачи можно выделить множество входных факторов (сигналов, признаков, данных и т.п.) и множество выходных факторов.
  •  Если изменения входных факторов приводит к изменению выходных.

   В то же время применение нейронных сетей при решении некоторых задач может оказаться эффективнее использования разума человека. Это объясняется тем, что человеческий разум ориентирован на решение задач в трехмерном пространстве. Многомерные задачи для него характеризуются значительно большей трудоемкостью. Искусственным нейронным сетям не свойственно такое ограничение. Им все равно решать трехмерную или 10-мерную задачу. [15]

   Место нейросетевой технологии среди других методов обработки данных показано на рисунке 3.

Рис. 3 Область использования нейронных сетей

  

При применении нейронных сетей необходимо решить следующие задачи:

  1.  Постановка задачи, пригодной для решения с помощью нейронной сети.
  2.  Выбор модели ИНС.
  3.  Подготовка исходных данных для обучения ИНС.
  4.  Обучение ИНС.
  5.  Собственно решение задачи с помощью обученной ИНС

   Кроме того, иногда нужен еще один этап – интерпретация решения, полученного нейронной сетью. [14]

Глава 2 Использование искусственных нейронных сетей при оценке стоимости подержанных автомобилей

2.1 Общая характеристика рынка подержанных автомобилей в России

В настоящее время рынок автотранспорта стремительно развивается. Покупка - продажа подержанных автомобилей - бизнес, пользующийся особым интересом россиян. В условиях свободного рынка и жесткой конкуренции производители транспортных средств буквально ошеломляют потенциального покупателя рекламой о надежности, долговечности и прочих преимуществ. Если с новым транспортом все понятно, то с транспортом, бывшим в эксплуатации, возникают вопросы, а действительно ли объявленная стоимость продавцом соответствует рыночной. Естественно, на рынке подержанных автомобилей встречаются и битые машины, и подержанные авто из "плохих рук" - машины, за которыми не следили их владельцы (не меняли масло, тормозную жидкость и прочее). Поэтому, приобретая поддержанные автомобили, следует проводить детальную предварительную диагностику и доверять выбор подержанного авто исключительно профессионалам (способным распознать тщательно перекрашенные битые машины, "топляки" и т.п.). Оценка транспортных средств это определение стоимости данного транспорта с учетом его технического состояния, физического и функционального износа [11].

Как и при оценке других видов активов, оценка автотранспорта необходима при решении ряда ситуаций, возникающих в жизни компаний и отдельного человека. Оценка автомобилей необходима при решении имущественных споров (при разводе, при наследовании и т.п.), для цели определении стартовой цены на аукционе, при продаже, для определения залоговой стоимости автомобиля, а также в других ситуациях, когда отчет об оценке послужит доказательством рыночной стоимости автомобиля [17].

Внутренний рынок вторичных автомобилей в России растет невиданно быстрыми темпами: только в столице каждый день прибавляется примерно по 500 таких машин. Во многом благодаря этому рынки под открытым небом, равно как и официальные дилеры, продают порядка 90-100 авто с пробегом ежедневно.

При этом авторынки имеют такое большое преимущество перед салонами, как большой выбор авто. Так, всего лишь за месяц через один такой рынок проходит несколько тысяч комиссионных автомобилей разных годов выпуска, цветов и комплектаций, в то время как ассортимент автодилера может быть в десятки (!) раз меньше [11].

Рис. 4 Соотношение продаж новых и подержанных отечественных автомобилей  в 1999-2006 гг., тыс. шт. [18].

С теоретической стороны: основой любых методик по определению стоимости автомобиля является расчет и коррекция цены в зависимости от основных ценообразующих факторов, таких как год выпуска, пробег, фактор износа и техническое состояние автомобиля.

Чаще всего, оценщику приходится иметь дело с автотранспортом, имеющим ту или иную степень износа, причем как физического, так и функционального. Сам по себе рынок транспортных средств весьма подвижен, это вызвано систематическим обновлением и появлением новых моделей взамен морально устаревших. Все эти факторы, которые влияют на стоимость транспорта, будут учтены в процессе оценки.

Основными ситуациями оценки стоимости автотранспорта являются:

  •  оценка стоимости автотранспорта при купле - продаже;
  •  оценка стоимости автотранспорта при залоге;
  •  оценка стоимости автотранспорта при переоценке;
  •  оценка стоимости автотранспорта при разделе имущества [17].

2.2 Проектирование нейронной сети

Наиболее трудоемкими процессами при использовании нейронных сетей являются подготовка исходных данных для обучения и обучение нейронной сети. Качество прогнозируемого результата зависит от качества нейросети только на 10-15 %. Остальное зависит от того, насколько хорошо были подготовлены данные [12]. Выборка данных должна быть репрезентативной. Они должны включать все важные факторы, влияющие на рынок.

От удачного подбора обучающих примеров во многом зависит успех создания нейронной сети, адекватно моделирующей предметную область.

Оценка стоимости подержанных автомобилей производится с помощью учета ряда факторов, учитывающих возраст, величину пробега, износ и техническое состояние автомобиля. Рассмотрим автомобили с пробегом семейства Нива. Данные были заимствованы с различных автомобильных интернет-ресурсов России [2,3,4,5,6]. Возьмем сто обучающих примеров. Каждый пример состоит из двадцати одного числа: двадцати входных параметров автомобиля и цены, за которую удалось его продать.

Входные параметры:

X1 – модель автомобиля

X2 – год выпуска

X3 – пробег

X4 – защита подкрылок

X5 – защита днища

X6 – износ резины

X7 – работа амортизаторов

X8 – износ рулевых тяг

X9 – износ подшипников переднего моста

X10 –износ подшипников заднего моста

X11 – износ шестеренок переднего моста

X12 – износ шестеренок заднего моста

X13 – износ шаровых опор

X14 – оценка технического состояния

X15 – оценка внешнего вида

X16 – установка газового оборудования

X17 – наличие сигнализации

X18 – наличие магнитолы

X19 – был ли автомобиль в аварии

X20 – наличие деформации

Выходной параметр:

Y – цена автомобиля

Сведения об оцененных автомобилях представлены в табл.1:

Таблица 1.

Сведения об оцененных автомобилях

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

x14

x15

x16

x17

x18

x19

x20

y

21213

1996

78000

1

1

1

0

0

1

1

1

0

1

3

2

0

1

1

1

0

53000

21214

1998

245000

1

0

0

0

1

1

0

1

1

0

3

4

0

1

1

1

0

70500

21217

1992

30000

0

0

0

1

1

0

0

0

0

0

4

4

0

1

1

0

1

60000

2129

1999

56000

0

1

0

0

0

0

1

1

0

1

4

5

0

0

0

1

0

48500

2130

1995

13500

1

1

0

1

0

1

0

0

1

1

4

2

1

0

1

0

0

97000

2131

1998

64250

0

0

1

1

1

0

1

0

1

1

3

5

0

0

0

0

1

115000

21217

2001

120000

1

0

1

0

1

1

1

0

1

0

4

5

0

0

0

0

0

83000

21217

2000

27000

1

1

0

1

1

0

0

1

0

1

3

2

1

0

1

1

1

128000

21213

1994

450000

1

0

0

1

0

1

0

0

0

0

2

3

0

1

1

0

1

158000

2131

1995

72000

0

0

1

1

0

1

1

0

0

0

4

4

1

0

0

0

0

72000

21312

2005

5000

1

0

0

0

1

1

0

1

0

0

5

3

0

0

1

0

0

60000

21214

2000

37900

1

1

0

1

0

0

0

1

1

0

4

3

0

1

1

1

0

55000

2129

2002

13000

1

0

0

1

1

0

1

0

0

1

3

4

0

1

0

0

0

140000

2131

1998

10000

0

1

0

1

0

1

1

1

0

0

5

5

0

0

1

0

1

70000

21213

1997

560000

0

1

1

0

0

0

0

0

1

1

2

2

0

0

1

0

1

100000

2130

1997

41000

0

0

1

0

0

1

0

1

0

0

3

4

0

1

1

1

0

120000

2129

1999

27000

1

1

0

1

1

0

1

1

0

1

3

3

1

1

0

0

0

90900

21213

1992

380000

0

0

1

0

1

0

1

1

0

0

2

4

1

0

0

0

0

85000

21214

1980

69200

1

0

0

1

0

0

1

0

0

0

4

3

0

0

1

0

1

190000

21217

1986

9000

1

0

0

1

0

1

1

0

1

0

4

2

0

0

0

0

0

85000

21312

2005

5400

1

1

0

0

0

1

0

0

1

0

5

4

0

1

0

0

0

110000

21214

1994

830000

0

1

1

1

1

1

0

1

0

1

2

5

1

1

1

0

1

139000

2130

2005

15200

1

0

0

0

0

1

0

1

1

1

5

4

0

1

0

1

0

51000

21312

2006

2300

0

1

0

1

1

0

1

0

1

0

5

2

0

0

0

0

1

70000

21214

1993

455000

0

0

0

1

0

0

1

1

1

0

2

3

0

1

1

1

0

160000

2130

1990

86000

0

1

1

1

1

0

1

0

0

1

3

3

0

1

0

1

0

125000

21213

2000

249000

1

0

1

1

0

1

0

1

0

0

4

5

0

0

1

0

0

70900

2129

1999

320000

0

0

1

0

0

0

0

0

1

1

3

4

0

1

0

0

1

85000

21213

2004

21000

1

1

0

1

0

0

0

0

0

1

3

4

1

1

0

0

0

62000

2131

2000

18000

1

1

0

1

1

0

0

0

1

1

4

3

0

0

1

1

0

56000

2130

1996

72000

1

1

1

1

1

1

1

1

1

1

5

4

0

0

0

0

1

125000

21312

2006

12000

1

0

0

1

1

0

1

0

1

1

2

3

1

1

0

0

0

80000

2130

1995

68000

1

1

0

0

0

1

1

1

0

1

4

5

0

1

1

1

0

110000

21214

1998

32000

1

1

0

0

0

0

0

1

0

0

5

2

1

1

0

1

1

55000

21213

1978

65000

0

0

1

1

0

1

1

1

1

0

3

4

1

1

1

0

0

140000

2129

1995

127000

1

0

1

0

1

1

0

0

0

0

5

4

1

1

1

1

1

74000

2131

1999

140000

1

1

0

1

1

1

1

1

1

1

4

3

0

0

0

0

1

83000

21214

1993

230000

0

0

1

0

1

0

1

0

0

1

4

3

0

0

0

1

1

128000

21213

1980

300000

0

1

0

1

0

0

1

1

0

0

3

3

1

1

0

0

1

158000

21214

1994

43000

0

1

1

1

1

1

0

0

1

0

5

5

0

0

0

0

0

72000

21217

1990

76000

0

1

1

0

0

0

0

0

1

1

4

3

1

1

1

1

1

55000

21312

2002

45000

1

1

0

1

1

1

1

0

1

1

4

2

0

1

1

1

1

48000

21213

1990

300000

0

0

1

0

1

1

0

1

1

0

3

3

0

1

0

1

0

115000

2130

1994

480000

1

0

0

1

0

1

0

1

0

0

4

3

0

0

0

0

0

170000

2129

1995

80000

0

1

1

0

1

0

1

0

0

1

3

3

1

0

0

1

0

142000

2131

2002

32000

0

0

1

0

1

1

0

0

1

0

5

5

1

1

1

1

1

84000

21214

1994

43000

1

1

1

1

1

0

1

0

0

1

2

2

1

0

0

0

0

60000

21213

1995

58000

1

0

0

1

1

0

1

1

0

0

4

2

1

0

0

0

0

71000

2130

1999

50000

1

1

0

1

0

0

1

1

1

1

3

4

0

0

1

0

1

82000

21214

1999

190000

0

1

1

0

1

1

0

1

0

0

3

3

0

1

0

1

0

65000

21214

1996

84000

0

0

0

0

0

1

0

0

1

0

3

4

0

0

1

0

1

53000

21217

1995

32000

1

0

0

0

1

0

1

0

1

0

4

3

0

1

0

0

1

160000

2130

2000

420000

0

0

0

0

1

1

1

0

1

1

5

4

0

1

1

1

1

125000

21213

1996

325000

1

1

1

1

0

0

1

0

1

1

4

3

1

0

1

0

0

76000

2130

1993

64000

1

0

0

1

1

1

1

1

0

1

4

4

1

1

1

1

0

150000

21214

1997

68000

1

1

1

0

1

0

0

1

0

0

5

3

1

0

0

1

1

130000

2131

2002

21000

0

1

0

1

1

1

0

0

0

0

3

4

1

0

0

0

0

62000

21217

2001

30000

0

1

0

1

1

1

1

0

1

1

2

3

1

0

1

0

1

90000

21213

1998

200000

0

0

1

0

0

0

0

1

1

1

3

4

1

1

0

1

0

45000

2130

1992

350000

1

0

1

1

1

0

1

1

1

0

3

2

0

1

0

0

0

86000

21214

2001

90000

0

1

1

0

1

0

0

1

0

0

5

3

0

0

0

1

0

125000

2130

1998

54000

1

0

1

1

0

0

1

0

0

1

4

4

0

1

1

0

0

140000

2131

2005

12000

1

1

1

1

1

0

1

0

1

1

4

3

0

0

0

1

1

84000

21213

2000

22000

1

1

1

0

0

1

1

1

1

0

3

3

0

1

1

1

1

95000

2130

1999

72000

0

1

0

1

1

0

0

0

1

1

4

3

1

0

1

1

0

100000

21214

2004

200000

1

0

0

0

0

1

0

0

1

1

5

4

1

0

0

0

0

120000

2130

1997

350000

0

1

0

1

0

1

0

1

1

0

4

4

1

1

1

0

0

80000

21312

1991

270000

1

0

1

0

0

1

1

1

0

0

3

4

1

1

0

1

1

55000

21213

2001

61000

0

1

1

1

1

1

0

0

0

0

4

5

0

1

0

1

0

48000

2130

1999

89000

0

1

1

0

1

1

0

0

0

1

3

3

1

0

0

0

0

115000

21214

2002

37000

1

1

1

1

1

0

1

0

1

0

5

5

1

1

1

1

1

156000

21214

2002

54000

1

0

1

0

0

1

0

0

0

1

3

4

1

1

1

1

0

80000

2131

2005

18000

0

1

1

0

0

0

1

0

1

1

3

4

1

0

1

0

1

59000

21214

2003

60000

0

1

1

1

1

0

1

0

1

0

4

3

0

0

1

0

0

98000

21213

1994

25000

0

1

0

0

0

1

1

0

1

0

4

5

1

0

0

0

1

129000

21217

2000

45000

0

1

1

1

1

0

1

1

1

0

4

4

1

1

0

1

1

84000

21213

1998

28000

1

0

0

0

0

1

0

1

0

0

5

4

0

0

1

0

1

60000

2129

2004

17000

0

0

0

1

0

0

0

1

0

1

3

3

1

0

1

0

0

75000

21214

1994

420000

0

0

1

0

1

1

0

1

1

1

2

4

0

1

1

0

0

69000

2130

2000

25000

0

1

0

0

1

1

0

1

1

1

3

3

0

0

1

0

0

64000

2129

2000

19000

0

1

1

1

1

1

1

1

0

0

3

5

0

1

0

0

0

89000

2131

2005

21000

1

1

0

1

1

0

1

0

1

0

3

3

0

1

1

0

0

125000

21213

2002

85000

0

1

1

1

0

0

0

0

1

1

5

5

1

1

0

1

1

80000

21217

2000

20000

1

0

1

1

0

0

0

0

1

1

2

4

0

0

0

0

1

110000

21213

1994

63000

0

1

1

1

1

1

0

0

0

1

2

4

0

0

1

0

1

170000

2129

2006

8000

0

0

0

0

1

0

1

0

0

1

4

3

0

1

1

1

1

156000

21217

1992

70000

1

0

0

1

0

1

1

1

0

0

3

4

0

0

1

0

0

48000

2131

1996

120000

0

1

0

1

0

0

0

1

0

1

4

5

1

1

1

1

0

59000

2131

2001

86000

1

1

1

1

0

1

1

1

1

0

3

4

0

0

0

1

1

70000

21213

1994

140000

0

1

1

1

1

0

1

1

1

1

4

3

1

0

0

1

1

152000

21312

2004

18000

1

0

1

1

1

1

1

0

1

1

3

4

0

1

1

0

1

120000

21217

2002

21000

0

0

1

1

1

1

1

1

0

1

4

5

0

1

0

0

1

95000

2129

1995

52000

1

1

0

1

1

1

1

1

1

0

3

2

1

1

1

1

0

50000

21213

1996

130000

0

0

1

0

1

0

0

1

0

0

4

4

0

1

0

0

1

152000

2131

1998

150000

1

1

1

0

1

0

0

1

1

1

3

5

1

0

1

1

0

110000

21213

1990

240000

0

1

1

0

0

0

1

0

0

0

4

3

0

1

1

0

0

67000

21213

2001

143000

0

1

0

0

0

1

0

1

1

1

2

5

1

0

1

0

1

80000

21312

2003

110000

0

0

1

0

0

0

1

1

0

0

3

4

0

0

0

0

1

85000

2131

2005

70000

0

0

0

1

1

1

1

0

0

1

4

4

1

1

0

1

1

125000

21213

1999

165000

1

1

1

1

0

0

0

1

0

0

3

3

0

1

1

1

1

90000

 

Будем использовать  нейросимулятор версии v 1.0, разработанный студентом четвертого курса механико-математического факультета ПГУ Черепановым Федором. Возьмем один скрытый слой нейронов.

Персептрон должен не только правильно реагировать на примеры, на которых он обучен, но и уметь обобщать приобретенные знания, т.е. правильно  реагировать на примеры, которых в обучающей выборке не было.

Чтобы оценить способность сети к обобщению, вводим  некоторое количество тестовых примеров, которые относятся к той же предметной области, но в процессе обучения не участвуют. Данные представлены в табл.2:

Таблица 2.

Данные тестируемой выборки

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

x13

x14

x15

x16

x17

x18

x19

x20

y

21213

2000

140000

0

0

0

0

1

1

1

1

0

1

4

4

0

0

0

1

1

45000

21214

2002

65000

0

1

0

0

1

0

0

0

1

0

3

4

0

1

1

0

0

158000

21217

2004

70000

1

0

0

0

0

1

1

1

1

0

4

5

1

0

1

0

0

215000

После обучения вычисляем среднеквадратичную погрешность между выданным прогнозом сети  и желаемым выходом. Среднеквадратичная погрешность обучения персептрона E, вычисленная на обучающей выборке представлена в табл.3:

Таблица 3.

Среднеквадратичная погрешность, вычисленная на обучающей выборке

Обучение

1

2

3

4

5

6

7

8

9

y

59963

58559

57333

68214

47207

52695

46364

25977

62709

Обучение

10

11

12

13

14

15

16

17

18

y

35300

55623

17949

40731

24754

15323

4575

5087

3200

А вычисленная на тестовой выборке  - погрешность обобщения Eт представлена в табл.4:

Таблица 4.

Среднеквадратичная погрешность, вычисленная на тестовой выборке

Тест

1

2

3

4

5

6

7

8

9

y

50379

61668

63494

62121

69489

82386

96884

88434

83784

Тест

10

11

12

13

14

15

16

17

18

y

18295

59945

85066

169191

57705

112196

83767

135459

75466

При увеличении числа нейронов внутренних слоев персептрона погрешность обучения E  падает, тогда как погрешность обобщения Eт сначала падает, а затем, начиная с некоторого оптимального значения  возрастает.

рис.5 Характерные кривые зависимости погрешностей обучения и обобщения от числа нейронов внутренних слоев персептрона

Наш персептрон выдает наиболее достоверную информацию при 10 нейронах.

Проведем попытку оптимизации нейросети. Рассмотрим объектную модель, позволяющую включать в состав сведений об автомобилях лишь описание тех параметров, которые являются основными и самыми важными. Уменьшим количество входных данных до пяти. Исключим из выборки те характеристики продаваемых автомобилей, которые указывают на наличие конкретных параметров износа. В результате оценка стоимости подержанных автомобилей будет производиться с помощью таких входных параметров как:

  1.  Модель автомобиля
  2.  Год выпуска
  3.  Пробег
  4.  Оценка технического состояния
  5.  Оценка внешнего вида   

Таким образом, видно, что для одной и той же предметной области можно построить различные объектные модели отличающиеся, помимо прочего, той или иной степенью адекватности.

Далее проводим обучение персептрона и анализируем полученные результаты.

Среднеквадратичная погрешность персептрона, вычисленная на обучающей выборке E представлена в табл.5:

Таблица 5.

Среднеквадратичная погрешность, вычисленная на обучающей выборке

Обучение

1

2

3

4

5

6

7

8

9

y

94000

79284

75587

78426

70584

71959

82705

72159

71326

Обучение

10

11

12

13

14

15

16

17

18

y

69027

62304

73736

69684

56354

58998

58881

73632

67682

Среднеквадратичная погрешность персептрона, вычисленная на тесовой выборке  - погрешность обобщения Eт представлена в табл.6:

Таблица 6.

Среднеквадратичная погрешность, вычисленная на тестовой выборке

Тест

1

2

3

4

5

6

7

8

9

y

81682

69535

68994

59134

89940

80182

124156

125127

111504

Тест

10

11

12

13

14

15

16

17

18

y

26416

105226

119552

134387

135114

148351

158762

174340

199867

Характерные кривые зависимости погрешностей обучения и обобщения от числа нейронов внутренних слоев персептрона приведены на рисунке 6.

рис.6 Характерные кривые зависимости погрешностей обучения и обобщения от числа нейронов внутренних слоев персептрона

Предсказанные нейросимулятором значения цен на автомобили, значительно отличаются от реальных цен. Построенная сеть с пятью входными параметрами дает наименее качественную оценку, по сравнению с первой моделью. Увеличение ошибки прогноза говорит о том, что удаленные из первоначальной выборки входные параметры являются значащими и играют важную роль в прогнозировании цены.

Как видно из этого примера, качество прогноза зависит от полноты учета факторов, влияющих  на результат, то есть выбранного нами количества входов нейронной сети. Если сделать 20 входов, то такая нейронная сеть потенциально может строить лучший прогноз, чем нейронная сеть с 5 входами. При выборе числа входов нейронной сети следует учитывать это, выбирая разумный компромисс между глубиной предсказания (число входов нейронной сети) и качеством обучения нейронной сети (объем тренировочного набора).

Заключение

В наш век невиданного раннее технологического прогресса множество технологических новинок проходят мимо нас незамеченными, либо, наоборот, повсеместно возносятся на щит и становятся тотемами, привлекающими огромное количество почитателей. Поскольку популярные технологические средства могут быть использованы в бизнесе и, повлиять на него, жизненно важно собрать про эти явления максимально доступное количество информации, перед тем, как начинать работать с этими технологиями. Нужно знать, что можно ожидать от этой технологии и чего стоит опасаться при ее использовании. Одной из таких популярных технологий в настоящее время являются нейросети [13].

Чтобы понять, что могут и чего не могут нейросети, надо четко знать, что они представляют собой. Нейросети – это алгоритм, с большой долей неточности, имитирующие нервную деятельность живых существ. При помощи нейросетей можно идентифицировать и использовать огромное количество взаимосвязей в данных, которые, обычно, спрятаны от глаз человека в связи с большой сложностью и нелинейностью данных. Это подтверждается тем, что нейросети используются в огромном количестве сфер человеческой деятельности.

При помощи нейросетей можно с определенной долей вероятности делать прогнозы, которые помогут принять лучшее торговое решение. При этом даже при ограниченности возможностей нейросетей, они являются одним из наиболее эффективных инструментов рыночного анализа.

Самый надежный и быстрый способ продать автомобиль – реализовать его по рыночной цене, а для этого необходимо произвести оценку стоимости автомобиля.

В работе была продемонстрирована попытка применения нейросимулятора для оценки стоимости подержанных автомобилей. Хороший результат показал, что искусственные нейронные сети способны к решению задач прогнозирования цены. Персептрон правильно среагировал на обучающие примеры, обобщил приобретенные знания и сумел с наименьшей ошибкой предсказать цену на автомобиль. Таким образом, цель данного курсового проекта достигнута.

Список литературы

  1.  Ясницкий Л.Н. Введение в искусственный интеллект: Учеб. пособие для студ. высш. учеб. Заведений/ Леонид Нахимович Ясницкий. – М.: Издательский центр «Академия», 2005.
  2.  http://www.irr.ru/
  3.  www.avtoportal.ru
  4.  www.bibika.ru
  5.  http://appraiser77.ru/
  6.  www.eatu.ru
  7.  http://ermak.cs.nstu.ru/site/students/ai2/
  8.  http://www.fxcompas.com/articles/articles.php
  9.  http://www.anriintern.com/neuro/menu.shtml
  10.  http://www.yarsk.ru/press/print?i=100004320
  11.  http://www.faza.ru/
  12.  http://www.neuroproject.ru/lectures.php
  13.  mailto:paukoff@fromru.com
  14.  http://ermak.cs.nstu.ru/site/personal/gavrilov_a_v.phtm
  15.  http://www.icmm.ru/~masich/win/lexion/neyro/1.htm
  16.  http://www.fxcompas.com/articles/articles.php
  17.  http://proocenka.ru/
  18.  http://www.yarsk.ru/press