49164

Скоринговые системы в оценке кредитоспособности физического лица

Курсовая

Банковское дело и рынок ценных бумаг

Цель исследования обусловила постановку и решение следующих конкретных задач: рассмотреть сущность скоринговых систем; методологии построения скоринговых систем; рассмотреть сущность нейронных сетей; показать сходства биологической и искусственной нейронной сети; рассмотреть специфику искусственной нейронной сети; показать сущность персептрона; применить персептрон для оценки кредитоспособности заемщика; определить входные и выходные параметры сети; обучить персептрон; интерпретировать результаты работы персептрона.5...

Русский

2013-12-22

1.04 MB

39 чел.

Федеральное Агентство по образованию

Министерство образования и науки Российской Федерации

ГОУ ВПО «Пермский государственный педагогический университет»

Кафедра экономики

КУРСОВАЯ РАБОТА

«Скоринговые системы в оценке кредитоспособности физического лица»

ИСПОЛНИТЕЛЬ: студент гр. 1243

Е.В. Волегова

НАУЧНЫЙ РУКОВОДИТЕЛЬ:

Профессор Л.Н. Ясницкий

Пермь 2007


СОДЕРЖАНИЕ

[1] ГЛАВА 1 Скоринговые системы в кредитовании физических лиц

[1.1] 1.1 Скоринговые системы как средство минимизации кредитного риска

[1.2] 1.2 Методология построения скоринговых систем

[2] ГЛАВА 2 Практическая часть

[2.1] 2.1 Проблемы и методы проектирования

[2.2] 2.2 Определение параметров выборки

[2.3] 2.3 Пример применения персептрона в скоринге

[3] ЗАКЛЮЧЕНИЕ

[4] СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ


ВВЕДЕНИЕ

Продолжающийся бурный рост рынка кредитования физических лиц неизбежно влечет за собой принятие дополнительных кредитных рисков как на отдельное кредитное учреждение, так и на банковскую систему в целом. Это связано с двумя основными факторами:

  1.  вовлечением в процесс розничного кредитования в качестве заемщиков нового контингента физических лиц и как следствие увеличением общего количества действующих кредитных договоров;
  2.  ростом среднего объема розничного кредита.

Экстенсивное развитие розничного кредитования проходит в условиях жесткой продуктовой и ценовой конкуренции основных участников рынка, что неизбежно ведет к снижению доходности данного направления банковского бизнеса. В этой ситуации качество управления кредитными рисками в розничном кредитовании становится не просто важным вопросом, а одним из конкурентных преимуществ/недостатков для кредитных учреждений, развивающих данный вид кредитования.

Конкурентная борьба идет не просто за доли расширяющегося рынка (в отличие, например, от торговли), а за "высококачественные" доли рынка, то есть за кредитоспособных заемщиков. Здесь необходимо пояснить термин "кредитоспособность". Данное понятие означает не только возможность (исходя из уровня и оценки стабильности доходов), но и желание потенциального заемщика вовремя и должным образом погасить задолженность. По существу реальным конкурентным преимуществом розничных банков становится уровень их кредитного "зрения", понимаемого как способность осуществлять выбор кредитоспособных заемщиков с высокой надежностью и минимальными затратами времени и ресурсов.

По сути, выдача кредита целесообразна при высокой доле уверенности в кредитоспособности потенциального заемщика. Именно задаче выбора кредитоспособных заемщиков в основном служат скоринговые системы.

В связи с этим цель курсовой работы: разработка системы оценки кредитоспособности заемщика. Предмет – использование персептрона для оценки кредитоспособности заемщика. Цель исследования обусловила постановку и решение следующих конкретных задач:

  •  рассмотреть сущность скоринговых систем;
  •  методологии построения скоринговых систем;
  •  рассмотреть сущность нейронных сетей;
  •  показать сходства биологической и искусственной нейронной сети;
  •  рассмотреть специфику искусственной нейронной сети;
  •  показать сущность персептрона;
  •  применить персептрон для оценки кредитоспособности заемщика;
  •  определить входные и выходные параметры сети;
  •  обучить персептрон;
  •  интерпретировать результаты работы персептрона.


ГЛАВА 1 Скоринговые системы в кредитовании физических лиц

1.1 Скоринговые системы как средство минимизации кредитного риска

Хотя многие авторы связывают возникновение скоринга с именем Дэвида Дюрана, который, уходя в 1941 г. в армию, оставил своим коллегам-банкирам краткие рекомендации по отбору кредитоспособных заемщиков; по-видимому, скоринг в той или иной форме существовал еще с тех времен, когда начали систематически предоставляться займы в денежной или натуральной форме неограниченному кругу лиц.

В современной практике работы банков скоринговые системы используются уже достаточно давно – начиная с середины 50-х годов, когда в Сан-Франциско начала свою деятельность одна из первых и лидирующих ныне компаний по разработке скоринговых систем Fair Isaac Corporation(1956 г.). Fair Isaac Corporation обслуживает 7 из 10 крупнейших банков в мире, 97 из 100 крупнейших банков Америки и 50 крупнейших эмитентов кредитных карт.

Английский глагол score имеет среди своих значений следующие: подсчитывать очки, вести счет; как существительное score, в частности, означает количество набранных очков, оценку, счет. Скоринговая система – это алгоритм или методика, позволяющие на основе данных о потенциальном заемщике оценить его кредитоспособность. По существу система призвана дать категоризированную оценку степени кредитного риска по потенциальному заемщику. В простейшем и наиболее значимом для практики случае эта оценка бинарная: "выдать кредит" (или "заемщик кредитоспособен") либо "отказать в выдаче кредита" (или "заемщик некредитоспособен"). Величина кредитного лимита в скоринговых системах второстепенна. Как правило, основой расчета кредитного лимита служит оценка уровня доходов заемщика при условии его кредитоспособности. В качестве данных о потенциальном заемщике выступает доступная кредитору информация, как содержащаяся в представляемых заемщиком документах, так и получаемая "со слов" самого заемщика. Зачастую эти два вида данных имеют непустое пересечение: например, данные о доходах, указываемые заемщиком в анкете, подтверждаются соответствующими справками и документами об уровне этих доходов. «В Великобритании наиболее часто используются следующие характеристики:

  •  Возраст;
  •  Количество детей/иждивенцев;
  •  Профессия;
  •  Профессия супруга(и);
  •  Доход;
  •  Доход супруга(и);
  •  Район проживания;
  •  Стоимость жилья;
  •  Наличие телефона;
  •  Сколько лет живет по данному адресу;
  •  Сколько лет работает на данной работе;
  •  Сколько лет является клиентом данного банка;
  •  Наличие кредитной карточки/чековой книжки;

В других странах набор характеристик, которые наиболее тесно связаны с вероятностью дефолта – вероятностью, что заемщик не вернет кредит или задержится с выплатой, будет отличаться в силу национальных, экономических и социально-культурных особенностей. Чем более однородна популяция клиентов, на которой разрабатывается модель, тем точнее прогнозирование дефолта. Поэтому очевидно, что нельзя автоматически перенести модель из одной страны в другую или из одного банка в другой. Даже внутри одного банка существуют различные модели для различных групп клиентов и различных видов кредита.»1 

Каждый вид используемой в скоринге информации обычно называют характеристикой или фактором (например, стаж работы на последнем рабочем месте; семейное положение и т.п.). Некоторые характеристики потенциального заемщика (возраст) имеют числовой характер, некоторые (образование) - дискретный нечисловой (категоризированный). Очевидно, что в скоринге целесообразно использовать наиболее существенные, важные для правильного принятия решения относительно оценки кредитоспособности характеристики. Их выбор ограничен наличием информации о заемщике и степенью ее документального подтверждения. Тем не менее в анкетах и представляемых заемщиком документах содержится достаточно данных для организации первоначальных работ по скорингу. Определение конкретной системы факторов для скоринга может быть сделано как на основе экспертных оценок кредитных работников, так и с использованием статистических методов.

Статистические методы эффективны при наличии достаточного по объему массива данных (значения факторов и результат погашения кредита – погашен или не погашен в срок). Если данных нет или их объем незначителен, то скоринг на основе экспертных оценок – разумное решение, во всяком случае, это лучше, чем отсутствие скоринга вообще.

Несмотря на начало работы по формированию в России системы бюро кредитных историй (БКИ), скоринговые системы не теряют своей актуальности. Это обусловлено двумя обстоятельствами:

  1.  расширением рынка розничного кредитования за счет вовлечения в процесс физических лиц, не бравших ранее кредиты в банках и не имеющих кредитных историй;
  2.  ограниченными возможностями БКИ по оценке кредитоспособности потенциальных заемщиков: кредитные отчеты БКИ содержат основную часть кредитной истории, то есть точно определенный перечень информации о фактически имевшем место исполнении/неисполнении потенциальным заемщиком (субъектом кредитной истории) обязательств по ранее выданным ему кредитам и займам. Сама по себе эта информация чрезвычайно важна: потенциальному заемщику с негативной кредитной историей новый кредит, скорее всего, не будет выдан. Однако выдача кредита заемщику с положительной кредитной историей не может проходить в "автоматическом режиме" – в любом случае необходима квалификация заемщика, оценка его кредитоспособности. Факты положительной кредитной истории заемщика и момент обращения за новым кредитом могут быть сильно разнесены во времени, в уровне доходов, обязательствах, собственности, условиях жизни заемщика, а следовательно, и в его кредитоспособности могли произойти серьезные изменения.

Говоря о перспективах развития и внедрения скоринговых систем, необходимо констатировать, что это направление деятельности будет развиваться параллельно с развитием системы бюро кредитных историй и применяться скоринговые системы будут не только в экспресс-кредитовании, но и во всех видах розничного кредитования как операциях, несущих кредитный риск.

1.2 Методология построения скоринговых систем

Методы и подходы, лежащие в основе скоринговых систем, весьма разнообразны. К основным известным и используемым в настоящее время методам могут быть отнесены следующие.

Линейный дискриминантный анализ

Дискриминантный анализ – это раздел математической статистики, содержанием которого является разработка методов решения задач различения (дискриминации) объектов наблюдения по определенным признакам. Применительно к скорингу объекты наблюдения – это данные о потенциальном заемщике, признаки – характеристики (факторы). Дискриминируются заемщики на два класса: кредитоспособные и некредитоспособные. Процедуры дискриминантного анализа можно разделить на две группы. Первая группа процедур предназначена для описания (интерпретации) различия между существующими классами, вторая – для проведения классификации новых объектов в тех случаях, когда неизвестно заранее, к какому из существующих классов они относятся.

«Пусть имеется множество объектов наблюдения (кредитных договоров с данными по заемщикам и результатом – кредит погашен должным образом или имели место проблемы). Каждая единица наблюдения характеризуется несколькими факторами (переменными): xij – значение j-й переменной у i-го объекта, при i = 1...N; j = 1...p. Все множество объектов разбито на несколько подмножеств (два и более), или классов. Из каждого подмножества взята выборка объемом nk, где k – номер подмножества (класса) при к = l...g. Признаки, которые используются для того, чтобы отличать один класс (подмножество) от другого, называются дискриминантными переменными (предикторами). Каждая из этих переменных должна измеряться либо по интервальной шкале, либо по шкале отношений. Интервальная шкала позволяет количественно описать различия между свойствами объектов. Для задания шкалы устанавливаются произвольная точка отсчета и единица измерения. Примерами таких шкал являются возраст заемщика, уровень его среднемесячного дохода за последние 6 месяцев и т.д.»2 Шкала отношений – частный случай интервальной шкалы. Она позволяет соотносить категоризированные предикторы. Теоретически число дискриминантных переменных не ограничено, но на практике их выбор осуществляется на основании содержательного анализа исходной информации и соответствующих статистических процедур оценки вклада каждого предиктора в процесс формирования правильных решений по классификации. Число объектов наблюдения должно превышать число дискриминантных переменных как минимум на два, то есть p < N. Дискриминантные переменные должны быть линейно независимыми. Еще одним предположением при дискриминантном анализе является нормальность закона распределения многомерной величины, то есть каждая из дискриминантных переменных внутри каждого из рассматриваемых классов должна быть подчинена нормальному закону распределения. В случае когда реальная картина в выборочных совокупностях отличается от выдвинутых предпосылок, следует решать вопрос о целесообразности использования процедур дискриминантного анализа для классификации новых наблюдений, так как при этом затрудняются расчеты каждого критерия классификации. Линейная дискриминантная функция имеет вид:

D(X) = w0 + w1x1 + w2x2 +... + wnxn,

где wi- коэффициенты.

Для случая дискриминации на два класса решающее правило выглядит следующим образом: если D(X) <= 0, объект Х относится к 1-му классу, если D(X) >= 0, - ко 2-му.

Необходимо отметить, что дискриминантный анализ является достаточно грубым и приближенным методом для скоринга в силу сделанных предположений и линейности самой дискриминантной функции. Однако данный метод важен в начале разработки скоринговых систем для оценки важности ("просеивания") предикторов.

Многофакторная логистическая регрессия

«Логика построения уравнения логистической регрессии аналогична построению линейной дискриминантной функции:

log(p/(1-p)) = w0 + w1x1 + w2x2 + ... + wnxn,

где р - вероятность дефолта (невозврата кредита),

w - весовые коэффициенты,

х - характеристики клиента.»3

В результате распознавания или классификации по предъявляемому объекту (потенциальному заемщику) уравнение логистической регрессии дает оценку вероятности невозврата кредита. Если разработчиками скоринговой системы заранее установлено определенное пороговое значение этой вероятности для разделения двух классов объектов (например, "надежный заемщик" и "проблемный заемщик"), такая конструкция будет способна в автоматическом режиме формировать вывод о допустимости или недопустимости выдачи кредита.

Кластерный анализ

Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения, объекты (заявки потенциальных заемщиков), каждый из которых описывается набором характеристик (факторов) X1, X2,..., Xm. Целью кластерного анализа является образование групп, классов сходных между собой объектов, которые принято называть кластерами. Слово "кластер" (cluster) в переводе с английского означает: сгусток, пучок, группа. В скоринговых системах в качестве классов выступают в простейшем случае два: "надежные заемщики" и "проблемные заемщики". В кластерном анализе используется подход, когда все группировочные признаки одновременно учитываются при отнесении субъектов наблюдения в тот или иной класс. Как правило, четкие границы каждого класса не указаны, но количество их известно.

При разработке скоринговых систем кластерный анализ на основе обучающей выборки позволяет построить меру (расстояние) между двумя основными классами объектов и определить "центры" каждого класса в пространстве характеристик Х1, Х2,..., Xm, то есть сформировать ключевое правило собственно для задачи скоринга: по предъявляемому объекту вычисляются расстояния до каждого из классов ("надежные заемщики" и "проблемные заемщики"), и классифицируемый объект относится к классу, расстояние до которого оказывается минимальным.4

Деревья решений

В методе деревьев решений классификация объектов осуществляется путем последовательного дробления факторного пространства Х1, Х2,..., Xm на вложенные прямоугольные области. Первый шаг – разделение по самому значимому фактору (характеристике). Последующие шаги – повторение процедуры до тех пор, пока никакой вариант последующей классификации (сегментации) не даст значимого различия между соотношением объектов разных классов по сравнению с полученными ранее сегментами. Количество разветвлений, факторы, по которым в узлах дерева решений осуществляется ветвление, и пороговые значения факторов в узлах дерева решений определяются в методе автоматически.

Метод минимизации структурного риска В. Вапника

Этот метод лежит в основе предлагаемого на российском рынке программного продукта по скорингу KXEN. Разделение на два класса по обучающей выборке объектов может быть осуществлено путем подбора решающей функции f(X), принадлежащей некоторому семейству функций f(X; a), где X <= Х1, Х2,..., Xm >, - вектор характеристик, а - обобщенный (в общем случае – векторный) параметр. Если f(X) < 0, то объект с характеристиками X <= Х1, Х2,..., Xm > относят к классу "проблемных заемщиков", а если f(X) >= 0, то к классу "надежных заемщиков". Очевидно, что лучшей решающей функцией будет функция, минимизирующая уровень ошибки классификации (ожидаемый риск). Однако напрямую, только по обучающей выборке, оценить ожидаемый риск невозможно. Если размерность пространства функций f(X; a) (своеобразная оценка сложности семейства функций, среди которых ищется оптимальная решающая функция) ограничена, то может быть получена оценка сверх ожидаемого риска. Ожидаемый риск рассматривается как сумма двух рисков: эмпирического (уровень ошибок классификации на обучающей выборке) и риска использования пространства функций f(X; a) размерности (N) (мера ошибок классификации вследствие неполноты (с точки зрения задач классификации) пространства функций f(X; a)). Принцип минимизации структурного риска, предложенный В. Вапником, состоит в выборе такого семейства решающих функций и нахождении в этом семействе такой оптимальной решающей функции, которая удовлетворительно классифицирует объекты обучающей выборки и не является чрезмерно сложной (имеющей большую размерность).5

Нейронные сети

В данной работе для оценки кредитоспособности заёмщика будет использованы нейронные сети. Идея нейронных сетей возникла в результате попыток смоделировать поведение живых существ, воспринимающих действия внешней среды и обучающихся на собственном опыте. Нейронные сети дают возможность по обучающей выборке объектов (массиву данных по заемщикам с закрытыми кредитными договорами и с известным результатом погашения кредита) конструировать структуру, состоящую из нейронов и связей и предназначенную для отнесения предъявляемого объекта (потенциального заемщика) к одному из классов:"надежные заемщики" или "проблемные заемщики". Применительно к скоринговым системам нейросеть рассматривается как черный ящик, содержание которого (нейроны, количество слоев нейронов, расположение нейронов по слоям, вес нейронов и т.д.) не имеет какой-либо смысловой трактовки или явного смысла. Нейросети позволяют на основе данных о потенциальном заемщике оценить его кредитоспособность. По существу система призвана дать категоризированную оценку степени кредитного риска по потенциальному заемщику. В простейшем и наиболее значимом для практики случае эта оценка бинарна: "выдать кредит" (или "заемщик кредитоспособен") либо "отказать в выдаче кредита" (или "заемщик некредитоспособен"). Так как, величина кредитного лимита в скоринговых системах второстепенна, то её можно не учитывать. В качестве данных о потенциальном заемщике выступает доступная кредитору информация, как содержащаяся в представляемых заемщиком документах, так и получаемая "со слов" самого заемщика. Зачастую эти два вида данных имеют непустое пересечение: например, данные о доходах, указываемые заемщиком в анкете, подтверждаются соответствующими справками и документами об уровне этих доходов. Целесообразно использовать наиболее существенные, важные для правильного принятия решения относительно оценки кредитоспособности характеристики заемщика.

Как работает биологическая нейронная сеть

Нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Все процессы передачи раздражений от нашей кожи, ушей и глаз к мозгу, процессы мышления и управления действиями – все это реализовано в живом организме как передача электрических импульсов между нейронами. Рассмотрим строение биологического нейрона. Каждый нейрон имеет отростки нервных волокон двух типов – дендриты, по которым принимаются импульсы, и единственный аксон, по которому нейрон может передавать импульс. Аксон контактирует с дендритами других нейронов через специальные образования – синапсы, которые влияют на силу импульса.

Рис. 1 Строение биологического нейрона.

Можно считать, что при прохождении синапса сила импульса меняется в определенное число раз, которое называется весом синапса. Импульсы, поступившие к нейрону одновременно по нескольким дендритам, суммируются. Если суммарный импульс превышает некоторый порог, нейрон возбуждается, формирует собственный импульс и передает его далее по аксону. Важно отметить, что веса синапсов могут изменяться со временем, а значит, меняется и поведение соответствующего нейрона.

Нетрудно построить математическую модель описанного процесса.

Рис. 2. Модель нейрона с тремя входами.

На рисунке 2 изображена модель нейрона с тремя входами (дендритами), причем синапсы этих дендритов имеют веса w1, w2, w3. Пусть к синапсам поступают импульсы силы x1, x2, x3 соответственно, тогда после прохождения синапсов и дендритов к нейрону поступают импульсы w1x1, w2x2, w3x3. Нейрон преобразует полученный суммарный импульс x=w1x1+ w2x2+ w3x3 в соответствии с некоторой передаточной функцией f(x). Сила выходного импульса равна y=f(x)=f(w1x1+ w2x2+ w3x3). Таким образом, нейрон полностью описывается своими весами wk и передаточной функцией f(x). Получив набор чисел (вектор) xk в качестве входов, нейрон выдает некоторое число y на выходе.

Искусственная нейронная сеть

Искусственная нейронная сеть (ИНС, нейронная сеть) – это набор нейронов, соединенных между собой. Как правило, передаточные функции всех нейронов в нейронной сети фиксированы, а веса являются параметрами нейронной сети и могут изменяться. Некоторые входы нейронов помечены как внешние входы нейронной сети, а некоторые выходы – как внешние выходы нейронной сети. Подавая любые числа на входы нейронной сети, мы получаем какой-то набор чисел на выходах нейронной сети. Таким образом, работа нейронной сети состоит в преобразовании входного вектора в выходной вектор, причем это преобразование задается весами нейронной сети. Практически любую задачу можно свести к задаче, решаемой нейронной сетью.

Обучение нейронных сетей

Обучить нейронную сеть – значит, сообщить ей, чего мы от нее добиваемся. Этот процесс очень похож на обучение ребенка алфавиту. Показав ребенку изображение буквы «А», мы спрашиваем его: «Какая это буква?» Если ответ неверен, мы сообщаем ребенку тот ответ, который мы хотели бы от него получить: «Это буква А». Ребенок запоминает этот пример вместе с верным ответом, то есть в его памяти происходят некоторые изменения в нужном направлении. Оказывается, что после многократного предъявления примеров веса нейронной сети стабилизируются, причем нейронная сеть дает правильные ответы на все (или почти все) примеры из базы данных. В таком случае говорят, что «нейронная сеть обучена»

Важно отметить, что вся информация, которую нейронная сеть имеет о задаче, содержится в наборе примеров. Поэтому качество обучения нейронной сети напрямую зависит от количества примеров в обучающей выборке, а также от того, насколько полно эти примеры описывают данную задачу. Так, например, бессмысленно использовать нейронную сеть для предсказания финансового кризиса, если в обучающей выборке кризисов не представлено. Считается, что для полноценной тренировки нейронной сети требуется хотя бы несколько десятков (а лучше сотен) примеров. Обучение нейронных сетей – сложный и наукоемкий процесс.

Области применения нейронных сетей

До недавнего времени (середины 80-х годов прошлого века) существовало несколько общепризнанных методов прогнозирования временных рядов:

  •  Эконометрические
  •  Регрессионные
  •  Методы Бокса-Дженкинса (ARIMA, ARMA)

Однако, начиная с конца 80-х годов, в научной литературе был опубликован ряд статей по нейросетевой тематике, в которых был приведен эффективный алгоритм обучения нейронных сетей и доказана возможность их использования для самого широкого круга задач. Эти статьи возродили интерес к нейросетям в научном сообществе и последние очень скоро стали широко использоваться при исследованиях в самых разных областях науки от экспериментальной физики и химии до экономики. Отчасти из-за относительной сложности и недетерминированности нейронных сетей и генетических алгоритмов, эти технологии не сразу вышли за рамки чисто научного применения. Тем не менее, с течением времени уровень доверия к новым технологиям повышался и со стороны бизнеса. С начала 90-х годов начали регулярно появляться сообщения об установках нейросетевых систем в разных компаниях, банках, корпоративных институтах. Причем сфера использования новых технологий была очень многогранной – оценка рисков, контроль технологических процессов, управление роботами и многое другое. Одним из самых успешных приложений нейронных сетей было прогнозирование временных рядов. Причем самым массовым было

  •  Прогнозирование на финансовых рынках
  •  Прогнозирование продаж

В настоящее время можно с уверенностью сказать, что использование нейронных сетей при прогнозировании дает ощутимое преимущество по сравнению с более простыми статистическими методами.

"Нейрокомпьютинг и его применения в экономике и бизнесе".

Существует несколько вариантов решения экономических задач:

  •  Использование многослойных персептронов
  •  Использование нейронных сетей с общей регрессией GRNN и GRNN-GA

Использование многослойных персептронов. Самый простой вариант применения искусственных нейронных сетей в задачах бизнес-прогнозирования – использование обычного персептрона с одним, двумя, или (в крайнем случае) тремя скрытыми слоями. При этом на входы нейронной сети обычно подается набор параметров, на основе которого (по мнению эксперта) можно успешно прогнозировать. Выходом обычно является прогноз сети на будущий момент времени.

Использование нейронных сетей с общей регрессией GRNN и GRNN-GA. Еще одной часто используемой нейросетевой архитектурой, используемой в бизнес-прогнозировании является нейронная сеть с общей регрессией. Несмотря на то что принцип обучения и применения таких сетей в корне отличается от обычных персептронов, внешне сеть используется таким же образом, как и обычный персептрон. Говоря другими словами, это совместимые архитектуры в том смысле, что в работающей системе прогнозирования можно заменить работающий персептрон на сеть с общей регрессией и все будет работать. Не потребуется проводить никаких дополнительных манипуляций с данными. Если персептрон во время обучения запоминал предъявляемые примеры постепенно подстраивая свои внутренние параметры, то сети с общей регрессией запоминают примеры в буквальном смысле. Каждому примеру – отдельный нейрон в скрытом слое сети, а затем, во время применения сеть сравнивает предъявляемый пример с примерами, которые она помнит. Смотрит, на какие из них текущий пример похож и в какой степени и на основе этого сравнения выдаст ответ. Отсюда следует первый недостаток такой архитектуры – когда база данных велика, сеть станет слишком большой и будет медленно работать. Второй недостаток таких сетей особенно заметен в задачах бизнес-прогнозирования – они совсем не способны "продлевать" тренд. Поэтому такие сети можно использовать только в случаях, когда рынок устойчивый, либо, после декомпозиции данных, тренд прогнозировать другими архитектурами нейронных сетей, или любыми классическими методами.

Нейронные сети в настоящее время находят огромное число разнообразных применений. Действительно, в любой области человеческой деятельности есть плохо алгоритмизуемые задачи, для решения которых необходима либо постоянная работа группы квалифицированных экспертов, либо адаптивные системы автоматизации, каковыми являются нейронные сети. Разные компании выбирают разные варианты – одни предпочитают тратить деньги на оплату лучших специалистов и их обучение, другие покупают полностью готовые специализированные нейросетевые системы, а третьи комбинируют эти подходы, создавая собственные системы с нуля или на основе готовых коммерческих пакетов.

Программные реализации

В настоящее время существует много компаний, занимающихся разработкой нейронных сетей.Наиболее известными компаниями являются Ward Systems Group,Inc. и НейроПроект Приведем краткие характеристики программных продуктов данных компаний:

NeuroShell 2 – программная среда с дружественным и интуитивно понятным интерфейсом, в которой реализованы наиболее распространенные и эффективные нейросетевые архитектуры. NeuroShell сопровождает целая серия дополнений, которые могут существенно упростить решение ряда специфических задач.

GeneHunter – программный пакет, использующий генетические алгоритмы для решения сложных комбинаторных и оптимизационных задач. GeneHunter является надстройкой Microsoft Excel, т.е. пользователь решает свои задачи непосредственно из рабочего листа, содержащего данные.

NeuroShell Trader – система, предназначенная для прогнозирования и поиска эффективных торговых стратегий на финансовых рынках. Система ориентирована на трейдеров, инвесторов и всех тех, кто зарабатывает или собирается зарабатывать на биржевой торговле. Она настолько проста в использовании, что начинающие могут быстро освоить ее и начать эффективно использовать. Однако система является настолько мощной, что дает возможность профессионалам решать широкий круг сложнейших задач. Нейросетевые архитектуры, лежащие в основе программ данной серии, являются самыми последними достижениями научного поиска, результатом которого явилось создание алгоритма "самопостроения" нейронной сети, обладающей рекордными скоростями обучения. Эти программы чрезвычайно просты в использовании. Теперь пользователь должен сосредоточиться только на формулировке задачи, все остальное программы данной серии сделают сами. В состав серии входят:

NeuroShell Predictor дает возможность с легкостью создавать системы для решения задач прогнозирования и предсказания на основе имеющейся базы данных. Это могут быть предсказания следующих значений параметров временного ряда, например, предсказание курса акций, или оценка какой-либо величины, определяемой набором независимых факторов, например, оценка стоимости квартир или подержанных автомобилей. NeuroShell Classifier предназначен для решения задач распознавания образов, связанных с определением принадлежности предъявляемого образа (ситуации) к той или иной категории. Например, по набору биржевых показателей вырабатывать сигнал для покупки или продажи акций той или иной компании.

NeuroShell Run-Time Server содержит ряд программ, которые позволяют использовать сети, созданные с помощью NeuroShell Predictor и NeuroShell Classifier, либо из рабочих листов Microsoft® Excel™, либо в собственных программах.

Для решения моей задачи используется готовый нейропакет NSim01, разработанный студентом 4 курса Механико-математического факультета ПГУ.


ГЛАВА 2 Практическая часть

2.1 Проблемы и методы проектирования

Персептрон, перцептрон (англ. perceptron, нем. Perzeptron, от лат. perceptio — понимание, познавание, восприятие), математическая модель процесса восприятия. Сталкиваясь с новыми явлениями или предметами, человек их узнаёт, то есть относит к тому или иному понятию (классу). Так, мы легко узнаём знакомых, даже если они изменили причёску или одежду, можем читать рукописи, хотя каждый почерк имеет свои особенности, узнаём мелодию в различной аранжировке и т.д. Эта способность человека и получила название феномена восприятия. Человек умеет на основании опыта вырабатывать и новые понятия, обучаться новой системе классификации. Например, при обучении различению рукописных знаков ученику показывают рукописные знаки и сообщают, каким буквам они соответствуют, то есть к каким классам эти знаки относятся; в результате у него вырабатывается умение правильно классифицировать знаки.

«Теоретически для построения нейросетевой модели любого сколь угодно сложного объекта достаточно использовать персептрон с одним скрытым слоем сигмоидных нейронов, число которых определяется формулами

NyQ/1+log2 Q ≤ Nw  ≤ Ny (Q/Nx +1)( Nx + Ny +1) +Ny

Где Ny – размерность выходного сигнала; Qчисло элементов обучающей выборки; Nw - необходимое число синаптических весов; Nx - размерность входного сигнала.

Оценив с помощью этой формулы необходимое число синаптических весов, можно рассчитать число нейронов в скрытых слоях.

N=Nw/(Nx  + Ny 6.

Однако в практических реализациях персептронов количество слоев и число нейронов в каждом из них часто отличаются от теоретических. Иногда целесообразно использовать персептроны с большим числом скрытых слоев. Такие персептроны могут иметь меньшие размерности матриц синаптических весов, чем двухслойные персептроны, реализующие то же самое преобразование.

«Строгой теории выбора оптимального числа скрытых слоев персептронов пока нет. На практике же чаще всего используются персептроны, имеющие один или два скрытых слоя, причем число нейронов в скрытых слоях обычно колеблется от Nx  до 3Nx.

При проектировании персептронов необходимо понимать, что персептрон должен не только правильно реагировать на примеры, которые были в обучающей выборке, но и уметь обобщать приобретенные знания, т.е. правильно реагировать на примеры, которых в обучающей выборке не было. Чтобы оценить способность сети к обобщению, помимо обучающей выборки примеров XD в рассмотрение вводят некоторое количество тестовых примеров XтDт, которые относятся к той же самой предметной области, но в процессе обучения не участвуют. После обучения вычисляют среднеквадратичную погрешность между прогнозом сети Y и желаемым выходом сети D или Dт. Среднеквадратичная погрешность персептрона, вычисленная на обучающей выборке XD, называется погрешность обучения, обозначаемой E , а вычисленная на тесовой выборке XтDт - погрешность обобщения, обозначаемой Eт. При увеличении числа нейронов внутренних слоев персептрона N погрешность обучения E  обычно падает, тогда как погрешность обобщения Eт сначала падает, а затем, начиная с некоторого оптимального значения N = N0, возрастает»7. Поведение этих кривых можно легко объяснить, если воспользоваться аналогией с аппроксимацией набора данных полиномами методом наименьших квадратов. Как известно, задача аппроксимации состоит в том, чтобы подобрать полином, наиболее правильно отражающий характер закономерности, представленной графически точками предметной области. Нейронные сети, как и регрессионные модели, выстраивают функции, аппроксимирующей точки предметной области, причем для каждой решаемой задачи существует некоторое оптимальное значение степеней свободы математической модели. Число степеней свободы персептрона – это общее число синаптических весов, которое определяется числом нейронов скрытых и выходных слоев. Свойство нейронной сети терять способность к обобщению при чрезмерном увеличении числа ее степеней свободы называют переобучением, или гиперразмерностью нейросети.

«Итак, при проектировании персептронов существует проблема выбора необходимого числа нейронов. Число нейронов входного слоя персептрона должно совпадать с размерностью вектора входных параметров X , который определен условиями решаемой задачи. Число нейронов выходного слоя должно совпадать с размерностью выходного вектора Y, что также определено условиями задачи. Число скрытых слоев персептрона должно быть не менее одного. Число нейронов в скрытых слоях желательно оптимизировать для каждой конкретной задачи.

Существует два способа оптимизации числа нейронов в скрытых слоях – деструктивный и конструктивный. Деструктивный способ заключается в том, что первоначально строится сеть с заведомо избыточным числом степеней свободы, а затем в процессе обучения из нее постепенно исключаются лишние синаптические связи и нейроны»8.

Общим недостатком деструктивных алгоритмов является значительная длительность их работы, поскольку первоначальные вычисления производятся в сетях, имеющих избыточное количество нейронов. Этого недостатка лишены альтернативные конструктивные алгоритмы, которые предполагают постепенное добавление нейронов к сети, в которой их заведомо недостаточно. Новые нейроны добавляются каждый раз после определенного числа эпох обучения, а синаптическим весам и порогам новых нейронов присваиваются случайные числа. Поэтому после каждого добавления нового нейрона текущая погрешность обобщения нейросети Eт резко увеличивается, но после нескольких эпох обучения становится меньше той, которая была до добавления нейрона. Однако, начиная с некоторого момента времени t0, добавление новых нейронов перестает способствовать уменьшению ошибки Eт, а, наоборот, приводит к ее увеличению, что свидетельствует о наступлении эффекта гиперразмерности.

Интересно отметить, что время обучения нейросети от начала до t0 обычно оказывается в полтора раза больше, чем если бы в сети было сразу оптимальное число нейронов. Эта цифра означает, что навыки, приобретенные нейросетью в процессе предварительного обучения, не теряются полностью при добавлении в нее нового нейрона.

2.2 Определение параметров выборки

Подбор обучающих примеров. От удачного подбора обучающих примеров во многом зависит успех создания нейронной сети, адекватно моделирующей предметную область. Прежде всего необходимо понимать, что не все параметры предметной области влияют на выходной вектор Y.

Параметры, которые не оказывают влияния на вектор Y, называют незначимыми для этого выходного вектора. Естественно, что незначимые параметры не следует включать в список параметров входного вектора X. На практике часто бывает трудно и даже невозможно установить, какие из параметров предметной области являются значимыми, а какие нет. Поэтому на первом этапе в вектор X включают как можно больше параметров, избегая только те из них, незначимость которых представляется очевидной.

«После первоначального создания и обучения нейронной сети, незначимые параметры могут быть выявлены двумя способами.

  1.  Путем анализа значений весовых коэффициентов входных нейронов. Если окажется, что у какого-либо входного нейрона синаптические веса значительно меньше, чем у других нейронов, то этот входной нейрон скорее всего соответствует незначимому параметру вектора X.
  2.  Путем возмущения значений входных параметров и анализа реакции сети на эти возмущения. Если сеть не реагирует или слабо реагирует на изменения значения какого-либо входного параметра, то этот параметр не является значимым.

После выявления и исключения входных нейронов, соответствующих незначимым параметрам, качество нейросети улучшается, так как снижается ее размерность. Однако надо понимать, что слишком малое число входных параметров может привести к тому, что нейросети не хватит данных для выявления требуемых от нее закономерностей предметной области.»9

Предобработка обучающих примеров и интерпретация ответов. Параметры, описывающие предметную область, могут иметь самый разнообразный характер. Это могут быть числа с различными диапазонами изменений, качественные характеристики, такие как цвет волос и глаз, даты, графические объекты. Поскольку нейросеть в состоянии обрабатывать только числа, то вся нечисловая информация должна быть закодирована в числовом виде. Таким образом, персептрон можно применять для моделирования предметной области, описываемой числовыми параметрами любого диапазона. При формировании обучающей выборки входные и выходные параметры желательно масштабировать – преобразовать к приемлемому диапазону [a,b]. Естественно, что ответы персептрона после этого следует интерпретировать путем применения преобразования, обратного масштабированию.

2.3 Пример применения персептрона в скоринге

Статистика показывает, что Банк скорее выдаст кредит, если характеристика заемщика будет соответствовать следующим параметрам:

  •  Высокая заработная плата;
  •  Возраст от 23 до 50 лет;
  •  Замужем(женат);
  •  Постоянное место работы в течении 2-3 лет;
  •  Наличие в собственности недвижимости, транспортного средства;
  •  Отсутствие судимости;
  •  Работа в государственном секторе.

Банк скорее всего откажет заемщику в выдаче кредита, по следующим причинам:

  •  Низкая заработная плата;
  •  Возраст меньше 21 года и старше 55;
  •  Не замужем(холост);
  •  Маленький стаж работы или его отсутствие;
  •  Отсутствие недвижимости в собственности.

Банк откажет заемщику при следующей характеристике:

  •  Наличие судимости.

При различном сочетании параметров, вероятность благосклонности решения банка – соответственно различна.

В данной работе для определения входных параметров были просмотрены различные сайты интернета, посвященные кредитованию и скорингу, а также опрошены ряд людей (родственники, знакомые), компетентных в данном вопросе и получавших кредиты в банках. 

Подготовили входные и выходные параметры. Удалили все незначимые для выходных векторов параметры.

Для анализа кредитоспособности заемщика в моей работе, я взяла следующие входные параметры:

  •  X1 – Возраст;
  •  X2 – Семейное положение;
  •  X3 – Образование;
  •  X4 – Количество лиц, находящихся на иждивении;
  •  X5 – Сфера деятельности;
  •  X6 – Служебное положение;
  •  X7 – Общий стаж работы;
  •  X8 – Стаж работы на последнем месте работы;
  •  X9 – Уровень среднемесячного дохода за последние 6 месяцев;
  •  X10 – Судимость;
  •  X11 – Наличие в собственности недвижимости;
  •  X12 – Наличие в собственности транспортных средств.

Как уже говорилось выше, на практике в скоринговых системах оценка кредитоспособности заемщика бинарная: "выдать кредит" (или "заемщик кредитоспособен") либо "отказать в выдаче кредита" (или "заемщик некредитоспособен"). Поэтому в моей работе, ответами нейросимулятора являются да(Y1) или нет(Y2). Таким образом, в моем примере будет 12 входных параметров(X1-X12) и 2 выходных параметра(Y1, Y2).

При этом, диапазон изменения каждого из параметром был следующим:

  •  Возраст: от 18 до 60 лет;
  •  Семейное положение: женат/холост;
  •  Образование: нет, неполное высшее, высшее, среднее техническое;
  •  Количество лиц, находящихся на иждивении: от 0 до 4;
  •  Сфера деятельности: госслужба, частный сектор, другие сферы;
  •  Служебное положение: рабочий, вспомогательный персонал, служащий, руководящий работник;
  •  Общий стаж работы: от 1 до 32;
  •  Стаж работы на последнем месте работы: до 1 года, до 2 лет, до 3 лет и более 5 лет;
  •  Уровень среднемесячного дохода за последние 6 месяцев: до 5000, от 5000-10000, от 10000-15000, от 15000-25000, от 25000-40000, более 40000;
  •  Судимость: нет/да;
  •  Наличие в собственности недвижимости: нет, квартира, коттедж, склад, гараж;
  •  Наличие в собственности транспортных средств: нет, машина, мотоцикл.

Нечисловую информацию закодировали в числовом виде, кроме возраста, количества иждивенцев и общего стажа работы, и присвоить им числовые значения. Поэтому присвоим следующие значения каждому входному параметру:

  •  Семейное положение: женат/холост. Женат – 1, Холост – 0;
  •  Образование: нет – 0, высшее – 1, среднее техническое – 2, неполное высшее – 3;
  •  Сфера деятельности: госслужба – 0, частный сектор – 1, другие сферы – 2;
  •  Служебное положение: рабочий – 0, вспомогательный персонал – 1, служащий – 2, руководящий работник – 3;
  •  Стаж работы на последнем месте работы: до 1 года – 0, до 2 лет – 1, до 3 лет – 2 и более 5 лет – 3;
  •  Уровень среднемесячного дохода за последние 6 месяцев: до 5000 – 0, от 5000-10000 – 1, от 10000-15000 – 2, от 15000-25000 – 3, от 25000-40000 – 4, более 40000 – 5;
  •  Судимость: нет/да. Нет – 0, да – 1;
  •  Наличие в собственности недвижимости: нет – 0, квартира – 1, коттедж – 2, склад – 3, гараж – 4;
  •  Наличие в собственности транспортных средств: нет – 0, машина – 1, мотоцикл – 2.

Будем использовать  персептрон с одним скрытым слоем сигмоидных нейронов. Персептрон должен не только правильно реагировать на примеры, которые были в обучающей выборке, но и уметь обобщать приобретенные знания, т.е. правильно реагировать на примеры, которых в обучающей выборке не было.

После того, как определены все параметры, необходимо создать обучающую выборку. Обучающая выборка представлена в таблице 2. Количество обучающих примеров в данной работе составляет 45 штук.

Таблица 2

Обучающая выборка

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

Y1

Y2

Обучение

18

0

0

0

2

0

1

0

0

0

1

0

0

1

18

0

2

1

0

1

2

1

1

1

4

1

0

1

20

1

0

0

2

2

3

2

2

0

0

0

1

0

20

1

3

3

1

3

1

3

3

1

0

1

0

1

21

0

2

0

0

0

4

0

4

0

3

2

1

0

21

1

3

2

1

2

3

1

5

1

1

0

0

1

22

0

1

1

2

1

2

2

0

0

0

1

0

1

22

1

3

0

0

2

4

3

1

0

4

1

1

0

25

0

1

0

2

0

3

0

2

0

1

2

1

0

25

1

2

1

1

3

1

1

3

1

1

0

0

1

26

1

2

0

0

2

5

2

4

1

0

2

0

1

26

0

1

2

2

1

2

3

3

1

0

1

0

1

28

1

2

3

0

0

1

0

0

0

0

0

0

1

28

0

3

0

1

3

5

3

5

0

2

1

1

0

30

1

1

0

0

2

6

2

2

0

0

1

1

0

30

0

0

2

1

1

3

3

3

0

3

0

1

0

31

1

0

4

0

1

8

0

2

0

4

0

0

1

31

0

1

0

2

0

7

1

2

0

4

0

1

0

33

1

1

0

0

2

10

2

0

0

0

1

1

0

33

0

2

2

1

3

6

3

4

0

0

1

1

0

35

1

1

3

2

3

22

0

5

0

1

1

1

0

35

0

2

0

0

0

1

1

3

0

0

2

1

0

37

1

1

1

1

2

10

2

4

0

0

0

1

0

37

0

1

3

0

1

8

3

2

0

1

0

1

0

40

1

2

2

2

2

9

0

0

0

1

0

0

1

40

0

0

0

1

2

10

1

2

0

1

1

1

0

42

1

1

1

0

0

11

2

1

0

1

2

1

0

42

0

0

0

2

0

14

3

2

0

1

2

1

0

45

1

2

0

1

2

15

0

4

1

1

1

0

1

45

0

0

2

0

1

23

1

0

1

1

1

0

1

48

0

1

0

2

3

3

2

5

0

2

1

1

0

48

1

0

1

0

1

30

3

1

0

4

1

1

0

50

0

1

4

2

0

1

0

2

0

4

2

0

1

50

1

2

0

1

1

22

1

3

0

1

0

1

0

52

0

1

4

2

3

20

2

4

1

1

0

0

1

52

1

0

0

0

0

19

3

1

1

1

2

0

1

55

1

1

4

2

2

17

0

0

0

1

1

0

1

55

0

0

0

1

1

28

1

1

0

2

1

1

0

58

0

2

3

1

3

29

3

2

0

0

0

0

1

58

1

1

0

0

1

30

2

1

0

2

2

1

0

60

0

2

0

1

3

31

3

4

0

1

0

1

0

60

1

1

2

2

2

32

0

0

0

0

2

0

1

22

1

1

0

0

3

22

3

5

1

1

1

0

1

18

1

1

3

0

0

5

1

1

0

0

0

0

1

После того, как обучающая выборка сформирована необходимо подобрать тест, чтобы оценить способность сети к обобщению. Тест – примеры, которые относятся к той же самой предметной области, но в процессе обучения не участвуют. Как правило 4,5 тестовых примеров достаточно. Тестовые примеры представлены  в таблице 3.

Таблица 3

Тестирующая выборка

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

Y1

Y2

Тест

1

0

0

3

25

3

3

1

1

1

0

1

1

0

0

3

25

3

3

0

1

1

1

0

1

3

0

0

5

1

1

0

0

0

0

1

1

0

1

2

15

2

2

0

3

2

1

0

Затем, необходимо определить оптимальное количество нейронов на скрытом слое, т.е. необходимо подобрать такое количество нейронов, при котором нейросимулятор будет считать с наименьшей погрешностью. Для этого после обучения вычисляем среднеквадратичную погрешность между прогнозом сети  и желаемым выходом сети обучающей или тестируемой. Среднеквадратичная погрешность персептрона, вычисленная на обучающей выборке E , показана в таблице 4. А вычисленная на тесовой выборке  - погрешность обобщения Eт, показана в Таблице 5.

Таблица 4

Среднеквадратичная погрешность персептрона, вычисленная на обучающей выборке E

Обуч.

1

2

3

4

5

6

7

8

9

Y1

0,0553

0,0266

0,0610

0,0292

0,0566

0,0290

0,0265

0,0284

0,0036

Y2

0,0553

0,0266

0,0607

0,0274

0,0576

0,0303

0,0274

0,0305

0,0036

10

11

12

13

14

0,0070

0,0211

0,0137

0,0071

0,0084

0,0053

0,0312

0,0172

0,0051

0,0077

Таблица 5

Среднеквадратичная погрешность обобщения, вычисленная на тестовой выборке Eт

Тест

1

2

3

4

5

6

7

8

9

Y1

0,0210

0,8291

1,0253

0,0178

0,0245

0,2397

0,0837

0,5787

0,3698

Y2

0,0210

0,8291

1,0253

0,0181

0,0256

0,2397

0,0861

0,5806

0,3702

10

11

12

13

14

0,2107

0,0268

0,2475

0,2096

0,7562

0,2125

0,0238

0,2502

0,2104

0,7542

При увеличении числа нейронов внутренних слоев персептрона погрешность обучения E  обычно падает, тогда как погрешность обобщения Eт сначала падает, а затем, начиная с некоторого оптимального значения  возрастает. Можно проследить это на графике 1.

График 1. Определение оптимального количества нейронов

Используется конструктивный метод оптимизации числа нейронов. В моем примере оптимальным количеством нейронов является 4. Рисунок 3 показывает ошибку сети при оптимальном количестве нейронов.

Рисунок 3. Ошибка сети

После того, как определено оптимальное количество нейронов, можно улучшить качество работы персептрона с помощью определения значимости входных параметров. Хотя в начале своей работы, я уже постаралась отобрать наиболее значимые параметры, которые используют банки для оценки кредитоспособностей заемщиков, теперь можно определить значимость, уже отобранных мною параметров, с помощью самого персептрона. Для этого нужно:

  1.  обучить персептрон с параметром;
  2.  после обучения вычислить среднеквадратичную погрешность между прогнозом сети  и желаемым выходом сети E;
  3.  найти сколько процентов составляет получившийся результат от желаемого;
  4.  убирать по очереди каждый из входных параметров;
  5.  обучать персептрон заново, но уже без этого параметра;
  6.  после обучения вычислить среднеквадратичную погрешность между прогнозом сети  и желаемым выходом сети E;
  7.  найти сколько процентов составляет получившийся результат от желаемого;
  8.  сравнить процентные соотношения, получившиеся с данным параметром и без него;
  9.  построить гистограмму для наглядности.

Таким образом, получилось гистограмма для оценки значимости каждого параметра. Получившиеся гистограммы показаны на рисунках 4-5.

Рис. 4. Проверка значимости параметров

На рисунке 4 показана значимость каждого парметра, и видно как возрастает погрешность персептрона, если убрать каждый из параметров по очереди. Таким образом, по данным гистограммам можно сделать вывод, что в данном случае все параметры значимы, так как при удалении одного из них возрастает погрешность персептрона. В целом, каждый рассмотренный параметр значим в совокупности с остальными параметрами, так как при принятии решения о кредитоспособности заемщика, банк рассматривает все параметры в совокупности, и если заемщик проходит по большему количеству параметров, то у него большие шансы для того, чтобы банк считал его кредитоспособным. На рисунке 5 показано, какой параметр является наиболее значимым, а какие менее. Из данного графика можно сделать вывод, что самым значимым параметром оказался параметр Судимость, на втором месте – параметр Стаж работы, на третьем – Среднемесячный доход.

Рис. 5. Самый значимый параметр

Также можно проверить значимость параметров с помощью другого способа. Можно посмотреть как изменится решение банка по выдаче кредита, если по очереди удалять каждый входной параметр, и если решение банка измениться существенно или в противоположную сторону, то данный параметр является значимым. Для этого сравним результаты персептрона с данным параметром и без него, а затем построим также график для наглядности. Для интереса опыта для построения графиков были взяты крайности значений параметров:

  •  Возраст: от 18 до 23, от 50 и больше;
  •  Семейное положение: холост, женат;
  •  Образование: нет, высшее;
  •  Количество лиц, находящихся на иждивении: нет, 3-4;
  •  Сфера деятельности: госслужба, другие сферы;
  •  Служебное положение: рабочий, руководящий работник;
  •  Общий стаж работы: 1-2, 10-35;
  •  Стаж работы на последнем месте работы: до 1 года, более 5 лет;
  •  Уровень среднемесячного дохода за последние 6 месяцев: до 5000, от 25000-40000, более 40000;
  •  Судимость: нет/да.
  •  Наличие в собственности недвижимости: нет, квартира/ коттедж;
  •  Наличие в собственности транспортных средств: нет, машина.

В нашем случае получились следующие графики(график 2-13):

Гафик 2. Как изменилось решение банка по выдаче кредита(Возраст)

Гафик 3. Как изменилось решение банка по выдаче кредита(Семейное положение)

График 4. Как изменилось решение банка по выдаче кредита(Образование)

График 5. Как изменилось решение банка по выдаче кредита(Количество иждивенцев)

График 6. Как изменилось решение банка по выдаче кредита(Сфера деятельности)

График 7. Как изменилось решение банка по выдаче кредита(Служебное положение)

График 8. Как изменилось решение банка по выдаче кредита(Общий стаж работы)

График 9. Как изменилось решение банка по выдаче кредита(Стаж работы на последнем месте)

График 10. Как изменилось решение банка по выдаче кредита(Среднемесячный доход)

График 11. Как изменилось решение банка по выдаче кредита(Судимость)

График 12. Как изменилось решение банка по выдаче кредита(Недвижимость)

График 13. Как изменилось решение банка по выдаче кредита(Транспортное средство)

Таким образом, из графиков видно, что решение банка по кредитоспособности заемщика меняется, если убрать какой-либо параметр, поэтому все параметры значимы. Это очевидно, и по гистограммам, которые обсуждались выше.

Исходя из проделанной работы можно дать несколько советов заемщику, как повысить свои шансы на получение кредита и стать в глазах банка абсолютно кредитоспособным:

  1.  Постарайтесь продемонстрировать максимальный доход всей семьи: зарплату мужа/жены, доход от сдачи квартиры, вклады, подработка и др.
  2.  Если вы не попадаете в категорию от 23 до 50 лет, лучше оформить кредит на другого члена семьи, а самому/самой выступить поручителем.
  3.  Если вы еще не женаты/замужем, возьмите в поручители семейных родственников.
  4.  В случае недобора стажа попробуйте приложить свой контракт, рекомендательные письма начальства, налоговую декларацию.
  5.  Постарайтесь включить в графу недвижимость и транспортные средства (если таковые есть) наиболее ценные вещи, доли в земельных участках, квартирах и т.д.


ЗАКЛЮЧЕНИЕ

В данной работе был разработан пример скоринговой системы с помощью персептрона. Мы определили входные параметры, обучили персептрон, нашли оптимальное число нейронов, при котором он выдает ответы с наименьшей погрешностью, проверили все параметры на значимость, и теперь с помощью данной системы можно оценивать кредитоспособность заемщиков.

Рассмотренный в курсовой работе метод оценки кредитоспособности заемщика с помощью персептрона, показывает как с его помощью можно добиться облегчения работы банка. Внедрение персептрона как метода скоринга для принятия решения о кредитоспособности позволяет банку, применяющему его в своей деятельности, во-первых, повысить доходность кредитных операций за счет снижения кредитных рисков, во-вторых, обоснованно выводить на рынок новые кредитные продукты, анализируя конъюнктуру рынка на основе накопленных данных, в-третьих, снизить издержки на операциях по выдаче кредитов за счет автоматизации принятия решений, увеличить скорость принятия решений при массовом кредитовании, а также, централизованно контролировать принимаемые кредитные решения, управлять влиянием человеческого фактора на принятие решений. Определив входные параметры, обучив персептрон, проанализировав значимость каждого входного параметра: возраст, семейное положение, образование, количество иждивенцев, сфера деятельности; служебное положение; общий стаж работы; стаж работы на последнем месте работы; уровень среднемесячного дохода за последние 6 месяцев; судимость; наличие в собственности недвижимости; наличие в собственности транспортных средств, по данной работе можно сделать вывод, что при определении банком кредитоспособности заемщика учитываются все его характеристики в совокупности, но как показали графики определения значимости каждого параметра, самым существенным параметром является Судимость, на втором месте – параметр Стаж работы, на третьем – Среднемесячный доход, а на последнем месте – параметр Возраст. Также в работе была продемонстрирована зависимость решения банка от каждого параметра: при удалении какого-либо параметра решение банка меняется, а иногда и в противоположную сторону, так человек с судимостью не мог получить кредит, но если этот параметр убрать, то при прочих положительных характеристиках он получает кредит. Важно еще раз отметить, что в данной работе использовались вымышленные характеристики заемщиков, поэтому получились такие результаты. Но данные результаты могли бы быть другими, более интересными, если бы вся информация о заемщиках была взята в каком-либо банке.

В дальнейшем, хотелось бы разработать такую систему с достоверной банковской информацией о заемщиках, если представится такая возможность. Если подобные системы использовать в работе банка, они могут автоматизировать процесс оценки кредитоспособности заемщика, и облегчить процесс принятия решения. Так развитые экономические страны успешно используют скоринговы системы. Скоринговые решения являются стандартом де-факто при кредитовании в банковских системах таких стран.


СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ

Литература

  1.  Вешкин Ю.Г., Авагян Г.Л Банковские системы зарубежных стран: Курс лекций: -М.: Экономист, 2004 г. 399 с.
  2.  Грюнинг Х., Братанович С.Б. Анализ банковских рисков: Система оценки корпоративного управления и управления финансовыми ресурсами.– М.:  Весь Мир, 2004
  3.  Ясницкий Л.Н. Введение в искусственный интеллект: Учебное пособие для студентов высш. учеб. заведений: -М.: Издательский центр «Академия», 2005 г. 176 с.

Официальные сайты Интернет

  1.  Секреты получения кредита//www.creditsf.ru/8.htm
  2.  Почему вам не дают кредит, или что такое cкоринг //www.rokf.ru/credits/2006/02/07/100944.html
  3.  Как банки определяют достойны ли мы rредита //www.rokf.ru/banking/2005/07/12/085050.html
  4.  Коммерческий кредит - от анализа к действиям "Консультант", 2006, № 1//www.financier.consultant.ru/pbi/list5/12.html
  5.  Методика оценки кредитоспособности регионов "Банковское кредитование", 2005, № 4//www.financier.consultant.ru/pbi/list5/12.html
  6.  Новые условия выдачи займа и кредита Начало "Финансовая газета", 2006, №12//www.buhi.ru/pages2006.php?id=201
  7.  Страхование финансовых рисков "Банковское кредитование", 2006, № 2//www.reglament.net/bank/credit/2006/3
  8.  www.banki.ru
  9.  www.alfabank.ru
  10.  www.creditov.ru/crediting.htm
  11.  www.neuroProject.ru

1 Галина Андреева. Скоринг как метод оценки кредитного риска./из материалов журнала «Банковские технологии»//www.cfin.ru/finanalysis/banks/scoring.html

2 Галина Андреева. Скоринг как метод оценки кредитного риска./из материалов журнала «Банковские технологии»//www.cfin.ru/finanalysis/banks/scoring.html

3 Галина Андреева. Скоринг как метод оценки кредитного риска./из материалов журнала «Банковские технологии»//www.cfin.ru/finanalysis/banks/scoring.html

4 Галина Андреева. Скоринг как метод оценки кредитного риска./из материалов журнала «Банковские технологии»//www.cfin.ru/finanalysis/banks/scoring.html

5 Галина Андреева. Скоринг как метод оценки кредитного риска./из материалов журнала «Банковские технологии»//www.cfin.ru/finanalysis/banks/scoring.html

6 Ясницкий Л.Н. Введение в искусственный интеллект: Учебное пособие для студентов высш. учеб. заведений: -М.: Издательский центр «Академия», 2005 г. C 61.

7 Ясницкий Л.Н. Введение в искусственный интеллект: Учебное пособие для студентов высш. учеб. заведений: -М.: Издательский центр «Академия», 2005 г. С 62.

8 Ясницкий Л.Н. Введение в искусственный интеллект: Учебное пособие для студентов высш. учеб. заведений: -М.: Издательский центр «Академия», 2005 г. С 63.

9 Ясницкий Л.Н. Введение в искусственный интеллект: Учебное пособие для студентов высш. учеб. заведений: -М.: Издательский центр «Академия», 2005 г. С 73.


 

А также другие работы, которые могут Вас заинтересовать

54050. Логарифмічні рівняння 681 KB
  Мета уроку: навчальна: систематизувати узагальнити знання учнів про логарифми та їх властивості формувати вміння і навички розв’язувати логарифмічні рівняння користуючись означенням та властивостями логарифма. розвивальна: удосконалювати навички застосовувати властивості логарифмів під час розв’язування рівнянь удосконалювати розумові здібності здатності до самостійного мислення розвивати пам'ять увагу. Розв’язки домашнього завдання. Розв’язати рівняння: 1.
54051. Особенности социальной работы с несовершеннолетними, склонными к совершению правонарушений 450.5 KB
  Обзор зарубежного и российского опыта социальной работы с несовершеннолетними. Изучить нормативно-правовые основы социальной работы с несовершеннолетними, склонными к совершению правонарушений. Охарактеризовать преступность несовершеннолетних, выделить её особенности. Рассмотреть возрастные особенности представленной категории лиц.
54052. МЕТОДИКА ВИКЛАДАННЯ ЛОГАРИФМІЧНОЇ ФУНКЦІЇ В ШКОЛІ 884 KB
  Мета роботи - системазувати відомості про логарифмічну функцію в шкільному курсі алгебри старшої школи і розкрити роль і місце вивчення логарифмічної функції, рівнянь та нерівностей в школі та вибрати методику подання цієї теми.
54053. ЛОГАРИФМІЧНІ РІВНЯННЯ. МЕТОДИ РОЗВЯЗУВАННЯ ЛОГАРИФМІЧНИХ РІВНЯНЬ 857 KB
  Мета: продовжувати роботу над пошуком шляхів розв’язування логарифмічних рівнянь, формувати вміння і навички аналізувати здобути корені рівнянь; розвивати увагу, математичне мовлення, робити висновки, узагальнювати факти; виховувати цілеспрямованість, вміння працювати в колективі, бути стійким перед труднощами.
54054. Типология культур. Особенности массовой и элитарной культуры 35 KB
  Типология культуры как метод научного познания осуществляет процедуру расчленения различных социокультурных систем и их группировки с помощью обобщенной идеализированной модели или типа. Типология культуры позволяет объединять какие-либо сходные культуры в одну группу и отличать их от других культур.
54055. Урочисте відкриття тижня Логіки 149.5 KB
  Учень. Відкрити тиждень логіки дозволяю Капітанів прошу представити команди і здати рапорти команди здають рапорти 1 учень. Увага Увага 2 учень. Доброго дня дорогі діти і гості 1 учень.
54056. Інтегрування змісту навчальних предметів та логіки 120.5 KB
  Дітям необхідно знати правила і закони логіки у них мають бути сформовані логічні вміння розвинуте логічне мислення. Особливо виразно продуктивність застосування інтегрованого підходу можна побачити на уроках логіки. Знання учителя основних правил і законів логіки дає змогу користуватися логічними прийомами під час розв’язування проблемних ситуацій з будь – якої освітньої галузі; розвивати в учнів вміння застосовувати правила і закони логіки щодо аналізу подій явищ оцінки своїх і чужих думок формулювати і приймати обґрунтовані рішення під...
54057. Межпредметная интеграция как средство активизации учебного процесса 135.5 KB
  В специализированных школах с углубленным изучением иностранного языка межпредметная интеграция должна занимать не последнее место. В этой связи совместные уроки математики и английского языка могут быть очень интересными.
54058. АЛГЕБРА ВЫСКАЗЫВАНИЙ. ОСНОВНЫЕ ОПЕРАЦИИ АЛГЕБРЫ ВЫСКАЗЫВАНИЙ 1.77 MB
  Таблица истинности - это таблица, устанавливающая соответствие между всеми возможными наборами логических переменных, входящих в логическую функцию и значениями функции.