72073

Дослідження існуючих моделей для прогнозування та аналізу кредитних ризиків

Дипломная

Информатика, кибернетика и программирование

В умовах сучасної світової економічної кризи і конкуренції ефективне функціонування підприємств, фінансових установ, банків неможливе без всебічного аналізу їх внутрішньої і зовнішньої діяльності, маркетингового аналізу, прогнозування, тощо.

Украинкский

2014-11-17

2.2 MB

6 чел.

ЗМІСТ

Анотації        

ВСТУП           

Розділ1Фінансові ризики та їх моделювання

1.1. Класифікація банківських ризиків

1.2. Проблема аналізу кредитних ризиків

1.3. Існуючі методики аналізу кредитних ризиків

1.3.1. Методи зниження рівня ризиків

1.3.2. Методи оцінювання кредитоспроможності позичальника

1.3.3.Підходи до побудови моделей для оцінювання ризиків

1.4. Постановка задачі

1.5. Висновки до розділу

РОЗДІЛ 2 Методи моделювання і прогнозування банківських кредитних ризиків

2.1.Нелінійні моделі логіт-пробіт

2.1.1. Логіcтична регресія

2.1.2. Пробіт-модель

2.2. Дерева рішень

2.3.Байєсівський підхід на основі мереж довіри

2.4. Моделювання на основі нечіткої логіки

2.5. Висновки до розділу

РОЗДІЛ 3 Застосування методів моделювання кредитних ризиків

3.1.Застосуваннялогіт-пробіт

3.1.1.Прогнозування кредитоспроможності індивідуального позичальника на основі бінарної логістичної регресії

3.1.2. Прогнозування кредитоспроможності індивідуального позичальника на основі пробіт моделі

3.1.3.Порівняння характеристик якості прогнозу для логіт та пробіт моделі

3.2. Дерева рішень для оцінювання кредитоспроможності індивідуального позичальника.

3.3.Байєсівська мережа - задача прогнозування кредитоспроможності індивідуального позичальника

3.4 Комбінування Байєсівської мережі і нечіткої логіки

3.5. Висновки до розділу

РОЗДІЛ 4Аналіз результатів

3.1.ROCаналіз

3.2.Розробка програми для аналізу результатів

3.3.Порівняльний аналіз результатів, отриманих різними методами

3.4. Висновки до розділу

ВИСНОВКИ ПО РОБОТІ

Анотації

Реферат

В роботі досліджується проблема управління кредитними ризиками. Наведено теоретичні відомості щодо математичних методів та підходів до інтелектуального аналізу даних, що застосовуються до моделювання і прогнозування банківських кредитних ризиків. Для реальних даних фінансової звітності банку про видані кредити побудовано моделі за допомогою логістичної регресії, дерев рішень, мереж Байєса. Враховуючи отримані результати прогнозів за побудованими моделями, доведено можливість та доцільність їх використання на практиці. Запропоновано використання нового підходу до прогнозування кредитоспроможності позичальника – комбінування мережі Байєса з нечіткою логікою. В порівнянні з моделями, побудованими за відомими методами, комбінований метод показав вищу якість результатів та свою конкурентоспроможність.

Розроблено програмний продукт на мові програмування Microsoft Visual Studio 2010 C++,за допомогою якого для прогнозних значень, отриманих за допомогою кожної з моделей, виконано ROC-аналіз та порівняно якість моделей. Також виконано завдання з економіки та охорони праці.

Реферат

В работе исследуется проблема управления кредитными рисками. Приведено теоритические сведения по математическим методам и подходам к интеллектуальному анализу данных, которые применяются при моделировании и прогнозировании банковских кредитных рисков. Для реальных данных финансовой отчетности банка о выданных кредитах построено модели с помощью логистической регрессии, деревьев решений, сетей Байеса. Учитывая полученные результаты прогнозов по построенным моделям, доказано возможность и целесообразность их использования на практике. Предложено использование нового подхода к прогнозированию кредитоспособности заемщика – комбинирование сети Байеса с нечеткой логикой. По сравнению с моделями, построенными известными методами, комбинированный метод показал более высокое качество результатов и свою конкурентоспособность.

Разработано программный продукт на языке программирования MicrosoftVisualStudio 2010 C++, с помощью которого для прогнозных значений, полученных с помощью каждой из моделей, выполнено ROC-анализ и проведено сравнение качества моделей. Такжевыполненозаданиепоэкономикеиохранетруда.

Abstract

Inthework wasresearchedtheproblemofmanagementcreditrisks. Theoretical information in mathematical methods and approaches to the intellectual data analysis, which are applied to modeling and forecasting of bank credit risks, is given. For real data from bank’s financial reports about given credits are built models with logistic regression, decision trees, and Bayesian networks. Considering getting forecast results based on built models, possibility and expediency of their practical use were proven. The use of new approach to the forecasting of creditworthiness was suggested – combination of Bayesian networks and fuzzy logic. Comparing to models built by known methods, combined method showed higher results quality and its competitiveness.

On programming language Microsoft Visual Studio 2010 C++   was developed the software, with its help for forecasting values from each model ROC-analysis was performed and comparison of models quality was conducted. Also economical and occupational safety and health tasks were performed.

ВСТУП

Актуальність теми. Сучасна економіка України ставить перед кожним суб'єктом підприємницької діяльності низку нових завдань. Серед найголовніших – управління ризиками. Їх поява обумовлена специфікою та особливостями ринкового механізму, зокрема, свободою дій, яка надається кожному суб'єкту господарювання.

В умовах глобалізації фінансових ринків проблема ризиків, їх оцінка набуває особливої актуальності. Характер міжнародних фінансових відносин України з іншими країнами багато в чому залежить від чинника ризику тієї або іншої економіки. Чим кращою буде банківська діяльність в Україні, тим вищим буде рівень міжнародної довіри до нашої країни. Банківську діяльність неможливо представити без ризику, тобто ризик є властивою складовою у функціонуванні комерційних банків. Проблема виникнення ризиків в тій або іншій сфері діяльності існуватиме завжди, оскільки кредити залишаються найприбутковішими банківськими активами. А це означає, що висока прибутковість неодмінно супроводжується підвищеним ризиком.

Під банківським ризиком розуміється властива банківській діяльності можливість понесення кредитною організацією втрат або погіршення ліквідності унаслідок настання несприятливих подій, пов'язаних з внутрішніми чинниками (складність організаційної структури, рівень кваліфікації службовців, організаційні зміни, плинність кадрів і т.д.)  або зовнішніми чинниками (зміна економічних умов діяльності кредитної організації, вживані технології і т.д.).Кредитний ризик визначається науковцями як внутрішній ризик в основній діяльності банку. Його суть полягає у вірогідності збитків від непогашення позичальником основної суми боргу та процентів за кредитом.

В умовах сучасної світової економічної кризи і конкуренції ефективне функціонування підприємств, фінансових установ, банків  неможливе без всебічного аналізу їх внутрішньої і зовнішньої діяльності, маркетингового аналізу, прогнозування, тощо. Перелічені об’єкти – це складні системи з багаторівневою ієрархією і множиною функціональних зв’язків між їх підсистемами, які до того ж діють в умовах обмеженої інформації та в реальному часі. Аналіз таких систем і своєчасне прийняття обґрунтованих рішень стосовно управління ними можна виконати лише за методологією системного аналізу, використовуючи математичне і комп’ютерне моделювання.   

Найкращими інструментами розв’язання задач в умовах наявності невизначеностей структурного, статистичного і параметричного характеру є методи інтелектуального аналізу даних. До них відносяться такі: регресійні моделі, нечітка логіка, нейро-нечіткі моделі, дерева рішень, ймовірнісні моделі, імунні алгоритми. Серед імовірнісних моделей на перший план виступають байєсівські мережі, які мають суттєві переваги перед багатьма іншими моделями. Зокрема, це можливості поєднання в одній моделі великої кількості категорійних і числових змінних, врахування структурних, параметричних і статистичних невизначеностей, коректне встановлення причинно-наслідкових зв’язків між змінними процесу і врахування впливу прихованих змінних.

Мета і завдання дослідження. Основною метою дипломної роботи є дослідження існуючих моделей для прогнозування та аналізу кредитних ризиків, вибір найкращої моделі та підвищення ефективності прогнозу завдяки комбінуванню існуючих методів.

Предмет дослідження. Фінансові дані, математичні методи і моделі аналізу фінансових даних на основі мереж Байєса, дерев рішень, логістичної регресії та нечіткої логіки.

Структура дипломної роботи. Робота складається із вступу, шести розділів, висновку, списку використаної літератури, додатків.

У вступі обґрунтовується актуальність обраної теми дипломної роботи, визначаються мета і задачі дослідження, формується практична значимість досліджень.

В першому розділі“Фінансові ризики та їх моделювання”розглядаються основні означення стосовно поняття ризику, наведено  класифікацію банківських ризиків та проаналізовано проблеми оцінювання кредитного ризику.

В другому розділі“Методи моделювання і прогнозування банківських кредитних ризиків”викладені основні теоретичні відомості щодо математичних методів та підходів до інтелектуального аналізу даних, що застосовуються до моделювання і прогнозування банківських кредитних ризиків.

В третьому розділі “Застосування методів моделювання кредитних ризиків” виконано побудову моделі логістичної регресії, пробіт-моделі, дерева рішень,  мережі Байєса та комбінованої моделі байєсовської мережі та нечіткої логіки  з використанням реальних даних фінансової звітності банку про видані кредити.

В четвертому розділі «Аналіз результатів» виконаноROC-аналіз результатів прогнозів за побудованими моделями за допомогою спеціально розробленого програмного продукту.

В п‘ятому розділі  Економіка.

В шостому розділі  Охорона праці.

У висновку сформульовані основні висновки і пропозиції за результатами дипломного дослідження.

РОЗДІЛ 1

ФІНАНСОВІ РИЗИКИ ТА ЇХ МОДЕЛЮВАННЯ

1.1. Класифікація банківських ризиків

Банком виділяються наступні групи ризику:

  1.  Кредитний ризик;
  2.  Фінансовий ризик;
  3.  Операційний ризик;
  4.  Ризик бізнесу.

У межах кожної групи ризику виділяються фактори ризику, щодо яких застосовуються обмеження.

Кредитний ризик – це потенційна можливість втрат капіталу або доходу, що виникає внаслідок неспроможності позичальника (контрагента) виконати свої зобов'язання за угодою з банком. У групі кредитного ризику виділяються наступні фактори ризику:

  1.  прямий кредитний ризик;
  2.  ризик, еквівалентний кредитному;
  3.  ризик розрахунків.

Прямий кредитний ризик полягає в потенційній неможливості виконання позичальником за кредитними угодами своїх зобов'язань щодо повернення основної суми кредиту та процентів за користування ним.

Ризик, еквівалентний кредитному – це потенційна можливість несплати контрагентом банкові випущених (емітованих) ним боргових зобов'язань, цінних паперів, гарантій, поручительств та інших зобов'язань.

Ризик розрахунків – це потенційна можливість невиконання контрагентом банкові розмірів договору купівлі-продажу, або непогашення будь-якої іншої договірної заборгованості, яка не має кредитного або еквівалентного кредитному характеру[1].

Фінансовий ризик полягає в потенційній можливості втрат капіталу, доходівбанку або неспроможності оплатити поточні зобов'язання внаслідок негативної зміни кон'юнктури ринку або невідповідності ціни (тарифів), встановленоїбанком, ринковій кон’юнктурі. У групі фінансового ризику виділяють наступні фактори ризику:

  1.  ліквідності;
  2.  процентний;
  3.  валютний;
  4.  товарний.

Ризик ліквідності полягає в потенційній можливості втрати капіталу або доходівбанку внаслідок неспроможності оплатити поточні зобов'язання. У межах групи ризику ліквідності виділяються наступні фактори:

  1.  ризик ліквідності ринку,
  2.  пруденційний ризик ліквідності.

Ризик ліквідності ринку – потенційна можливість втрат капіталу або доходів банку внаслідок невиконання банком поточних зобов'язань, спричинена нестачею власних ресурсів та зовнішніх ресурсів ліквідності.

Пруденційний ризик ліквідності – потенційна можливість втрат капіталу або доходівбанку внаслідок невиконання встановлених показників ліквідності.

Процентний ризик – потенційна можливість втрат капіталу або доходів банку внаслідок негативних змін процентних ставок на ринках грошових ресурсів або невідповідності процентних ставок банку ринковій кон’юнктурі.

Валютний ризик – потенційна можливість втрат капіталу або доходів банку внаслідок негативних змін курсів іноземних валют або невідповідності встановлених банком курсів ринковій кон’юнктурі.

Товарний ризик – потенційна можливість втрат капіталу або доходів банку внаслідок негативних змін кон'юнктури товарних ринків. Товарний ризик реалізується як зниження оціночної вартості заставленого майна; втрати (недоодержання коштів) від реалізації заставленого майна; втрати від зміни ринкової вартості фінансових інструментів, похідних від певного товарові (товарної групи); невідповідності ціни (тарифу), встановленого банком, ринковій кон’юнктурі; перевищення звичайних лімітів витрат на придбання товарів для власних потреб банку.

Операційний ризик – вид гарантованого ризику, який полягає в потенційній можливості втрат капіталу або доходів банку внаслідок помилок персоналу, неадекватності процедур внутрішнього контролю та невідповідності системи кінцевому результату її діяльності. У групі операційного ризику виділяють наступні фактори:

  1.  ризик транзакції;
  2.  ризик операційного контролю;
  3.  системний ризик.

Ризик транзакції – можливість потенційних втрат капіталу або доходів банку внаслідок помилкового виконання персоналом етапів та елементів банківської операції.

Ризик операційного контролю – можливість потенційних втрат капіталу або доходів внаслідок відсутності, неправильної організації або помилкової направленості внутрішнього контролю.

Системний ризик – можливість потенційних втрат капіталу або доходів внаслідок організації системи проведення, обліку та контролю операцій таким чином, що можливість помилок персоналу або неадекватності операційного контролю не усувається.

Ризик бізнесу полягає в потенційній можливості втрат капіталу або доходів банку внаслідок змін у законодавстві або виникнення обставин, що можуть бути використані в збиток банка. У межах групи ризику бізнесу виділяються наступні фактори ризику:

  1.  юридичний;
  2.  стратегічний (бізнес) ризик;
  3.  ризик втрати репутації;
  4.  ризик виникнення непередбачуваних обставин.

Юридичний ризик – можливість потенційних втрат банка внаслідок недосконалості юридичного забезпечення або його невідповідності, при допущені помилок у розробці внутрішніх нормативних актів банка, при нечіткому формулюванні прав і відповідальності сторін, некоректному оформленні договорів, що призводить до збитків банка, збільшення його зобов'язань або знеціненню активів.

Стратегічний (бізнес) ризик – можливість потенційних втрат банка  внаслідок прийняття неправильних бізнес-рішень або їх неправильної реалізації.

Ризик втрати репутації – можливість потенційних втрат банка внаслідок негативного сприйняття з боку контрагентів, недовіри клієнтів тощо, що призводить до зниження кількості клієнтів та зниження обсягу операцій.

Ризик виникнення непередбачуваних обставин – можливість потенційних втрат банка внаслідок виникнення обставин, що не були передбачені або заплановані[2].

1.2. Проблема аналізу кредитних ризиків

Найважливіші аспекти стратегічної діяльності банків полягають у тому, щоб подолати ті ризики (кредитний, відсотковий, валютний, ліквідності, тощо), які постійно виникають у банківській діяльності. Необхідним стає якісний і кількісний аналіз ризиків, розробка інструментарію та методології аналізу, напрацювання засобів та способів зниження ступеня ризиків. Найбільшу питому вагу у структурі банківських ризиків складають кредитні ризики.Кредит є необхідним механізмом пересування капіталу з одних галузей в інші для підтримки неперервності кругообігу фондів підприємств, обслуговування процесу реалізації товарів, вирішення соціальних проблем.

Кредитна політика повинна містити коротку інформацію про масштаби і розподіл кредитних коштів банку і яким чином кредитний портфель управляється, тобто як кредити виникають, оцінюються, керуються, і повертаються. Хороша кредитна політика не надмірно обмежена, вона дозволяє надати кредити особам, які гідні розгляду, але не цілкомзадовольняють параметрамписьмової інструкції. Повинна існувати гнучкість для забезпечення швидкої реакції та  ранньої адаптації до змін в активахбанку та ринкового середовища.

Міркування, що лежать в основі раціонального кредитної політики включають наступне:

- Обмеження на загальну кількість непогашених кредитів. Обмеження на загальний кредитний портфельзазвичай виражається по відношенню до депозитів, капіталу, або всіх активів. При встановленні такої межіповинні бути розглянуті такі фактори, як попит на кредити, волатильність депозитів і кредитних ризиків.

- Кредитні концентрації. Кредитна політика повинна стимулювати портфель диверсифікації та збереження балансу між максимальною прибутковістю і мінімальним ризиком. Граничні концентрації зазвичай відносяться до максимально допустимого впливуна одного клієнта, пов'язану групу,  або галузі економічної діяльності (наприклад, сільське господарство, сталі і текстилю). Це особливо важливо для малих, регіонально-зорієнтованих, або спеціалізованих банків. Кредитна політика має також вимагати, щоб всі концентрації регулярнопереглядалися та велась звітність.

-  Розподіл за категоріями. Обмеження на основі сукупності відсотківвід загального обсягу кредитів у нерухомості, комерційних, споживчих, або інших кредитних категоріях є загальними. Політика, пов'язана з такими обмеженнями повинна забезпечувати відхилення, які затверджуються радою директорів.

-  Тип кредитів. Кредитній політиці слід вказати види кредитів та інших кредитних інструментів, що банк має намір запропонувати клієнтам та надавати рекомендації по конкретним кредитами. Рішення про види кредитних інструментів повинні бути засновані на досвіді кредитування, депозитній структурі банку і очікуваного попиту на кредити. Види кредитів, які призвели до втрат повинні контролюватися вищим керівництвомабо від них треба повністю відмовитися.

-Терміни погашення. Кредитна політика повинна встановити максимальний термін погашення для кожного виду кредиту, а кредити повинні надаватися  з реалістичним графіком погашення. Планування має визначатися в залежності від очікуваного джерела погашення, мети кредиту, термін корисного використання предмета застави.

- Позики ціноутворення. Ціни на різні види кредитів повинна бути достатніми для покриття витрат на фонди, кредитний нагляд, управління (в тому числізагальні накладні витрати), і можливі втрати. У той же час вони повинні забезпечити достатній запас прибутку. Ціни повинні періодично переглядатися і коректуватися з урахуванням змін витрат або конкурентних факторів. Оцінка відмінностей може свідомо підтримуватися щоб заохочувати деякі групи позичальників отримувати кредити в інших місцях або для залучення певного типу позичальників. Керівництво по іншим відповідним процедурам, таким як визначення плати за зобов'язаннями або штрафні санкції, також є елементами цінової політики.

-Оцінювання процесу. Кредитною політикою має бути вказанавідповідальність за недостовірну інформацію і повинна визначатися формальна, стандартна оцінка процедур, в тому числі посилання на переоцінку з продовженням або розширенням. Допустимі типи і обмеження на суму оцінки повинні бути визначені для кожного виду кредиту. Обставини, що вимагають оцінки кваліфікованими незалежними оцінювачами повинні бути описані. Ставки по  сумі кредиту від оціночної вартості обох проектів ізастави, а також методи оцінки і відмінності серед різних видів кредитних інструментів, повинні бути деталізовані. Кредитна політика також повинна містити вимоги до  початкового внеску, якщо це доречно.

- Максимальна ставкасуми кредиту по відношенню до ринкової вартості закладених цінних паперів. Кредитною політикою має бути зазначено граничні вимоги для всіх видів цінних паперів, які приймаються в якості застави. Маржинальні вимоги повинні бути пов'язані з конкурентоспроможністю цінних паперів.

- Розкриття фінансової інформації. Банк повинен відображати кредитив своєму балансі. Це маєвідбувається, як тільки банк укладає договір, який відноситься до кредиту.

- Порушення. Банк повинен визначати і визнавати порушеннякредиту. Це повинно бутизроблено, коли є ймовірним, що банк не буде в змозі зібрати належні суми відповідно до умов кредитного договору. Порушення може бути визнане за рахунок зниження балансової вартості кредиту по відношенню до  вартості реалізації або за рахунок збільшення прибутку протягомперіоду, в якому відбувається порушення.

- Звітність. Кредитна політика повинна визначити правопорушника зобов'язаньвсіх типів і відповідні звіти мають бути представлені управлінню. Ці звіти мають включати в себе детальну інформацію, що дозволить визначити фактори ризику, потенціальні втрати, і альтернативні варіанти дій. Політика повинна вимагати звітності, що буде  систематичною.

- Фінансова інформація. Безпечне надання кредиту залежить відповноти і достовірності інформації, що містить деталі про фінансове становище позичальника. Кредитна політика маєвизначати фінансові та індивідуальні вимоги до позичальників на різних рівнях запозичень і повинні включати в себе відповіднікерівні принципи для перевірених, неперевірених та проміжних грошові потоків. Вона повинна включати зовнішні перевірки кредитоспроможності, які потребують періодичного оновлення. Якщо погашення кредиту більше, ніж один рік, політика повинна вимагати, щоб співробітники банку підготувати фінансові прогнози щоб визначити, чи може бути кредит погашений з грошових потоків. Припущення для прогнозів повинні бути чітко обумовлені. Всі вимоги повинні визначатися таким чином, щоб будь-які негативні кредитнідані чітковказували на порушення кредитної політики банку[3].

В Україні певна практика оцінки кредитоспроможності позичальника існує, але переважно вона має формальний (документальний) характер. Робота з аналізу кредитоспроможності індивідуального позичальника передує укладенню з ним кредитного договору і дає можливість визначити фактори ризику, які можуть призвести до непогашення наданої банком позички в обумовлений термін, і оцінити вірогідність своєчасного повернення позички.

Аналіз сучасної української практики кредитування індивідуальних позичальників доводить, що найкращий метод оцінки кредитоспроможності можна визначити, тільки виходячи зі специфічних умов кожної угоди. В Україні це проявляється особливо чітко, у зв'язку з тим, що загальна нестабільність ринку, унікальність багатьох операцій і відсутність кредитних історій більшої частини позичальників роблять практично неможливим вироблення універсальних методів щодо визначення кредитоспроможності [5].

1.3. Існуючі методики аналізу кредитних ризиків

1.3.1.Методи зниження рівня ризиків

Лімітування

Встановлення лімітів кредитування на різні операції являє собою конкретизацію структурних лімітів з метою не вийти за межі  встановленого ліміту втрат. Поняття «кредит» включає в себе цілий спектр операцій, які відрізняються за рівнем ризику за рахунок різних строків, цільового напрямку кредиту, виду залогу.

Лімітування кредитних ризиків на конкретного позичальника включає в себе обмеження на всі інструменти, які містять елементи кредитного ризику: кредити позичальнику, кредити компаніям, видані поручительства.

Диверсифікація портфелю

Диверсифікація портфелю проводиться в першу чергу за допомогою лімітування різних видів операцій. Головна мета диверсифікація портфелюуникнути надлишкової концентрації кредитів по певним параметрам:валюта кредиту; строк кредитування; географічне розташування позичальників; форма власності позичальника; забезпеченість;

Резервування

Резервування є одним з основних способів управління кредитним ризиком.

Страхування

Страхування застосовується з метою зниження ризиків забезпечення, тобто витрат застави.

Забезпечення зобов’язань

Банк знижує кредитні ризики  шляхом прийняття під заставу рухомого і нерухомого майна, майнових прав, гарантій, поручительств. Найменш ліквідним вважається заставатоварів в обороті і поручительство, найпривабливішим для банку є високоліквідне забезпечення (векселя, депозитні сертифікати банку, права вимог за договорами вкладу в банку, гарантії і поручительства надійних західних банків), актуальні цінні папери та нерухомість.

Розподіл

Найбільш розповсюдженим способом зниження ризику шляхом його розподілу являється включення в процентну ставку ризикової надбавки, яка розраховується виходячи з параметрів: боргової загрузки позичальника, розміру річного /квартальногодоходу, виду та вартості забезпечення.

Базельський комітет пропонує розраховувати коефіцієнт ризику шляхом використання банком зовнішніх кредитних рейтингів або власної (внутрішньої) системи рейтингів активів і позабалансових статей (для розрахунку вимог до капіталу).

Зовнішній кредитний рейтинг публікується спеціалізованими рейтинговими агентствами (Moody`s, Standard&Poor`s и т.д.). Рейтингові оцінки виставляються у відповідності з платоспроможністю країни позичальника, а також з врахуванням строку обороту зобов’язань або окремого кредитного продукту, в результаті чого визначається рейтинг (ААА, BB, Dіт.д.)

Внутрішній кредитний рейтингвизначається самим банком шляхом оцінки певних факторів, які відображають ймовірність погашення боргу в повному обсязі та в строк.

В якості загальних критеріїв оцінки можна зазначити платоспроможність організації, характеристики кредитного продукту, оцінка зовнішнього середовища. Отримані рейтингові оцінки можуть використовуватися для створення звітності про якість кредитного портфелю, визначення необхідного рівня капіталу і резерву, визначення вартості кредитних продуктів та прийняття інших управлінських рішень[4].

При оцінці кредитного ризику на основі внутрішніх рейтингів (підхід IRBinternalratingbasedapproach).

Мають зберігатися мінімальні вимоги на розкриття інформації банку (вказані Базельським договором). Крім того необхідно отримати згоду наглядових органів на використання банком підходу IRB. Підхід IRBґрунтується на вимірі непередбачуваних збитків (UL) та очікуваних збитків (EL). Компоненти ризику включають в себе:

  1.  Показник ймовірності дефолту (PD), що приймає значення від 0 до 1, і чим більше значення приймає ймовірність дефолту, тим більша ймовірність того, що клієнт не поверне кредит;
  2.  Вартість під ризиком дефолту (EAD), іншими словами, вартість активу (величину суми кредиту), що знаходиться під ризиком;
  3.  Покриття кредиту заставою (LGD). Покриття кредиту приймає значення від 0 (кредит повністю покритий заставою) до 1 (кредит повністю не покритий заставою);
  4.  Величину кредитних втрат (CL).

В скороченому вигляді величину кредитних збитків можна представити наступним чином:

CL=PD*LGD

Компонентиризику виступають в якості вхідних функцій вагових коефіцієнтів ризику, які розроблюються для кожного класу активів (наприклад для корпоративних або роздрібних).

Найбільш корисним показником є ймовірність дефолту. В основному всі дослідження щодо оцінки кредитного ризику ведуться саме у напрямі розробки механізму розрахунку ймовірності дефолту. На основі певних параметрів позичальника та кредиту необхідно розробити процедуру оцінки ймовірності дефолту

,          

де – ваги параметрів , – кількість позичальників, – кількість параметрів кредиту.

Для розв’язання даної задачі можливим є використання двох підходів:

  1.  Скоринговий підхід (побудова математичної моделі на основі статистики дефолтів за попередні періоди).
  2.  Експертний підхід [7].

1.3.2.Методи оцінювання кредитоспроможності позичальника

Якісна оцінка

Даний спосіб оцінки ризику представляє собою словесний опис рівня ризику шляхом виявлення негативної інформації, на основі якої визначається кредитний рейтинг позичальника або консолідаційний рівень ризику. Спираючись на показники по кожному клієнту, можна визначити, середньозважений показник ризику по кредитному портфелю в цілому.

Кількісна оцінка

Кількісна оцінка передбачає присвоєння кількісного параметра якісному, з метою визначення втрат по операції і включення процесу управління ризиками в бізнес-планування. Якщо якісна оцінка дає досить широкі межі показника, то в кількісній оцінці межі є конкретними.Кількісний показник визначається шляхом збільшення рівня кредитного ризику (у процентах) на розмір кредиту

З кількісної точки зору кредитний ризик представляє собою функцію параметрів позики та позичальника. Ступінь ризику, зв’язаного з певним позичальником та видом кредиту, базується на оцінці різних видів ризику, які виникають для банку при появі кредиту[4].

1.3.3. Підходи до побудови моделей для оцінювання ризиків

Постійний розвиток

Аналіз доступних методів

Всебічне дослідження

Об’єктивність процесів

Цілісність вхідної інформації

Вичерпність вхідної інформації

Практична перевірка результатів

Теоретичне підґрунтя

Розробка, прийняття, реалізація рішення

Рис.1.1 Діалектичні аспекти, що впливають на прийняття рішення [6].

Експертні моделі

Експертний підхід передбачає, що фахівці в області кредитування індивідуальних позичальників визначають суттєві характеристики клієнту банку, які можуть впливати на повернення чи неповернення кредиту, ставлять у відповідність цим характеристикам певні ваги. Для кожного клієнта за всіма характеристиками проставляються бали у відповідності з вагами, встановленими експертами, та підраховується сума всіх балів. Для банку завчасно встановлюється певне порогове значення, яке визначає правило: якщо сума всіх балів менше цього значення, то клієнту не слід видавати кредит, а якщо більше цього значення, то клієнт може отримати кредит. Також банк може встановити ще одне значення (верхня межа), яке визначає таке правило: якщо сума балів більша встановленого значення, то клієнту можна видавати кредит без надмірної обережності. Якщо і верхня і нижня межа щодо видачі кредиту задані, то значення між цими межами знаходяться у компетенції менеджера банку, який на власний розсуд визначає, чи видавати кредит клієнту, чи ні. Зрозуміла суб’єктивність цього підходу як при встановленні балів (для одних експертів одні характеристики є більш важливими і мають більший вплив, для інших експертів – інші характеристики), так і при встановленні порогового та верхнього значення.

Кожний комерційний банк може розробити власну бальну методику оцінки кредитоспроможності індивідуальних позичальників, створити єдиний інтегральний показник, в якому буде відображено зважене значення показників оцінки кредитоспроможності потенційних позичальників з урахуванням специфіки функціонування і власного бачення клієнтів.

Скорингові моделі

Скоринговий підхід ґрунтується на побудові математичної моделі оцінки кредитоспроможності позичальників на основі кредитних історій банку та оцінці ймовірності дефолту потенційного позичальника, виходячи з його соціально-демографічних характеристик. Маючи статистичні дані «гарних» і «поганих» кредитів за певний період, банк може визначити безпосередньо фактори, які створюють передумови для повернення/неповернення кредиту, та для кожного нового клієнту на основі цих характеристик визначити його можливість повернути кредит. На початковому етапі скоринговий підхід ґрунтується на експертному підході, адже необхідно перш за все визначити, які саме характеристики щодо клієнту потрібно збирати, як перевірити надані клієнтом дані, та в процесі застосування скорингової моделі змінювати дані про клієнта, які збирає банк. Очевидно, що скорингову модель необхідно корегувати у процесі роботи (кожні 2-3 роки), оскільки ситуація в країні динамічно змінюється, з’являються певні зловмисники, які можуть прорахувати, які саме фіктивні дані потрібно надати банку для того щоб скорингова модель визначила, що йому можна надати кредит і т. ін. Спільне використання обох підходів дозволило б полегшати процес прийняття рішення стосовно видачі кредиту клієнту банком.  

Більш адекватним є підхід на основі статистики дефолтів за попередні періоди, тобто побудова скорингової моделі. Статистичні методи передбачають визначення ймовірності реалізації певної події на основі певних вимог:

  1.  об’єкти, для аналізу яких пропонується використати статистичні дані, і об’єкти, на яких збираються статистичні дані, є еквівалентними (вимога еквівалентності об’єктів);
  2.  умови, в яких пропонується використовувати статистичні дані і умови їх збору є еквівалентними (вимога еквівалентності умов);
  3.  обсяги вибірок статистичних даних є достатніми, методи обробки – коректними, а джерело інформації – надійним (вимога переконливості).

Отже, даний підхід висуває доволі високі вимоги до статистики дефолтів:

  1.  Одноманітна вибірка(позичальники повинні бути досить схожими).
  2.  Вибірка має складатися з певної кількості випадків – чим більше дефолтів, тим краще. За різними оцінками, для адекватності моделі  обсяг вибірки повинен складати не менше 2000 випадків.
  3.  Вибірка для побудови моделі повинна накопичуватися за доволі обмежений термін. Дана вимога викликана фактом зміни макроекономічного середовища. Позичальник з певними параметрами в одному макроекономічному середовищі без проблем виплачуватиме кредит; а в іншому середовищі – виявиться дефолтом. Вважається, що в умовах країн, які розвиваються, модель оцінки  ймовірності дефолту необхідно змінювати кожні 2-3 роки.
  4.  Необхідно накопичувати не лише кредитну історію позичальників (дефолт / не дефолт), але й параметри цих позичальників – вік, стать, місце роботи, посада, сімя, тощо. Проблема в тому, що спочатку невідомо, які саме параметри виявляться значущими у моделі. Тому на етапі побудови моделі необхідно накопичувати максимальну кількість параметрів по кожному позичальнику.
  5.  Вибірка має включати інформацію по кредитах,  цикл кредитування яких вже закінчився. Ця вимога є необхідною, оскільки обов’язковою є інформація про те, чи був цей кредит повернений, чи ні.  
  6.  Історія повинна накопичуватися в рамках кредитних продуктів (споживчий кредит, кредит на авто, іпотечний кредит). Скорингова модель також повинна будуватися для кожного кредитного продукту.

Дані стосовно процесу кредитування фізичних осіб задовольняють практично всім цим вимогам. Для фізичних осіб параметрами скорингової моделі можуть бути вік, сімейний стан, кількість дітей, освіта, місце проживання, робота, посада, власність, кредитна історія та інші[5].

1

Прийом, обробка, представлення інформації

2

Розпізнавання ситуації

3

Підготовка варіантів рішення

4

Оцінка ефективності варіантів рішення

5

Прийняття рішення

Рис.1.2 Блочна модель прийняття рішення [6].

1.4.Постановка задачі

У сучасній українській банківській практиці неформальний аналіз кредитоспроможності індивідуальних позичальників застосовується винятково рідко, оскільки практика кредитування індивідуального позичальника ще не отримала широкого розповсюдження. До того ж в Україні лише недавно розпочалось впровадження аналізу кредитоспроможності клієнтів. І, нарешті, українські комерційні банки тільки починають розширювати практику кредитування індивідуальних позичальників, водночас вважаючи цю сферу діяльності більш ризикованою та менш прибутковою у порівнянні з кредитуванням юридичних осіб.

Виконане дослідження існуючих методів і технологій аналізу кредитних ризиків показало, що моделі і методи, які пропонуються у відомих програмних продуктах, мають деякі обмеження і тому потребують певного доповнення, модифікації і покращення. Виникає необхідність розробки нових методів для коректного розв’язання проблем, з якими не справляються існуючі методи, та отримання кращих результатів.

Для досягнення поставленої мети у роботі поставлені і вирішуються такі завдання:

  1.  Виконати аналіз предметної області і вибрати методи математичного моделювання і оцінювання кредитних ризиків.
  2.  Запропонувати математичні моделі для аналізу кредитних ризиків індивідуальних позичальників на основілогістичної регресії.
  3.  Розробити математичні моделі для аналізу кредитних ризиків індивідуальних позичальників на основі дерев рішень.
  4.  Побудувати математичну модельдля аналізу кредитних ризиків індивідуальних позичальників на основі мереж Байєса.
  5.  Розробити новий ефективний метод аналізу кредитних ризиків індивідуальних позичальників на основі інтеграції мереж Байєса та  нечіткої логіки з метою підвищення якості оцінок прогнозів.
  6.  Розробити програмний продукт для виконання аналізу якості оцінених прогнозів.
  7.  Виконати порівняльний аналіз показників якості моделейза допомогоюROCаналізу.

1.5.Висновки до розділу

В першому розділі розглянуто основні означення стосовно поняття ризику. Наведено класифікацію банківських ризиків та проаналізовано проблеми оцінювання кредитного ризику. Також  розглядаються методики аналізу кредитних ризиків, існуючі методи для зниження кредитних ризиків та підходи до побудови математичних моделей для аналізу та прогнозування ризиків.

Встановлено, що задачі математичного моделювання, оцінювання і прогнозування кредитних ризиків є на сьогодні надзвичайно актуальними. У зв’язку з цим виникає необхідність збору статистичних даних стосовно позичальників кредитів, а також вибору і розробки належних методів обробки цих даних з метою побудови адекватних моделей.

Зроблено загальну постановку задачі та опис етапів аналізу даних, які будуть реалізовані в наступних розділах.

РОЗДІЛ 2

МЕТОДИ МОДЕЛЮВАННЯ І ПРОГНОЗУВАННЯ БАНКІВСЬКИХ КРЕДИТНИХ РИЗИКІВ

2.1.Нелінійні моделі логіт-пробіт

2.1.1. Логіcтична регресія

Логістична регресія – це різновид множинної регресії, загальне призначення якої полягає в аналізі зв'язку між декількома незалежними змінними (званими також регресорами або предикторами) і залежною змінною. Бінарна логістична регресія, як випливає з назви, застосовується у разі, коли залежна змінна є бінарною (тобто може приймати тільки два значення). Іншими словами, за допомогою логістичної регресії можна оцінювати вірогідність того, що подія наступить для конкретної випробовуваної (хворий/здоровий, повернення кредиту/ дефолт і т.д.).

Як відомо, всі регресійні моделі можуть бути записані у вигляді формули:

.  

Наприклад, в множинній лінійній регресії передбачається, що залежна змінна є лінійною функцією незалежних змінних, тобто:

.

Чи можна її використовувати для завдання оцінки вірогідності результату події? Так, можна, обчисливши стандартні коефіцієнти регресії. Наприклад, якщо розглядається результат по позиці, задається змінна у із значеннями 1 і 0, де 0 означає, що відповідний позичальник розплатився по кредиту, а 1, що мав місце дефолт. Проте тут виникає проблема: множинна регресія не "знає", що змінна відгуку бінарна за своєю природою. Це неминуче приведе до моделі із значеннями, що передбачаються, більшими 1 і меншими 0. Але такі значення взагалі не допустимі для первинного завдання. Таким чином, множинна регресія просто ігнорує обмеження на діапазон значень для у.

Для вирішення проблеми завдання регресії може бути сформульоване інакше: замість прогнозу бінарній змінній, ми передбачаємо безперервну змінну із значеннями на відрізку [0,1] при будь-яких значеннях незалежних змінних. Це досягається застосуванням наступного регресійного рівняння (логіт-перетворення):

,

де Р – ймовірність того, що відбудеться подія, що цікавить;

е – основа натуральних логарифмів 2,71...;

у – стандартне рівняння регресії.

Залежність, що зв'язує ймовірність події і величину у, показана на наступному графіку

Рис. 2.1 Логістична функція розподілу.

Пояснимо необхідність перетворення. Припустимо, що ми міркуємо про нашу залежну змінну в термінах основної ймовірності Р, що лежить між 0 і 1. Тоді перетворимо цю ймовірність Р:

.

Це перетворення зазвичай називають логістичним або логіт-перетворенням. Теоретично Р може приймати будь-яке значення. Оскільки логістичне перетворення вирішує проблему про обмеження на 0-1 межі для первинної залежної змінної (ймовірність), то ці перетворені значення можна використовувати в звичайному лінійному регресійному рівнянні. А саме, якщо провести логістичне перетворення обох частин описаного вище рівняння, ми отримаємо стандартну модель лінійної регресії.

Існує декілька способів знаходження коефіцієнтів логістичної регресії. На практиці часто використовують метод максимальної правдоподібності. Він застосовується в статистиці для отримання оцінок параметрів генеральної сукупності за даними вибірки. Основу методу складає функція правдоподібності (likelihoodfunction), що виражає щільність ймовірності (ймовірність) сумісної появи результатів вибірки  

Згідно методу максимальної правдоподібності в якості оцінки невідомого параметра приймається таке значення  , яке максимізує функцію L.

Знаходження оцінки спрощується, якщо максимізувати не саму функцію L, а натуральний логарифм  , оскільки максимум обох функцій досягається при одному і тому ж значенні .

.

У разі бінарної незалежної змінної, яку ми маємо в логістичній регресії, викладення можна продовжити таким чином. Позначимо через   ймовірність появи одиниці:  Prob . Ця ймовірність залежатиме від  , де  – рядок матриці регресорів,   – вектор коефіцієнтів регресії:

.

Логарифмічна функція правдоподібності рівна:

.

де  0, 1 – множина спостережень, для яких і   відповідно.

Можна показати, що градієнт  і гессіан Н функції правдоподібності рівні:

.

Гессіан всюди негативно визначений, тому логарифмічна функція правдоподібності всюди увігнута. Для пошуку максимуму можна використовувати метод Ньютона, який тут завжди сходитиметься (виконана умова збіжності методу):

.

Для розрахунку коефіцієнтів логістичної регресії можна застосовувати будь-які градієнтні методи: метод зв'язаних градієнтів, методи змінної метрики та інші [9].

Недоліком логістичної регресії є те, що вона застосовується лише до обмеженої кількості вхідних факторів, тобто на етапі підготовки даних приходиться додатково залучати експертів або виконувати додаткову обробку для виявлення найвпливовіших характеристик і включення у модель лише їх.  Можуть також виникнути проблеми з аномальними даними, інколи з’являється необхідність відкидання викидів, регуляризації ваг, відкидання ознак, стандартизації даних. Трудомісткість методу вища за звичайний метод найменших квадратів, оцінки ймовірностей можуть виявитися неадекватними, якщо функція правдоподібності не має експоненціального вигляду[10].

2.1.2. Пробіт-модель

Пробіт модель – альтернативна бінарна модель

Для пробіт-аналізу використовується стандартний нормальний розподіл для моделювання залежності F(Z)

.

Функція вірогідності залежить від змінної Z, яка в свою чергу залежить від обраних факторів

.

Для оцінки параметрів, як і в логіт-моделі використовується метод максимальної правдоподібності

Граничний ефект змінної Xi  - дорівнює похідній функції вірогідності по цій змінній

.

Оскільки f(Z) – похідна функції (функція щільності) стандартного нормального розподілу F(Z), то вона виглядає наступним чином

 [9].

Таблиця 2.1

Логіт та пробіт аналіз: переваги та недоліки

Плюси

Мінуси

Виправлення недоліку лінійної моделі, для якої ймовірність могла бути більше 1 (що є логічно неправильним), оскільки ймовірність від 0 до 1

Систематичне збільшення похибки коефіцієнтів регресії при розмірі вибірки менше 500

При розв’язанні задач класифікації об’єкти можна розділити на декілька груп:

Наприклад в скорингу не тільки (0-поганий, 1-хороший), але і декілька груп (1,2,3,4 групи ризику).

При побудові моделі потрібно мінімально 10 варіантів на кожну незалежну змінну (рекомендовано 30-50)

Наприклад, потрібний варіант неповернення кредиту. Якщо 50 позичальників зі 100 не повертають – максимальне число незалежних змінних в моделі -50/10=5

2.2. Дерева рішень

Перші ідеї створення дерев рішень закладені в роботах Ховленда і Ханта в кінці 50-х років ХХ сторіччя. Дерева рішень – це один з методів автоматизованого аналізу даних, коли правила представляються у вигляді послідовної ієрархічної структури, в якій кожному вузлу відповідає єдиний вузол, що дає можливість прийняти рішення.Під правилом передбачається конструкція, представлена у вигляді «якщо ... , то ...».

На сьогодні відома значна кількість алгоритмів, що реалізують дерева рішень: CART, C4.5, CHAID, тощо. Найбільш поширеними є алгоритм CART та С4.5. CART (Classification  And Regression Tree) – алгоритм побудови бінарного дерева рішень, кожний вузол якого при розбитті має лише двох нащадків. Вперше був опублікований у 1984 р. Бріманом та ін. [20]. Алгоритм використовується для вирішення задач класифікації і регресії. Для вибору оптимального правила розбиття дерева використовується функція оцінки якості розбиття:  

.

В алгоритмі С4.5, запропонованому Р.Куінленом[21], з’явилась можливість роботи з пропущеними даними, покращений критерій розбиття дерева, кількість нащадків для вузла не обмежена. Для роботи алгоритму висуваються наступні вимоги до даних: дані мають бути представлені у вигляді двовимірної таблиці, атрибути мають дискретні або числові значення, кількість атрибутів фіксована для усіх прикладів, мають бути визначені класи (тобто наявність атрибутів-міток класу), класи мають бути дискретними.

Процес побудови дерева здійснюється зверху вниз. Спочатку створюється корінь дерева, потім нащадки кореня і так далі. На першому кроці є лише корінь (порожнє дерево) і множина навчальних прикладів. Необхідно розбити множину   на підмножини. Це можна зробити, обираючи один з атрибутів в якості перевірочного. В результаті такого розбиття отримують   (по кількості значень атрибута) підмножин та, відповідно, створюють   нащадків кореня, кожному з яких поставлена у відповідність своя підмножина, яка отримана при розбитті множини. Ця процедура рекурсивно застосовується до всіх підмножин (нащадків кореня).

Критерієм вибору атрибуту є формула:

,

де  ,.

– кількість прикладів з даної множини  , які відносяться до одного й того самого класу  .

Aлгоритм CHAID (CHi-squaredAutomaticInteractionDetector) був запропонований у 1980 р. Гордоном В. Касом. Тест хі-квадрат використовується як оцінка якості розбиття. Цей алгоритм може використовуватись як для числових, так і для категоріальних змінних. У випадку неперервних змінних потребує попередньої трансформації їх у категоріальні змінні.

Модифікацією методу CHAID є метод Exhaustive CHAID, який був запропонований у 1991р. Бігсом. На етапі виконання об’єднуючого кроку виконується вичерпний пошук для об’єднання будь-яких подібних пар, поки не залишиться окрема пара.

Більшість з відомих алгоритмів є "жадібними алгоритмами": якщо один раз був вибраний атрибут і по ньому проведено розбиття на підмножини, то алгоритм не може повернутися назад і вибрати інший атрибут, який дав би краще розбиття. І тому на етапі побудови дерева не можна сказати чи дасть вибраний атрибут, зрештою, оптимальне розбиття.

Моделі CHAID чи CART створюють дерева рішень за найбільш інформативними атрибутами. Дерева рішень широко використовуються завдяки доволі високій точності прогнозу на більшості видів бізнес-даних, а також завдяки легкості розуміння результату, що формулюється у вигляді послідовності правил – умов та результату прогнозу. Прикладом може бути гілка дерева рішень для задачі кредитування наступного вигляду: «якщо вік позичальника між 25 та 40 роками, що володіє автомобілем, має професію фінансовий аналітик, то можна видати кредит з ризиком неповернення 0,004%».

Переваги дерев рішень: (1) швидкий процес навчання; (2) генерування правил в тих областях, де знання складно формалізувати; (3) зрозуміла класифікаційна модель; (4) висока точність прогнозу[5].

2.3.Байєсівський підхід на основі мереж довіри

При використанні байєсівських мереж (БМ) в якості інструменту аналізу даних необхідно вирішувати два математичні задачі: (1) побудови структури БМ і (2) формування імовірнісного висновку. Задача побудови БМ по заданих навчальних даних є NP-важкою, тобто завданням нелінійної поліноміальної складності. Кількість всіх можливих нециклічних моделей, які потрібно проаналізувати обчислюється за рекурентною формулою Робінсона, запропонованої у 1976 році[22]:

,

де - кількість вершин, а. Однак на практиці виконати повний перебір моделей можна тільки для мереж не більш ніж з 7 вершинами (вузлами), тому що в іншому випадку не вистачає ніяких обчислювальних ресурсів.

Завдання формування імовірнісного висновку в БМ є важливою і складовою і відноситься до класу задач прийняття рішень. Однак для реалізації цього методу необхідно привести структуру БМ до виду об'єднаного дерева (junctiontree), і тільки після цього можна використовувати алгоритм імовірнісного висновку в об'єднаному дереві, який ґрунтується на проходженні повідомлень і по дереву.

Очевидно, що існуючі методи побудови БМ і формування висновку, вимагають трудомістких обчислень. Тому розробка методів, що дозволяють зменшити обчислювальну складність, є актуальною при моделюванні процесів різної природи мережами Байеса [8].

Постановка задачіпобудови байєсівської мережі

1. Ставиться завдання розробки евристичного методу побудови БМ, що складається з двох етапів. На першому етапі виконується обчислення значення інформації між усіма вершинами. На другому виконується цілеспрямований пошук, який використовує в якості оціночної функції оцінку мінімальної довжини (ОМД), засновану на принципі опису, який застосовується на кожній ітерації алгоритму навчання.

2. Також ставиться завдання розробки методу імовірнісного висновку в БМ з використанням двох кроків. На першому кроці виконується обчислення матриці емпіричних значень спільного розподілу ймовірностей всієї мережі. На другому кроці проводиться обчислення значень ймовірностей всіх можливих станів неінстанційованних вершин [11].

Поняття байєсівської мережі

Байєсова мережа являє пару, в якій перша компонента - це спрямований нециклічний граф, який відповідає випадковим змінним і записується як набір умов незалежності: кожна змінна незалежна від її батьків в. Друга компонента пари - це множина параметрів, що визначають мережу. Компонента містить параметри для кожного можливого значення і, де позначає набір батьків змінної. Кожна змінна представляється у вигляді вершини. Якщо розглядають більше одного графа, то для визначення батьків змінної в графі використовують позначення. Повна спільна ймовірність БМ обчислюється за формулою[12].

Гібридна мережа Байєса

Гібридна мережа Байєса визначається через спрямований ациклічний граф  і його функції , де − набір батьківських вузлів  .   − набір змінних, розділених на дискретні   і неперервні   змінні, тобто  . Структура графа обмежена тим, що неперервні змінні не можуть мати дискретні змінні як їх вузли-нащадки. Умовний розподіл неперервних змінних задається лінійною гаусівською моделлю:

,

де   та   − множини відповідно неперервних і дискретних батьків  ,    − мультиваріантний нормальний розподіл. Мережа представляє собою спільний розподіл усіх його змінних, заданих добутком усіх таблиць умовних ймовірностей.

У одновимірному випадку нормальний розподіл характеризують двома параметрами – середнім  і дисперсією . Для зручності розподіл параметризують, використовуючи дисперсію. Функція щільності має вигляд:  

.  

У багатовимірному випадку нормальний розподіл характеризується двома параметрами – вектором середнього і коваріаційною матрицею. Кажуть, що випадкові змінні   мають нормальний розподіл  (де  − вектор розмірністю ;   − симетрична позитивно визначена матриця розміром ), якщо

 .

Контур багатовимірної гаусіани виглядає як еліпсоїди навколо середнього  , де кожний еліпсоїд має певну сталу щільність. Вектор середнього визначає центр еліпсоїдів і коваріаційна матриця визначає їх обрис. Взагалі,   − це відхилення  ,   (для  ) − це коваріація між  і . Вектор середнього і коваріаційна матриця відповідають першим двом моментам нормального розподілу, тобто ; . Якщо всі недіагональні елементи у матриці нульові, тоді усі змінні незалежні одна від одної, а гаусіана є сферичною.

Зазвичай розглядається сумісний нормальний розподіл над  , де   і  . Використовується позначення:

,   (1.1)

де  , ;   − матриця розміром  ; − матриця розміром  ;  − матриця розміром  ;  − матриця розміром .

Нехай має сумісний нормальний розподіл, формально визначений виразом (1.1). Умовний розподіл   − це нормальний розподіл  , де  , .

Для окремого випадку, коли , справедливий висновок: умовний розподіл   − це нормальний розподіл , де ;  ;   − транспонована матриця  .

Можна розглядати сформульований висновок як шлях конвертації багатовимірних гаусіанів у мережу Байєса. Змінні упорядковуються у певному порядку . Потім цей висновок використовується для знаходження умовного розподілу:

  (1.2)

Створюється ребро з   до  () тоді і тільки тоді, коли . Умовний ймовірнісний розподіл (УЙР)  називається лінійним умовним ймовірнісним розподілом і має вигляд виразу (1.2) (після скорочення усіх нульових  ). Лінійний умовний ймовірнісний розподіл для кореневих вузлів є просто одновимірною гаусіаною. Мережа Байєса, у якій всі умовні ймовірнісні розподіли є лінійними, називається лінійною гаусіаною (ЛГ). Таким чином, кожна багатовимірна гаусіана може бути представлена ЛГ. Зворотне твердження також є справедливим. Кожна МБ з лінійними УЙР представляє собою нормальний спільний розподіл.

Умовна лінійна гаусіана (УЛГ) – це МБ, яка містить як неперервні змінні (), так і дискретні змінні (), з такими обмеженнями:

− дискретний вузол не може мати неперервних батьків, таким чином, усі УЙР для дискретних вузлів можуть бути подані як у дискретних мережах Байєса;

− УЙР будь-якої неперервної змінної є лінійним УЙР, заданий будь-якою комбінацією дискретних батьків. Формально, якщо вузол  має батьків  і , він визначається як УЙР, з використанням таких параметрів: для кожного  ,  і .  УЙР тоді визначається так:

.

Це найбільш популярний вид гібридних моделей. Вони дозволяють лише лінійні відношення між неперервними змінними і не дозволяють дискретним змінним мати неперервних батьків. Широке використання таких моделей обумовлене їх математичною зручністю. В УЛГ задані значення дискретних змінних, розподіл неперервних змінних  − багатовимірна гаусіана, отже спільний ймовірнісний розподіл – це композиція гаусіан, з якими можна працювати, використовуючи аналітичні інструменти.   

Якщо всі дискретні змінні задані, то умовні ймовірнісні розподіли неперервних змінних є лінійними умовними неперервними розподілами. Тоді при наданні будь-яких значень дискретним змінним умовна лінійна гаусіана редукується у ЛГ і тому представляє нормальний розподіл. Звідси випливає, що спільний розподіл, представлений УЛГ, є композицією гаусіан, де кожна композиція компонентів відповідає реалізації дискретних змінних.

Таким чином, використання МБ дозволить проаналізувати причинно-наслідковий зв'язок між окремими змінними (подіями, даними, тощо) і сформулювати на цій основі обґрунтований прогноз. Так, для задачі оцінки кредитоспроможності МБ дозволяють зрозуміти, який зв'язок між дефолтами позичальників та їх особистими характеристиками, отримати одразу без додаткової трансформації ймовірність повернення кредиту, і визначити – кому слід (чи не слід) надавати кредит. Використання гібридних МБ дозволить коректніше відпрацювати неперервні змінні в моделі (наприклад, вік чи сума кредиту) і досягти більшої точності прогнозу[13].

Алгоритм GreedyThickThinning

Алгоритм GreedyThickThinning (GTT) оптимізує існуючу структуру за допомогою модифікації структури та оцінювання результату. Повторюючи цей процес декілька разів, GTTздатний виділити найкращу мережу. GTT оцінює мережу, згенеровану за простим алгоритмом.Алгоритмпочинається з повністю з’єднаного орієнтованого ациклічного графуі згодом приєднує дуги між вузлами, спираючись на результати тесту на умовну незалежність. Цей тест перевіряє три пов’язані між собою вузли одночасно.

Викиди

                     Рак

                                       Задишка

Рис.2.2 Приклад умовної незалежності.

Розглянемо приклад з Рис. 2.2. Нехай ми знаємо, що викиди спричиняють рак, який спричиняє задишку. Якщо ми вже знаємо, що в пацієнта рак, тоді знання, що це спричинено викидами, не змінює знання, що в пацієнта є задишка. Таким чином, вузол «Задишка» умовно незалежний від вузла «Викиди» , враховуючи, що у пацієнта рак.

З цих даних алгоритмздатен визначити, які вузли краще поєднувати між собою, щоб сформувати мережу. Оскільки алгоритмне дуже добре визначає, чи не був зв'язок видалений помилково, результуюча помилка для необхідних зв’язків збільшується.

Алгоритм GTT пропонує вирішення цієї  проблеми за допомогою жадібного оцінювання мережі, на відміну від інших алгоритмів, які не використовують оціночної функції. GTT розглядає модифікації існуючої мережі. Ці модифікації включають додавання дуги, якщо вона не існує, та стирання або перевертання дуги, якщо вона існує. Процес формування отримав назву потовщення (thickening), а останній –  розрідження (thinning). Далі мережа оцінюється, і якщо покращень більше не знайдено, то побудова алгоритму закінчується. Проте, щоб уникнути лише місцевих покращень в мережі, після кожної оцінки задаються збурення. Кількість збурень зумовлена забезпеченням побудови кращої мережі [18].

2.4.Моделюванняна основі нечіткої логіки

Сьогодні одним з найбільш перспективних напрямів наукових досліджень в галузі аналізу, прогнозування та моделювання економічних явищ і процесів є нечітка логіка (fuzzylogic). Нечітко-множинні моделі, часто представлені у вигляді програмного забезпечення для персональних комп'ютерів, дозволяють і менеджерам різного рівня, і власникам підприємств приймати економічно грамотні рішення

Математична теорія нечітких множин і нечітка логіка– це узагальнення класичної теорії множин і класичної формальної логіки. Тані поняття вперше були запропоновані Л.Заде в 1965 р. Основною причиною появи нової теорії стала наявність нечітких і наближених міркувань при описі процесів, систем, об’єктів. []

Довгий час нечіткі множини майже не використовувались для фінансового аналізу, оцінки цінних паперів, оптимізації фондового портфелю і прогнозування фондових індексів, але останнім часом інтерес до цього підходу значно зріс.

Характеристикою нечіткої множини виступає функція приналежності (ФП)   – степінь приналежності до нечіткої множини C. Для нечітких множин визначені основні логічні операції. Перетином двох нечітких множин   і   є: . Об’єднанням двох нечітких множин називають: .

Для опису нечітких множин вводиться поняття нечіткої і лінгвістичної змінної. Нечітка змінна описується набором , деN   – назва змінної,   X– універсальна множина,  A – нечітка множина над X . Значеннями лінгвістичної змінної можуть бути нечіткі змінні. Кожна лінгвістична змінна складається з назви, множини значень (термів), універсальної множини  X та синтаксичного і семантичного правил.

Існують типові функції приналежності (ФП), найчастіше використовуються трикутні, трапецієподібніі і гаусівські ФП.

Трикутна функція має вигляд:

.

Трапецієподібна функція приналежності має вигляд:

.

Гаусівська функція приналежності описується функцією  .

Основою для виконання операції нечіткого логічного висновку є база правил, яка містить вислови у формі «якщо …, то …» і відповідних лінгвістичних термів. При цьому повинні виконуватись такі умови:

1. Існує хоча б одне правило для кожного лінгвістичного терму вихідної змінної.

2.  Для будь-якого терму вхідної змінної існує хоча б одне правило, в якому цей терм використовується в якості передумови (ліва частина правила).

Інакше база нечітких правил є неповною.

В загальному вигляді механізм логічного виведення включає чотири етапи: введення нечіткості (фазифікація), нечітке виведення, композиція і приведення до чіткості або дефазифіказція (рис.2.3).

Фазифікатор

(приведення до нечіткості)

Нечіткий логічний висновок

Дефазифікатор

База правил

Рис.2.3 Система формування нечіткого логічного висновку

Відомі основні типи алгоритмів формування нечіткого висновку, а саме, алгоритми Мамдані, Цукамото, Сугено, Ларсена, які відрізняються між собою видом правил, логічних операцій і методу дефазифікації, що використовуються.

Недоліки систем з нечіткою логікою: (1) набір правил формулюється експертом і він може виявитися неповним або суперечливим; (2) функції приналежності містять ряд параметрів, які зазвичай невідомі точно експерту, а відома лише їх форма. Тому нечіткі множини потребують навчання, тобто спочатку здійснюється налагодження або генерування правил, а потім виконується навчання параметрів функцій приналежності[17].

2.5. Висновки до розділу

В другому розділі викладені основні теоретичні відомості щодо математичних методів та підходів до інтелектуального аналізу даних, що застосовуються до моделювання і прогнозування банківських кредитних ризиків. Зокрема розглянуто такі моделі і методи:

  1.  модель логістичної регресії та пробіт-модель;
  2.  загальні відомості про дерева рішень, та алгоритми, що їх реалізують, такі як CART, C4.5, CHAID;
  3.  поняття байєсівської мережі, гібридна мережа Байєса, алгоритм GreedyThickThinningта особливості його побудови;
  4.  нечітка логіка, поняття функції приналежності, терм множини, бази правил та системи формування логічного висновку.

РОЗДІЛ 3

ЗАСТОСУВАННЯ МЕТИОДІВ МОДЕЛЮВАННЯ КРЕДИТНИХ РИЗИКІВ

3.1.Застосування  логіт-пробіт

3.1.1. Прогнозування кредитоспроможності індивідуального позичальника на основі бінарної логістичної регресії

Для побудови моделі використаємо навчальну вибірку даних про клієнта та результатів повернення чи неповернення цим клієнтом кредиту (0 – якщо кредит повернули і 1 – якщо ні). Маємо інформацію про 1500 клієнтів, спочатку побудуємо модель логістичної регресії на основі даних про 1200 кліентів, а потім зробимо прогноз на основі побудованої моделі для наступних 300 клієнтів, маючи в моделі всі дані про них, окрім результатів повернення  чи неповернення кредиту, і порівняємо результати побудованого прогнозу з реальним станом подій.

Скористаємося програмою EViews 7.0 для побудови моделі.

Недоліком логістичної регресії є те, що вона застосовується лише до обмеженої кількості вхідних факторів, тобто на етапі підготовки даних приходиться додатково залучати експертів або виконувати додаткову обробку для виявлення найвпливовіших характеристик і включення у модель лише їх.  В даному випадку в якості вхідних даних були включені такі змінні: сума кредиту, вік позичальника, його дохід, платіж по кредиту, строк кредиту та освіта.

Характеристики якості моделі логістичної регресі

Рис.3.1 Основні характеристики якості моделі логістичної регресії

Рис.3.2Прогноз для 300 значень на основі моделі логістичної регресії

Рис.3.3Прогнозні значення за моделлю логістичної регресії та реальні значення

3.1.2. Прогнозування кредитоспроможності індивідуального позичальника на основі пробіт моделі.

Використовуємо ту ж саму умову задачі, що і для логістичної регресії

Характеристики якості пробіт моделі

Рис.3.4 Основні характеристики якості пробітмоделі

Рис.3.5Прогноз для 300 значень на основі пробіт моделі

Рис.3.6Прогнозні значення за пробітмоделлюта реальні значення

3.1.3. Порівняння характеристик якості прогнозу для логіт та пробіт моделі

Таблиця 3.1

Статистичні характеристики якості прогнозів

СКП

САПП

К-т Тейла

Логіт

0.407083

13.23895

0.493373

Пробіт

0.406719

13.23129

0.493053

3.2. Дерева рішень для оцінювання кредитоспроможності індивідуального позичальника.

Найбільш часто дерева рішень використовують для розв’язання задачкласифікації. Наприклад, звернення за кредитом можуть бути класифіковані як такі що мають високий або низький ризик – дерева рішень дозволяють визначити правила для виконання такої класифікації на основі даних з навчальної вибірки. В порівнянні з іншими алгоритмами дерева рішень мають такі переваги як висока швидкість навчання, висока точність та легко зрозумілі шаблони. Прогнозування за деревами рішень вважається ефективним.

Постановка задачі: на вибірці з 1600 кредитів, частина з яких були поверненні, а частина ні, побудувати дерево рішень, що дозволяє класифікувати нового клієнта як такого, що поверне кредит, або не поверне.

Кожен клієнт описується 18 характеристиками

Для побудови дерева рішень використаємо програму SPSS 20.0.

Рис.3.7 Дерево рішень

Таблиця 3.2

Результати за побудованим деревом рішень

Класифікація

Спостереження

Спрогнозовано

0

1

Відсоток коректних

0

1079

71

93,8%

1

314

136

30,2%

Загальний відсоток

87,1%

12,9%

75,9%

3.3. Прогнозування кредитоспроможності індивідуального позичальника за допомогою БМ

В Україні працює один іноземний комерційний банк, який видає кредити та збирає статистику по виданих кредитах: чи були вони повернуті, чи ні. Нехай за рік банком  було видано 1600 кредитів. Зрозуміло, що не усі ці дані впливають на прийняття рішення програмою про видачу кредиту, оскільки частина даних необхідна банкові для статистичної звітності, для формування єдиного банківського реєстру про неповернення кредитів і т.п. Кожний клієнт описується 18 характеристиками. Постановка задачі: по наявних даних необхідно побудувати мережу, яка показує зв'язок між характеристиками клієнта і вершиною – подією повернення кредиту. Друга частина задачі: за наявними навчальними даними визначити ймовірність повернення кредиту новим клієнтом, що прийшов до банку. Отже, треба визначити – ймовірність дефолту потенційного позичальника.

Оскільки числові характеристики (сума кредиту, вік, дохід і т.п.) набувають досить багато значень, тобто є неперервними, то для вирішення даної задачі необхідно використовувати гібридні мережі Байєса. За описаною вище методикою необхідно виконати аналіз проблеми і зробити формалізовану постановку задачі. Розглянемо детальніше типову схему застосування запропонованої методики.

1 крок. Для вирішення задачі оцінювання кредитоспроможності позичальника необхідно зібрати статистичні дані по виданих кредитах, частина з яких було повернуті, а частина виявилась дефолтами, тобто отримати позитивні і негативні приклади навчальних даних.

На основі певних параметрів позичальника та кредиту необхідно розробити формальну модель і оцінити ймовірності дефолту позичальника:

,        

де – ваги параметрів , – кількість позичальників, – кількість параметрів кредиту .

Модель оцінки кредитоспроможності на основі мереж Байєса описується наступним чином:

,       

де – змінні, що описують характеристики клієнту і кредиту; – імовірнісний розподіл змінних ; – спрямований ациклічний граф, вузли якого відповідають випадковим змінним модельованого процесу; - ймовірність повернення кредиту.

2 крок. Дані, що відносяться до задачі – це наші статистичні дані по 1600 виданих кредитах, з яких 450 випадків дефолтів, 1150 – повернутих кредитів.

3 крок. Взаємовиключними змінними для даної задачі є 18 характеристик, що описують клієнта та кредит.

4-5 кроки. Оскільки в задачі використовуються неперервні змінні і будується гібридна мережа Байєса, то для неперервних змінних використовується дискретизація, тобто область значень неперервної змінної розбивається на проміжки. Кількість проміжків визначається користувачем, ті стовпчики, для яких не було вказано кількість інтервалів розбиття, автоматично  розбиваються на два проміжки.  Доцільно виконувати дискретизацію даних за однаковою шириною класів або за однаковою кількістю точок всередині кластерів. Крім цього, ширину та кількість проміжків можуть бути регламентовані банком, виходячи з соціологічних або демографічних досліджень груп клієнтів [15].

Для побудови мережі Байєса використаємо програму GeNIe 2.0.

При побудові структури мережі Байєса в програмі GeNIe слід пам’ятати, що обраний алгоритм впливає на швидкість і на саму побудовану структуру. Найшвидшим є алгоритм GreedyThickThinning, його і будемо використовувати для аналізу прикладів.  У результаті роботи алгоритму  отримуємо тільки одну структуру, яка є логічною і оптимальною.

Побудована за цими даними структура мережі Байєса представлена на рис.  Вона наочно демонструє зв’язки між даними.

Рис.3.8 Структура побудованої за допомогою GeNIe мережі

Для більш наочного відображення ймовірностей можливих станів всіх вузлів використовують функцію ViewAs ->BarChart, яка відображає вузли у вигляді гістограм. На рис.3.9 наведена структура мережі з вузлів у вигляді гістограм.   

Рис.3.9 Структура побудованої за допомогою GeNIe мережі у вигляді гістограм

3.4. Комбінування байєсівської мережі і нечіткої логіки

Основна ідея інтегрованого підходу полягає у тому, що він передбачає комбінацію методів таким чином, щоб уникнути недоліків, таких як наприклад те, що дерева рішень і логістична регресія працюють лише з обмеженим об’ємом вхідних даних, і дозволяє працювати у тих випадках, коли інші методи не можуть бути застосовані. Очевидно, що під час побудови прогнозної моделі постає питання, як формалізувати зібрані фінансові дані і виявити, які з них є суттєвими. Для цього пропонується спочатку побудувати мережу Байєса, яка встановить причинно-наслідкові зв’язки між змінними, що відповідають факторам, визначить силу зв’язків між цими змінними, а також дозволить виявити змінні, які взагалі не пов’язані з результуючою подією («висячі змінні»). На основі побудованої мережі і встановлених зв’язків можна суттєво скоротити кількість факторів, які слід включати на наступному етапі при побудові моделі. При застосуванні інтегрованого підходу поєднанням мережі Байєса та нечіткої логіки до задачі прийняття рішення щодо кредитоспроможності клієнтів банку, визначення зв’язку вхідних та вихідних характеристик  за допомогою експертного аналізу дозволяє побудувати базу даних, на основі якої формуються правила системи нечіткого виведення. Для визначення характеру взаємозв’язку вхідних та вихідних змінних розроблена база знань, яка лежить в основі мережі Байєса. Проводиться дискретизація вхідних та вихідних змінних, та задається рівень кредитоспроможності, визначається коефіцієнт максимальної зміни ймовірностей для кожного параметра за наступною формулою для і-того параметра:

,

де – сума значень ймовірностей значень і-того параметра при різних апріорі заданих значеннях вихідної змінної.

Обирається інтервал для вхідних та вихідних змінних, вигляд функцій приналежності, а також терм-множини. Комплексне використання системи нечіткого виведення і мережі Байєса в системах підтримки прийняття рішень сприяє збільшенню швидкості і точності прийняття рішення за рахунок автоматизації процесу обробки вхідної інформації[19].

Загальна послідовність реалізації інтегрованого методу аналізу даних

1 крок:   Збір статистичних даних, які у достатній мірі характеризують досліджуваний процес.

2 крок:   Формалізація зібраних даних і виявлення, які з них є суттєвими. Будується та навчається мережа Байєса на основі статистичних даних, яка  виявляє суттєві змінні та причинно-наслідкові відношення між ними. Це дає можливість на наступному кроці побудови моделі скоротити кількість факторів, які слід враховувати.

3 крок: Визначення множини суттєвих факторів; змінні, що їм відповідають, включаються у модель, яка будується на основі вибраного методу (логістичної регресії, дерева рішень, кластерного аналізу, нечіткої логіки).

4 крок:   Аналіз отриманих результатів, перевірка якості моделі. У випадку прийнятної якості моделі використати її для прогнозування.

5 крок:  На основі побудованої моделі обчислюється оцінка прогнозу та видаються рекомендації [15].

Методика побудови

  1.  Вибір показників

Проаналізувавши мережу Байєса, отриману в попередньому пункті, використаємо для побудови нової мережі Байєса тільки ті показники, які безпосереднью впливають на повернення або неповернення кредиту, та які являються нечіткими, тобто були отримані за допомогою процедури дискретизації.

Рисунок 3.10 Спрощена мережа Байєса

2. Побудова функцій належності 

При побудові функцій належності конструюються функції належності вхідних і вихідних змінних термів.

Виходячи з результатів, отриманих з побудованої мережі Байєса, в якості терм-множин вхідних змінних візьмемо наступні:

Рис. 3.11Вік позичальника – «AGE» - Т1={“f21_to35”, “f30_to50”, “f45_to61”};

Рис.3.12Сума кредиту -  «CREDIT» - Т2={“small”, “average”, “big”};

Рис 3.13 Платіж по кредиту  - «PAYMENT» - Т3={“low”, “average”, “high”};

Рис.3.14Дохід позичальника - «INCOME» -  Т4={“very_low”,”low”, “average”, “high,”very_high”};

В якості терм-множини вихідної лінгвістичної змінної «Дефолт» використаємо множину Т5={“return”, “not_return”} (рис. 3.15);

Рис. 3.15 Вихідна змінна «Дефолт»

В якості методу формування нечіткого виведення використовуємо метод Мамдані, який забезпечує належну точність оцінок. На рис.  наведено вигляд інтерфейсу після визначення вхідних та вихідних змінних системи формування нечіткого висновку.

Рис.3.16 Вигляд редактора після визначення вхідних та вихідних змінних системи формування нечіткого висновку

  1.  Формування множини правил

Для побудови бази правил скористаємось мережею Байєса, за допомогою якої можна визначити зв'язок вхідних та вихідних змінних.

Наприклад, задамо в мережу клієнта, віком 45 років, який хоче взяти кредит 3500грн., на 1 рік, з щомісячними виплатами 550 грн., і його дохід після цих виплат складатиме 1000 грн на місяць. За мережею Байеса цей клієнт поверне кредит з ймовірністю 78 %.  

Рис.3.17 Ймовірність повернення кредиту за побудованою мережею Байєса для певного нового клієнта

Правила

1) Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит “small” дохід “very_low”,  платіж “low” або “average”, то кредит “return

2) Якщо вік “f21_to35”,або “f45_to61”,  кредит “average” дохід “very_low”,  платіж  “low”, то кредит “return

3) Якщо вік “f30_to50”, кредит “average”,  дохід “very_low”,  платіж  “low”, то кредит “not_return

4) Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит “big” дохід “very_low”,  платіж  “low”, то кредит “not_return

5) Якщо вік “f21_to35”,  кредит “average”  дохід “very_low”,  платіж “average”, то кредит “not _return

6) Якщо вік “f30_to50”,або “f45_to61”,  кредит “average” дохід “very_low”,  платіж  “ average ”, то кредит “return

7) Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит “small” або “average” або “big” дохід “very_low”,  платіж  “high”, то кредит “not_return

8) Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит “small”  дохід “low”,  платіж  “low” або “average”, то кредит “return

9) Якщо вік “f30_to50” або“f45_to61”,  кредит “small”  дохід “low”,  платіж  “high”, то кредит “not_return

10) Якщо вік “f21_to35”,  кредит “small”  дохід “low”,  платіж  “high”, то кредит “return

11) Якщо вік “f21_to35”,  кредит “average”  дохід “low”,  платіж  “low” або “average”, то кредит “not_return

12) Якщо вік “f30_to50” або“f45_to61”,  кредит “average”  дохід “low”,  платіж  “low”або “average”, то кредит “return

13) Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит  “average” дохід “low”,  платіж  “high”, то кредит “not_return

14)Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит  “big” дохід “low”,  платіж  “low” або “average” або “high”, то кредит “not_return

15)Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит  “big” дохід “average”,  платіж  “low” або “average” або “high”, то кредит “not_return

16) Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит  “small”, дохід “average”,  платіж  “high”, то кредит “not_return

17)Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит  “small”, дохід “average”,  платіж  “low” або “average”, то кредит “return

18) Якщо вік “f21_to35” ,  кредит  “average”, дохід “average”,  платіж  “low” або “average” або “high”, то кредит “not_return

19)Якщо вік  “f30_to50” або“f45_to61”,  кредит  “average”, дохід “average”,  платіж  “low” або “average” або “high”, то кредит “return

20) Якщо вік “f21_to35” ,  кредит  “small” або“average” або “big”, дохід “high”,  платіж  “low” або “average” або “high”, то кредит “not_return

21)Якщо вік або “f30_to50” або“f45_to61”,  кредит  “small”, дохід “high”,  платіж  “low” або “average” або “high”, то кредит “not_return

22)Якщо вік  “f30_to50” або“f45_to61”,  кредит  “average”, дохід “high”,  платіж  “low” або “average”, то кредит “not_return

23)Якщо вік  “f30_to50” або“f45_to61”,  кредит  “average”, дохід “high”,  платіж  “high”, то кредит “return

24)Якщо вік  “f30_to50” або“f45_to61”,  кредит  “big”, дохід “high”,  платіж “low” або “average” або“high”, то кредит “return

25)Якщо вік “f21_to35” або “f30_to50” або“f45_to61”,  кредит  “small”, дохід “very_high”,  платіж  “low” або “average” або “high”, то кредит “return

26) Якщо вік “f45_to61” або “f30_to50”,  кредит  “average” або “big”, дохід “very_high”,  платіж  “low” або “average”або “high”, то кредит “return

27)Якщо вік “f21_to35” ,  кредит  “small”, дохід “very_high”,  платіж  “low” або “average” або “high”, то кредит “return

28)Якщо вік “f21_to35” ,  кредит  “average”, дохід “very_high”,  платіж  “low”, то кредит “return

29)Якщо вік “f21_to35” ,  кредит  “average”, дохід “very_high”,  платіж  або “average” або “high”, то кредит “not_return

30)Якщо вік “f21_to35” ,  кредит  “big”, дохід “very_high”,  платіж  “low”, то кредит “not_return

31)Якщо вік “f21_to35” ,  кредит  “big”, дохід “very_high”,  платіж  “average”або “high”, то кредит “return

Рис.3.18 Результати роботи системи оцінки кредитоспроможності позичальника

Таблиця 3.3Результат роботи системи оцінювання

кредитоспроможності позичальника

Вік

Кредит

Платіж

Дохід

Результат

Клієнт 1

27

6100

450

2025

0,769

Клієнт 2

52

3000

250

5000

0,272

Клієнт 3

36

3000

100

3000

0,5

 

3.5. Висновки до розділу

В третьому розділі побудовано модель логістичної регресії, пробіт-модель, дерево рішень та мережу Байєса з використанням реальних даних фінансової звітності банку про видані кредити. Отримані результати прогнозів за побудованими моделями доводять можливість та доцільність їх використання на практиці для розв’язання задачі аналізу кредитоспроможності позичальника.

Запропоновано новий підхід до аналізу та прогнозування ймовірності повернення кредитів позичальниками. Цей підхід грунтується на комбінуванні мережі Байєса з нечіткою логікою.

В порівнянні з моделями, побудованими за відомими методами, комбінований метод показав високу якість результатів та свою конкурентоспроможність при вирішенні задачі прогнозування кредитоспроможності позичальника. Це зумовлено тим, що використання комбінованого методу дозволяє точніше і ефективніше встановити причинно-наслідкові зв’язки між окремими характеристиками-факторами задачі, їх вплив на вихідну змінну та питому вагу, що дає змогу підвищити обґрунтованість прийняття рішень та покращити точність прогнозу вихідних даних. У подальшому запропонований комбінований підхід може бути використаний в розробці нових інформаційних технологій та систем підтримки прийняття рішень.      

РОЗДІЛ 4

АНАЛІЗ РЕЗУЛЬТАТІВ

4.1. ROC – аналіз 

Для аналізу якості моделей і встановлення найкращої моделі для розвязання певної задачі використовують декілька критеріїв для оцінювання адекватності моделей:

  1.  загальна точність моделі;
  2.  помилки І-го та ІІ-го роду;
  3.  ROC-крива та індекс GINI.

Загальна точність моделі (CA – commonaccuracy) визначається як: , де – кількість вірно спрогнозованих випадків, а – загальна кількість випадків. Загальна точність моделі є дещо суб’єктивною оцінкою, оскільки вона залежить від частки дефолтів в моделі, а також від порогу відсікання. Для різних значень порогу точність моделі також буде приймати різні значення.

ROC-крива (ReceiverOperationCharacteristic – робоча характеристика приймача) показує залежність кількості вірно класифікованих позитивних прикладів від кількості невірно класифікованих негативних прикладів. Перші називають істинно позитивними, а інші – негативними множинами. При цьому припускається, що у класифікатора існує певний параметр, варіюючи який, можна отримати певне розбиття на класи. Цей параметр часто називають порогом або точкою відсікання (сut-off), в залежності від якого будуть отримані різні величини помилок І-го та ІІ-го роду (табл. 4.1).  

Таблиця 4.1

Помилки І-го та ІІ-го роду

 

Прогноз моделі: Повернення кредиту (0)

Прогноз моделі: Дефолт (1)

Фактично: Повернення кредиту(0)

Вірно класифіковані (TP)

Помилки ІІ-го роду (FN)

Фактично: Дефолт (1)

Помилки І-го роду (FP)

Вірно класифіковані (TN)

Для аналізу якостей моделі найчастіше використовують такі відносні показники у процентах:

  1.  частка істинно позитивних прикладів (TruePositivesRate): ;
  2.  частка хибно позитивних прикладів (FalsePositivesRate): .

Зазвичай для аналізу якості моделей використовують ще дві характеристики: чутливість та специфічність.

Чутливість моделі – це частка істинно позитивних випадків, тобто .

Специфічність моделі – це частка істинно негативних випадків, які були вірно класифіковані моделлю: . Зрозуміло, що .

Модель з високою чутливістю надає істинний результат при наявності позитивних випадків (виявляє позитивні приклади). Навпаки, модель із високою специфічністю найчастіше дає істинний результат за наявності негативних випадків (виявляє негативні приклади). Для побудови графіка ROC-кривої по осі відкладаються значення чутливості , а по осі – долю хибно позитивних випадків або .

Графік ідеального класифікатора ROC–кривої проходить через верхній лівий кут, де доля істинно позитивних випадків становить 1 (ідеальна чутливість), а доля хибно позитивних прикладів дорівнює нулю. Тому чим ближче крива наближається до верхнього лівого кута, тим кращою є здатність моделі передбачувати. Діагональна лінія відповідає класифікатору, який не здатний розпізнати ці два класи.

Оскільки візуальне порівняння ROC-кривих не завжди дозволяє визначити ефективнішу модель, застосовують оцінку площі під кривими. Чисельний показник площі під кривою AUC (AreaUnderCurve) і обчислюється, наприклад, за методом трапецій: .

Більш зрозумілим і частіше згадуваним в літературі параметром оцінки якості моделі є індекс GINI, розроблений італійським статистиком КоррадоДжіні, який тісно пов'язаний з чисельним показником площі під ROC-кривою. Індекс GINI – це площа області між діагоналлю і кривою Лоренца, поділена на площу усієї області під діагоналлю. Індекс  GINI широко використовується для аналізу роздільної здатності системи оцінювання при управлінні кредитними ризиками, тобто оцінки здатності моделі розділяти клієнтів на схильних та несхильних до дефолту. Якщо модель здатна оцінити клієнтів за ймовірністю дефолту, то більшість клієнтів, схильних до дефолту, мають отримати більшу ймовірність дефолту. Відповідно, найменша ймовірність дефолту має бути для клієнтів, несхильних до дефолту. Індекс GINI проілюстровано графом, де сукупний процент дефолту для клієнтів показано поряд із сукупним процентом клієнтів, коли вони упорядковані за ймовірністю дефолту (менша ЙД – зліва, більша – справа).  Цей графік відомий як крива Лоренца (рис. 4.1).

Рис.4.1 Крива Лоренца для задачі кредитування

Діагональна лінія – це лінія «випадкової моделі». На осі Х клієнти впорядковані за заданою ймовірністю дефолту. Очевидно, що 80% дефолтів зустрічаються саме серед останніх 20% клієнтів (20% клієнтів з найбільшою ймовірністю дефолту). Очевидно, це означає, що модель виконує прийнятне розділення. Отже, чим більша область між діагоналлю та кривою, тим вища якість моделі. Дефолти серед клієнтів із рівною ймовірністю дефолту вважаються розподіленими випадково серед цих клієнтів. Індекс GINI можна визначити через площу фігури, що знаходиться під ROC-кривою, таким чином:.

Діапазон значень індексу GINI складає , а моделі з найвищою розділювальною здатністю, тобто моделі, які роблять високоякісне сортування схильних до дефолту клієнтів і клієнтів, не схильних до дефолту, отримають найвищі коефіцієнти. На практиці оцінка якості моделі суттєво залежить від даних, за якими вона будується. Для застосування на практиці скорингу (оцінки фінансового стану нових клієнтів) індекс GINI на рівні 55% є вже дуже високим, в той час як для скорингу поведінки (оцінки фінансового стану існуючих клієнтів) індекс GINI зазвичай приймає значення вищі 70%.

Таблиця 4.2

Оцінка якості моделі за площею AUC та індексом GINI

Інтервал AUC

Індекс GINI

Якість моделі

0,9 – 1,0

0,8 – 1,0

Відмінна

0,8 – 0,9

0,6 – 0,8

Висока

0,7 – 0,8

0,4 – 0,6

Прийнятна

0,6 – 0,7

0,2 – 0,4

Середня

0,5 – 0,6

0 – 0,2

Незадовільна

Значення точок ROC-кривої можуть бути використані для знаходження оптимального порогу відсікання – компромісу між чутливістю та специфічністю моделі. Критеріями вибору порогу відсікання можуть бути:

  1.  вимога мінімальної величини чутливості (специфічності) моделі;
  2.  вимога максимальної сумарної чутливості і специфічності моделі, тобто ;
  3.  вимога балансу між чутливістю і специфічністю, тобто коли : [5].

3.2. Розробка програми для аналізу результатів

Програмний продукт був розроблений на мові програмування MicrosoftVisualStudio 2010 C++.

Головний інтерфейс містить одне поле для вводу cut-off(рис. 4.2).

Рис. 4.2 Вигляд інтерфейсу програма при її запуску

Після введення значення cut-off обираємо, яку з побудованих моделей необхідно проаналізувати. Робота програми для моделей логістичної регресії, дерев рішень, мереж Байєса та комбінованого підходу представлені на рис. 4.3, рис.4.4, рис. 4.5 та рис. 4.6 відповідно.

Рис. 4.3 Загальний вигляд програми для аналізу моделі логістичної регресії при cut-off=0,25

Рис. 4.4Загальний вигляд програми для аналізу моделідереварішень при cut-off=0,3

Рис. 4.5Загальний вигляд програми для аналізу моделі мережі Байєса при cut-off=0,3

Рис. 4.6 Загальний вигляд програми для аналізу моделі комбінування мережі Байєса та нечіткої логіки при cut-off=0,3

3.3. Порівняльний аналіз результатів, отриманих різними методами, для задачі кредитування індивідуальних позичальників

В Україні працює один іноземний комерційний банк, який видає кредити та збирає статистику по виданих кредитах: чи були вони повернуті, чи ні. Нехай за рік банком  було видано 1600 кредитів. Зрозуміло, що не усі ці дані впливають на прийняття рішення програмою про видачу кредиту, оскільки частина даних необхідна банкові для статистичної звітності, для формування єдиного банківського реєстру про неповернення кредитів і т.п. Кожний клієнт описується 18 характеристиками.

За побудованими в Розділі 3 моделямипроведемо аналіз прогнозів останніх 300 значень про кредити, отриманих за методами логістичної регресії, дерев рішень, мережі Байєса та комбінованого підходу мережі Байєса та нечіткої логіки, в порівнянні з реальними значеннями.

Скористаємося програмою для проведення ROC-аналізу, встановивши пороги відсікання на певних рівнях (тобто, якщо ймовірність дефолту перевищує вказаний рівень, то клієнт вважається таким, що не поверне кредит), отримаємо таблицю результатів

Бінарна логістична регресія

Таблиця 4.3

Загальна точність моделі та помилки І-го та ІІ-го роду для різних рівнів порогу відсікання, отримані для логістичної регресії

Прогноз: Повернення кредиту (0)

Прогноз: Дефолт (1)

Cut-off=0,1

Факт: Повернення кредиту (0)

57

183

Факт: Дефолт (1)

0

60

Загальна точність моделі  = 61,9 %

Cut-off=0,15

Факт: Повернення кредиту (0)

86

154

Факт: Дефолт (1)

1

59

Загальна точність моделі  = 67 %

Cut-off=0,2

Факт: Повернення кредиту (0)

109

131

Факт: Дефолт (1)

3

57

Загальна точність моделі  = 70,3 %

Cut-off=0,25

Факт: Повернення кредиту (0)

151

89

Факт: Дефолт (1)

6

54

Загальна точність моделі  = 76,5 %

Cut-off=0,3

Факт: Повернення кредиту (0)

184

56

Факт: Дефолт (1)

11

49

Загальна точність моделі  = 79,2 %

Очевидно, що максимальна точність моделі на рівні 79,2 % досягається при значенні порогу відсікання 0,3, при цьому модель пропускає 11 дефолтів та відсіює 23,3% добросовісних позичальників.  Для логістичної регресії побудована ROC-крива, представлена на рис. Значення площі під кривою становить: , а індекс GINIвідповідно становить: .

Рис.4.7ROC-крива для бінарної логістичної регресії

Дерева рішень

Скористаємось методом дерев рішень для розв’язання тієї ж задачі кредитування. Встановивши пороги відсікання на певних рівнях (тобто, якщо ймовірність дефолту більше вказаного рівня, то клієнт вважається таким, що не поверне кредит), отримаємо наступну таблицю результатів.

Таблиця 4.4

Загальна точність моделі та помилки І-го та ІІ-го роду для різних рівнів порогу відсікання, отримані для дерева рішень

Прогноз: Повернення кредиту (0)

Прогноз: Дефолт (1)

Cut-off=0,1

Факт: Повернення кредиту (0)

29

211

Факт: Дефолт (1)

0

60

Загальна точність моделі = 56 %

Cut-off=0,15

Факт: Повернення кредиту (0)

56

184

Факт: Дефолт (1)

0

60

Загальна точність моделі = 61,2 %

Cut-off=0,2

Факт: Повернення кредиту (0)

84

156

Факт: Дефолт (1)

3

57

Загальна точність моделі =65 %

Cut-off=0,25

Факт: Повернення кредиту (0)

112

128

Факт: Дефолт (1)

5

55

Загальна точність моделі =69,2 %

Cut-off=0,3

Факт: Повернення кредиту (0)

134

106

Факт: Дефолт (1)

8

52

Загальна точність моделі = 71,25 %

Очевидно, що максимальна точність моделі на рівні 71,25 % досягається при значенні порогу відсікання 0,3.  При цьому модель пропускає 8дефолтів та відсіює 44 % добросовісних позичальників. Очевидно, що побудоване дерево рішень має схильність до «перестраховки», тобто воно частіше помиляється, відкидаючи тих клієнтів, які б повернули кредит. Для дерев рішень побудована ROC-крива, представлена на рис.  Значення площі під кривою становить: , а індекс GINIвідповідно становить: .

Рис.4.8 ROC-крива для дерева рішень

Мережі Байєса

На основі навчальної вибірки з1300 клієнтів побудована мережа Байєса за допомогою програмного комплексу GeNIe 2.0. Для перевірочної вибірки (300 випадків) обчислено ймовірності дефолтів, які потім були порівняні з реальними результатами, які спостерігалися. Для різних порогів відсікання обчислено помилки І-го та ІІ-го роду.

Таблиця 4.5

Загальна точність моделі та помилки І-го та ІІ-го роду для різних рівнів порогу відсікання, отримані для мережі Байєса

Прогноз: Повернення кредиту (0)

Прогноз: Дефолт (1)

Cut-off=0,1

Факт: Повернення кредиту (0)

3

237

Факт: Дефолт (1)

0

60

Загальна точність моделі = 50,6 %

Cut-off=0,15

Факт: Повернення кредиту (0)

3

237

Факт: Дефолт (1)

0

60

Загальна точність моделі = 50,6 %

Cut-off=0,2

Факт: Повернення кредиту (0)

22

218

Факт: Дефолт (1)

0

60

Загальна точність моделі = 54,6 %

Cut-off=0,25

Факт: Повернення кредиту (0)

23

217

Факт: Дефолт (1)

0

60

Загальна точність моделі = 54,8 %

Cut-off=0,3

Факт: Повернення кредиту (0)

146

94

Факт: Дефолт (1)

3

57

Загальна точність моделі = 77,9 %

Найбільша точність моделі досягається на рівні 77 % при встановленні порогу 0,3; при цьому буде пропущено 3 дефолти та відкинуто 39 % добросовісних позичальників.

Для МБ побудована ROC-крива, представлена на рис.4.9. Значення площі під кривою становить: , а індекс GINI відповідно становить: .  

Рис.4.9 ROC-крива для мережі Байєса

Таблиця 4.6

Загальна точність моделі та помилки І-го та ІІ-го роду для різних рівнів порогу відсікання, отримані для  методу комбінування мережі Байєса та нечіткої логіки

Прогноз: Повернення кредиту (0)

Прогноз: Дефолт (1)

Cut-off=0,1

Факт: Повернення кредиту (0)

42

198

Факт: Дефолт (1)

0

60

Загальна точність моделі = 58,75 %

Cut-off=0,15

Факт: Повернення кредиту (0)

88

152

Факт: Дефолт (1)

0

60

Загальна точність моделі = 68,3 %

Cut-off=0,2

Факт: Повернення кредиту (0)

121

119

Факт: Дефолт (1)

0

60

Загальна точність моделі = 75,3 %

Cut-off=0,25

Факт: Повернення кредиту (0)

161

79

Факт: Дефолт (1)

2

58

Загальна точність моделі = 81,9 %

Cut-off=0,3

Факт: Повернення кредиту (0)

173

67

Факт: Дефолт (1)

3

57

Загальна точність моделі = 83,5 %

Як видно з отриманих результатів, інтегрована модель показує кращі значення загальної точності для порогів відсікання 0,2 і 0,25, а також відсіює менше добросовісних позичальників у порівнянні з даними для мережі Байєса. Побудована ROC-крива, представлена на рис.

Значення площі під кривою для моделі на основі інтегрованого підходу становить: , а індекс GINI відповідно становить: , що є  кращим результатом.

Рис. 4.10 ROC-крива для комбінованого методу мережі Байєса з нечіткою логікою

Зрозуміло, що точність моделі та кількість помилок І-го та ІІ-го роду буде залежати від порогу відсікання, який буде встановлений банком. Слід пам’ятати, що встановлюючи поріг відсікання, ми визначаємо не лише процент відсіяних клієнтів, а нижню границю ймовірності повернення кредиту, тобто поріг, нижче якого клієнт вважається таким, що не поверне кредит (або нижню границю ймовірності дефолту, нижче якої вважається, що клієнту слід видати кредит). При цьому значення ймовірності дефолту 0,1 або 0,2 для клієнта є доволі незначними та статистично малими, а тому поріг відсікання доцільно було б встановити на рівні 0,25 – 0,3. Зрозуміло, що встановлений поріг відсікання впливає на кількість помилок І-го та ІІ-го роду.

Таким чином, інтегрований підхід до оцінки кредитоспроможності позичальника дозволив покращити якість моделі, а також її здатність розрізняти надійних та ненадійних клієнтівта зменшив кількість некоректно відсіяних клієнтів.

Таблиця 4.7

Порівняльна таблиця характеристик для різних моделей

Назва методу

Індекс GINI

Значення AUC

Точність моделі

Якість моделі

Бінарна логістична регресія

0,5491

0,7745

79,2 %

Прийнятна

Дерева рішень

0,548

0,774

71,25 %

Прийнятна

Мережа Байєса

0,758

0,879

77,9 %

Висока

Мережа Байєса з нечіткою логікою

0,775

0,8875

83,5 %

Висока

 

Отримані результати обчислювальних експериментів свідчать, що кращі результати дає комбінування мереж Байєса з нечіткою логікою, також хороший результат дає модель побудована за допомогою  мережіБайєса. Найкращі значення точності моделі також дає логістична регресія. Ці результати ще раз підтверджують доцільність використання логістичної регресії, дерев рішень та мереж Байєса при оцінюванні кредитоспроможності позичальника.

3.4.Висновки до розділу

В четвертому розділі виконано аналіз якості моделей, побудованих за методами логістичної регресії, дерев рішень, мереж Байєса та комбінування мереж Байєса з нечіткою логікою. Встановлено, що модель комбінування мережі Байєса з нечіткою логікою є найкращою  для розв’язання задачі визначення ймовірності дефолту для кредитного позичальника, на що вказує порахована програмою точність моделі, яка становить 83,5% для комбінованої моделі та 77,9%  для простої мережі Байєса. Це зумовлено тим, що використання комбінованого методу дозволяє точніше і ефективніше встановити причинно-наслідкові зв’язки між окремими характеристиками-факторами задачі, їх вплив на вихідну змінну та питому вагу.

Для аналізу використано декілька критеріїв оцінювання адекватності моделей. За допомогою розробленої на мові програмування MicrosoftVisualStudio 2010 C++ програми для кожної з моделей, запропонованих в Розділі 3, пораховано помилки І-го та ІІ-го роду, загальну точність моделей для заданих користувачем порогів відсікання (cut-off), значення якого безпосередньо впливає на точність моделі та кількість помилок І-го та ІІ-го роду.  Побудовано ROC-криву та пораховано площу під кривою (AUC) та індекс GINI.

ВИСНОВКИ ПО РОБОТІ ТА ПЕРСПЕКТИВИ ПОДАЛЬШИХ ДОСЛІДЖЕНЬ

В дипломній роботі розглянуто задачу управління банківськими кредитними ризиками, яка є на сьогоднінадзвичайно актуальною. Розглянуто основні математичні методи та моделі,  що можуть бути використані для прогнозування кредитоспроможності позичальника.

Досліджено особливості типового процесу обробки та аналізу фінансових даних, визначені основні етапи та вимоги до засобів аналізу. Всі моделі побудовано на реальних даних фінансової звітності банку. На прикладі аналізу кредитних ризиків виконано порівняльний аналіз існуючих методів та підходів до інтелектуального аналізу даних: експертного та скорингового підходів, дерев рішень, моделей логіт і пробіт, нечітких методів та мереж Байєса, зроблено висновок про доцільність використання цих методів у задачах аналізу фінансових даних. Слід зазначити, що для країн, що розвиваються, прийнятним є значення коефіцієнтаGINI на рівні від 0,4 до 0,6. Отриманий результат попадає у вказаний проміжок, але, очевидно, що дерева рішень та логістична регресія показують гірші результати при  оцінюванні  кредитних ризиків. Так, на основі моделей у формі мереж Байєса отримані дуже високі значення індексу GINI, що становить 0,758.

У роботі запропоновано новий комбінований підхід до моделювання фінансових процесів, який передбачає розбиття процесу аналізу на дві стадії та послідовне використання комбінації методів: мереж Байєса та нечіткої логіки, що дозволяє покращити якість прийнятих рішень. Дана модель показала набагато кращі результати за точністю, а саме 83,5%, в той час як для мережі Байєса цей показник становить 77,9%. Індекс GINIдля даної моделі становить 0,775, що також  вище, ніж у звичайної мережі.

Можна зазначити ефективність та переваги використання мереж Байєса та методу поєднання мереж Байєса з нечіткою логікою, як комбінацій експертного і скорингового підходів для ефективного розв’язання фінансово-економічних задач.

Виконано аналіз якості розроблених моделей. Для аналізу використано декілька критеріїв оцінювання адекватності моделей. За допомогою розробленої програми для кожної з побудованих моделей виконано ROC-аналіз та зроблено висновок щодо якості моделі.

Згідно з результатами виконаних експериментальних досліджень, розроблені моделі показали високу точність при вирішенні поставленої задачі аналізу моделювання та прогнозування банківських кредитних ризиків.

У подальших дослідженнях доцільно використати більші обєми статистичних даних і розширити кількість змінних, які характеризують позичальників кредиту. Також необхідно створити інформаційну систему підтримки прийняття рішень для розвязання задач даного класу. Це суттєво спростить роботу працівникам банків, які займаються розвязуванням задач оцінювання та менеджменту ризиків.


 

А также другие работы, которые могут Вас заинтересовать

35130. Расчёт пространственного одноэтажного промышленного здания, оборудованного мостовым краном 414.33 KB
  Список литературы Исходные данные Количество пролетов – 3; Длина пролета – l1 = 18 м; Длина здания – l = 168 м; Несущая конструкция покрытия – балка; Шаг колонн – 6 м; Высота до верха рельса – 84 м; Грузоподъемность крана – 15 т; Расчетное сопротивление грунта – Rгр =019 МПа; Место строительства – г. Расчет крайней колонны Данные для расчета сечений: бетон тяжелый класса B15 подвергнутый тепловой обработке при атмосферном давлении Rb = 85 МПа; Rbt = 075 МПа; Eb = 20500 МПа. Арматура класса АIII d 10 мм RS = RSC =...
35131. Форматирование результатов запроса 82 KB
  Например можно применить следующую команду чтобы увидеть определенные поля таблицы Slespeople упорядоченные по убыванию поля commission comm: SELECT snme comm FROM Slespeople ORDER BY 2 DESC; Мы рассматриваем это свойство ORDER BY для того чтобы продемонстрировать возможность его использования со столбцами выходных данных; эта процедура аналогична применению ORDER BY со столбцами таблицы. Например чтобы подсчитать заявки orders для каждого продавца slespeople и вывести результаты в убывающем порядке: SELECT snum COUNT DISTINCT...
35132. Создание таблиц 90 KB
  Команда CRETE TBLE Таблицы определяются с помощью команды CRETE TBLE создающей пустую таблицу таблицу не имеющую строк. Команда CRETE TBLE определяет имя таблицы и множество поименованных столбцов в указанном порядке. Синтаксис команды CRETE TBLE: CRETE TBLE имя таблицы имя столбца тип данных [ размер ] имя столбца тип данных [ размер ]. Поскольку пробелы используются для разделения отдельных частей команд в SQL их нельзя использовать как часть имени таблицы.
35133. Основные понятия SQL 152.5 KB
  Он используется для связи с такими системами управления базами данных как Orcle INGRES Informix Sybse SQLbse Microsoft SQL Server DB2 СУБД самой IBM продуктами SQL DC Prdox ccess pproch и многими другими. Обычно продукт базы данных включает не только СУБД. Собственно СУБД иногда ее называют исполнительной системой или исполнительным механизмом базы данных является рабочей лошадкой продукта. Она хранит данные осуществляет поиск и выборку данных а также записывает данные посредством исполнения операторов SQL В вычислительной...
35134. Альтернативная программная реализация выборки и модификации данных в базе данных Interbase 34.5 KB
  Конфигурируется ODBCисточник реализующий доступ к БД Interbse. В DBE dministrtor настраивается псевдоним БД доступной через BDE и представляющей собой в данном случае ODBCисточник. В отличие от 3го способа являющегося усовершенствованным подходом BDE 1й способ является более универсальным и более ресурсоемким в первую очередь по критерию времени поскольку представляет собой использование промежуточного уровня BDE и промежуточного уровня ODBC а 2й – менее универсальным и менее ресурсоемким поскольку предполагает использование...
35135. Пример реализации трехзвенной архитектуры 39.5 KB
  Два разрабатываемых при этом программных компонента – это сервер приложений и клиент взаимодействующие по протоколу DCOM. Разработка сервера приложений Основные шаги создания сервера приложений: Создание удаленного модуля данных Remote Dt Module. Однократный запуск программы с целью регистрации сервера приложений в реестре Windows. Для распределенного использования разработанных клиентского и серверного приложений требуется установка некоторых дополнительных программных компонент.
35136. Пример реализации обмена данными с Microsoft Excel 45.5 KB
  Создание новой книги Vrint MSBooks; MSBooks = MSExcel. Создание нового листа книги. Сохранение книги. Создание нового листа книги.
35137. Изучение формата баз данных Visual FoxPro 549.5 KB
  После заголовка таблицы следует цепочка 32байтовых описаний полей таблица 4.fmp Fp 01 1 YY Год последнего обновления таблицы Все 02 1 MM Месяц последнего обновления таблицы Все 03 1 DD День последнего обновления таблицы Все 04 4 RecordsCount Количество записей в таблице Все 08 2 HederSize Размер заголовка в байтах Все 10 2 RecordSize Размер записи в байтах Все 12 2 0x000x00 Зарезервировано Все 14 1 0x01 Начало транзакции D4 D5 0x00 Конец транзакции D4 D5 0x00 Игнорируется FS D3 Fb Fp CL 15 1 0x01 Закодировано D4 D5 0x00 Нормальная...
35138. Разработка файл-серверной информационной системы с использованием технологий Borland 47.5 KB
  Программное использование БД Простейший случай Для обращения к таблицам используются невизуальные компоненты TTble и TDtSource закладки Dt ccess и BDE палитры компонентов и ряд визуальных: TDBGrid TDBEdit TDBLookupComboBox и т. В компоненте TTble устанавливаются свойства TbleNme TbleType. В последнем случае псевдоним БД указывается в свойстве DtbseNme объекта TTble. В компоненте TDtSource устанавливается свойство DtSet как указатель на TTble.