8136

Обучение в системах искусственного интеллекта

Лекция

Информатика, кибернетика и программирование

Обучение в системах искусственного интеллекта Формы обучения. Обучение на основе наблюдений. Индуктивное обучение. Построение деревьев решений. Один из центральных элементов интеллектуального поведения -способность приспосабливаться или учиться...

Русский

2013-02-04

92 KB

16 чел.

Обучение в системах искусственного интеллекта

Формы обучения. Обучение на основе наблюдений. Индуктивное обучение. Построение деревьев решений.

Один из центральных элементов интеллектуального поведения –способность приспосабливаться или учиться на основе опыта. Возможность обучения или адаптивного поведения интеллектуального агента соответствует его более высокому уровню способностей. В основе обучения лежит представление о том, что результаты восприятия должны использоваться не только для осуществления действий, но и для повышения способности агента действовать в будущем.

Формы обучения. Обучение на основе наблюдений

Обучение принимает много разных форм в зависимости от характера производительного элемента, компонента, подлежащего усовершенствованию и доступной обратной связи.

В первую очередь – контролируемое обучение, при котором предусматривается изучение некоторой функции на примерах ее входных и выходных данных и доступна обратная связь либо от учителя, либо от среды, позволяющая получать правильные значения, относящиеся к примерам. Изучение функции с дискретными значениями называется классификацией, а изучение непрерывной функции называется регрессией (предсказанием).

Простейшая разновидность – механическое обучение, при котором предлагается пример, а интеллектуальный агент просто копирует пример и точно воспроизводит поведение. Например, можно управлять моделированием 24 часа в день, 7 дней в неделю, производить новые ситуации и желательное поведение, затем представлять эти примеры агенту. Агент был бы уже приспособленным интерпретировать ситуации спустя одну неделю после того, как начато обучение, и еще лучше делал бы это один месяц спустя. Другая разновидность - регулирование веса или параметра. В этом случае, мы можем знать априорно, какие факторы являются важными в решении, но мы не знаем их вклад в решение. Можно подбирать весовые факторы в течение некоторого времени так, чтобы увеличивалась вероятность правильного решения. На этой технике основано обучение на основе нейронной сети.

Индуктивное обучение - процесс контролируемого обучения, в котором извлекаются важные особенности проблемы, что позволяет вывести новую ситуацию или вход. Деревья решения и нейронные сети и выполняют индукцию и могут использоваться для классификации или регрессии проблемы. Ключевой аспект индуктивных методов заключается в том, что примеры обработаны и автоматически преобразованы во внутреннюю форму, которая представляет сущность проблемы.

Форма неконтролируемого обучения предполагает выявление определенных закономерностей во входных данных в случае, когда не задаются соответствующие выходные данные. Объединение входных данных в кластеры или сегментация процесса продолжаются, пока агент не помещает те же самые данные в ту же самую группу на последовательных проходах по данным. Например, агент-водитель такси может изучить понятие о “днях с хорошими условиями для движения” даже не получая обозначенных подобными заголовками примеров таких дней. Для данной формы обучения часто применяются статистические методы обучения.

Форма обучения с подкреплением является наиболее общей. При этом агент не получает от учителя информации о правильных действиях, а должен сам делать данный вывод на основе подкрепления (вознаграждения). Например, большой штраф за столкновение с идущим впереди автомобилем может служить для агента показателем нежелательности его поведения. Задача обучения с подкреплением обычно включает подзадачу обучения тому, как функционирует среда, в которой существует агент.

Индуктивное обучение

Основная задача чисто индуктивного логического вывода, или просто индукции, заключается в том, чтобы на основании совокупности примеров входных и выходных данных функции f получить функцию h, которая аппроксимирует  функцию f. Функция h называется гипотезой. Качественная гипотеза должна обеспечивать приемлемое обобщение, т.е. должна правильно предсказывать появление еще не полученных примеров. В этом состоит фундаментальная проблема индукции.

Известным примером (рис.1 и рис.2) индуктивного обучения является подгонка функции от одной переменной к некоторым точкам из набора данных.

Рис.1

Примеры представляют собой пары (x,f(x)), где и x и f(x) – действительные числа. Выберем в качестве пространства гипотез – множество полиномов, имеющих степень не больше k, таких как 5x2+2, x17-3x3. На рис.1 показаны значения, которые соответствуют некоторой прямой (полиному первой степени). Так как прямая согласуется со всеми данными, то она называется совместимой с гипотезой. На том же рис. 1 показан полином более высокой степени, который также совместим с этими данными. Это пример важной проблемы индуктивного обучения – выбору среди множества согласованных гипотез. Эта проблема может быть решена с использованием  принципа “бритвы Оккама”, согласно которому предпочтение следует отдавать наиболее простой гипотезе, согласующейся с данными.

Рис. 2

На рис. 2 показан второй набор данных, с которым нельзя точно совместить прямую линию. Для точного согласования с данным набором требуется полином четвертой степени с пятью параметрами. Возможно, что лучше согласовать этот набор данных с прямой линией, которая не будет точно совместимой, но позволит получать обоснованные предсказания. Принятие данного решения равносильно признанию недетерминированности искомой функции. При наличии недетерминированных функций неизбежно приходится искать компромисс между сложностью гипотезы и степенью ее согласованности с данными.

Возможность найти простую согласованную гипотезу зависит от выбранного пространства гипотез. На рис. 2 показано как тот же набор данных может быть точно согласован с простой функцией вида ax+b+csin(x). Задача обучения называется реализуемой, если Пространство гипотез содержит подходящую функцию, иначе она называется нереализуемой. В произвольной ситуации невозможно определить, относится ли конкретная задача обучения к категории реализуемых. Использование априорных знаний для логического вывода пространства гипотез – один из способов решения данной проблемы. Еще один подход – применение наибольшего возможного пространства гипотез, например, использование класса всех машин Тьюрина, так как известно, что любая вычислимая функция может быть представлена с помощью некоторой машины Тьюринга. При этом приходится искать компромисс между выразительностью пространства гипотез и сложностью поиска простой, совместимой гипотезы в этом пространстве, так как неразрешима в общем виде проблема определения того, является ли конкретная машина Тьюринга совместимой с данными. Кроме того результирующие гипотезы из простых пространств гипотез могут оказаться и более простыми в использовании, т.е. вычисление h(x), если h – линейная функция, будет осуществляться быстрее, чем при использовании программы, моделирующей произвольную машину Тьюринга.

Построение деревьев решений

Индуктивный логический вывод деревьев решений – одна из простейших и эффективных форм алгоритмов обучения.

Дерево решений принимает в качестве входных данных множество атрибутов, описывающих объект или ситуацию, и возвращает предсказанное выходное значение, соответствующее этим входным данным. Входные атрибуты и выходные значения могут быть дискретными или непрерывными. Будем рассматривать случай булевой классификации, когда каждый пример может быть либо истинный (положительный), либо ложный (отрицательный).

Решение, содержащееся в дереве решений, может быть получено путем выполнения последовательности проверок. В каждом узле дерева проверяется значение одного из свойств, а ветви, исходящие из этого узла, обозначаются возможными значениями результатов проверки. При достижении листового узла возвращается соответствующее ему значение.

Рассмотрим пример применения метода обучения на основе дерева решений к задаче, в которой клиент ждет, пока освободится место за столиком в ресторане. Целевой предикат WillWait (Следует ли ждать). Вначале определим, какие атрибуты доступны для описания примеров ситуаций в данной проблемной области:

Alternate – есть ли поблизости ресторан такого же класса,

Bar – имеется ли в ресторане бар, в котором можно подождать,

Fri/Sat – атрибут истинен по пятницам и субботам,

Hungry  испытывает ли посетитель чувство голода,

Patrons  Full/Some/None – количество людей в ресторане,

Price – */**/*** – ценовая категория ресторана,

Raining – идет ли дождь на улице,

Reservation – забронировано ли за посетителем место,

Type French/Italian/Thai/Burger – тип кухни в ресторане,

WaitEstimate – 0-10/10-30/30-60/>60 минут – время ожидания.

Возможное дерево решений показано на рис.3. В нем не используются атрибуты Price и Type, что означает, что лицо, принимающее решение, рассматривает их как малозначительные. Обработка примеров ситуаций с помощью этого дерева начинается от корня и проходит по соответствующей ветви до тех пор, пока не будет достигнут какой-то лист. Например, для ситуации, в которой Patrons = Full и WaitEstimate = 0-10 будет получено положительное решение, т.е. следует дождаться освобождения столика.

Рис.3


х

х

f(x)

(x)

х

х

f(x)

f(x)

Patrons?

No

Yes

WaitEstimait?

No

Yes

Alternate?

Hangry?

Reservation?

Fri/Sat?

Yes

Alternate?

Bar?

Yes

Yes

Yes

No

Raining?

Yes

Yes

No

No

None

Some

Full

>60

30-60

10-30

0-10

No

Yes

No

Yes

No

Yes

No

Yes

No

Yes

No

Yes

No

Yes


 

А также другие работы, которые могут Вас заинтересовать

66108. НЕНАЛОГОВЫЕ ДОХОДЫ СУБЪЕКТОВ РФ, НЕ СВЯЗАННЫЕ С ИСПОЛЬЗОВАНИЕМ ИХ ГОСУДАРСТВЕННОЙ СОБСТВЕННОСТИ 77.5 KB
  При этом мы не будем говорить о доходах от использования государственной собственности субъектов РФ. Важную роль среди всех неналоговых доходов играют доходы от государственной собственности. Со временем его значение в структуре государственных доходов снизилось...
66109. ОСОБЕННОСТИ СОДЕРЖАНИЯ И ФОРМЫ ИНДИВИДУАЛЬНОЙ ЖАЛОБЫ В ЕВРОПЕЙСКИЙ СУД ПО ПРАВАМ ЧЕЛОВЕКА 181 KB
  Вряд ли можно найти более значимую и вместе с тем сложную проблему нежели проблема защиты прав и свобод человека и гражданина. В настоящее время граждане Российской Федерации часто обращаются в международные судебные правозащитные органы подавая жалобы на нарушения...
66110. ПОНЯТИЕ, ЦЕЛИ И ПРИНЦИПЫ ФЕДЕРАЛЬНОГО ВМЕШАТЕЛЬСТВА 154.5 KB
  Когда власти некоторых субъектов Федерации игнорируют ее требования и законные интересы она Федерация вынуждена прибегать к использованию принудительных мер обеспечения государственного экономического и правового единства страны то есть к мерам федерального вмешательства.
66111. РОЛЬ ГОСУДАРСТВЕННОЙ АВТОИНСПЕКЦИИ В БЛАГОУСТРОЙСТВЕ ГОРОДОВ РОССИИ 50.5 KB
  Под благоустройством городов традиционно понимается создание и улучшение условий способствующих безопасной и комфортной жизни жителей и гостей города. В период распутицы весной и осенью по данным областной газеты Красное Знамя большинство улиц города были...
66112. ПОНЯТИЕ И ВИДЫ ПРЕКРАЩЕНИЯ ПРАВА СОБСТВЕННОСТИ 64.5 KB
  Право собственности наиболее широкое и устойчивое вещное право. Поэтому одна из важнейших задач правовой системы – охрана и защита существующих отношений собственности. Однако одной защиты отношений собственности явно недостаточно. Мозолина который выделяет еще два элемента правовых гарантий относящихся к собственности...
66113. ПРОБЛЕМЫ ФОРМИРОВАНИЯ ГОСУДАРСТВЕННОЙ ФИНАНСОВОЙ ПОЛИТИКИ В СФЕРЕ ВЫСШЕГО ОБРАЗОВАНИЯ 80 KB
  Политика реализуется в рамках политической системы и через политическую систему. Так предметами ведения государственной политики в области образования и науки выступают организации составляющие образовательную систему и научные организации...
66114. ИНВЕСТИЦИОННАЯ ДЕЯТЕЛЬНОСТЬ ГОСУДАРСТВА В БЮДЖЕТНОЙ СФЕРЕ В УСЛОВИЯХ ФИНАНСОВОЙ РЕФОРМЫ 75.5 KB
  В правительственных источниках в частности в постановлениях и распоряжениях Правительства Российской Федерации о необходимости улучшения инвестиционного климата и расширения объемов привлекаемых иностранных инвестиций называются более весомые...
66115. ТЕОРЕТИКО-ПРАВОВАЯ ХАРАКТЕРИСТИКА ЮРИДИЧЕСКОГО КОНФЛИКТА 88 KB
  Научные представления о природе, структуре и содержании конфликтов в правовой сфере прошли сложный эволюционный путь. При этом основным, несомненно, был вопрос о соотношении категорий правового и социального, с одной стороны...
66116. МЕСТО И РОЛЬ ПРОФЕССИОНАЛЬНЫХ СОЮЗОВ В СИСТЕМЕ ИНСТИТУТОВ ГРАЖДАНСКОГО ОБЩЕСТВА 105.5 KB
  Одно из наиболее значимых последствий реализации либеральной концепции государства идея гражданского общества основанная на представлениях о естественных неотъемлемых правах человека и ответственности государства за обеспечение этих прав.